亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于語言差異的彈幕文化研究
        ——以英語和漢語為例

        2021-02-14 01:51:56楊欣月
        文化創(chuàng)新比較研究 2021年36期
        關鍵詞:英文文本語言

        楊欣月

        (四川大學文學與新聞學院,四川成都 610000)

        彈幕指的是在網絡上觀看視頻時彈出的評論性字幕?!皬椖弧币辉~最初的意思指炮火射擊過于密集,以至于像一塊幕布一樣,為軍事術語,也經常被用在彈幕射擊游戲中。大量吐槽評論從屏幕飄過時效果看上去像是飛行射擊游戲里的彈幕,所以網民將這種有大量的吐槽評論出現時的效果叫做彈幕。在中國,本來只有大量評論同時出現才能叫彈幕,但是隨著誤用單條評論也能叫彈幕了。

        彈幕最早起源于日本的視頻分享網站——Niconico 動畫,其基本功能與You-Tube 等影片共享網站相似。2007年,Niconico 動畫新增留言板功能,為用戶提供可在影片上留言的功能,而留言會以彈幕的形式出現在影片上。后來國內某些視頻網站例如A 站(AcFun)和B 站(Blilibili)陸續(xù)引入這種形式。在日本,這種評論(也就是我們通常所說的“彈幕”)被稱為コメント(comment,注釋、評論),只有國內的彈幕網站會將評論稱之為彈幕。彈幕塑造一種與眾不同的“圍觀”體驗,排解一個人對著電腦屏幕而產生的孤獨感,同時獲得自我和群體認同,這種強社交屬性使之迅速流行起來。

        然而彈幕這種評論形式卻沒有在歐美國家的視頻網站上掀起潮流。事實上,海外媒體也有關于彈幕網站為何流行不起來的討論,但少有針對語言本身進行分析;雖然社會文化等各種因素有一定的影響,但該文認為語言文字的特點才是英文彈幕無法流行的主要原因。

        1 彈幕視讀

        視讀是一種通過大面積掃視文字,主要以大腦形象記憶及形象思維來對信息進行集群處理的閱讀方式。與傳統(tǒng)電子文本的閱讀相同,視讀也是一項多個神經中樞參與的復雜過程,包括視覺中樞、聽覺中樞、語言中樞、記憶中樞等。

        同時,彈幕視讀也是一種包含多種認知行為的活動,通過視讀產生知覺需要現實刺激及過去的經驗等?,F實刺激指的是文字信息對眼睛產生光學刺激,而人們能夠理解這些文字的意思則是由于認知中的過去經驗起了作用。因彈幕文本的特殊性,如實時性、時限性等特點,人們需要在短時間內掃視大量以一定速度運動的文本,大腦需要將這些文字符號進行快速的加工處理并轉化為能夠理解的信息,而在這個過程中經驗信息尤為重要。

        2 彈幕文化中的漢英語言差異

        2.1 掃讀難度與視讀效率

        2.1.1 英語表音漢語表意

        與拼音文字不同,漢字兼有文字與圖形的雙重特征,是一種獨特的圖形文字。人們在閱讀漢字的時候會同時刺激左腦的語言區(qū)和右腦的圖像區(qū),提取經驗中的文字和圖像信息進行快速的加工整合,在此過程中圖像信息不需要經過類似文字轉語音的過程便能刺激大腦形成思維。漢字屬于具有一定表音功能的表意文字,表意文字的語言書寫符號表達的是意義,用字形直接表達語意,雖然在文字結構上也有表音成分,但字音服從于字形,是間接表音。而絕大多數印歐語系的文字都是表音文字,從記錄語音入手,用文字符號直接表示語音,字形服從于字音,不直接表示意義,即間接表示語意。這就意味著在觀看彈幕的時候,我們一看到漢字就能想到其表達的意思(文字→意義),而看到英文的時候要先把它拼讀出來然后才能明白它的含義 (文字→讀音→意義),在文字信息的閱讀理解過程中多了一個步驟,所以對于英語國家的人而言,聽視頻里的語言(發(fā)音→含義)比閱讀視頻里面的文字(文字→發(fā)音→含義)更容易更輕松(見圖1)。

        圖1 文字傳輸進腦途徑

        在提取漢語經驗與英文經驗的過程中也存在一些差別;漢語的文本中雙音節(jié)詞匯占比最多,還有大量的固定短語如四字成語、諺語、歇后語等,閱讀中我們一般將其視作一個整體理解其意義,因為通過過去大量的閱讀實踐,我們對其表現形式及意義都非常熟悉,形與意在腦中已融為一體。而英語文本是26 個字母的排列組合,單詞長短不一,組合眾多,很難輕松地推斷出某一字母前后的字母,只能從詞根、詞綴、整個英文單詞的程度上整體把握,另外英語單詞之間的空格使得英語文本的結構較中文本更加松散。在彈幕視頻中,彈幕文本以一定的速度從屏幕上成片飄過,在同樣的情況下若只改變文字的形式,比起中文彈幕英文彈幕的掃讀難度更大、視讀效率較低。

        雖然日語也是表音文字,但與英語不同的是日語是由音符直接表示音節(jié)的音節(jié)文字,而英文是由音符表示音素的音素文字。音節(jié)是由音素構成的語音片段,是聽話時自然感到的最小語音單位,所以在閱讀英文時需要先將音素組合成音節(jié),閱讀日語則不需要此步驟。另一方面日本處于漢字文化圈,受中國文化影響,日語中也大量使用漢字。由此可見,日語彈幕的視讀效率也必然高于英文彈幕。

        2.1.2 閱讀知覺廣度

        眼睛的生理結構給閱讀行為施加了很多限制。人的視網膜并不是一個勻質的感受器,只有視野中占大約15 度視角的中央凹才是視網膜中唯一真正可以用來閱讀的區(qū)域。文字要進入中央凹才能進行閱讀,所以在閱讀的時候眼球需要不斷地移動,這種注視點的移動稱為眼跳。在閱讀文本的時候,眼球會做著每秒鐘4~5 次的跳動,即每秒鐘4~5 次注視,每次注視都會新有的信息進入中央凹。

        閱讀知覺廣度通常指閱讀者在閱讀文本過程中在每次注視內能獲取有用視覺信息的范圍。Rayner[1-3]等人采用眼動追蹤技術中的移動窗口范式對英語文本知覺廣度的研究取得了較一致的結論,即注視點左側3~4 個字母空間到注視點右側12~15 字母空間,即每次注視20 個字母左右。Inhoff[4]等人的研究采用移動窗口范式探討了漢語讀者的閱讀知覺廣度,實驗結果顯示漢字被注視的字符左側延伸1 個字符,向右延伸3 個字符,即每次注視5 個漢字左右。

        在電腦屏幕上,文字是以字符串的形式顯示出來的,我們沒有辦法直接在電腦里面存入字符,如“彈幕文化” 這4 個字是沒有辦法將其進行存儲的。現行的方案是將字符編碼成0 和1 的數字串形式,建立兩者之間的映射關系,我們把這種方案叫作“字符集”。目前最常用的字符集是UTF-8 (8-bit Unicode Trans- formation Format),它是一種針對Unicode 字符集的可變長度字符編碼規(guī)則,又稱萬國碼;UTF-8 用1 到4 個字節(jié)編碼Unicode 字符;用在網頁上可以統(tǒng)一頁面顯示各種語言。

        在UTF-8 字符集下,一個中文字符占用3 個字節(jié),一個英文字符占用1 個字節(jié)。前面提到,英文的閱讀知覺廣度為每次20 個字母左右,漢字為每次5個字左右,所以在顯示屏上對于漢字的每次注視只需15 個字節(jié)左右,英文則需要20 個字節(jié),比中文多5 個字節(jié),每次注視停留的時間也會稍長。另一方面,英文文本都有詞間空格,而漢語和日語中都沒有詞間空格;一般情況下彈幕的文本長度都比較短,也不需要借助標點符號將其隔開。在播放同樣視頻的情況下,在相同文本長度,相同閱讀者視力、智力,相同熟練度的條件下,中文的視讀效率就比英文的視讀效率高。

        2.2 字符的信息熵

        美國數學家、信息論的創(chuàng)始人香農(Shannon)在1948年發(fā)表的文章 《通信的數學理論”(A Mathematical Theory of Communication)》一文中提出了“信息熵”的概念,用于度量信息的不確定程度。一個信源發(fā)送出什么符號是不確定的;在信源中,考慮的不是某一單個符號發(fā)生的不確定性,而是要考慮這個信源所有可能發(fā)生情況的平均不確定性,不確定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大。在自然語言處理中,信息熵表示語言的每個字符所含平均信息量的大小,度量語言符號這個隨機變量的不確定性程度[5]。

        公式里的pi 是指某種符號系統(tǒng)中,某個符號出現的頻率,熵的單位為比特(bit)。影響信息熵的因素有兩個: 一個是符號的數量n,一個是符號的頻率pi。固定其中一個變量,看另一個變量對信息熵的影響,可以得出的結論為:符號越多,信息熵越大;符號的頻率分布越均勻,信息熵越大。

        馮志偉[6]用逐漸擴大漢字容量的辦法,計算出包含在一個漢字中的熵為9.65 比特,并與其他印歐語字符熵值進行了統(tǒng)計對比(見表1)。

        表1 各語言字符的熵

        通過對比可以觀察到漢字的熵最大,也就是說其輸出的信息量也最多。國外對英語字母的熵做了許多研究,到了21 世紀,Cleary[7]運用基于PPM(Prediction by Partial Matching) 的模型處理文本得到了更精確的結果為1.46 比特/字符。關于漢字的研究,吳軍[8]等人通過大量的統(tǒng)計,給出漢語信息熵的上界為5.17 比特/漢字;孫帆等人基于詞的語言模型估計方法得到漢字的熵值為5.31 比特。可以看出漢字的熵值仍然更大,在表示相同意思的情況下所需要的英文字符比漢字字符更多,播放視頻時彈幕文本快速從顯示屏上飄過,要在不錯過視頻內容的情況下視讀完英文彈幕并理解其意思必定比視讀中文彈幕更加困難。

        2.3 省略與緊縮現象

        2.3.1 漢語意合英語形合

        意合性是漢語有別于其他語言的一個顯著特點,所謂的“意合”,指的是語言單位與語言單位組合時語義上的聯(lián)系。由于漢語是缺乏形態(tài)變化的語言,語言單位之間的組合注重的是語義之間的關系,所以相關語言成分之間往往包含著較復雜的語義關系,但在結構關系上并沒有標志顯示。句子或詞語之間沒有連接詞,句子中沒有介詞和介詞短語,句子缺失主語,語義是依靠詞語之間的邏輯關系來顯現的,凸顯出意合特征,這也符合了漢語的意合特征。

        漢語的意合主要靠意義來組合,而不像英語那樣主要靠形合手段來組合。漢語句子中省略和緊縮的現象非常常見,省略主謂語、省略賓語、省略代詞等,句內沒有語音停頓,各部分緊密結合,以邏輯表達條件、因果、轉折、讓步等語義關系。對讀者來說這些縮略不會影響文章理解,往往通過上下文就能揣測部分省略。但很講究形式的英語句子中,主謂部分是必不可少的,而且句式結構的附屬部分和修飾部分英文比中文復雜得多;動詞不定式、介賓短語、主從關系、時態(tài)等,這些都是英文里重的要部分,不能輕易省略。

        我們看彈幕網站的彈幕不是一條一條看,而是一片一片掃讀的,提取出關鍵字詞就能直覺反映出這一片彈幕是在說什么。當我們掃讀一片一片的英文彈幕時,雖然也能提取出關鍵字,但是關鍵字關聯(lián)復雜,不能瞬間明白這一堆英文彈幕的意義到底是什么。

        2.3.2 彈幕中的緊縮現象

        在彈幕中詞匯和短語的省略緊縮現象更加頻繁,彈幕因其及時性強、停留時間短暫等特點催生了大量網絡縮略詞及縮略短語。中國目前最大的彈幕網站嗶哩嗶哩在2020年發(fā)布的年度最熱5 條彈幕中,除了“武漢加油”,其余4 條彈幕“有內味了”“雙廚狂喜”“禁止套娃”和“爺青回”都有語言的緊縮現象。比如占據榜首的“爺青回”就是“爺的青春又回來了”的縮寫。隨著彈幕文化的流行,一種新的壓縮詞也大量出現,將每個字的拼音首字母組合代表一個詞或一個短語,如“yyds(永遠的神)、nsdd(你說的對)、xswl(笑死我了)、zqsg(真情實感)”等,這些縮略詞也向來是彈幕中出現的高頻詞匯,它們不僅能快速發(fā)送到顯示屏上,也讓觀眾能在短時間內更快速地瀏覽大量彈幕。

        其實在英語中也存在這樣的現象,為了有效溝通,西方人在聊天中也會使用縮寫、替代等形式;如“GOAT(the greatest of all time)、AFAIK(as far as Iknow)、BFF(best friends forever)”等。但中英文中這種形式類似的“緊縮”其時間成本和效率又如何呢,如“yyds(永遠的神)”一詞成為共識性的縮寫是需要一段時間的,是否漢語中的緊縮結構會更有利于理解,而英文縮寫需要更多壓縮和解壓的過程呢?

        哈佛大學的F.Behr[9-12]等人運用PPMD、PPMZ、BZIP2、GZIP 等算法壓縮了不同語言版本的圣經,對比壓縮前后文件的大小與英文文件的比例。去除文本中的冗余信息,用接近最優(yōu)編碼方式對文件進行編碼,理想條件下若翻譯壓縮等過程沒有信息損失,壓縮后其他語言文件大小與英文文件大小的比率值應該等于1。通過實驗,得到結果如表2 所示。

        表2 各種語言版本的圣經壓縮后比率

        通過對比發(fā)現,4 種算法下得到的中英文壓縮后比率都是最小的,雖然這個實驗有所局限,但是也能提供一些證據;在英語、西班牙語、法語等八大主流語言中,中文是壓縮效率最低的語言。

        3 結語

        如今很多人喜歡看劇、看視頻不僅是為了內容,而是喜歡參與彈幕討論,但在歐美國家彈幕卻始終流行不起來。在地理環(huán)境、歷史、民族、文化背景等因素的影響下,中西方語言有很多顯著的差異,不同的思維方式也體現在了語言模式中。中英文不同的句子結構和表現方式也反映了相異的文化內涵,體現了不同民族的價值觀念:漢民族則有著重形象、重悟性的思維模式,在語言上注重隱性連貫,邏輯事理,言簡意賅。英語民族有著重理性、重分析、重形式的思維習慣,在語言上以形顯意,注重嚴謹規(guī)范,形式分析。英文文字的特征局限了其在彈幕文化中的表現力,也因此彈幕文化難以在歐美國家中流行起來。

        猜你喜歡
        英文文本語言
        語言是刀
        文苑(2020年4期)2020-05-30 12:35:30
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        讓語言描寫搖曳多姿
        英文摘要
        鄱陽湖學刊(2016年6期)2017-01-16 13:05:41
        英文摘要
        累積動態(tài)分析下的同聲傳譯語言壓縮
        英文摘要
        財經(2016年19期)2016-08-11 08:17:03
        英文摘要
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
        亚洲色www无码| 亚洲av日韩av天堂一区二区三区 | 久久AV中文综合一区二区| 综合久久青青草免费观看视频| 久久本道久久综合伊人| 久久久免费精品re6| 香蕉久久人人97超碰caoproen| 欧美中出在线| 亚洲国产av一区二区不卡| 成人免费无码大片a毛片抽搐色欲 日本动漫瀑乳h动漫啪啪免费 | 国产精品自在拍在线播放| 中文字幕日韩人妻在线| 国产在线观看视频一区二区三区| 女女女女女裸体处开bbb| 999久久久精品国产消防器材| 日本韩国黄色三级三级| 丰满的少妇av一区二区三区| 国产成人精品一区二区三区视频| 亚洲人成网站在线播放观看| 亚洲成人色黄网站久久| 亚洲 国产 韩国 欧美 在线| 国产一区三区二区视频在线观看| 精品人妻一区二区三区四区在线| 成人看片黄a免费看那个网址| 国产精品久久久久亚洲| 亚洲中文字幕第15页| 精品国产性色无码av网站| 国内免费AV网站在线观看| 国产目拍亚洲精品二区| а天堂中文地址在线| 男女啪啪免费体验区| 在线观看精品视频一区二区三区| 成人免费av高清在线| 亚洲av永久无码精品网站在线观看 | 99国产精品欲av麻豆在线观看| 亚洲夫妻性生活免费视频| 特级婬片国产高清视频| 成人综合亚洲欧美一区h| 国产自拍在线视频91| 米奇777四色精品人人爽| 在线观看日本一区二区|