王 虹
(1.中國刑事警察學院 文件檢驗技術系 文件檢驗鑒定公安部重點實驗室,遼寧 沈陽110035;2.東北大學自然語言處理實驗室,遼寧 沈陽110004)
言語識別是刑事科學技術的分支學科之一,是“運用語言學和偵查學以及相關學科的知識、原理和方法,研究各類群體言語人的言語特點和規(guī)律,分析、鑒別各類文件物證的言語特征,并以此判斷涉案言語人的社會群體屬性,為案件偵查確定方向、范圍的一種專門技術手段”[1]。地域性言語識別是言語識別技術的重要組成部分,是通過分析言語材料的方言特點、地域性文字特點和地域性言語內(nèi)容特點來判斷言語人的所在地區(qū)或籍貫,為偵破案件確定方向和范圍的一種刑事科學技術手段。
漢語方言特點具有明顯的地域?qū)傩?,是進行地域性言語識別的主要依據(jù)之一。因此,從事案件言語識別教學、研究、辦案工作的刑事科學技術人員也一直致力于漢語方言的學習、調(diào)查與研究。
近年來,隨著普通話的推廣、市場經(jīng)濟的發(fā)展、各地交際的日漸頻繁,犯罪分子作案時多故意使用普通話發(fā)音,這給我們利用犯罪分子的語音材料來分析其籍貫等屬性帶來了很大的困難。因此,我們開始研究利用漢語“普通話”進行地域性言語識別。拙文《利用漢語“普通話”語聲進行案件地域性言語識別的可行性研究》[2]從理論上論證了這一技術的可行性。隨后,我們嚴格遵照中國社會科學院李愛軍教授作為國家863項目研究成果提出的“語音庫制作過程和一般規(guī)范”,建立了《面向案件言語識別應用的漢語“普通話”語料庫》,包含15個方言點150個發(fā)音人的22350個語音文件;并研發(fā)了《漢語“普通話”語音數(shù)據(jù)庫查詢檢索系統(tǒng)》,可按方言點、發(fā)音人年齡段、職業(yè)、文化、性別進行查詢檢索,并進行播放演示,亦可將查詢結果導出、打印。在此基礎上,我們展開了相應的漢語“普通話”地域性差別研究,希望能夠從理論和實驗上探討從有限的以普通話發(fā)音的語音材料中提取出更多地域性特征的途徑和方法,更有效為案件分析定向服務。
通過對語音數(shù)據(jù)庫中語料的初步分析,我們發(fā)現(xiàn)方言區(qū)的人在說普通話時會不同程度的出現(xiàn)其母語方言的固有特點,大體上是年輕人、知識分子、市區(qū)人方言特點出現(xiàn)得少一些,老年人、與外界很少交往的人、郊區(qū)人方言特點出現(xiàn)得多一些。這些方言特點主要表現(xiàn)在語音、詞匯、語法等各個層面。
語音是語言的外殼,方言區(qū)的人在說普通話時,往往最容易在語音上露出馬腳。有方言特點的普通話在語音上主要表現(xiàn)為聲母、韻母、聲調(diào)、重音等方面的特征。
1.1.1 聲母特征
漢語普通話有22個聲母(包括零聲母),多數(shù)方言音系的聲母與普通話有差別,這就導致方言區(qū)的人在說普通話時會不同程度的保留其原有的方言聲母 特征。 通過分析,我們發(fā)現(xiàn) z[ts]、c[ts‘]、s[s]與zh[t?]、ch[t?‘]、sh[?]相混、[n]和 [l]不分、合口呼零聲母音節(jié)讀[v]聲母、開口呼零聲母讀[n]或[?]聲母、送氣聲母與不送氣聲母常相混、h[x]、f[f]相混等是方言區(qū)人講普通話時常出現(xiàn)的聲母特征。
例如:西南官話區(qū)的成都人說普通話時,常把翹舌音讀成平舌音,如把“晝”讀作[tsou];把 h[x]讀作f[f],如“懷”讀[fai]、“皇”讀[fa?]等。
又如:吳語區(qū)上海人說普通話時不能很好地區(qū)分翹舌聲母與平舌聲母,因為上海話的聲母系統(tǒng)中沒有翹舌聲母,不存在平翹舌的音位對立。[?]聲母常被錯發(fā)成[l]聲母,與上海話自身的音系中不存在這個音有關。 [n]聲母和[l]也存在一定的混淆,常把[n]發(fā)成[l]。同時我們發(fā)現(xiàn):由于受其自身音系系統(tǒng)的影響,上海人在說普通話時,往往會將某些音位混淆,造成發(fā)音錯誤,且其聲母較之韻母更容易發(fā)生音變。
粵語區(qū)廣州人說普通話常把[t?]組讀成[ts]組或[t?]組,如把“知道”的“知”讀作[ts?]或[t?i];常把 f[f]讀作 h[x],如把“飛機”的“飛”讀作[xuei]等。
1.1.2 韻母特征
漢語普通話有39個韻母,多數(shù)方言音系的韻母與普通話有差別,這就導致方言區(qū)的人在說普通話時會不同程度的保留其原有的方言韻母特征。通過分析,我們發(fā)現(xiàn)[y]和[i]的混淆、前后鼻音不分、復元音韻母的互混等是方言區(qū)人講普通話時常出現(xiàn)的韻母特征。
例如:吳語區(qū)上海人說普通話時經(jīng)?;煜踶]和[i],將[y]發(fā)成[i]的情況較多。前后鼻音不分的現(xiàn)象更普遍,很多普通話比較好的上海人都會把[??]和[i?]讀成[?n]和[in]。
又如:粵語區(qū)廣州人說普通話分不清前后鼻音,常把前鼻音讀作后鼻音,如把“沾”讀作[t?ɑ?],“憤”讀作[f??];常出現(xiàn)復元音韻母的互混現(xiàn)象,如混淆[au]和[ou],把“晝”讀作[t?au]。
西南官話區(qū)成都人說普通話除了常把后鼻音讀作前鼻音外,還常將[ye]、[uo]、[?]與[o]相混,如把“靴”、 “妥”、“勒”等字的韻母均讀作[o];將合口呼韻母讀作開口呼,如把“巒”讀作[lan];將齊齒呼韻母讀作撮口呼,如把“先”讀作[?yεn]。
1.1.3 聲調(diào)特征
聲調(diào)特征是語音特征的一個重要方面,很多方言區(qū)的人可以把聲母、韻母說得很接近標準普通話,但往往會在一兩個聲調(diào)的調(diào)型或調(diào)值上露出方言味兒。
例如:東北官話區(qū)的沈陽人說普通話,尤其是年輕人說普通話時聲母、韻母發(fā)音都很接近標準普通話,但聲調(diào)卻與標準普通話不同。沈陽人說普通話時聲調(diào)的調(diào)值分別為陰平44、陽平34、上聲213、去聲41,明顯低于普通話陰平調(diào)讀55,陽平讀35,上聲讀214,去聲讀51的調(diào)值。
又如:粵語區(qū)廣州人說普通話時聲調(diào)的調(diào)值分別為陰平44、陽平24、上聲212、去聲51,不同于標準普通話的調(diào)值。由于廣州話中沒有上聲曲折調(diào),年齡大一點的廣州人讀不好曲折調(diào),年輕人則基本能念好,只是調(diào)值上有些差別。
中原官話區(qū)鄭州人普通話中的降調(diào)就比較多,常把“河南”[x?35nan35]讀作[x?41nan41]。
1.1.4 重音特征
重音是語義上的著重、強調(diào)和聚焦的一種語音手段,是各個語言中必不可少的韻律特征。漢語作為一種聲調(diào)語言,雖然重音對漢語來說,不存在區(qū)別意義的作用,但是整個語句語音的輕重配置會使得語言中產(chǎn)生語音上的抑揚頓挫。而這種抑揚頓挫也是每一種語言生動表達必不可少的方式。因此,重音在漢語中具有極其重要的作用。重音在各個語言及方言中的表現(xiàn)不盡相同。
例如:吳語區(qū)上海普通話和標準普通話的詞重音表現(xiàn)不同。首先,在詞重音的分布模式上有著一定的差異。兩者詞重音在調(diào)類中的分布大概相似,都是去聲最易重讀,上聲最不易重讀,其次依次為陰平和陽平。但是上海普通話去聲重讀趨勢比普通話去聲的重讀趨勢強一點。在詞重音位置分布上,上海普通話比普通話更不易于前字重讀。其次,從詞重音的聲學表現(xiàn)上看,兩者在音高和時長等方面存在差異。在音高上,上海普通話詞重音的音階比普通話的普遍要高,普通話的調(diào)域比上海普通話的調(diào)域普遍要寬,且兩者音高最大值、最小值及均值與地區(qū)這一因素相關顯著。在時長上,上海普通話陰平、陽平和去聲詞重音的時長要短些,而其上聲詞重音的時長比普通話長些。同樣,兩者在詞重音時長上的差異與地區(qū)這一因素相關顯著。從這里可以看出上海普通話和普通話兩者在實現(xiàn)重讀的方式上不盡相同。上海人說普通話音階比北京人說普通話高些,音域卻小些;時長由于上海方言的影響,不同聲調(diào)有不同的差異;在沒有音高降升曲折的陰平、陽平和去聲中,上海普通話詞重音時長沒有普通話長;在有降升曲折的上聲這種聲調(diào)中,上海人卻因為自身方言中沒有降升調(diào)而拉長了時長,使得上海普通話上聲詞重音時長長于普通話。
又如:粵語區(qū)廣州普通話和標準普通話相比,在單念的二字詞中,標準普通話傾向于前重,而廣州普通話傾向于后重。從重音的聲學表現(xiàn)看,廣州普通話比標準普通話更傾向于拖音。從語流中的兩音節(jié)重音分部來看,廣州普通話和標準普通話都傾向于前重,但是普通話的前重傾向更加明顯,從重音的聲學表現(xiàn)看,標準普通話比廣州普通話更傾向于拖音。
1.1.5 兒化特征
兒化指某些音節(jié)和韻母er的結合變成卷舌韻母的讀音。兒化韻母里的“兒”不是一個單獨的音節(jié),只是在一個音節(jié)末尾音上附加的卷舌音。普通話中的兒化有區(qū)別詞性、詞義及帶有不同感情色彩的作用。而南方各大方言中閩、客、贛、粵、徽、平話諸方言都沒有兒化音現(xiàn)象。因此導致不同地方的人說普通話時在兒化上的表現(xiàn)有很大的差別。
例如:北京官話區(qū)的北京人說普通話時兒化音特別多,運用廣泛,這是北京普通話的最大特點。普通話雖然以北京語音為標準音,但并不是北京話任何一個語音成分都是標準音,都成為普通話成分。北京話往往濫用兒化音,只有約定俗成的才能進入普通話。
又如:粵語區(qū)的廣州人說普通話時總使人感覺生硬、急促,沒有高低起伏、抑揚頓挫,意義表達不夠明確,感情表達也不夠準確。所謂“廣式普通話”,除了發(fā)音時聲母、韻母不準確,沒有卷舌音外,就是不注意兒化和輕聲。廣州普通話往往把“兒”作為一個單獨的音節(jié)念,把“兒”和前面的音節(jié)割裂開來,而且念“兒”不卷舌,把“兒[]”念成“鵝[?]”。
1.1.6 輕聲特征
輕聲指對某個音節(jié)的輕短讀音。漢語的每個音節(jié)都有一定的聲調(diào)。有的音節(jié)在一定場合里失去原調(diào),變成一種既短又輕的調(diào)子,就叫輕聲。一般來說,我國北方的各大方言中輕聲現(xiàn)象較普遍,而南方各大方言中只有吳、閩有輕聲現(xiàn)象。因此導致不同方言區(qū)的人說普通話時在輕聲上的表現(xiàn)不同。
例如:北京官話區(qū)的北京人、東北官話區(qū)的沈陽人等都能很好的掌握和運用輕聲,尤其是在口語中雙音節(jié)詞的第二個音節(jié)經(jīng)常讀作輕聲,如“分析”、“緊張”、“快樂”、“窗戶”、“晚上”等。
而粵語區(qū)的廣州人則由于粵語中沒有輕聲現(xiàn)象而在講普通話時發(fā)不好輕聲音節(jié),經(jīng)常是將兩個音節(jié)都重讀。
詞匯是人的言語習慣中最不穩(wěn)定的特征,方言和普通話相比,有大量詞匯是相同的,但也有不少有明顯的區(qū)別。一般地說,政治、經(jīng)濟、文化等方面的詞彼此相同的較多,但在日常生活方面所使用的詞彼此有較大的差別。方言區(qū)的人在說普通話時,往往最容易出現(xiàn)用方言詞匯代替普通話詞匯的現(xiàn)象。
例如:粵方言區(qū)廣州人說普通話時會用“好彩”代替“幸運”,用“搞掂”代替“做好”,用“頂不順”代替“受不了”,用“利事”代替“紅包”等等。以至于有些詞已經(jīng)超出粵方言區(qū)人使用的范疇,開始向普通話進軍,如“巴士”(公共汽車)、“鐳射”(激光)、“朱古力”(巧克力)、“靚”(漂亮)、“寫字樓”(公司辦公室)等。
又如:東北官話區(qū)的沈陽人說普通話中常出現(xiàn)這樣的句子:“這屋子里可真埋汰(臟)”?!澳莻€人怎么傻啦吧唧的(傻),饅頭掉地上了還撿起來吃?!薄疤哿耍屛页榭脽煟ǔ橹煟┬獣海ㄐ菹⒁粫海?。這也是用方言詞匯代替普通話詞匯的典型特征。
一般情況下,北方各方言區(qū)的人在說普通話時出現(xiàn)的語法特征較少,因為北方主要是官話區(qū)和晉語區(qū),其方言語法與普通話的語法差別不大。南方各大方言區(qū)的人說普通話時出現(xiàn)的語法特征能夠多些,這也會因普通話水平的不同而有不同的表現(xiàn)。
例如:粵語區(qū)廣州人說普通話會把“我沒膽量”說成“我不夠膽”,把“說普通話”說成“講普通話”,把“我先走”說成“我走先”,把“一百五十”說成“百五”,把“給他一支筆”說成“給支筆他”等等。
閩語區(qū)福州人說普通話時會把 “妹妹來了嗎”說成“妹妹有沒有來”,把“做得完”說成“會做得完”,把“把書給我”說成“書拿給我”等等。
2.1.1 單個價值較低的特征
平翹舌不分、[n]和[l]不分、[x]和[f]相混等聲母特征,后鼻韻母[i?]、[??]與前鼻韻母[in]、[?n]相混,韻頭[u]、[i]脫落等韻母特征是方言區(qū)人說普通話時常出現(xiàn)的語音特征,出現(xiàn)頻率極高。但是這些特征在不同方言區(qū)的人中普遍存在,就單個特征而言,價值不是很高,須在多個特征印證中綜合運用,互相補足,可用于綜合評斷。
某些詞匯特征,如“巴士”、“朱古力”、“寫字樓”等由于廣播電視的影響,也被很多不同方言區(qū)的人使用,其單個特征價值也不是很高,須結合其他特征使用,綜合評斷。
2.1.2 單個價值較高的特征
普通話一些零聲母讀成方音的輔音聲母字、送氣聲母與不送氣聲母常相反等聲母特征,[ye]、[uo]、[?]與[o]相混的韻母特征等是在某個方言普通話中較為突出的特點,一般出現(xiàn)率也很高。這些特征對于幫助我們確定發(fā)音人地域?qū)傩杂幸欢ǖ膬r值。但我們不能只依據(jù)這類特征作出判斷,仍然要與其他特征結合起來進行綜合評斷。
2.1.3 單個價值高的特征
聲調(diào)特征、輕聲特征、兒化特征、某些特殊的詞匯特征和方言語法特征等是最不容易被注意到又最難以改變的特征,就好像筆跡檢驗中的筆順特征,對于確定發(fā)音人的方言歸屬有著十分重要的作用。比較而言,是價值最高的特征。
針對上文的特征價值分析,我們提出了利用漢語“普通話”語聲進行案件地域性言語識別方法如下:2.2.1以調(diào)值特征為中心,聲韻特征相結合
聲調(diào)是方言區(qū)人學習普通話時容易忽略的地方,它的受關注度要明顯低于聲母、韻母和詞匯。由于漢語各方言之間、方言與普通話之間聲調(diào)差異較大,再加上,方言區(qū)人學習普通話聲調(diào)時往往容易滿足于接近就好的程度,因此導致很多方言區(qū)人說普通話時聲調(diào)都是不標準的。這樣就使調(diào)值的系統(tǒng)性差異特征成為我們形成判斷結論的一個可靠依據(jù),我們在識別時一定要格外重視,緊緊抓住。要通過仔細辨聽,確認發(fā)音人的方言味普通話實際調(diào)值的系統(tǒng)性特點,得出判斷結論,切忌只憑其中的一個聲調(diào)調(diào)值上的相似形成判斷。
同時,我們也要注意充分挖掘其他的聲韻特征,爭取描繪出發(fā)音人的語音系統(tǒng)輪廓,與該方言區(qū)語音特點相互印證,對比符合點和差異點,從而形成較為準確的判斷。
2.2.2 利用各類特征的總和進行綜合評斷
如上文特征價值分析中所述,方言味普通話的特征有的分布地域較窄,特殊性較強,可以幫助我們初步判斷出發(fā)音人的方言區(qū)屬,但這樣的實際案例并不多。更多的特征分布比較廣泛,帶有一定的普遍性。據(jù)此很難把發(fā)音人的所在地區(qū)、籍貫確定在一個比較準確的范圍內(nèi)。如發(fā)音人“陳”與“程”不分,反映[?n]與[??]不分的方音特征,這一特征在吳語、湘語、客家話、晉語、西南官話、江淮官話、蘭銀官話等方言區(qū)都有分布。這樣我們只有根據(jù)言語特征的總和表現(xiàn)出的總體特殊性才能準確的判斷發(fā)音人所說的是哪種方言味的普通話。同時我們還要注意,在識別中要排除言語的變化、偽裝和假象等情況的干擾。
2009年9月6日北京市某公安機關送來了綁架案中綁匪與被綁架人老伴通話的語聲錄音,要求通過對語聲的分析,判斷綁匪的籍貫。綁匪語聲為帶有方言味的普通話。我們將綁匪語聲輸入到了VS3.0語音工作站,從中分別切分出短語、詞、音節(jié)、音素等進行了仔細反復的辨聽和分析,選取出地域性言語特征如下:
(1)四聲聲調(diào)普遍偏低,陰平聲調(diào)調(diào)值在44或更低;
(2)“鄭”[t???]、“這”[t??]、“知”[t??]、“轉(zhuǎn)”[t?uan]、“承”[t?‘??]、“是”[??]等字讀標準的卷舌音;
(3)“讓”、“人”、“任”等字讀標準的“[?]”聲母;(4)用詞和語調(diào)上,與東北官話接近。
綜合以上特征,我們又組織了來自相關地區(qū)的學生進行了辨聽,最后傾向認為綁匪為東北官話區(qū)黑松片齊齊哈爾一帶人。
2010年3月8日,沈陽市某公安機關送來了兩份某殺人案中10086服務熱線錄制的嫌疑人電話錄音,請求幫助分析撥打電話的人是不是沈陽市郊區(qū)平羅鎮(zhèn)本地人,如果不是,其籍貫是哪里。
利用VS-99語音工作站,我們對兩份檢材進行了反復的審聽。發(fā)現(xiàn)兩份檢材均為言語人撥打10086服務熱線給手機報停機的電話錄音,時長都很短,檢材一時長為40秒 67,檢材二時長為46秒83。且兩份檢材錄音中以10086服務熱線接線員的語音居多,被檢言語人較長的成句語聲總共只有三句,其余均為“嗯,有”、“好的”、“對”等簡單答話,且均為帶有方言味的普通話發(fā)音,檢驗難度較高。
經(jīng)過反復審聽,我們找到了被檢言語人的如下方言語音、方言詞語特征,未發(fā)現(xiàn)有特殊的方言語法特征:
(1)“我想”一詞中“我”發(fā)音為[u?],不是普通話讀音[uo]。
(2)“辦理”、“停機”、“暫時,暫停業(yè)務”等詞中“辦”、“?!?、“暫”三個字的讀音分別為[pan]、[ti?]、[tsan],前后鼻音分得很清楚。
(3)“那個”、“辦理”等詞中“那”發(fā)音為[nei],“理”發(fā)音為[li],聲母 n、l分得很清楚。
(4)“時候”、“暫時,暫停業(yè)務”等詞中“時”發(fā)音為[??],“暫”發(fā)音為[tsan],平卷舌分得很清楚。
(5)使用疑問語氣詞“嗎”,如:“行嗎?”
(6)表示肯定的回答用:“恩,有”、“好的”。
隨后我們又帶著錄音筆到重點懷疑地區(qū)平羅鎮(zhèn)實地調(diào)查了平羅人說話的言語特點,得出結論:被檢言語人不是土生土長的平羅本地人;應為東北官話區(qū)哈阜片人。建議重點偵查在平羅鎮(zhèn)居住或活動的東北官話區(qū)哈阜片人。
不久后此案得以偵破,抓獲了犯罪嫌疑人侯某,內(nèi)蒙區(qū)通遼市科爾沁區(qū)人(正屬于東北官話區(qū)哈阜片),在平羅鎮(zhèn)某飯店打工。
從地域方言的影響上來看,帶方言味普通話就像豐富復雜的方言一樣色彩紛呈,利用“普通話”語聲進行言語人地域性識別是一條可行的途經(jīng)。只要檢材中有較好的特征表現(xiàn),而我們又能夠認真的去分析和判斷,就一定能在“普通話”中發(fā)現(xiàn)言語人的地域性歸屬。
參考文獻:
[1]岳俊發(fā).言語識別與鑒定[M].北京:中國人民公安大學出版社,2007:3.
[2]王虹,華凡倩,于天昱.利用漢語“普通話”語聲進行案件地域性言語識別的可行性研究[J].中國刑事警察學院學報,2006,(2):42-43.
[3]傅靈.方言與普通話的接觸研究—以長沙、上海、武漢為背景[D].蘇州大學,2010:5.
[4]吳瓊.徐州口音普通話初探[D].華中師范大學大學,2004.
[5]高山.“武漢普通話”語音考查[D].華中師范大學大學,2009.
[6]陳蒙.“濟南普通話”語音研究[D].山東大學,2009.
[7]呂文蓓.吳語、南京話和普通話的接觸研究[D].蘇州大學,2010.
[8]張瀛月.“地方普通話”文獻綜述[J].文教資料,2012,(5):27-28.