亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        《說文解字》釋義元語言研究技術(shù)路線

        2013-12-31 00:00:00喬俊杰
        數(shù)字化用戶 2013年17期

        【摘 要】在漢語元語言系統(tǒng)研究的理論和方法的指導(dǎo)下,設(shè)計科學(xué)的思路、借助科學(xué)先進的方法,基于《說文解字》電子文本庫語料庫,建構(gòu)古代漢語釋義元語言系統(tǒng),進一步展開現(xiàn)漢元語言系統(tǒng)與古漢元語言系統(tǒng)的對比研究,以探索漢人的元認知特征。

        【關(guān)鍵詞】說文解字 釋義元語言 發(fā)凡

        語言學(xué)的元語言研究,是語義學(xué)、詞匯學(xué)、詞典學(xué)、句法學(xué)的國際性前沿課題。作為與“對象語言”相對的“工具語言”,元語言是人類認知經(jīng)驗中的深層單元?!墩f文解字》是我國第一部分析字形、考究古音、總匯古義的文字學(xué)專著,保存了上古甚至原始的文字釋義,是探尋古代詞匯、詞源義的的橋梁和鑰匙,是研究漢語語義和漢人認知特征的本原性基礎(chǔ)。

        該課題就是在漢語元語言系統(tǒng)研究理論和方法的指導(dǎo)下,提取詞元、進行分詞并采取合適的義場予以語義分類、設(shè)計合理的方案予以驗證優(yōu)化,進而研制《說文》釋義基元詞表,建構(gòu)《說文解字》釋義元語言系統(tǒng),以探索漢人的元認知特征;觀照漢民族的文化鏡象。

        《說文解字》的傳本大多是宋刻本(毛晉刻本)?,F(xiàn)在最通行的是宋·徐弦的《說文解字》(通稱大徐本)和清·段玉裁的《說文解字注》。本研究依據(jù)的是“大徐本”(中華書局2005年影印本)。

        《說文》釋義基元的研究方法,主要采取宏觀理論和微觀刻畫、人工內(nèi)省和機器輔助、定性分析與定量分析、歸納分析與演繹分析、比對分析和優(yōu)選分析相結(jié)合的方法。

        本課題的技術(shù)路線大致如下:

        一、建立《說文》語料庫及其檢索系統(tǒng)(可檢索釋義詞)

        (一)建立《說文》語料庫所需軟件

        1.安裝大容量繁體字庫;經(jīng)過多方搜尋,最終選定了“國際標準超大字符集字體支持包:Unifonts 5.4”。另外,安裝Microsoft Taiwan Corp新細明體PmingLiu,輔助。

        2.安裝大字庫輸入法:

        首先,安裝海峰五筆,以便輸入快捷。該輸入法,全面支持64位系統(tǒng),收錄了UNICODE超大字集詞匯,基本滿足了輸入需要。

        又安裝了紫光華宇拼音輸入法V6,該輸入法是一個面向漢字輸入的工具,提供了不完整拼音方式和模糊拼音方式輸入漢字和詞的功能,輸入方便。

        (二)建立《說文》語料庫的原則

        據(jù)《說文·序》,《說文》共有注文133440字。古代漢語單音節(jié)為主,復(fù)音詞為數(shù)寥寥,《說文》釋義元語言研究的基礎(chǔ)是建立《說文》語料庫。

        建立《說文》釋義元語言語料庫文件文本,僅指許慎《說文解字》正文,電子文本依大徐本《說文解字》,只錄《說文解字》“正文”部分,即,只錄《說文解字》“正文字頭及其釋文文本”部分,同時,把明顯易辨的復(fù)音詞另外提取出來,分別建表:

        人名、地名、文獻名專有名詞復(fù)音詞集;連綿詞詞集;疊音詞、擬聲詞詞集;訓(xùn)詁術(shù)語詞集;說文復(fù)音詞。

        剔除與該課題研究無關(guān)的下列內(nèi)容:徐弦增加的標目字、反切字、注釋文及405新附字;徐鍇、李陽冰等人的注釋;許慎釋文中1163 “重文”及其相應(yīng)的例釋;標點;《說文·序》。

        之后,輸錄《說文解字》正文文本。

        二、說文釋義元語言復(fù)音詞的判定標準

        我們首先借助賀勝老師的分詞工具“CIPP_JS分詞檢索” 對說文釋義元語言電子文本進行分詞,然后予以校對。校對中復(fù)音詞斷定的標準如下:

        (一)連綿詞肯定是復(fù)音詞,如“徬徨”,系統(tǒng)自動分為倆詞“徬” “徨”,我們予以歸并;“璆 珌”同理。

        (二)復(fù)音術(shù)語、專名一概是復(fù)音詞,如“虞 書”“漢 律”“司 命”“犧 牲”“讀 若”“春秋 傳”“省 聲”“雝 州”。

        值得注意的是:雙音節(jié)人名,系統(tǒng)誤為3音節(jié);古代單音節(jié)詞占優(yōu)勢,機器以現(xiàn)代漢語雙音節(jié)特點析詞多有不當,我們應(yīng)認真校對視情況或分或合。

        (三)訓(xùn)詁術(shù)語:解釋部首的“凡”、“之”、“屬”、“皆”,解釋意義“從”,解釋讀音“聲”,皆單音節(jié)詞?!白x”“與”“同”不是“讀與 同” ?!霸弧薄霸啤蓖瑯幼鰡我艄?jié)處理。

        (四)前綴“所”并后成復(fù)音詞。助詞“者”、“也”、“之”、“其”“而”單音詞。

        (五)普通名詞與專名構(gòu)成復(fù)音詞,像“雝州”“淮水”。

        在語言科技中心賀勝老師的支持下,借助賀老師編的中文自動分詞全文檢索@統(tǒng)計工具(GBK版)軟件,把說文復(fù)音詞的 ·txt文本加掛系統(tǒng)中,擴充系統(tǒng)詞典。

        《說文》復(fù)音詞構(gòu)成舉例:

        人名:董仲舒、杜林、賈侍中、孔子、宋弘、王子蹻、尹彤、祖甲、王育、伯臩

        官稱:挏馬官、鹽官、工官、巫、司命、博士、司農(nóng)、六卿、太史卜、炎帝

        天文:玄枵、天體、白虎宿星、房星、大陰、春分、冬至、仲秋、螮蝀、太白

        地理:潁川縣、邵陵里、汝南、朝鮮、襄邑、發(fā)鳩山、宕渠、郣澥、酒泉、滎陽、中國

        動物:牂羊、虦貓、五技鼠、蝯蜼、犧豭、烏鰂、鯕魚、伯勞、牻牛、牦牛、六畜

        植物:莧菜、蘆菔、茱萸、枇杷、枸杞、黃華木、棠棣、梧桐木、枌榆、瑚蓮、艸苺

        器物、服飾:小巵、甌瓿、幬帳、屏風、系璧、規(guī)榘、兜鍪、方舟、舟輿、襐飾、襌被、禮巾、襜褕、衵服、畫袍、馬絆、蔥衡、枲織、桎梏

        文獻:禹貢、祕書、司馬法、史篇、逸國語、明堂月令、漢律、淮南傳、少儀、星經(jīng)

        訓(xùn)詁術(shù)語:古文、象形、重言、籀文、俗語、名爲、或從、亦聲、缺省、通用、讀與、愿詞、亟詞、曳詞、眾詞、詮詞、同義、驚聲、語已詞、出氣詞、上諱、狀如、復(fù)說

        擬聲詞:鍠鍠、所所、詽詽、鈴鈴、喤喤、謍謍、謷謷、鼘鼘、牄牄、獷獷、嘵嘵

        疊音詞:菶菶、枖枖、毛冄冄、伾伾俟俟、甤甤、怲怲、姕姕、炔炔、婓婓、戔戔

        聯(lián)綿詞:窈窕、玫瑰、瑯玕、饕飻、枎疏、窀穸、仳倠、襤褸、嵯峨、崝嶸、委隨

        其他:弦樂、律數(shù)、法度、顨卦、縮肭、疻痏、熱病、勞病、黃病、脈痬、小兒瘛瘲病、痛瘌、文章、經(jīng)典、負何、便利、儃何、譬諭、棽儷、佚民、叢生、竹刑、車笭、有瑲

        三、對文本進行預(yù)處理,提取釋義性語料:首先,刪除字頭;其次,把“釋義性語料文本”建成.txt文本;最后,對釋義性語料進行分詞

        四、對釋義性語料分詞文本進行統(tǒng)計詞頻,得出釋義用詞詞頻統(tǒng)計表(從高向低)

        五、對釋義性語料分詞文本進行統(tǒng)計詞頻,切出釋義用詞高頻詞表(2500)

        六、基于釋義用詞高頻詞表(2500)進行同義合并,得到釋義基元原始表

        七、依據(jù)釋義基元原始表進行《說文解字》內(nèi)部驗證,得到釋義基元驗證表

        八、依據(jù)釋義基元原始表進行外部外部驗證,得到釋義基元驗證表

        選取《說文》時代的辭書和其他經(jīng)典箋注進行釋義對比和驗證。其他經(jīng)典箋注,主要是說文時代的左傳鄭玄箋和毛詩傳,分別選取左傳鄭玄箋和毛詩傳中連續(xù)釋文(避免人為干預(yù))各二百條,文字總數(shù)各在3000字以內(nèi),建立小型釋義文本和基元詞表,然后比對《說文》釋義基元在箋傳中使用的頻率,以證釋義基元表的符合度、可信度。

        九、釋義基元的語義分類

        (一)訓(xùn)詁術(shù)語,如:釋義訓(xùn)詁術(shù)語,體現(xiàn)在以下幾方面:

        表形,形訓(xùn)(單訓(xùn)、互訓(xùn)):象形、象×形、表意“從×、從×省”、 篆文、籀文、古文;重文:小篆“或作×”、古文重文(古文作×,古文奇字作×)、籀文重文:籀文作×

        示義,義訓(xùn):方言、指事、通用、古者、凡……之屬皆從……、從……、或以爲、或從、曰(辨同義詞)、所以、者也

        表音,音訓(xùn)術(shù)語:×聲、×省聲、×亦聲(其中反切為徐弦所加,非《說文》所有,新附字同此)、讀若、讀與……同

        統(tǒng)訓(xùn)(綜合字詞的形音義、語法、修辭二個以上方面):上諱、闕、未詳、總言

        專名,如:人名、地名、職官、文獻名

        其他釋義詞,如:形容詞、動詞、動物、植物、天文數(shù)學(xué)醫(yī)學(xué)農(nóng)業(yè)科技術(shù)語。

        (二)對其他釋義詞進行語義再分類,如:名物詞分類:動物、植物、天文數(shù)學(xué)醫(yī)學(xué)農(nóng)業(yè)科技術(shù)語。

        (三)汰除同義和近義

        《說文》的同義詞,主要有六類:①最典型的是互訓(xùn)字;②說文》釋義本身所表明的同義詞;③方言詞一般也是同義詞;④古今詞:⑤聲訓(xùn)字中也有一些是同義詞:⑥《說文段注》中注明的“渾言/析言”詞、“義同/義近”詞,“音義同/音義近”詞,一般也是同義詞。

        《說文》釋義元語言中的同義詞,主要有二類:(一)《說文》釋義本身所表明的同義詞;(二)方言詞一般也是同義詞。汰除原則:低頻,不表音。如:

        《說文》釋義元語言中,恐懼,作為復(fù)音詞,不典型;“懼”比“恐7”出現(xiàn)頻率是高點,11次,但較“畏”少,而且三字均不表音,汰除,不影響訓(xùn)釋,保留高頻、表音的“畏”。

        《說文》是許慎一人勞動的成果,譴詞風格統(tǒng)一,不象后世詞典是集體智的結(jié)晶,風格不統(tǒng)一,同義詞多。

        (四)得出釋義用詞優(yōu)選清單,如:

        象形 152 0.0016224409

        竹 171 0.0018252460

        春秋 198 0.0021134428

        魚 201 0.0021454646

        其 201 0.0021454646

        說明:

        1.建立義場框架的原則:

        按字族關(guān)系系聯(lián)建立對比詞群,構(gòu)成一個同義義場;

        按語義搭配關(guān)系,找出義場中每個基元詞的區(qū)別特征(共同和相異),李葆嘉先生以為,依據(jù)常見語義關(guān)聯(lián),詞語之間的搭配關(guān)系可以劃分為四大類:

        (1)動作-對象:動作詞語具有[+使處置],對象詞語具有[+可處化];

        (2)主體-陳述:主體詞語具有[+可陳述],陳述詞語具有[+陳述性];

        (3)動作-補充:動作詞語具有[+可補充],補充詞語具有[+補充狀];

        (4)限定-主體:主體詞語具有[+可限定],限定詞語具有[+限定性]。

        對語義場內(nèi)的釋義基元進行義位分析,用二元偶分法予以描寫。

        2.建立義場框架的步驟:

        依據(jù)所要辨析基元的語素,列出包含這一語素的詞群——依據(jù)已有語言知識初步分類,將這些詞語歸納為不同義類——依據(jù)相關(guān)詞書釋義,深入考察這一語素古漢本義與說文時代用義,梳理本義和引申義(包括比喻義、假借義、感染義、訛變義)的演變線索,將義類以及相應(yīng)詞語按序排列——依據(jù)常見搭配對象,對義類中所包含的同形語素和異形語素歸納義征——依據(jù)能夠滿足需比對詞語間的區(qū)別為準,調(diào)整義征的提取量——在同形語素和異形語素各自辨析的基礎(chǔ)上,再歸納包含語素的基元詞之義征。

        3.研制釋義元語言基元表(2000詞)。

        十、《說文》釋義基元與現(xiàn)漢釋義基元的舉例比較,揭示釋義元語言的演變規(guī)律

        說文釋義元語言研究的技術(shù)路線圖

        《說文》釋義元語言的預(yù)期目標:1.《說文解字》釋義詞頻檢索系統(tǒng)(軟件);2. 《說文解字》釋義元語言基元詞表(軟件);3. 《〈說文解字〉釋義元語言研究》(專著)。

        探討《說文解字》釋義元語言基元系統(tǒng),就特定歷史時期(上古漢語)的釋義元語言研究以豐富一般的元語言研究理論,具有一定的學(xué)術(shù)創(chuàng)新價值。同時,該課題能夠為辭書釋義、詞匯語義系統(tǒng)描寫和語言信息處理提供應(yīng)用研究基礎(chǔ),為認知科學(xué)研究以及中國思想史研究提供深層依據(jù),又具有一定的應(yīng)用價值。

        參考文獻:

        [1]李葆嘉,漢語元語言系統(tǒng)研究的理論建構(gòu)及其應(yīng)用價值,南京師范大學(xué)學(xué)報,2002 (4)

        [2]李葆嘉.漢語的詞語搭配和義征的提取辨析.蘭州大學(xué)學(xué)報,2003,11(6)

        [3]安華林,現(xiàn)代漢語釋義元語言研究[M].北京:中國社會科學(xué)出版社,2005

        [4]班吉慶.建國50年來的《說文解字》研究[J].揚州大學(xué)學(xué)報,2000,09(5)

        作者簡介:

        喬俊杰(1965-)博士,河南工業(yè)大學(xué)教授,文化與傳播研究所所長,主要從事漢語言文字學(xué)和應(yīng)用語言學(xué)研究。

        基金項目:

        河南省哲學(xué)社會科學(xué)規(guī)劃項目(2010-BYY-003)、河南省高??萍紕?chuàng)新人才(人文社科)支持計劃資助(HASTIT)、河南省高等學(xué)校人文社會科學(xué)研究項目(2009-GH-031)、河南工業(yè)大學(xué)科研專項(09XZX002)

        青春草在线视频免费观看| 亚洲女同精品一区二区久久| 二区视频在线免费观看| 国产亚洲精品久久久闺蜜 | 国产亚洲精品第一综合麻豆| 成人精品国产亚洲欧洲| 日本三区在线观看视频| 久久精品国产亚洲av无码偷窥 | 亚洲av无码精品色午夜在线观看| 国产美女在线精品亚洲二区| 亚洲成人色黄网站久久| 亚洲精品视频在线一区二区| 99亚洲男女激情在线观看 | 成在线人免费无码高潮喷水| 久久精品一区二区熟女| 蜜桃一区二区三区| 国产精品多人P群无码| 99久久国产露脸精品竹菊传媒| 亚洲成在人线电影天堂色| 男女性生活视频免费网站| 亚洲av成人无码久久精品老人| 一本一道人人妻人人妻αv| 免费精品无码av片在线观看| a√无码在线观看| 蜜桃视频第一区免费观看| 成人午夜视频精品一区| 久久久久这里只有精品网| 国产一区不卡视频在线| 精品人妻一区二区三区久久| 精品午夜福利无人区乱码一区| 亚洲午夜久久久久中文字幕久| 国产午夜精品视频观看| 丰满少妇高潮惨叫久久久一| 久久精品re| av在线不卡一区二区三区| 亚洲av综合色区无码专区桃色| 亚洲精品久久久久中文字幕二区| 精品系列无码一区二区三区| a黄片在线视频免费播放| 国产女主播精品大秀系列| 伊香蕉大综综综合久久|