亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中國現(xiàn)代職業(yè)教育理論之概念的抽取研究

        2016-02-15 05:17:32良,梁
        職教通訊 2016年19期
        關鍵詞:術語規(guī)則概念

        王 良,梁 卿

        中國現(xiàn)代職業(yè)教育理論之概念的抽取研究

        王良,梁卿

        構建中國現(xiàn)代職業(yè)教育理論體系和概念體系的前提是確定中國現(xiàn)代職業(yè)教育理論的概念?;谛g語學理論和實踐,中國現(xiàn)代職業(yè)教育理論的概念獲取摒棄了傳統(tǒng)的純人工方式,而是通過計算機技術的運用從專業(yè)文獻中獲得候選術語集合,從候選術語中篩選得到最終術語,并進而確定作為中國現(xiàn)代職業(yè)教育理論概念體系構成要素的概念。

        現(xiàn)代職業(yè)教育理論;概念;術語

        概念體系就是“根據(jù)概念間相互關系建立的結構化的概念的集合?!保?]根據(jù)這一界定,概念是構成概念體系的要素。因此,構建概念體系首先就需要識別并確定組成體系的概念。中國現(xiàn)代職業(yè)教育理論概念體系的建構亦不例外。但問題也隨之而來,即如何才能識別并確定中國現(xiàn)代職業(yè)教育理論的概念呢?傳統(tǒng)上,一般都是由專業(yè)領域的專家學者組成團隊,采取人工的方式從專業(yè)文獻中識別并收集概念。這種方式的典型代表就是各種專業(yè)詞典的編纂。在人工方式中,概念的識別和收集是由專家學者集體完成的,因而具有很強的可靠性。但這種方式也具有明顯的缺陷,即費時費力,效率低下。這一缺陷的進一步后果是,新出現(xiàn)的概念難以得到及時的識別和收集。如果采用這種方法收集中國現(xiàn)代職業(yè)教育理論的概念,并進而構建概念體系,那么,不僅概念的收錄工作非常復雜,而且即使概念體系建構起來,其更新也將頗為緩慢。因此,從中國現(xiàn)代職業(yè)教育理論概念體系本身的發(fā)展來講,需要找到一個新的獲取概念的方法。

        一、理論基礎

        我國國家標準《術語工作:原則與方法》(GB/ T 10112-1999)指出,概念是人們根據(jù)客體(包括客觀存在且可感知的事物和想象產(chǎn)生的事物)的“特性概括而得到的心理構想?!薄霸谝粋€知識領域中,概念用定義描述,被賦予約定的指稱(即術語)?!保?]國家標準的這些論述清晰地建構了一個“客體—概念—術語”的理論框架。根據(jù)這一框架,人們先是通過感官的觀察和大腦的抽象,揭示客體的特征,并以此為依據(jù)對客體進行概括和分類,形成特定的心理構想,即概念。這是一個概念化的過程。作為一種心理構想,只有當概念能夠被清晰地“說”出來的時候,才意味著概念的真正形成。因此,在概念化過程之后還有一個指稱化的過程,即使用特定語詞來代表或指稱已經(jīng)形成的概念。在這里,特定的語詞就是術語。顯然,客體先于概念,概念先于術語。

        根據(jù)上文論述,在理想的情況下,概念的識別應與概念的形成是同一過程。這意味著,在中國現(xiàn)代職業(yè)教育理論概念體系的建構過程中,概念獲取的根本途徑就是通過對中國現(xiàn)代職業(yè)教育的現(xiàn)實進行觀察和抽象。但這種途徑存在巨大困難。第一,這個過程將會非常漫長。第二,在一個專業(yè)領域,一個所謂的“概念”是否稱得上“概念”還需要得到同行的認可。也就是說,即使某個專家面向中國現(xiàn)代職業(yè)教育的現(xiàn)實抽象出了所謂“概念”,還需要通過某種方式由同行進行認定。這又會進一步增加概念獲取的難度。因此,試圖在“客體—概念”的框架中來獲得中國現(xiàn)代職業(yè)教育理論的概念并不具有現(xiàn)實的可行性。因此,我們只能在“概念—術語”的框架中來尋找辦法。

        事實上,在我國,學者們圍繞著現(xiàn)代職業(yè)教育的各種問題,開展了大量研究,已經(jīng)形成了一定數(shù)量的概念。在構建中國現(xiàn)代職業(yè)教育理論概念體系的過程中,人們的主要任務是從已有的關于現(xiàn)代職業(yè)教育的研究文獻中,識別這些已經(jīng)形成的概念。那么,如何才能識別已有概念呢?在“概念—術語”框架下,可行的路徑是以術語識別為基礎,獲取概念。在理論上來講,術語只是表示概念的一種符號,獲取了符號并不代表得到了概念。因此,試圖通過術語識別的方式獲取概念似乎并不可靠。但如果換個角度,這不失為一種比較好的方式。其一,從概念與術語的關系上看,概念雖然先于術語,但任何概念都必然表現(xiàn)為一定術語。其二,在術語學上,理想的情況是,一個特定概念在某一特定語種之中,一般只有一個相對應的術語。雖然現(xiàn)實并不如此,但這是術語學的努力方向。因此,在中國現(xiàn)代職業(yè)教育理論的概念體系建構過程中,人們可以通過對中國現(xiàn)代職業(yè)教育研究文獻的考察與分析,從中提取相關術語,進而識別相關概念。

        二、中國現(xiàn)代職業(yè)教育理論術語的收集方法

        傳統(tǒng)上,專業(yè)領域術語主要是由該領域的學者們直接從專業(yè)文獻中識別。在信息技術尚不發(fā)達的情況下,這種方式即使存在缺陷,也是不可替代的。但是,近些年來,伴隨著信息技術的發(fā)展和日漸成熟,人們開始嘗試使用信息技術實現(xiàn)術語的自動發(fā)現(xiàn)和識別。從目前的實踐來看,術語的自動識別一般有三種方法。

        (一)基于規(guī)則的術語抽取法

        這是一種以句法(術語上下文)或詞法(術語的內部構成成分)為基礎的術語抽取法。這種方法不僅需要對文檔進行分詞和詞性標注,而且需要借助人工方式將語言學知識和特定專業(yè)領域知識結合起來,總結歸納特定專業(yè)領域術語構成知識,并用規(guī)則表達出來,進而使用計算機程序完成術語的自動抽取?;谝?guī)則的術語抽取法的最大優(yōu)點是具有較高的準確性。但是,這種方法也具有以下局限:(1)覆蓋范圍窄。即不同專業(yè)領域的術語的結構不同,因此,使用基于規(guī)則方法抽取術語時,每個專業(yè)領域都需要建立一套規(guī)則。(2)規(guī)則的建立費時費力?;谝?guī)則的抽取法的前提之一就是要建立規(guī)則,但規(guī)則的建立需要對大量專業(yè)文獻進行研究才能完成,比較耗費時間。(3)不同時期術語的構成規(guī)則可能會發(fā)生變化。

        (二)基于統(tǒng)計的術語抽取法

        這種方法主要是基于術語區(qū)別于普通詞匯的統(tǒng)計特征來實現(xiàn)術語的自動抽取。其優(yōu)點在于:(1)簡單直接。這種方法不需要借助規(guī)則等額外的要素,而是直接基于術語自身的統(tǒng)計特征來實現(xiàn)術語的自動識別,既簡單又直接。(2)跨領域?;诮y(tǒng)計的方法不用考慮特定專業(yè)領域的句法和詞法等語言學信息,因此,這一方法適用于各個專業(yè)領域。(3)對于高頻術語具有很好的識別率。其不足主要表現(xiàn)為:①受語言材料多少的影響較大。一般來說,在語料規(guī)模較大的情況下,這一方法的效果較好。②對低頻術語的識別率較低。在專業(yè)文獻中,有些詞語出現(xiàn)的頻率較低,但卻是合法的專業(yè)術語。由于這類術語的出現(xiàn)頻率低,在使用基于統(tǒng)計的方法識別術語時,這類術語往往會被錯誤地排除。

        (三)混合策略的方法

        將基于規(guī)則的方法和基于統(tǒng)計的方法結合起來使用。在實際的使用中,有的先采用統(tǒng)計方法,后采用規(guī)則方法,有的則相反。[3]

        在上述三種方法中,理論上比較理想的方法是混合策略的方法。但有研究表明,這種方法并不是在所有情況下都是最優(yōu)的選擇。[4]本研究擬將基于統(tǒng)計的自動抽取法和人工方法結合起來使用。具體而言,本研究首先采用基于統(tǒng)計的自動抽取法中的信息熵方法形成初步的術語集合。然后采用人工的方式,對初步的術語集合進行分析,形成最終的專業(yè)術語。之所以采用基于統(tǒng)計的方法而不是基于規(guī)則的方法有兩點原因:一是基于規(guī)則的方法需要建立規(guī)則,而規(guī)則的建立比較復雜。職業(yè)教育領域術語規(guī)則的建立需要語言學家和職業(yè)教育學者的合作,需要耗費很長的時間。借助已有的相關詞典(顧明遠教授主編的《教育大辭典》第3卷中收錄有職業(yè)教育方面的術語)來建立規(guī)則雖然也是可行的路徑,但該詞典出版于20多年前,職業(yè)教育術語的構詞規(guī)則有可能發(fā)生變化。二是因為統(tǒng)計方法的優(yōu)缺點符合我國職業(yè)教育研究的特點。近些年來,我國職業(yè)教育研究水平有了長足的進步,但總的來說存在理論水平不高,理論色彩不夠濃厚的問題。許多研究成果往往就事論事,滿足于對職業(yè)教育現(xiàn)狀的簡單描述。[5]可以說,相對于其他領域,包括普通教育和高等教育領域而言,我國職業(yè)教育研究水平相對落后。這意味著,在職業(yè)教育理論中,不僅概念的科學性還有待提高,而且科學的概念在數(shù)量上相對較少。一般來講,科學的、得到公認的科學概念使用的頻率相對比較多?;诮y(tǒng)計的術語自動抽取法,高頻術語的識別較強,低頻術語的處理較弱,這個特點與目前職業(yè)教育的研究狀況具有很強的適切性。同時,從促進職業(yè)教育理論發(fā)展的角度,在職業(yè)教育研究總體水平有待進一步提高的條件下,不能急于提取尚未成熟的概念,而更應該將已經(jīng)得到認可的、被學者們廣為使用的術語識別并確定下來。之所以采用信息熵方法,主要是因為它是目前被廣泛認可并使用的信息統(tǒng)計工具。之所以在基于統(tǒng)計方法之后使用人工方法進行進一步分析,主要是因為,統(tǒng)計方法在術語抽取中存在一大特點,即它不僅能識別文獻中的高頻術語,還往往會將高頻通用詞匯和其他字符串抽取出來。這些詞語如果不通過規(guī)則的方式予以排除,就需要借助人工的方式去除。

        三、中國現(xiàn)代職業(yè)教育理論術語的收集和概念的識別

        在本研究中,“中國現(xiàn)代職業(yè)教育”被界定為中華人民共和國建國后的職業(yè)教育。因此,在術語收集過程中,應該將新中國建國以來的職業(yè)教育研究文獻都囊括進來。但這樣一來,工作量將非常巨大。事實上,也完全沒有必要這樣做。20世紀80年代末90年代初,北京師范大學顧明遠教授主持編纂出版了《教育大辭典》(12卷),其中第3卷收錄了職業(yè)教育方面的術語。我們將該詞典收錄的413條術語全部納入進來(不含人名、具體的學校名、法律規(guī)范名、會議等專有名詞),作為中國現(xiàn)代職業(yè)教育理論術語的一部分。[6]如此以來,我們需要收集處理的就是20世紀90年代以來的術語。具體過程如下。

        (一)建立語料庫

        以“職業(yè)教育”或“職業(yè)技術教育”為主題,在中國知網(wǎng)期刊網(wǎng)CSSCI庫搜索職業(yè)教育領域2014年(含)之前的研究文獻(不包含研究綜述、新聞報道、會議綜述、領導講話和政府文件類文章),下載這些文章的題名、關鍵詞和摘要,以文本文件形式存儲,得到由3 083個文本文件構成,共計60余萬字的語料庫。

        (二)二次開發(fā)NLPIR分詞系統(tǒng)

        NLPIR分詞系統(tǒng)是由漢語詞法分析系統(tǒng)ICTCLA發(fā)展而來。該系統(tǒng)曾獲得錢偉長中文信息處理科學技術一等獎等多個獎項,在中文信息處理領域被廣泛認可。目前,該系統(tǒng)在傳統(tǒng)的分詞和詞性標注功能之外,又相繼開發(fā)出了許多新的功能。基于信息熵方法的關鍵詞自動獲取就是其新的功能之一?;谛畔㈧胤椒ㄊ腔诮y(tǒng)計方法中的一種,其基本思想是,如果一個詞或短語是術語或者關鍵詞,那么它反復出現(xiàn)并且前后出現(xiàn)不同詞語的概率應該非常高。作為NLPIR系統(tǒng)的一部分,該系統(tǒng)的關鍵詞提取組件采用了靈活的開發(fā)結構,可以支持各種不同的計算機操作系統(tǒng)和調用語言。本研究在win32系統(tǒng)中,采用Java語言,對NLPIR系統(tǒng)進行了二次開發(fā),以實現(xiàn)基于信息熵方法的術語自動獲取。

        (三)術語的自動提取、選擇與校對

        運行術語提取程序,處理3 083條題錄信息,初步獲得候選術語24 385條。在此基礎上,采取人工的方式對這些術語進行選擇和校對,最后獲得職業(yè)教育領域的專業(yè)術語349條。術語的選擇和校對遵循“四排除、一合并”原則?!八呐懦笔侵福海?)高頻非通用詞匯予以排除。例如,“發(fā)展殘疾人”就不是術語。它之所以被抽取出來,主要就是因為結合比較穩(wěn)定而且出現(xiàn)次數(shù)多。(2)通用詞匯予以排除。如“原因”、“啟示”、“探索”等通用詞匯被排除在術語之外。(3)專有名詞予以排除。例如,“黃炎培”、“杜威”、“普洛瑟”等人名、“澳大利亞”、“江蘇”、“株洲市”等地名,“浙江金融職業(yè)學院”、“中華職業(yè)學?!钡忍囟▽W校的校名等都被去除。(4)未體現(xiàn)職業(yè)教育特色的教育術語予以排除。例如,“教育”、“課程”、“教學”等雖然是教育術語,但并未體現(xiàn)職業(yè)教育特點,因此,也被排除在職業(yè)教育術語之外?!耙缓喜ⅰ笔侵笇⒃诓煌墨I中出現(xiàn)的同一術語加以合并。

        (四)術語的確定

        將《教育大辭典》(第3卷)中收錄的413個職業(yè)教育術語與運用信息熵方法提取的349個術語進行比對,取其并集,形成中國現(xiàn)代職業(yè)教育理論的術語集合,共計733個術語。兩個來源的術語集共有29個重復術語。應該說,重復的術語數(shù)量比較少。出現(xiàn)這種狀況的可能原因是,CSSCI期刊即使接收職業(yè)教育方面的論文,一般也不刊發(fā)教學方面的文章。這就使得基于CSSCI期刊庫獲得的職業(yè)教育術語很少涉及職業(yè)教育微觀教學領域。但《教育大辭典》(第3卷)收錄的職業(yè)教育術語中,涉及職業(yè)教育微觀教學領域和相關職業(yè)領域的占比非常高,前者如“案例教學法”、“示范教學法”等,后者如“工種”、“成品測量”等。

        (五)概念的確認

        雖然術語學的追求是一個術語對應一個概念,但在我們收集獲得的733個職業(yè)教育術語卻不是這樣。在這733個術語中,有些術語雖然不同,但表達的實際上是同一個概念。例如,“職業(yè)技術教育”、“職業(yè)教育”、“技術和職業(yè)教育”和“技術職業(yè)教育”等四個術語所指的其實是一個概念。“職業(yè)基礎教育”與“基礎職業(yè)教育”、“職業(yè)教育體系”與“職業(yè)技術教育體系”也是如此。對于這些術語,我們將其進行歸并,最終形成了中國現(xiàn)代職業(yè)教育理論的728個概念。

        本研究也存在一些不足。其一,限于能力和時間,在語料庫的建設上,本研究只是將中國知網(wǎng)CSSCI期刊庫論文的題錄信息收集起來,既沒有收集更多論文的題錄信息,也忽視了20世紀90年代以來出版的職業(yè)教育著作。其二,在術語自動抽取方法上,本研究采取了信息熵方法。這種方法雖然考慮了一個詞或短語外部的邊界自由度,即詞或短語左右兩側出現(xiàn)不同符號或符號串的可能性大小,但沒有考量詞或短語內部結合的緊密度,即一個詞或短語內部各符號間的結合強度。[4]通常情況下,作為概念的指稱,術語應是一個相對固定的完整語言單位,不僅其左右兩側的符號和符號串應該是變化的,即邊界自由度高,而且其內部符號之間也應該緊密結合在一起,即內部緊密度高。信息熵方法只考慮了邊界自由度,而忽視了內部緊密度,這不能不說是一大缺憾。在后續(xù)的研究中,我們考慮將職業(yè)教育研究領域主流期刊論文的題錄信息涵蓋進來,以擴大語料庫規(guī)模,并將盡可能采取措施改進術語自動抽取的方法,以對這些缺憾加以彌補。

        [1]中華人民共和國國家質量監(jiān)督檢驗檢疫總局.術語工作:概念體系的建立(GB/T 19100-2003)[Z].北京:中國標準出版社,2003:1.

        [2]國家質量技術監(jiān)督局.術語工作:原則與方法(GB/T 10112-1999)[Z].北京:中國標準出版社,2000:1.

        [3]季培培,鄢小燕,岑詠華.面向領域中文文本信息處理的術語識別與抽取研究綜述[J].圖書館情報工作,2010(16):124-129.

        [4]張二艷.術語自動抽取技術研究[D].哈爾濱:哈爾濱工業(yè)大學,2009:9,18.

        [5]徐國慶.職業(yè)教育原理[M].上海:上海教育出版社,2007:12-14.

        [6]教育大辭典編纂委員會.教育大辭典(第3卷)[Z].上海:上海教育出版社,1991:227-341.

        [責任編輯曹穩(wěn)]

        國家社會科學基金“十二五”規(guī)劃2013年度教育學一般課題“中國現(xiàn)代職業(yè)教育理論體系:概念、范疇與邏輯”(項目編號:BJA130096)

        王良,男,天津科技大學教育發(fā)展研究中心助理研究員,主要研究方向為教育理論與政策;梁卿,男,天津職業(yè)技術師范大學副教授,教育學博士,主要研究方向為職業(yè)教育原理與哲學,職業(yè)教育評價。

        G710

        A

        1674-7747(2016)19-0001-04

        猜你喜歡
        術語規(guī)則概念
        Birdie Cup Coffee豐盛里概念店
        撐竿跳規(guī)則的制定
        數(shù)獨的規(guī)則和演變
        幾樣概念店
        學習集合概念『四步走』
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        聚焦集合的概念及應用
        TPP反腐敗規(guī)則對我國的啟示
        有感于幾個術語的定名與應用
        從術語學基本模型的演變看術語學的發(fā)展趨勢
        蜜桃av噜噜噜一区二区三区| 五十路熟妇高熟无码视频| 亚洲地址一地址二地址三| 中文字幕日韩人妻高清在线| 一区二区中文字幕在线观看污污| 欧美成人秋霞久久aa片 | 精品人妻一区二区三区浪人在线 | 全球中文成人在线| 国产精品无码片在线观看| 亚洲av乱码一区二区三区观影| 一区二区视频在线观看地址| 无码国产福利av私拍| 美日韩毛片| 日韩女同一区二区三区久久| 国产福利一区二区三区在线视频| 肥臀熟女一区二区三区| 99久久人妻无码精品系列蜜桃| 中文字幕被公侵犯的丰满人妻| 亚洲精品在线国产精品| 另类内射国产在线| 国产午夜激情视频自拍| 水蜜桃视频在线观看入口| 国产乱妇无码大片在线观看| 国产精品熟妇视频国产偷人| 国产一区二区三区视频大全| 国产女同va一区二区三区| 最近在线更新8中文字幕免费| 白浆出来无码视频在线| 午夜视频在线观看国产| 风流老太婆大bbwbbwhd视频| 国产免费一区二区三区在线观看| 国产一区二区在线观看我不卡 | 成熟丰满熟妇高潮xxxxx| 嗯啊 不要 啊啊在线日韩a| 在线免费看91免费版.| 在熟睡夫面前侵犯我在线播放| 国产午夜精品一区二区三区视频| 国产精品自拍视频免费看| 亚洲精品中文幕一区二区| 久久久久亚洲av无码网站| 免费的黄网站精品久久|