亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于德溫特?cái)?shù)據(jù)庫的關(guān)鍵共性技術(shù)分析

        2016-12-19 09:15:43杜宏巍
        中國市場 2016年31期
        關(guān)鍵詞:共詞分析

        杜宏巍

        [摘要]文章在界定關(guān)鍵共性技術(shù)概念的基礎(chǔ)上,以德溫特?cái)?shù)據(jù)庫為數(shù)據(jù)來源,下載了鋼鐵產(chǎn)業(yè)的熱處理領(lǐng)域的相關(guān)數(shù)據(jù)。同時(shí),開發(fā)了分詞系統(tǒng)及數(shù)據(jù)分類系統(tǒng),并結(jié)合陳超美開發(fā)的Citespace軟件對相關(guān)數(shù)據(jù)進(jìn)行了二次螺旋分析。經(jīng)實(shí)驗(yàn)驗(yàn)證,數(shù)據(jù)分析速度快、結(jié)果準(zhǔn)確,具有一定的應(yīng)用及推廣價(jià)值。

        [關(guān)鍵詞]關(guān)鍵共性技術(shù);二次螺旋分析;共詞分析

        [DOI]10.13939/j.cnki.zgsc.2016.31.273

        重大關(guān)鍵共性技術(shù)在整個(gè)技術(shù)創(chuàng)新鏈條中處于基礎(chǔ)性地位,是跨產(chǎn)業(yè)部門的關(guān)鍵技術(shù),能夠?yàn)槎囗?xiàng)其他技術(shù)的進(jìn)步、產(chǎn)業(yè)的發(fā)展提供支撐,具有廣闊的應(yīng)用前景,為眾多用戶所使用,規(guī)模效用明顯。[1]

        1關(guān)鍵共性技術(shù)辨識系統(tǒng)的構(gòu)建

        由關(guān)鍵共性技術(shù)的內(nèi)在構(gòu)成要素及其相互關(guān)系展開的邏輯順序,可以把關(guān)鍵共性技術(shù)系統(tǒng)過程概括為3個(gè)階段。

        1.1數(shù)據(jù)準(zhǔn)備確定數(shù)據(jù)源

        Derwent Innovations Index(DII)是美國科學(xué)情報(bào)所(ISI)最新推出的基于因特網(wǎng)環(huán)境的數(shù)據(jù)庫產(chǎn)品,該數(shù)據(jù)庫將Derwent World Patents Index(DWPI,德溫特世界專利索引)與Patents Citation Index(PCI,專利引文索引)加以整合,它收錄來自40多個(gè)專利機(jī)構(gòu)授權(quán)的1000多萬基本發(fā)明、3000多萬個(gè)專利,數(shù)據(jù)每周更新并已回溯至1963年,為研究人員提供了世界范圍內(nèi)的化學(xué)、電子與電氣以及工程技術(shù)領(lǐng)域內(nèi)綜合全面的發(fā)明信息,是最為全面的國際專利信息數(shù)據(jù)庫。符合數(shù)據(jù)源篩選原則,因此確定數(shù)據(jù)源為德溫特世界專利索引數(shù)據(jù)庫。

        1.2數(shù)據(jù)獲取

        1.2.1特征詞的識別

        抽取文本特征集的目的是通過將文本特征項(xiàng)(關(guān)鍵詞、標(biāo)引詞等)的量化,將它們從一個(gè)無結(jié)構(gòu)的原始文本轉(zhuǎn)化為結(jié)構(gòu)化的計(jì)算機(jī)可以識別處理的信息。通過對文獻(xiàn)的回顧可以發(fā)現(xiàn),抽取的文本特征項(xiàng)類型經(jīng)歷了從單純選用標(biāo)引詞擴(kuò)展到全文中的自由詞匯這樣一個(gè)發(fā)展過程。

        選擇標(biāo)引詞作為文本特征集時(shí),詞匯的使用很規(guī)范,也較能反映文獻(xiàn)的主題,一直是共現(xiàn)分析操作過程中首選的分析單元。選擇自由詞作為文本特征集時(shí),需要選擇自由詞的抽取位置,從標(biāo)題和摘要中抽取詞匯作為文本特征集時(shí)能夠直接從作者對文章的認(rèn)識角度理解文本內(nèi)容,提高對文本內(nèi)容把握的準(zhǔn)確性。從全文中抽詞的最大優(yōu)點(diǎn)是能夠保留出現(xiàn)頻率不高但非常重要的詞匯,同時(shí)避免了更新詞表、標(biāo)引文獻(xiàn)等不小的工作量。但由于涉及文本切分詞等處理,實(shí)現(xiàn)的復(fù)雜度較高。

        總結(jié)起來,抽取文本特征集時(shí)必須做出兩重選擇,從何處抽?。梢赃x擇標(biāo)題、關(guān)鍵詞、摘要、全文)和抽取哪種類型的詞。本研究對特征詞的識別包括標(biāo)引詞匯和自由詞匯。

        1.2.2特征詞的抽取

        從關(guān)鍵詞、標(biāo)題、摘要、全文中抽取,抽取詞匯的質(zhì)量依次增高,操作的復(fù)雜程度也逐個(gè)增強(qiáng)。抽取標(biāo)引詞時(shí),用詞規(guī)范、詞匯間概念關(guān)系清晰,但存在可能出現(xiàn)標(biāo)引偏差和丟失新興詞匯的缺陷。抽取自由詞匯時(shí)則與上述情況正好相反,該抽取方法能夠科學(xué)地反映文本內(nèi)容、跟蹤新興詞匯的出現(xiàn),但詞匯的“一詞多義”和“一義多詞”現(xiàn)象導(dǎo)致數(shù)據(jù)預(yù)處理困難,自由詞匯間復(fù)雜的語義關(guān)系影響分析結(jié)果的可解釋性。所以應(yīng)該根據(jù)分析目標(biāo)的不同做出合理選擇??梢姡~匯抽取結(jié)果的有效性和實(shí)現(xiàn)的便捷性始終是相互矛盾的,它們互相制約,實(shí)際操作中必須找到兩者的平衡點(diǎn),以便利用最簡便的方法取得最科學(xué)的結(jié)果。

        綜上分析,本文特征詞的識別是根據(jù)具體的科技跟蹤需要,從下載的文本集合中利用我們開發(fā)的分詞軟件自動(dòng)抽取“標(biāo)引詞”和“自由詞”作為反映文獻(xiàn)內(nèi)容的特征值,具體包括“標(biāo)題”“關(guān)鍵詞”“標(biāo)引詞”“作者信息”“引文”等。

        1.2.3特征詞的選擇

        詞是文獻(xiàn)中承載學(xué)術(shù)概念的最小單位。詞頻的波動(dòng)與社會現(xiàn)象、情報(bào)現(xiàn)象之間具有內(nèi)在的關(guān)系,一定的社會現(xiàn)象和情報(bào)現(xiàn)象必然引起相應(yīng)的詞頻波動(dòng)現(xiàn)象。[2]因此,通過統(tǒng)計(jì)關(guān)鍵詞、主題詞、篇名詞等核心詞匯在某一類學(xué)術(shù)文獻(xiàn)中所出現(xiàn)的頻次,可以判別該學(xué)術(shù)領(lǐng)域的研究熱點(diǎn)、知識結(jié)構(gòu)和發(fā)展趨勢。

        本研究特征詞的選擇,就是對數(shù)據(jù)庫中的文件進(jìn)行詞頻統(tǒng)計(jì)分析,形成詞頻統(tǒng)計(jì)文件。借助分詞軟件將論文標(biāo)題中使用的單詞按照出現(xiàn)的頻次由高到低進(jìn)行降序排列,然后將一些不完整的單詞及沒有特殊意義的單詞從詞頻列表中刪除,同時(shí)刪除掉那些在科學(xué)研究中被普遍應(yīng)用的、沒有代表性的單詞,如研究(study)、分析(analysis)等。[3]

        當(dāng)選擇確定的特征詞后,利用我們開發(fā)的數(shù)據(jù)分類軟件,根據(jù)特征詞將下載數(shù)據(jù)中包含特征詞的數(shù)據(jù)段落歸類,歸類后的數(shù)據(jù)段落作為一個(gè)完整的數(shù)據(jù)集合,可供Citespace軟件進(jìn)行共詞聚類分析。

        2共詞分析

        從“技術(shù)方法”上看,國內(nèi)外本階段共詞分析研究注重方法的系統(tǒng)化,將研究對象納入時(shí)空坐標(biāo),提高了其應(yīng)用結(jié)果同實(shí)際情況的擬合度和置信度,為拓展共詞分析的應(yīng)用范圍奠定了基礎(chǔ)。同時(shí),運(yùn)用該階段方法體系所揭示的信息和對象之間的關(guān)聯(lián)已向深層擴(kuò)展,初步解決了某些利用相關(guān)文獻(xiàn)挖掘內(nèi)隱知識的問題。

        從“應(yīng)用領(lǐng)域”上看,基于共詞分析的研究成果可以歸納為:揭示特定科技領(lǐng)域內(nèi)的研究主題、主題的層級及其關(guān)系以及由研究主題所映射的具體研究方向之間的關(guān)系,區(qū)分科學(xué)子領(lǐng)域,確定學(xué)科結(jié)構(gòu);揭示研究主題接近所屬領(lǐng)域熱點(diǎn)問題的程度;考察特定領(lǐng)域內(nèi)科學(xué)研究主題的變遷和可視化結(jié)果;從內(nèi)聯(lián)和外聯(lián)的角度揭示特定領(lǐng)域內(nèi)研究主題之間以及研究主題同其他主題之間的關(guān)系;通過科技環(huán)境分析,揭示科技主體的機(jī)會和威脅;揭示不同子領(lǐng)域的演化模式及其相互關(guān)系,勾畫出研究主題的生命周期。[5]

        建議聚類分析采用軟件為由美國德雷賽爾大學(xué)信息科學(xué)與技術(shù)學(xué)院陳超美開發(fā)的Citespace。采用一種“突發(fā)詞檢測”算法來確定研究前沿中的概念,利用3個(gè)網(wǎng)絡(luò)(“研究前沿術(shù)語的共現(xiàn)”“知識基礎(chǔ)文章的同被引”和“研究前沿術(shù)語引用知識基礎(chǔ)文章”)隨著時(shí)間演變的情況來尋找研究熱點(diǎn)及趨勢,并以可視化的方式展示出來。

        3結(jié)論

        本研究依據(jù)德溫特?cái)?shù)據(jù)庫的分類,并開發(fā)了分詞系統(tǒng)及數(shù)據(jù)分類系統(tǒng),結(jié)合陳超美開發(fā)的Citespace軟件對相關(guān)數(shù)據(jù)進(jìn)行了二次螺旋分析:利用分詞軟件進(jìn)行特征詞的識別及抽取,特征詞的選擇,利用數(shù)據(jù)分類系統(tǒng),以特征詞為依據(jù)進(jìn)行數(shù)據(jù)的文本分類,利用Citespace軟件對分類后的文本進(jìn)行共詞聚類分析,對得到的共詞進(jìn)行二次文本分析及共詞聚類分析。經(jīng)驗(yàn)證,該研究方法的分析速度及準(zhǔn)確度均較理想,可用于研究產(chǎn)業(yè)關(guān)鍵共性技術(shù)領(lǐng)域。

        參考文獻(xiàn):

        [1]郭曉林.產(chǎn)業(yè)共性技術(shù)創(chuàng)新體系及共享機(jī)制研究[D].武漢:華中科技大學(xué),2006.8:28.

        [2]鄧珞華.詞頻分析[J].武漢大學(xué)學(xué)報(bào):社會科學(xué)版,1987(1):46.

        [3]郭衛(wèi)東.技術(shù)預(yù)見理論方法及關(guān)鍵技術(shù)創(chuàng)新模式研究[D].北京:北京郵電大學(xué),2007(6):64.

        [4]呂一博,康宇航.基于共現(xiàn)分析的科技監(jiān)測地圖繪制及實(shí)證研究[J].科學(xué)學(xué)研究,2010,28(10):1460.

        [5]藍(lán)玲,胡煒,易法敏.產(chǎn)業(yè)共性技術(shù)創(chuàng)新與區(qū)域產(chǎn)業(yè)升級[J].科技管理研究,2009(7):36.

        猜你喜歡
        共詞分析
        基于共詞聚類分析的逆向物流熱點(diǎn)研究
        國內(nèi)圖書館嵌入式服務(wù)研究主題分析
        基于文獻(xiàn)計(jì)量分析我國生物科學(xué)素養(yǎng)研究狀況(2001~2016年)
        基于知識圖譜的智慧教育研究熱點(diǎn)與趨勢分析
        基于關(guān)鍵詞共現(xiàn)聚類的電子商務(wù)信用研究熱點(diǎn)分析
        基于共詞分析的近年國內(nèi)O2O研究主題分析
        商(2016年5期)2016-03-28 10:55:02
        國內(nèi)移動(dòng)用戶行為研究熱點(diǎn)與前沿
        商(2016年3期)2016-03-11 12:43:03
        國內(nèi)MOOC學(xué)術(shù)研究熱點(diǎn)領(lǐng)域構(gòu)成的共詞可視化分析
        高教探索(2015年11期)2015-12-02 04:22:20
        關(guān)鍵詞共詞分析法:高等教育研究的新方法
        高教探索(2015年9期)2015-09-21 04:24:01
        十五年來我國社區(qū)教育研究規(guī)律和研究熱點(diǎn)
        成人教育(2015年8期)2015-09-06 10:53:05
        热久久这里只有| 亚洲av无码乱码在线观看性色| 免费看黑人男阳茎进女阳道视频| 欧美人妻精品一区二区三区| 久久久精品2019中文字幕之3| 亚洲最黄视频一区二区| 不卡av网站一区二区三区| 亚洲成a人片在线观看无码3d| 人妻无码一区二区三区四区| 亚洲乱码少妇中文字幕| 国产一区二区三区在线影院| 国产av无码专区亚洲av男同| 国产精品9999久久久久| 日本污视频| 国产精品久久国产精品久久| 久久精品国产色蜜蜜麻豆国语版| 久久精品99久久香蕉国产| 亚洲日韩乱码中文无码蜜桃臀| 久久久久AV成人无码网站| 中文字幕34一区二区| 又嫩又硬又黄又爽的视频| 国产精品内射后入合集| 免費一级欧美精品| 国产一区二区三区成人| 免费无码av片在线观看播放| 亚洲国产精品久久久久久久| 好看午夜一鲁一鲁一鲁| 一二三区亚洲av偷拍| 欧美性色黄大片手机版| 国产欧美精品一区二区三区–老狼 | 日韩国产自拍视频在线观看| 十四以下岁毛片带血a级| 夜夜嗨av一区二区三区| 亚洲Va中文字幕无码毛片下载| 日本妇女高清一区二区三区| 精品久久久久久久久午夜福利| 日本55丰满熟妇厨房伦| 日韩av一区二区三区精品| 手机免费在线观看av网址| 成人免费看www网址入口| 国产精品情侣露脸av在线播放|