亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        文本智能計(jì)算研究的主題挖掘與演化分析*

        2021-04-29 04:41:22胡吉明田沛霖
        情報(bào)雜志 2021年4期
        關(guān)鍵詞:信息檢索關(guān)聯(lián)領(lǐng)域

        胡吉明 田沛霖

        (1.武漢大學(xué)信息管理學(xué)院 武漢 430072;2.武漢大學(xué)信息檢索與知識(shí)挖掘研究所 武漢 430072)

        0 引 言

        文本智能計(jì)算是依托于人工智能、自然語(yǔ)言處理等大數(shù)據(jù)管理和分析技術(shù),所形成的體系化的智能計(jì)算解決方案[1],是文本處理領(lǐng)域的全新計(jì)算模式,囊括了信息分析、自然語(yǔ)言處理、深度學(xué)習(xí)等領(lǐng)域的大量技術(shù)創(chuàng)新,能夠揭示大規(guī)模非結(jié)構(gòu)化文本數(shù)據(jù)的語(yǔ)義內(nèi)涵,從而為決策提供智力支持。傳統(tǒng)情報(bào)學(xué)文本計(jì)算方法已無(wú)法滿足大數(shù)據(jù)時(shí)代下不斷提升的文本處理需求,以及智能計(jì)算方法的不斷發(fā)展,促使文本智能計(jì)算成為當(dāng)前文本處理研究的重要方向與熱點(diǎn)課題。

        1958年Luhn將詞頻統(tǒng)計(jì)與句子顯著性因子計(jì)算的方法應(yīng)用于自動(dòng)摘要生成[2],開(kāi)創(chuàng)了文本智能計(jì)算研究的先河。1991年Dubois研究了基于模糊集的近似推理語(yǔ)義方法[3],進(jìn)一步推動(dòng)了文本智能計(jì)算研究的發(fā)展,自此之后研究規(guī)模開(kāi)始發(fā)展壯大。近年來(lái)國(guó)際學(xué)者從多種細(xì)分領(lǐng)域?qū)ζ溥M(jìn)行研究,取得了豐富的成果,并廣泛涉及社會(huì)諸領(lǐng)域,為輿情分析、情感計(jì)算、遷移學(xué)習(xí)、金融市場(chǎng)等領(lǐng)域提供了技術(shù)支持[4-7]。

        在對(duì)文本智能計(jì)算及其子領(lǐng)域研究進(jìn)展與發(fā)展態(tài)勢(shì)的研究中,一方面,部分學(xué)者采用內(nèi)容分析等定性分析方法,指出當(dāng)前面向技術(shù)路徑識(shí)別的文本挖掘方法主要有語(yǔ)義增強(qiáng)、文本聚類等,未來(lái)會(huì)加強(qiáng)面向多源數(shù)據(jù)的多元關(guān)系融合研究[8];基于圖神經(jīng)網(wǎng)絡(luò)的方法在文本特征提取中將會(huì)愈發(fā)受追捧[9];基于神經(jīng)網(wǎng)絡(luò)的分布表示方法是未來(lái)文本相似度計(jì)算領(lǐng)域最為重要的研究方向[10]。另一方面,少數(shù)學(xué)者采用共詞網(wǎng)絡(luò)分析等定量分析方法,對(duì)領(lǐng)域文獻(xiàn)進(jìn)行發(fā)文量、關(guān)鍵詞、合著關(guān)系等指標(biāo)的統(tǒng)計(jì),從而識(shí)別領(lǐng)域的研究熱點(diǎn)、現(xiàn)狀及未來(lái)方向[11]。

        上述研究對(duì)文本智能計(jì)算及其子領(lǐng)域的研究現(xiàn)狀、主題分布及發(fā)展趨勢(shì)進(jìn)行了揭示,但所涉及的多為部分子領(lǐng)域,缺乏對(duì)文本智能計(jì)算整體研究結(jié)構(gòu)及關(guān)聯(lián)關(guān)系的描述;同時(shí)缺少定量分析,特別是基于計(jì)量學(xué)基礎(chǔ)的演化脈絡(luò)梳理與發(fā)展趨勢(shì)分析。基于上述情況,本文在前人研究的基礎(chǔ)上,對(duì)文本智能計(jì)算研究的相關(guān)文獻(xiàn)進(jìn)行關(guān)鍵詞抽取,通過(guò)計(jì)算詞共現(xiàn)關(guān)系,以識(shí)別文本智能計(jì)算研究的主題分布,并揭示整體研究結(jié)構(gòu)與子領(lǐng)域研究結(jié)構(gòu)的特征與差異;在對(duì)詞共現(xiàn)網(wǎng)絡(luò)和演化脈絡(luò)進(jìn)行可視化分析的同時(shí),基于多元指標(biāo)計(jì)算,對(duì)其研究的發(fā)展態(tài)勢(shì)進(jìn)行預(yù)測(cè),從而全面系統(tǒng)地揭示文本智能計(jì)算研究的主題結(jié)構(gòu)與演化態(tài)勢(shì),為國(guó)家、科研院所與學(xué)者把握研究動(dòng)態(tài)提供智力支持。

        1 主題網(wǎng)絡(luò)提取與分析方法

        共同出現(xiàn)在同一文獻(xiàn)中的一對(duì)關(guān)鍵詞被視為具有共現(xiàn)關(guān)系,共現(xiàn)強(qiáng)度等于包含這對(duì)關(guān)鍵詞的文獻(xiàn)數(shù)量[12]。共現(xiàn)強(qiáng)度越大,兩個(gè)詞之間的內(nèi)涵關(guān)聯(lián)性越強(qiáng),在主題上的一致性越好,對(duì)大規(guī)模學(xué)科關(guān)鍵詞共現(xiàn)的關(guān)聯(lián)網(wǎng)絡(luò)計(jì)算[13]則能夠反映研究主題的結(jié)構(gòu)和演變規(guī)律[14-17]。共現(xiàn)分析已成為學(xué)科研究現(xiàn)狀描述及發(fā)展趨勢(shì)預(yù)測(cè)的重要定量分析方法[18]。由此,本文以文本智能計(jì)算研究文獻(xiàn)的關(guān)鍵詞為數(shù)據(jù)處理與分析依據(jù),在關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)分析的基礎(chǔ)上進(jìn)行主題結(jié)構(gòu)揭示、演化脈絡(luò)梳理與發(fā)展態(tài)勢(shì)分析,并進(jìn)行可視化展示。

        1.1文獻(xiàn)數(shù)據(jù)收集與處理為獲取學(xué)科最前沿、最全面的研究動(dòng)態(tài),本文從國(guó)際視角展開(kāi)研究,以WOS核心合集(含SCIE、SSCI、A&HCI、CPCI數(shù)據(jù)庫(kù))為數(shù)據(jù)源,以“text AND intelligen* AND (comput* OR calculat*)”為檢索詞在主題字段進(jìn)行檢索,檢索時(shí)間范圍為2000年1月1日至2020年12月31日。檢索結(jié)果經(jīng)人工篩選,去除與主題不相關(guān)的文獻(xiàn),共得到1 483篇文獻(xiàn),下載其題錄數(shù)據(jù)作為詞頻統(tǒng)計(jì)與詞共現(xiàn)分析的基礎(chǔ)數(shù)據(jù)集。文本智能計(jì)算研究的歷年發(fā)文及關(guān)鍵詞數(shù)量(多次出現(xiàn)的關(guān)鍵詞不重復(fù)計(jì))統(tǒng)計(jì)情況如圖1所示,可以發(fā)現(xiàn)其研究過(guò)程經(jīng)歷了相當(dāng)長(zhǎng)的平穩(wěn)期,自2011年起,文獻(xiàn)數(shù)量呈顯著增長(zhǎng)趨勢(shì),2015年和2019年的增長(zhǎng)情況最為突出;關(guān)鍵詞數(shù)量總體呈增長(zhǎng)趨勢(shì),說(shuō)明文本智能計(jì)算的研究?jī)?nèi)涵在逐步擴(kuò)大。

        圖1 2000-2020年文本智能計(jì)算研究的發(fā)文及關(guān)鍵詞數(shù)量演化圖

        本文使用文獻(xiàn)題錄信息統(tǒng)計(jì)分析工具SATI[19]對(duì)文獻(xiàn)進(jìn)行關(guān)鍵詞抽取與詞頻統(tǒng)計(jì),根據(jù)頻次占比情況,結(jié)合普賴斯指數(shù)[20]、G指數(shù)[21],從關(guān)鍵詞中篩選出詞頻大于等于5的關(guān)鍵詞作為代表文本智能計(jì)算研究的重點(diǎn)內(nèi)容,以支撐后續(xù)的共詞網(wǎng)絡(luò)分析??紤]到關(guān)鍵詞存在不規(guī)范、不統(tǒng)一等問(wèn)題且具有上下位關(guān)系,本文首先進(jìn)行同義詞合并(如Natural Language Processing和NLP等),刪除主題詞(Text、Intelligent Computing)、概念寬泛的詞(如Processing、Speech等);其次將詞頻小于5的關(guān)鍵詞合并至其高頻上位詞中(如將Special education、Medical education、Elementary education合并至Education等),最終確定127個(gè)關(guān)鍵詞作為文本智能計(jì)算研究的主流關(guān)鍵詞,使用SATI構(gòu)建其共現(xiàn)矩陣并導(dǎo)入U(xiǎn)cinet[22]中,生成關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)文件以供后續(xù)分析。

        此外,采用Citespace[23]對(duì)文獻(xiàn)進(jìn)行突發(fā)關(guān)鍵詞檢測(cè),并根據(jù)各年份主題的重合關(guān)系,實(shí)現(xiàn)研究主題隨時(shí)間演進(jìn)的演化過(guò)程可視化,分析主題延續(xù)、突現(xiàn)、融合、分化等發(fā)展過(guò)程,從而把握文本智能計(jì)算研究的主題隨年代的變化情況[24]。

        1.2主題關(guān)聯(lián)數(shù)據(jù)提取與關(guān)聯(lián)網(wǎng)絡(luò)分析方法本文以文本智能計(jì)算研究文獻(xiàn)為分析單位,進(jìn)行關(guān)鍵詞共現(xiàn)相關(guān)數(shù)據(jù)計(jì)算與關(guān)聯(lián)網(wǎng)絡(luò)構(gòu)建,對(duì)關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)進(jìn)行格式化處理。網(wǎng)絡(luò)中,節(jié)點(diǎn)代表關(guān)鍵詞,其大小代表關(guān)鍵詞詞頻;邊代表連接的兩節(jié)點(diǎn)存在共現(xiàn)關(guān)系,其粗細(xì)代表共現(xiàn)次數(shù)。對(duì)上述127個(gè)關(guān)鍵詞形成的共詞網(wǎng)絡(luò)進(jìn)行最大連通子圖提取,以表示文本智能計(jì)算研究的主流。具體分析方法如下:

        首先對(duì)共詞網(wǎng)絡(luò)的整體和局部特征進(jìn)行計(jì)算與分析。包括共詞網(wǎng)絡(luò)的密度、各中心勢(shì)、各中心度和聚集系數(shù)等指標(biāo)。其中網(wǎng)絡(luò)密度表征了關(guān)鍵詞間關(guān)聯(lián)程度與領(lǐng)域發(fā)展程度[25],密度越大則詞間關(guān)聯(lián)越強(qiáng),學(xué)科越成熟;中心勢(shì)和中心度揭示了網(wǎng)絡(luò)的集中程度、網(wǎng)絡(luò)中信息通達(dá)程度與詞間依賴程度[26];聚類系數(shù)表明了學(xué)科領(lǐng)域研究的聚集程度[27]。

        其次對(duì)共詞網(wǎng)絡(luò)的社區(qū)進(jìn)行劃分。采用多級(jí)Louvain算法[28]劃分共詞網(wǎng)絡(luò)社區(qū),使社區(qū)內(nèi)部節(jié)點(diǎn)聯(lián)系緊密,不同社區(qū)間節(jié)點(diǎn)聯(lián)系疏松,從而產(chǎn)生區(qū)別鮮明的主題社區(qū)。主題社區(qū)內(nèi)部節(jié)點(diǎn)緊密聯(lián)系的特征表征了這些關(guān)鍵詞在研究方向上的同質(zhì)性,從而可將各主題社區(qū)視作文本智能計(jì)算研究的各子領(lǐng)域。

        最后對(duì)結(jié)果進(jìn)行可視化。使用Gephi[29]對(duì)整體網(wǎng)絡(luò)及各主題社區(qū)進(jìn)行可視化,以直觀展示文本智能計(jì)算研究的主題關(guān)聯(lián)特征,辨析各主題社區(qū)研究地位;結(jié)合各主題社區(qū)的密度與平均中心度,可將社區(qū)映射至戰(zhàn)略圖[30],以此對(duì)各子領(lǐng)域的發(fā)展態(tài)勢(shì)進(jìn)行預(yù)測(cè)分析。

        2 文本智能計(jì)算研究的主題關(guān)聯(lián)結(jié)構(gòu)與演化發(fā)展態(tài)勢(shì)

        2.1主題分布本文從所采集的文獻(xiàn)數(shù)據(jù)中共提取出3 952個(gè)唯一的關(guān)鍵詞,總頻次為6 876。進(jìn)行頻次累計(jì)比例計(jì)算后發(fā)現(xiàn),頻次Top100的關(guān)鍵詞頻次總和占總頻次的31.4%,覆蓋了當(dāng)前文本智能計(jì)算研究的絕大部分,具有統(tǒng)計(jì)學(xué)上的代表性。這表明文本智能計(jì)算研究的詞頻分布不均衡,總體呈現(xiàn)冪律分布,即少數(shù)關(guān)鍵詞占據(jù)絕大多數(shù)詞頻,說(shuō)明研究的傾向性明顯[31],主要集中于少數(shù)主題,如圖2所示。

        圖2 文本智能計(jì)算研究的詞頻冪律分布

        表1列出了詞頻排序前50的關(guān)鍵詞,是2000-2020年文本智能計(jì)算研究的重要主題,內(nèi)涵廣泛且重點(diǎn)突出,如人工智能、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、文本挖掘、信息檢索、本體論、教育等。

        表1 文本智能計(jì)算研究的主題分布(前50)

        根據(jù)圖3所示的突發(fā)詞檢測(cè)結(jié)果,2000年起文本智能計(jì)算研究的新興主題不斷涌現(xiàn),尤其是2014、2016和2018年,是三次技術(shù)的爆發(fā)期。2014年的新興研究重點(diǎn)主題為智能導(dǎo)學(xué)系統(tǒng)、計(jì)算智能等;2016年的新興研究重點(diǎn)主題為主題模型、智能字符識(shí)別等;2018年的新興研究重點(diǎn)主題為知識(shí)發(fā)現(xiàn)、遺傳算法和深度學(xué)習(xí),且這三個(gè)主題一直延續(xù)至2020年,很可能會(huì)在接下來(lái)的幾年中保持一定的熱度。

        圖3 2000-2020年研究的突發(fā)詞及其強(qiáng)度

        2.2主題關(guān)聯(lián)網(wǎng)絡(luò)分析計(jì)算發(fā)現(xiàn),本文選取的127個(gè)關(guān)鍵詞組成的共詞網(wǎng)絡(luò)為最大連通子圖,代表了文本智能計(jì)算研究的熱點(diǎn)。計(jì)算其網(wǎng)絡(luò)指標(biāo)并識(shí)別社區(qū)關(guān)聯(lián)結(jié)構(gòu),可以展示出研究的主題方向,并對(duì)其發(fā)展態(tài)勢(shì)作出預(yù)測(cè)。

        2.2.1 整體網(wǎng)絡(luò)分析 整體網(wǎng)絡(luò)指標(biāo)如表2所示,整體共詞網(wǎng)絡(luò)的中心勢(shì)較高,具體表現(xiàn)為:較高的點(diǎn)度中心勢(shì)表明文本智能計(jì)算研究的向心力較大,形成了部分核心主題且其對(duì)整體研究的把控與影響能力較強(qiáng);較高的接近中心勢(shì)表明網(wǎng)絡(luò)中各關(guān)鍵詞間路徑較短,信息通達(dá)度較好,核心主題對(duì)邊緣主題可以產(chǎn)生直接影響;中介中心勢(shì)較低,表明網(wǎng)絡(luò)中多數(shù)關(guān)鍵詞可以直接關(guān)聯(lián),而不需中介關(guān)鍵詞作為共現(xiàn)的“橋梁”。結(jié)合較高的聚類系數(shù),表明文本智能計(jì)算研究主題具有明顯的內(nèi)聚性與差異性,子領(lǐng)域內(nèi)部一致性較強(qiáng)而各子領(lǐng)域間區(qū)別鮮明。此外,網(wǎng)絡(luò)密度較低,說(shuō)明學(xué)科正處于發(fā)展過(guò)程中,尚未完全成熟。

        表2 整體關(guān)聯(lián)網(wǎng)絡(luò)指標(biāo)

        表3 關(guān)鍵詞各中心度排序(前10位)

        網(wǎng)絡(luò)中各關(guān)鍵詞的中心度排序如表3所示。人工智能、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、文本挖掘、文本分析、信息檢索、數(shù)據(jù)挖掘、情感分析、深度學(xué)習(xí)、大數(shù)據(jù)主題的點(diǎn)度中心度和接近中心度都排在前10位,說(shuō)明這些關(guān)鍵詞代表的研究方向是文本智能計(jì)算研究的核心主題,研究集群的建立主要以這些方向?yàn)橐罁?jù)。此外,與中介中心勢(shì)類似,各關(guān)鍵詞的中介中心度普遍處于較低水平,說(shuō)明當(dāng)前的各研究主題間存在較緊密的關(guān)聯(lián)。

        2.2.2 主題社區(qū)分析 根據(jù)關(guān)鍵詞間的關(guān)聯(lián)關(guān)系及其強(qiáng)度,可將當(dāng)前文本智能計(jì)算的研究劃分為5個(gè)主題社區(qū),具體研究?jī)?nèi)容如表4所示。各主題研究規(guī)模各異,分層現(xiàn)象鮮明。其中規(guī)模較大的社區(qū)有:C3-信息檢索,包含本體論、算法、信息抽取、語(yǔ)義網(wǎng)、知識(shí)庫(kù)等主題;C4-文本挖掘,包括教育、智能導(dǎo)學(xué)系統(tǒng)、社會(huì)媒體、計(jì)量學(xué)、虛擬現(xiàn)實(shí)等主題;規(guī)模一般的社區(qū)有:C1-人工智能,包含自然語(yǔ)言處理、深度學(xué)習(xí)、會(huì)話代理、認(rèn)知計(jì)算、醫(yī)學(xué)信息學(xué)等主題;C5-文本分析,包含多媒體、主題建模、驗(yàn)證碼、知識(shí)圖譜、圖像分割等主題;規(guī)模較小的主題有C2-數(shù)據(jù)挖掘,包含情感識(shí)別、情感分析、情感計(jì)算、商務(wù)智能、交互等。各社區(qū)的研究主題各異,但都是文本智能計(jì)算范疇內(nèi)的研究方向,可以代表當(dāng)前國(guó)際研究的主流。

        為探究各主題社區(qū)間的交叉協(xié)同影響情況,將主題社區(qū)間的關(guān)聯(lián)關(guān)系可視化,如圖4所示。C1-人工智能與其他四個(gè)主題社區(qū)間關(guān)聯(lián)均非常緊密,表明信息檢索、文本分析、文本挖掘與數(shù)據(jù)挖掘的研究離不開(kāi)人工智能技術(shù)的支持,人工智能在文本智能計(jì)算領(lǐng)域的運(yùn)用已成共識(shí)。C4-文本挖掘、C2-數(shù)據(jù)挖掘和C3-信息檢索三個(gè)主題社區(qū)間關(guān)聯(lián)也較為緊密,表明文本挖掘與數(shù)據(jù)挖掘具有較大的同質(zhì)性,且二者在信息檢索領(lǐng)域的應(yīng)用廣泛[32]。此外,C5-文本分析除了與C1-人工智能有較緊密的關(guān)聯(lián)外,與其他三個(gè)社區(qū)關(guān)聯(lián)疏松,此社區(qū)雖然所含主題較少,但其研究建立在文本挖掘與人工智能之上[33],具有較大的發(fā)展?jié)摿Α?/p>

        表4 文本智能計(jì)算研究的主題社區(qū)

        圖4 文本智能計(jì)算研究的主題社區(qū)關(guān)聯(lián)圖

        通過(guò)表5和圖5對(duì)各主題社區(qū)的可視化與指標(biāo)計(jì)算發(fā)現(xiàn),C1-人工智能和C2-數(shù)據(jù)挖掘兩主題社區(qū)平均度數(shù)中心度與密度最大,且二者關(guān)聯(lián)最為緊密,說(shuō)明其處于文本智能計(jì)算研究的核心地位,且發(fā)展較為成熟,已形成了系統(tǒng)化的研究結(jié)構(gòu);C5-文本分析雖然規(guī)模一般,但內(nèi)部主題關(guān)聯(lián)較為緊密,其研究有形成體系化的趨勢(shì);C3-信息檢索和C4-文本挖掘兩社區(qū)雖然規(guī)模最大,但內(nèi)部主題間關(guān)聯(lián)程度松散,平均度數(shù)中心度也較低,表明其研究結(jié)構(gòu)尚不明顯,發(fā)展水平有待提高。

        表5 各主題社區(qū)網(wǎng)絡(luò)指標(biāo)

        C1-人工智能 C2-數(shù)據(jù)挖掘

        C3-信息檢索 C4-文本挖掘

        C5-文本分析

        2.3主題演化與發(fā)展態(tài)勢(shì)分析為探究文本智能計(jì)算研究主題隨時(shí)間演化的情況,本文將文獻(xiàn)數(shù)據(jù)以兩年為單位進(jìn)行切片,將主題演化脈絡(luò)進(jìn)行可視化展示,并依據(jù)戰(zhàn)略圖分析各主題社區(qū)的發(fā)展態(tài)勢(shì)。

        圖6 2000-2020年文本智能計(jì)算研究的主題演化情況

        2.3.1 主題演化分析 首先,在2002-2013年間研究主題的持續(xù)性較好,有許多持續(xù)演化的脈絡(luò)出現(xiàn)。2014-2018年則涌現(xiàn)出較多新興的主題,這與圖3中突發(fā)詞檢測(cè)的結(jié)果相印證。因此可以認(rèn)為2014年之后文本智能計(jì)算的研究進(jìn)入了新時(shí)代,社會(huì)媒體、智能導(dǎo)學(xué)系統(tǒng)、粒子群優(yōu)化、計(jì)算機(jī)視覺(jué)、語(yǔ)義學(xué)等新興主題不斷出現(xiàn)。

        其次,整個(gè)演化過(guò)程中出現(xiàn)了自然語(yǔ)言處理、信息檢索兩個(gè)持續(xù)性較強(qiáng)的演化脈絡(luò),且其存在較多的主題融合與分化現(xiàn)象。自然語(yǔ)言處理演化脈絡(luò)主要涉及知識(shí)、網(wǎng)絡(luò)框架、深度學(xué)習(xí)、醫(yī)療保健、隱私等主題;信息檢索演化脈絡(luò)主要涉及知識(shí)、網(wǎng)絡(luò)框架、情感分析、會(huì)話代理等主題,二者在2004年和2010年都出現(xiàn)過(guò)融合現(xiàn)象,體現(xiàn)了信息檢索與自然語(yǔ)言處理的交叉協(xié)同關(guān)系。此外,2014年后出現(xiàn)的許多脈絡(luò)也具有持續(xù)演化的趨勢(shì),如2014年出現(xiàn)的“大數(shù)據(jù)”主題演化脈絡(luò)和2018年出現(xiàn)的“聊天機(jī)器人”主題演化脈絡(luò),都演化至2020年,有很大可能在接下來(lái)一段時(shí)間中持續(xù)演化。

        最后,在整個(gè)研究過(guò)程中,也出現(xiàn)了許多孤立主題和未能持續(xù)演化下去的主題,如2006年出現(xiàn)的“人機(jī)交互”主題演化至2016年便發(fā)生斷裂。2000年出現(xiàn)的“人工智能”主題脈絡(luò)在2018年演化至“深度學(xué)習(xí)”時(shí)也發(fā)生了斷裂,可能的原因是深度學(xué)習(xí)研究分化為了多個(gè)規(guī)模較小的子領(lǐng)域,研究關(guān)注熱點(diǎn)受到分散[34]。

        2.3.2 發(fā)展態(tài)勢(shì)分析 根據(jù)圖7展示的主題戰(zhàn)略圖的結(jié)果,文本智能計(jì)算研究各主題社區(qū)均位于第一或第三象限,發(fā)展態(tài)勢(shì)對(duì)比鮮明。C1-人工智能和C2-數(shù)據(jù)挖掘兩社區(qū)位于第一象限,是當(dāng)前研究的核心主題,且發(fā)展?jié)摿薮?,不僅受到研究者的廣泛關(guān)注,其研究體系也已比較完善。其中,C2-數(shù)據(jù)挖掘主題社區(qū)的密度最大,說(shuō)明其內(nèi)部各子主題的發(fā)展已經(jīng)相對(duì)完備,交叉現(xiàn)象明顯,如基于數(shù)據(jù)分析和商務(wù)智能的意見(jiàn)挖掘等研究方向在近年來(lái)發(fā)展勢(shì)頭較好[35];C1-人工智能主題社區(qū)的平均度數(shù)中心度最大,說(shuō)明社區(qū)內(nèi)的各主題受關(guān)注程度最高。

        C3-信息檢索、C4-文本挖掘和C5-文本分析三社區(qū)位于第三象限,處于學(xué)科領(lǐng)域的邊緣位置。結(jié)合領(lǐng)域發(fā)展的實(shí)際情況,信息檢索與文本挖掘主題社區(qū)中的許多研究方向已經(jīng)較為成熟,如樸素貝葉斯、SVM、眾包、推薦系統(tǒng)等,不再是當(dāng)前需要突破的核心,且伴隨著新興技術(shù)的發(fā)展,其受到的關(guān)注度也在逐年下降;文本分析主題社區(qū)中的許多研究方向都是新興的技術(shù)領(lǐng)域,如驗(yàn)證碼識(shí)別、知識(shí)圖譜、計(jì)算機(jī)視覺(jué)、LIWC等,與許多學(xué)科有廣闊的交叉應(yīng)用前景,同時(shí)還有許多有價(jià)值的方面未被充分挖掘,雖然目前處于邊緣位置,但在未來(lái)有很大的提升空間,很可能成為未來(lái)研究中的引擎類主題。

        圖7 文本智能計(jì)算研究發(fā)展態(tài)勢(shì)戰(zhàn)略圖

        3 研究結(jié)論與反思

        文章基于文獻(xiàn)關(guān)鍵詞,利用復(fù)雜網(wǎng)絡(luò)分析方法和可視化工具,以文獻(xiàn)關(guān)鍵詞為分析依據(jù),對(duì)文本智能計(jì)算研究的主題分布、關(guān)聯(lián)結(jié)構(gòu)、演化脈絡(luò)和發(fā)展態(tài)勢(shì)進(jìn)行了分析與揭示,以更直觀清晰地揭示文本智能計(jì)算研究的當(dāng)前主題關(guān)聯(lián)結(jié)構(gòu)與未來(lái)發(fā)展規(guī)律。

        3.1研究結(jié)論2000-2020年間文本智能計(jì)算研究涉獵主題廣泛,研究方向明顯,形成了特征和區(qū)別鮮明的主題社區(qū),各主題社區(qū)均表現(xiàn)出了獨(dú)特的方向特征與發(fā)展態(tài)勢(shì)。

        在學(xué)科結(jié)構(gòu)上,整個(gè)文本智能計(jì)算領(lǐng)域結(jié)構(gòu)穩(wěn)定,發(fā)展全面,各主題社區(qū)在互相交叉滲透的同時(shí)也保持了自身研究體系的穩(wěn)定。研究大致可分為如下5個(gè)主題社區(qū):人工智能、數(shù)據(jù)挖掘、信息檢索、文本挖掘、文本分析。其中,人工智能在文本智能計(jì)算領(lǐng)域的運(yùn)用已成共識(shí);數(shù)據(jù)挖掘、信息檢索、文本挖掘領(lǐng)域的發(fā)展已經(jīng)較為成熟;文本分析領(lǐng)域具有較大的發(fā)展?jié)摿Α?/p>

        在研究的當(dāng)前熱點(diǎn)與未來(lái)方向上,人工智能、數(shù)據(jù)挖掘兩個(gè)主題社區(qū)是目前文本智能計(jì)算領(lǐng)域研究的主流方向,具有良好的發(fā)展前景;信息檢索、文本挖掘和文本分析領(lǐng)域受關(guān)注程度較弱,在研究中較為孤立,原因是信息檢索與文本挖掘主題社區(qū)中許多研究方向已經(jīng)較為成熟,不再是當(dāng)前需要突破的核心,因此領(lǐng)域受到的關(guān)注度也逐年下降;文本分析主題社區(qū)中的許多研究方向都是新技術(shù)和新應(yīng)用的高發(fā)區(qū)間,研究正處于萌芽階段,主題間關(guān)聯(lián)正在建立之中,價(jià)值未被充分挖掘,在未來(lái)很可能成為研究中的引擎類主題,發(fā)展前景廣闊。

        3.2研究反思本文直觀清晰地揭示了2000-2020年期間文本智能計(jì)算研究的主題關(guān)聯(lián)結(jié)構(gòu)、研究方向、演化脈絡(luò)和發(fā)展態(tài)勢(shì),總結(jié)并拓展了前人在文本智能計(jì)算領(lǐng)域的研究成果,并為后續(xù)的研究指明了可能的方向。

        此外,本文的研究是基于文獻(xiàn)中的關(guān)鍵詞及其之間的共現(xiàn)關(guān)系開(kāi)展的計(jì)量學(xué)定量分析,有一定的研究缺陷:在今后的研究中應(yīng)當(dāng)考慮文獻(xiàn)多方面的特征,如標(biāo)題、摘要、基金及參考文獻(xiàn)等,以更加深入豐富地揭示領(lǐng)域研究的內(nèi)涵;還可以考慮開(kāi)展文本智能計(jì)算研究領(lǐng)域的國(guó)家、機(jī)構(gòu)、作者的合作關(guān)系研究,從而多元化地描述文本智能計(jì)算研究的主題結(jié)構(gòu)與發(fā)展演化態(tài)勢(shì)。

        猜你喜歡
        信息檢索關(guān)聯(lián)領(lǐng)域
        領(lǐng)域·對(duì)峙
        青年生活(2019年23期)2019-09-10 12:55:43
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
        新聞傳播(2016年18期)2016-07-19 10:12:06
        基于神經(jīng)網(wǎng)絡(luò)的個(gè)性化信息檢索模型研究
        新常態(tài)下推動(dòng)多層次多領(lǐng)域依法治理初探
        教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計(jì)與實(shí)施
        河南科技(2014年11期)2014-02-27 14:10:19
        肯定與質(zhì)疑:“慕課”在基礎(chǔ)教育領(lǐng)域的應(yīng)用
        公共圖書(shū)館信息檢索服務(wù)的實(shí)踐探索——以上海浦東圖書(shū)館為例
        夜夜春精品视频| av免费网址在线观看| 国产青草视频在线观看| 久久无码一二三四| 国产一区二区三区av香蕉| 免费视频无打码一区二区三区| 北条麻妃国产九九九精品视频 | 成人日韩av不卡在线观看| 81久久免费精品国产色夜| 日日麻批免费40分钟无码| 精品国产aⅴ无码一区二区| 亚洲深夜福利| 久久精品人妻一区二三区| 好大好湿好硬顶到了好爽视频| 精品香蕉久久久爽爽| 毛片一级精油按摩无码| 精品亚洲国产日韩av一二三四区| 亚洲av无码成人精品区狼人影院 | 国产激情视频高清在线免费观看| 日本xxxx色视频在线观看| 越猛烈欧美xx00动态图| 国产午夜亚洲精品一级在线| 亚洲美女主播内射在线| 国产精品久久久久免费观看 | 丰满人妻无套中出中文字幕| 天堂网av在线免费看| 国产乱妇无码大片在线观看| 无码毛片aaa在线| 蜜桃网站在线免费观看视频| 日本熟女中文字幕在线| 美女又色又爽视频免费| 免费观看久久精品日本视频| 精品极品视频在线观看| 品色堂永远免费| 亚洲红怡院| 亚洲av网站在线免费观看| 丁香婷婷激情综合俺也去| 这里有精品可以观看| 风韵丰满妇啪啪区老老熟女杏吧| 色中文字幕在线观看视频| 国产在线观看www污污污|