大數(shù)據(jù)時代的到來,標志著信息技術已經(jīng)跨越了數(shù)字化與網(wǎng)絡化階段,進入智能化處理階段.由此引發(fā)的一個新的挑戰(zhàn)就是知識的碎片化問題,表現(xiàn)為與特定主題相關的知識以文本、圖像、視頻、音頻、圖、網(wǎng)頁等多模態(tài)跨模態(tài)的形式分散在多個數(shù)據(jù)源中,呈現(xiàn)出位置分散、模態(tài)多樣、結構無序、內(nèi)容片面、動態(tài)依賴的特點,由此造成日趨嚴重的“學習迷航、認知過載”和“只見樹木、不見森林”等問題,成為構建智慧化知識密集型應用的一個瓶頸問題.因此,如何從多源、異質、時變的大數(shù)據(jù)中分析挖掘碎片化知識并融合成為知識圖譜,是提升知識可用性和系統(tǒng)性的基礎性關鍵問題,也是大數(shù)據(jù)、人工智能、知識自動化等領域面臨的共性難題.
為此,《計算機研究與發(fā)展》推出“碎片化知識融合與應用”專題,介紹在此新領域中的實際案例,交流學術思想和研究成果,促進碎片化知識融合與應用的研究與發(fā)展.本期專題得到同行的廣泛關注,通過公開征文收到15篇高質量投稿稿件,這些論文圍繞不同應用領域闡述了碎片化知識融合與應用的研究成果,展現(xiàn)出大數(shù)據(jù)挖掘、機器學習、深度學習、知識圖譜等方法在破解碎片化知識融合與應用難題方面取得的最新進展和前沿趨勢.
本專題的審稿嚴格按照期刊審稿的要求進行,特邀編委先后邀請了二十余位相關領域的專家參與評審,歷經(jīng)初審、復審、終審等階段,最終遴選出3篇高質量的論文入選本專題.內(nèi)容涵蓋了醫(yī)療知識圖譜、視覺問答系統(tǒng)等應用,在一定程度上反映了當前國內(nèi)學者在碎片化知識融合的代表性應用.
隨著醫(yī)療大數(shù)據(jù)時代的到來,知識互聯(lián)受到了廣泛的關注.如何從海量的數(shù)據(jù)中提取有用的醫(yī)學知識,是醫(yī)療大數(shù)據(jù)分析的關鍵.知識圖譜技術提供了一種從海量文本和圖像中抽取結構化知識的手段,知識圖譜技術在醫(yī)療領域擁有廣闊的應用前景.侯夢薇等作者的“知識圖譜研究綜述及其在醫(yī)療領域的應用”一文針對醫(yī)療領域大數(shù)據(jù)專業(yè)性強、結構復雜等特點,對醫(yī)學知識圖譜架構和構建技術進行了剖析;并分別針對醫(yī)學知識圖譜中知識表示、知識抽取、知識融合和知識推理這4個模塊的關鍵技術和研究進展進行綜述.此外,介紹了醫(yī)學知識圖譜在臨床決策支持、醫(yī)療智能語義檢索、醫(yī)療問答等醫(yī)療服務中的應用現(xiàn)狀以及發(fā)展前景的展望.
結構無序、內(nèi)容片面的碎片化信息以文本、圖像、視頻、網(wǎng)頁等不同模態(tài)的形式,高度分散存儲在不同數(shù)據(jù)源中,通過構建視覺問答系統(tǒng)實現(xiàn)對多模態(tài)碎片化信息的提取、表達和理解.王一蕾等作者的“基于深度神經(jīng)網(wǎng)絡的圖像碎片化信息問答算法”一文研究包括圖像特征提取、問題文本特征提取、多模態(tài)特征融合和答案推理各個流程的模型與算法.構建深度神經(jīng)網(wǎng)絡模型提取用于表示圖像與問題信息的特征,結合注意力機制與變分推斷方法關聯(lián)圖像與問題兩種模態(tài)特征并推理答案.
利用群體智慧原理,將多個相互獨立的聚類方法的結果進行聚合,可提高聚類結果的準確性.張恒山等作者的“基于群體智慧的簇連接聚類集成方法”一文提出基于群體智慧的簇連接聚類集成方法,首先使用群體智慧理論的獨立性、分散性、多樣性原則引導個體聚類結果的生成,然后提出基于連接三元組的聚類集成方法對個體聚類結果進行分組聚合,將分組聚合的結果再次進行聚合得到最終的聚類結果.實驗結果表明,該方法可以提高集成聚類結果的準確性.
碎片化知識融合應用的領域非常多,本專題僅僅選擇3個有代表性的應用進行嘗試性的報道,以饗讀者.最后,衷心感謝各位作者、審稿專家和編輯部的全力支持和辛勤工作,使得本專題得以順利出版!