亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)知識圖譜的構(gòu)建與實(shí)現(xiàn)

        2022-02-18 05:05:46趙偉張覽望俊成
        情報(bào)工程 2022年6期
        關(guān)鍵詞:圖譜領(lǐng)域金融

        趙偉 張覽 望俊成

        中國科學(xué)技術(shù)信息研究所 北京 100038

        引言

        在大數(shù)據(jù)和數(shù)字經(jīng)濟(jì)迅猛發(fā)展的大背景下,知識圖譜技術(shù)已成為科技文獻(xiàn)資源服務(wù)的重要?jiǎng)?chuàng)新手段,面向標(biāo)準(zhǔn)領(lǐng)域的知識服務(wù)已經(jīng)成為標(biāo)準(zhǔn)信息化發(fā)展的前沿?zé)狳c(diǎn)問題[1]。開展標(biāo)準(zhǔn)文獻(xiàn)知識圖譜構(gòu)建和資源服務(wù),有助于有序組織相關(guān)領(lǐng)域知識,揭示標(biāo)準(zhǔn)知識的整體關(guān)聯(lián)性,讓標(biāo)準(zhǔn)數(shù)據(jù)發(fā)揮更大效用[2]。

        然而,總體上國內(nèi)外針對標(biāo)準(zhǔn)文獻(xiàn)知識圖譜的相關(guān)研究還十分有限。早期研究主要面向標(biāo)準(zhǔn)間的關(guān)系關(guān)聯(lián)網(wǎng)絡(luò),如李景等[3]采用文獻(xiàn)計(jì)量學(xué)方法,基于相關(guān)行業(yè)的標(biāo)準(zhǔn)文獻(xiàn)規(guī)模統(tǒng)計(jì),對比分析國內(nèi)外同行業(yè)標(biāo)準(zhǔn)文獻(xiàn)數(shù)量的不同;李濤等[4]通過建立標(biāo)準(zhǔn)文獻(xiàn)網(wǎng)絡(luò),辨析標(biāo)準(zhǔn)文獻(xiàn)間的引用關(guān)系和相似性,但該階段的研究仍未達(dá)到標(biāo)準(zhǔn)內(nèi)容知識元的粒度[5-8]。而后又逐漸向標(biāo)準(zhǔn)知識關(guān)聯(lián)領(lǐng)域開展探索[9,10],如計(jì)雄飛[11]基于對標(biāo)準(zhǔn)文獻(xiàn)內(nèi)容的分解,通過文本分類、特征提取、內(nèi)容加工等建立了標(biāo)準(zhǔn)內(nèi)容比對分析模型。隨著語義網(wǎng)技術(shù)的推廣,進(jìn)一步面向語義網(wǎng)環(huán)境下標(biāo)準(zhǔn)知識關(guān)聯(lián)的理論和方法開展積極探索[1,12-17],如李景等[18]通過獲取和標(biāo)注標(biāo)準(zhǔn)文本和網(wǎng)絡(luò)信息,構(gòu)建了實(shí)現(xiàn)語料編輯、語義標(biāo)引、雙語翻譯功能的標(biāo)準(zhǔn)文獻(xiàn)語料庫;劉知民[19]在開展標(biāo)準(zhǔn)的信息組織基礎(chǔ)上,通過分詞技術(shù)和信息挖掘技術(shù)形成了標(biāo)準(zhǔn)知識庫??傮w上,相關(guān)研究在對標(biāo)準(zhǔn)間關(guān)系的抽取深度和廣度上仍有所欠缺,并將影響到知識圖譜構(gòu)建的質(zhì)量和效用。趙偉等[2]提出了用于描述標(biāo)準(zhǔn)知識的標(biāo)準(zhǔn)知識單元五元組,構(gòu)建了面向標(biāo)準(zhǔn)文獻(xiàn)的資源層—描述層—映射層的三層知識圖譜模型,提出了基于規(guī)則和LDA主題模型的標(biāo)準(zhǔn)文獻(xiàn)知識圖譜構(gòu)建的集成式方法,為實(shí)踐研究提供了有益的參考。

        金融標(biāo)準(zhǔn)是實(shí)現(xiàn)金融交易信息系統(tǒng)互聯(lián)互通、降低交易成本的基本條件,為金融相關(guān)部門實(shí)施有效管理提供了基礎(chǔ)性支撐。金融標(biāo)準(zhǔn)通過文獻(xiàn)載體將對企業(yè)、市場及產(chǎn)業(yè)發(fā)展產(chǎn)生重要影響,以系統(tǒng)視角分析標(biāo)準(zhǔn)文獻(xiàn)間的替代過程、引用關(guān)系等,將推動(dòng)標(biāo)準(zhǔn)情報(bào)的有效研究和標(biāo)準(zhǔn)化政策的形成與應(yīng)用[16]。因此,本文嘗試構(gòu)建金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)的知識圖譜,以期為金融領(lǐng)域標(biāo)準(zhǔn)化工作實(shí)踐提供參考和借鑒。

        1 金融領(lǐng)域數(shù)據(jù)的范圍和特征

        從分類角度,金融業(yè)包含了眾多細(xì)分行業(yè)和領(lǐng)域,大類主要包括銀行類、證券類、保險(xiǎn)類等,細(xì)分領(lǐng)域可進(jìn)一步分為債券、信托、貨幣、基金等資管計(jì)劃、要素市場、征信貸款等。金融領(lǐng)域涉及到各行業(yè)的數(shù)據(jù)信息,具有數(shù)據(jù)量巨大、多維度和完備性等特征,這些信息又以文字、圖形、表格等形式存儲在大量文檔中,格式非標(biāo)準(zhǔn)統(tǒng)一且呈碎片化存在,具有隱蔽性,因此采用集自然語言處理技術(shù)、處理非標(biāo)準(zhǔn)化數(shù)據(jù)和多層級關(guān)系挖掘技術(shù),展現(xiàn)數(shù)據(jù)關(guān)聯(lián)性于一體的知識圖譜應(yīng)用,成為了金融領(lǐng)域數(shù)據(jù)管理和利用的較好的支撐形式。

        構(gòu)建金融領(lǐng)域知識圖譜,不僅將對多源異構(gòu)數(shù)據(jù)進(jìn)行知識化整合,從而為缺乏可解釋性的機(jī)器學(xué)習(xí)算法提供有益借鑒,還可以通過建立金融行業(yè)海量多源異構(gòu)數(shù)據(jù)的關(guān)聯(lián)關(guān)系,挖掘數(shù)據(jù)的深層價(jià)值。構(gòu)建金融領(lǐng)域知識圖譜的數(shù)據(jù)來源主要包括互聯(lián)網(wǎng)上的輿情數(shù)據(jù),期貨、股權(quán)、股票、上市公司等工商數(shù)據(jù),以及行研報(bào)告信息等。在金融知識圖譜構(gòu)建的已有應(yīng)用研究中,最為普遍的是用于信用評估、風(fēng)控反欺詐、營銷推薦和產(chǎn)業(yè)鏈分析等實(shí)踐,常見的實(shí)體包括人物、公司、地名,常見的關(guān)系包括投資關(guān)系、競爭關(guān)系和股權(quán)關(guān)系等。但在實(shí)際相關(guān)行業(yè)環(huán)境里,某種意義下幾乎各行各業(yè)都與金融或多或少地相關(guān),如某國家標(biāo)準(zhǔn)(或戰(zhàn)略文件)的發(fā)布,可能影響銀行信貸決策,進(jìn)而影響某地區(qū)企業(yè)群的融資規(guī)模,最終影響相關(guān)上市公司的股票價(jià)格。我們希望通過構(gòu)建知識圖譜來支撐實(shí)現(xiàn)類似的關(guān)聯(lián)分析。

        2 標(biāo)準(zhǔn)文獻(xiàn)知識圖譜的構(gòu)建模型

        如前文所述,趙偉等基于標(biāo)準(zhǔn)文獻(xiàn)內(nèi)容及特征的分析,分解了標(biāo)準(zhǔn)知識結(jié)構(gòu),提出了標(biāo)準(zhǔn)知識單元五元組,在此基礎(chǔ)上設(shè)計(jì)了標(biāo)準(zhǔn)文獻(xiàn)知識圖譜RDM模型,從資源層、描述層和映射層三個(gè)方面提出了標(biāo)準(zhǔn)知識圖譜構(gòu)建的理論模型。通過識別和挖掘標(biāo)準(zhǔn)之間的關(guān)聯(lián)關(guān)系,包括一般性題錄關(guān)系、相互采用的知識關(guān)聯(lián)關(guān)系和基于主題關(guān)聯(lián)的多元關(guān)系,充實(shí)和擴(kuò)展標(biāo)準(zhǔn)文獻(xiàn)知識關(guān)聯(lián)的已有成果[2]。標(biāo)準(zhǔn)文獻(xiàn)中“范圍”部分可視為論文文獻(xiàn)中的“摘要”,基于提取其中存在揭示主題內(nèi)容的主題詞信息,挖掘標(biāo)準(zhǔn)實(shí)體和主題詞之間的語義關(guān)系,從而構(gòu)建標(biāo)準(zhǔn)主題之間的關(guān)聯(lián)性。

        基于標(biāo)準(zhǔn)文獻(xiàn)知識圖譜RDM模型,進(jìn)一步建立了包括標(biāo)準(zhǔn)文獻(xiàn)的知識抽取和知識鏈接兩個(gè)步驟的集成方法[1],分別作用于不同的章節(jié)結(jié)構(gòu),從而建立起標(biāo)準(zhǔn)文獻(xiàn)知識圖譜,拓展實(shí)體關(guān)系類型。

        圖1 基于RDM模型的知識圖譜構(gòu)建流程

        3 金融領(lǐng)域標(biāo)準(zhǔn)數(shù)據(jù)實(shí)體關(guān)系的抽取與主題詞抽取

        3.1 數(shù)據(jù)采集與預(yù)處理

        (1)實(shí)驗(yàn)環(huán)境

        系統(tǒng)平臺:Windows10 64位;

        處理器:Intel(R) Core(TM) i5-8250U,CPU 1.60GHz,4內(nèi)核8邏輯處理器;

        編程環(huán)境:Python3.8;

        數(shù)據(jù)庫:Neo4j-community-3.4.5。

        (2)數(shù)據(jù)獲取與預(yù)處理

        本文的研究數(shù)據(jù)采自中國標(biāo)準(zhǔn)服務(wù)網(wǎng),檢索范圍為現(xiàn)行標(biāo)準(zhǔn),不包括已廢止的標(biāo)準(zhǔn),時(shí)間范圍不限定。分別基于國際和中國標(biāo)準(zhǔn)分類號,開展金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)的遴選,如表1所示,從而獲得73份國家標(biāo)準(zhǔn)和265份行業(yè)標(biāo)準(zhǔn),標(biāo)準(zhǔn)發(fā)布時(shí)間為1992—2020年。

        表1 金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)采集表

        采用自上而下的方法,從文獻(xiàn)文本中采集相關(guān)數(shù)據(jù),并分別利用不同的數(shù)據(jù)預(yù)處理技術(shù)對獲取的實(shí)體數(shù)據(jù)進(jìn)行加工。PDF文件是標(biāo)準(zhǔn)文獻(xiàn)編輯生成后的主要形式,本研究根據(jù)文獻(xiàn)的段落格式并采用相關(guān)的信息抽取和邏輯結(jié)構(gòu)轉(zhuǎn)化技術(shù),將原始PDF文件轉(zhuǎn)化為TXT格式或XML文檔,以便于更加清楚地顯示標(biāo)準(zhǔn)文獻(xiàn)的邏輯結(jié)構(gòu)特點(diǎn),并開展人工核驗(yàn)和校對。

        (3)中文分詞

        在對標(biāo)準(zhǔn)文獻(xiàn)范圍文本內(nèi)容進(jìn)行中文分詞的過程中,需要先通過調(diào)用Python的jieba分詞器,來剔除標(biāo)點(diǎn)符號以及非專業(yè)名詞的外文詞組;其次將《金融行業(yè)主題詞表》作為分詞組件的自定義領(lǐng)域詞典,經(jīng)過不斷迭代,從而獲得中文分詞結(jié)果。

        3.2 標(biāo)準(zhǔn)文獻(xiàn)實(shí)體關(guān)系獲取

        基于針對標(biāo)準(zhǔn)文獻(xiàn)前言、范圍及規(guī)范性引用文件來開展知識抽取,從而獲得標(biāo)準(zhǔn)名稱、發(fā)布年份、ICS、CCS、所屬標(biāo)準(zhǔn)、代替標(biāo)準(zhǔn)、采用標(biāo)準(zhǔn)、采用方式、提出單位、歸口單位、負(fù)責(zé)起草單位、參加起草單位、主要起草單位、起草單位、主要起草人、規(guī)范性引用文件和參考文獻(xiàn)。進(jìn)一步基于正則表達(dá)式規(guī)則抽取獲得標(biāo)準(zhǔn)文獻(xiàn)實(shí)體關(guān)系。

        針對338篇標(biāo)準(zhǔn)文獻(xiàn)進(jìn)行顯性知識抽取,獲得1534個(gè)實(shí)體節(jié)點(diǎn)和4716條關(guān)系,如表2所示。

        表2 顯性知識抽取實(shí)體關(guān)系數(shù)量表

        鑒于部分標(biāo)準(zhǔn)的原文較難獲取,面向互聯(lián)網(wǎng)檢索只能得到題錄信息,因此范圍部分的文本數(shù)據(jù)量將少于檢索標(biāo)準(zhǔn)的總量,故本文將標(biāo)準(zhǔn)文獻(xiàn)的標(biāo)題合并到了范圍數(shù)據(jù)中,并基于LDA主題模型獲取的主題抽取過程,采用困惑度計(jì)算獲得相對適合的主題數(shù)。設(shè)定的閾值將對困惑度的計(jì)算結(jié)果產(chǎn)生影響,在閾值分別為10、20、30的條件下,困惑度分別為9、19、29,進(jìn)一步針對主題劃分結(jié)果進(jìn)行人工比對,最終得到19類主題。經(jīng)過統(tǒng)計(jì)合并關(guān)鍵詞后共獲得136個(gè)關(guān)鍵詞,從而形成338篇標(biāo)準(zhǔn)文獻(xiàn)與主題類別的對應(yīng)關(guān)系,包括289條標(biāo)準(zhǔn)與主題的隱性關(guān)系和460條主題與關(guān)鍵詞的隱性關(guān)系,如表3所示。

        表3 金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)主題抽取結(jié)果

        4 金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)知識圖譜可視化的實(shí)現(xiàn)

        本研究使用Neo4j創(chuàng)建知識圖譜,首先將建立實(shí)體節(jié)點(diǎn)和實(shí)體之間的關(guān)系。采用CQL“創(chuàng)建”命令來創(chuàng)建無屬性節(jié)點(diǎn)、創(chuàng)建屬性節(jié)點(diǎn)、創(chuàng)建無屬性節(jié)點(diǎn)之間的關(guān)系、創(chuàng)建屬性節(jié)點(diǎn)之間的關(guān)系、創(chuàng)建一個(gè)或多個(gè)標(biāo)簽節(jié)點(diǎn)或關(guān)系。通過CQL語句,實(shí)現(xiàn)抽取出來的實(shí)體關(guān)系知識庫與Neo4j圖數(shù)據(jù)庫之間的鏈接并推動(dòng)知識圖譜可視化。圖2給出了標(biāo)準(zhǔn)文獻(xiàn)知識圖譜示意圖,其中“金融業(yè)務(wù)”等紅色節(jié)點(diǎn)代表初始標(biāo)準(zhǔn)文獻(xiàn),“中國人民銀行”等粉色節(jié)點(diǎn)代表標(biāo)準(zhǔn)提出單位,“全國金融標(biāo)準(zhǔn)化技術(shù)委員會(huì)”等黃色節(jié)點(diǎn)代表歸口單位,“GB/T21078”等灰色節(jié)點(diǎn)代表初始標(biāo)準(zhǔn)所代替的標(biāo)準(zhǔn)文獻(xiàn),“銀行業(yè)務(wù)證書管理”等綠色節(jié)點(diǎn)代表初始標(biāo)準(zhǔn)采用的標(biāo)準(zhǔn)文獻(xiàn)。以實(shí)體節(jié)點(diǎn)Standard類型“金融服務(wù)生物特征識別第1部分:安全框架”為例,它與JurisdictionOrg類型“全國金融標(biāo)準(zhǔn)化技術(shù)委員會(huì)”之間的邊關(guān)系為歸口關(guān)系,與AdoptStandard類型“ISO 19092 1:2006《金融服務(wù)生物特征識別第1部分:安全框架》”節(jié)點(diǎn)之間形成了修改采用關(guān)系,展示了本文設(shè)計(jì)的核心實(shí)體與關(guān)系。

        圖2 標(biāo)準(zhǔn)文獻(xiàn)知識圖譜示意圖

        (1)標(biāo)準(zhǔn)文獻(xiàn)中的歸口單位關(guān)系。金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)歸口單位共8個(gè),出現(xiàn)頻次排在前5位的相關(guān)情況見表4,圖3顯示了標(biāo)準(zhǔn)與歸口單位之間的關(guān)系,其中綠色節(jié)點(diǎn)代表標(biāo)準(zhǔn)文獻(xiàn),黃色節(jié)點(diǎn)代表歸口單位,從實(shí)體節(jié)點(diǎn)的密集程度可以看出,最主要的歸口單位是全國金融標(biāo)準(zhǔn)化技術(shù)委員會(huì)。

        圖3 歸口單位圖譜片段

        表4 金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)歸口單位數(shù)量Top5排名

        (2)標(biāo)準(zhǔn)文獻(xiàn)中的提出單位關(guān)系?;诒疚臄?shù)據(jù)范圍,金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)提出單位共31個(gè),出現(xiàn)頻次排在前5位的情況如表5所示。圖4顯示了標(biāo)準(zhǔn)與提出單位之間的關(guān)系,JR/T 0173—2020《銀行業(yè)集中營運(yùn)規(guī)范》、JR/T 0146.2—2016《證券期貨業(yè)信息系統(tǒng)審計(jì)指南第2部分:期貨交易所》、JR/T 0101—2013《銀行業(yè)軟件測試文檔規(guī)范》等重要標(biāo)準(zhǔn)的提出單位均為全國金融標(biāo)準(zhǔn)化技術(shù)委員會(huì)。JR/T 0138—2016《銀團(tuán)貸款業(yè)務(wù)技術(shù)指南》、JR/T 0014—2005《銀行信息化通用代碼集》的提出單位均為國家開發(fā)銀行。

        圖4 提出單位圖譜片段

        表5 金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)提出單位數(shù)量Top5排名

        (3)標(biāo)準(zhǔn)文獻(xiàn)中的采用關(guān)系。圖5顯示了標(biāo)準(zhǔn)與其他標(biāo)準(zhǔn)之間的采用聯(lián)系,GB/T 27909.2—2011《銀行業(yè)務(wù)密鑰管理零售第2部分:對稱密碼及其密鑰管理和生命周期》修改采用了ISO 11568.2:2005《銀行業(yè)務(wù)密鑰管理(零售)第2部分:對稱密碼系統(tǒng)及其密鑰管理和生命周期》;GB/T 27911—2011《銀行業(yè)安全和其他金融服務(wù)金融系統(tǒng)的安全框架》修改采用了ISO/TR 17944:2002《銀行云安全和其他金融服務(wù)金融系統(tǒng)的安全框架》。

        圖5 采用標(biāo)準(zhǔn)圖譜片段

        (4)標(biāo)準(zhǔn)文獻(xiàn)中的替代關(guān)系。圖6顯示了標(biāo)準(zhǔn)與其他標(biāo)準(zhǔn)之間的替代關(guān)系。JR/T 0052—2020《銀行卡卡片規(guī)范》替代了JR/T 0052—2009《銀行卡卡片規(guī)范》,JR/T 0025.7—2018《中國金融集成電路IC卡規(guī)范第7部分借記/貸記應(yīng)用安全規(guī)范》替代了JR/T 0025.8—2013《中國金融集成電路(IC)卡規(guī)范第8部分:與應(yīng)用無關(guān)的非接觸式規(guī)范》。

        圖6 代替標(biāo)準(zhǔn)圖譜片段

        (5)標(biāo)準(zhǔn)文獻(xiàn)中的起草關(guān)系?;诒疚墨@取數(shù)據(jù)范圍,金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)起草單位的共有420個(gè),出現(xiàn)頻次排在前5位的情況見表6。圖7以金融科技企業(yè)為例,顯示了標(biāo)準(zhǔn)文獻(xiàn)間通過起草單位構(gòu)成的間接關(guān)系,其中紅色節(jié)點(diǎn)代表標(biāo)準(zhǔn)文獻(xiàn),黃色節(jié)點(diǎn)代表起草單位。通過圖譜可見,螞蟻科技集團(tuán)股份有限公司、京東數(shù)字科技控股股份有限公司、百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司、深圳市騰訊計(jì)算機(jī)系統(tǒng)有限公司華為技術(shù)有限公司共同參與了JR/T 0166—2020《云計(jì)算技術(shù)金融應(yīng)用規(guī)范技術(shù)架構(gòu)》、JR/T 0167—2020《云計(jì)算技術(shù)金融應(yīng)用規(guī)范安全技術(shù)要求》、JR/T 0168—2020《云計(jì)算技術(shù)金融應(yīng)用規(guī)范容災(zāi)》、JR/T 0193—2020《區(qū)塊鏈技術(shù)金融應(yīng)用評估規(guī)則》等標(biāo)準(zhǔn)文獻(xiàn)的起草。

        表6 金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)起草單位數(shù)量Top5排名

        圖7 金融科技企業(yè)參與起草圖譜片段

        (6)標(biāo)準(zhǔn)文獻(xiàn)的主題關(guān)聯(lián)關(guān)系。根據(jù)LDA主題模型抽取結(jié)果對我國現(xiàn)行金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)進(jìn)行劃分,圖8顯示了不同標(biāo)準(zhǔn)文獻(xiàn)間通過主題和關(guān)鍵詞建立起來的鏈接關(guān)系,其中綠色節(jié)點(diǎn)代表標(biāo)準(zhǔn)文獻(xiàn),黃色節(jié)點(diǎn)代表關(guān)鍵詞,藍(lán)色節(jié)點(diǎn)代表主題,粉色節(jié)點(diǎn)代表起草單位。在華為技術(shù)有限公司參與起草的標(biāo)準(zhǔn)文獻(xiàn)中,有6篇標(biāo)準(zhǔn)文獻(xiàn)涉及4類主題,分別是主題1、主題10、主題12、主題13。JR/T 0193—2020《區(qū)塊鏈技術(shù)金融應(yīng)用評估規(guī)則》與JR/T 0168—2020《云計(jì)算技術(shù)金融應(yīng)用規(guī)范容災(zāi)》同屬于主題10,該主題與JR/T 0156—2017《移動(dòng)終端支付可信環(huán)境技術(shù)規(guī)范》所屬的主題13通過關(guān)鍵詞設(shè)計(jì)、規(guī)范、安全單元建立了主題關(guān)聯(lián)關(guān)系。可見,基于RDM模型的主題關(guān)聯(lián)圖譜是可以實(shí)現(xiàn)的,但圖譜質(zhì)量仍有待提升,有些關(guān)鍵詞沒有與之相連接的標(biāo)準(zhǔn)實(shí)體節(jié)點(diǎn),這些都有待進(jìn)一步完善。

        圖8 金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)主題關(guān)聯(lián)圖譜(片段)

        7 結(jié)論

        本文采用基于RDM模型的知識圖譜構(gòu)建流程,構(gòu)建了金融領(lǐng)域標(biāo)準(zhǔn)文獻(xiàn)的知識圖譜。針對基于中國標(biāo)準(zhǔn)服務(wù)網(wǎng)獲取到的金融行業(yè)標(biāo)準(zhǔn)文獻(xiàn),采取數(shù)據(jù)預(yù)處理、清洗加工、人工干預(yù)等手段,進(jìn)一步開展顯性知識和隱性知識的抽取,最后利用Neo4j數(shù)據(jù)庫實(shí)現(xiàn)圖譜的可視化并進(jìn)行圖譜解讀。

        圖譜給出了標(biāo)注歸口管理、標(biāo)準(zhǔn)的主要提出單位等信息。除了基本信息查詢,還通過CQL語句進(jìn)行了深度查詢,在揭示隱性關(guān)聯(lián)的主題關(guān)聯(lián)知識圖譜中,實(shí)現(xiàn)了標(biāo)準(zhǔn)—主題—關(guān)鍵詞之間的相互關(guān)聯(lián)關(guān)系,印證了RDM模型的可行性。

        但是,本文所構(gòu)建的金融領(lǐng)域主題關(guān)聯(lián)圖譜,但仍有一些無連接的關(guān)鍵詞類型的節(jié)點(diǎn),說明LDA主題模型的應(yīng)用還有待進(jìn)一步研究,標(biāo)準(zhǔn)文獻(xiàn)的主題揭示效果有待進(jìn)一步提升。

        猜你喜歡
        圖譜領(lǐng)域金融
        繪一張成長圖譜
        領(lǐng)域·對峙
        青年生活(2019年23期)2019-09-10 12:55:43
        何方平:我與金融相伴25年
        金橋(2018年12期)2019-01-29 02:47:36
        君唯康的金融夢
        補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
        中成藥(2017年3期)2017-05-17 06:09:01
        主動(dòng)對接你思維的知識圖譜
        P2P金融解讀
        新常態(tài)下推動(dòng)多層次多領(lǐng)域依法治理初探
        金融扶貧實(shí)踐與探索
        肯定與質(zhì)疑:“慕課”在基礎(chǔ)教育領(lǐng)域的應(yīng)用
        人妻无码中文人妻有码| 久久精品熟女亚洲av麻| 日本又色又爽又黄又免费网站| 人妻少妇被猛烈进入中文字幕| 中文字幕精品久久天堂一区 | 人妖系列在线免费观看| 漂亮人妻被强了完整版| 亚洲av永久精品爱情岛论坛| 色综合一本| 日韩av在线不卡观看| 久久精品不卡一区二区三区| 亚洲妇女自偷自偷图片| 久久香蕉国产线看观看网| 视频精品熟女一区二区三区| 97超碰国产成人在线| 国产精品乱码一区二区三区| 无码一区二区三区AV免费换脸| 亚洲av高清在线一区二区三区| 韩国av一区二区三区不卡| 亚洲av永久无码精品一区二区| 国产免费网站看v片元遮挡| 中文字幕日韩精品中文字幕| 成年美女黄的视频网站| 午夜福利电影| 国产毛片A啊久久久久| 精华国产一区二区三区| 国产高跟黑色丝袜在线| 久久99欧美| 激情视频在线播放一区二区三区| 久久婷婷五月综合色奶水99啪| 少妇脱了内裤让我添| caoporon国产超碰公开| 国产一区二区三区视频在线观看 | 久久天堂av色综合| 久久精品国产自产对白一区| 色爱av综合网站| 亚洲一区欧美二区| 日本一区二区三区在线视频观看| 中文字幕一区二区三区四区五区 | 日本一区二区啪啪视频 | 国产专区一线二线三线码|