摘 要:針對中國生豬產(chǎn)業(yè)鏈各環(huán)節(jié)關(guān)聯(lián)性弱、產(chǎn)業(yè)數(shù)據(jù)碎片化、數(shù)據(jù)類型復(fù)雜多樣等問題,文章研究設(shè)計(jì)了基于知識圖譜的生豬產(chǎn)業(yè)總體架構(gòu)。通過分析生豬垂直產(chǎn)業(yè)領(lǐng)域、本體設(shè)計(jì)、數(shù)據(jù)采集、基于語義角色標(biāo)注與依存句法分析的知識抽取和詞典匹配與相似度匹配相結(jié)合的知識融合、基于Neo4j數(shù)據(jù)庫的知識存儲六個(gè)步驟,構(gòu)建了生豬產(chǎn)業(yè)知識圖譜,實(shí)現(xiàn)了產(chǎn)業(yè)鏈上各孤立環(huán)節(jié)的應(yīng)用關(guān)聯(lián),為產(chǎn)業(yè)知識智能檢索與智能輔助決策系統(tǒng)構(gòu)建提供數(shù)據(jù)基礎(chǔ),助力中國生豬產(chǎn)業(yè)數(shù)字化建設(shè)。
關(guān)鍵詞:生豬產(chǎn)業(yè);知識圖譜;本體構(gòu)建;產(chǎn)業(yè)鏈;知識圖譜構(gòu)建
中圖分類號:TP391.1 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2024)16-0136-06
Research on the Construction of Knowledge Graph for Chinese Pig Industry
Abstract: In view of the problems of weak correlation between various links in Chinese pig industry chain, fragmentation of industrial data, and complex and diverse data types, this paper researches and designs the overall architecture of the pig industry based on knowledge graph. Through the six steps of analyzing the vertical industry field of pigs, ontology design, data collection, knowledge extraction based on semantic role annotation and dependency syntax analysis, knowledge fusion combining dictionary matching and similarity matching, and kJLESmAXguEJvGin3ybeRyXCUkdQruMacK/AiWS6vaqI=nowledge storage based on Neo4j database, the knowledge graph of pig industry is constructed. It realizes the application correlation of isolated links in the industrial chain, provides a data basis for intelligent retrieval of industrial knowledge and the construction of intelligent auxiliary decision-making systems, and assists the digital construction of Chinese pig industry.
Keywords: pig industry; knowledge graph; ontology construction; industrial chain; knowledge graph construction
0 引 言
我國生豬產(chǎn)業(yè)是農(nóng)業(yè)的重要支柱產(chǎn)業(yè),也是關(guān)乎我國民生大計(jì)的一大產(chǎn)業(yè),其在我國畜牧產(chǎn)業(yè)中長期處于主導(dǎo)地位。中國肉類消費(fèi)結(jié)構(gòu)以豬肉和雞肉作為主要消費(fèi)品種,牛羊肉作為補(bǔ)充品種,其中豬肉消費(fèi)量占中國總體肉類需求的一半以上。放眼全球,中國是最大的生豬生產(chǎn)國,豬肉產(chǎn)量接近全球豬肉產(chǎn)量的一半,2022年,全球豬肉產(chǎn)量約為1.25億噸,中國豬肉產(chǎn)量為5 541萬噸,在全球豬肉產(chǎn)量中所占比重近一半,約為44.47%[1]。
總的來看,生豬產(chǎn)業(yè)鏈主要由上游飼料加工行業(yè)和動物保健行業(yè)、中游生豬養(yǎng)殖行業(yè)、屠宰加工行業(yè)以及下游肉制品加工行業(yè)組成。然而在產(chǎn)業(yè)鏈實(shí)際運(yùn)作中涉及多個(gè)相互關(guān)聯(lián)階段的多層面內(nèi)容,極具復(fù)雜性。從參與方角度來看,產(chǎn)業(yè)鏈上有多種不同類型的參與方,包括飼養(yǎng)企業(yè)、養(yǎng)殖戶、獸醫(yī)、監(jiān)管部門、加工廠、運(yùn)輸公司、批發(fā)商、職業(yè)者等,這些參與方之間往往有著復(fù)雜的合作競爭關(guān)系。從數(shù)據(jù)多樣性的角度來說,各單元環(huán)節(jié)數(shù)據(jù)獨(dú)立,帶來數(shù)據(jù)來源雜亂、數(shù)據(jù)結(jié)構(gòu)不一致等問題。生豬產(chǎn)業(yè)數(shù)據(jù)包括養(yǎng)殖環(huán)境數(shù)據(jù)、飼料成分?jǐn)?shù)據(jù)、疫苗記錄、獸醫(yī)檢查結(jié)果、產(chǎn)品質(zhì)量檢測數(shù)據(jù)等,這些數(shù)據(jù)缺乏統(tǒng)一的數(shù)據(jù)庫進(jìn)行收集并整合分析[2]。從外部環(huán)境來看,生豬產(chǎn)業(yè)受到了許多政策法規(guī)的影響,涉及稅收政策、貿(mào)易政策、環(huán)保政策等多個(gè)方面,各個(gè)環(huán)節(jié)都需要遵守相應(yīng)的規(guī)定;在風(fēng)險(xiǎn)管理中涉及的因素也眾多,包括疫情疫病、市場供需價(jià)格波動、質(zhì)量安全問題、國際貿(mào)易政策等,這些因素將對產(chǎn)業(yè)鏈上的各個(gè)環(huán)節(jié)產(chǎn)生影響[3]。
知識圖譜技術(shù)提供了一種對該產(chǎn)業(yè)數(shù)據(jù)進(jìn)行結(jié)構(gòu)化存儲及智能化處理的方法,將同一領(lǐng)域內(nèi)的知識進(jìn)行關(guān)聯(lián)整合,提供全面準(zhǔn)確的信息支持。針對上述生豬產(chǎn)業(yè)鏈特點(diǎn),構(gòu)建生豬知識圖譜將從信息協(xié)作共享、智能決策協(xié)助以及風(fēng)險(xiǎn)管理預(yù)警等方面推動產(chǎn)業(yè)轉(zhuǎn)型升級,提出一條數(shù)字化賦能新型生豬產(chǎn)業(yè)經(jīng)營體系的實(shí)施路徑,為生豬產(chǎn)業(yè)數(shù)字化建設(shè)帶來新的契機(jī)[4]。
1 知識圖譜應(yīng)用現(xiàn)狀
知識圖譜作為一種以圖形化方式表示和組織知識的方法,本質(zhì)上是一種語義網(wǎng)絡(luò),通俗地講,就是把所有不同種類的信息連接在一起而得到的一個(gè)關(guān)系網(wǎng)絡(luò),其提供了從“關(guān)系”的角度去分析問題的能力。從另一個(gè)角度來說,它是一種基于圖的數(shù)據(jù)結(jié)構(gòu),由節(jié)點(diǎn)(Point)、邊(Edge)和屬性(Property)組成。在知識圖譜中,每個(gè)節(jié)點(diǎn)表示現(xiàn)實(shí)世界存在的“實(shí)體”,每條邊為實(shí)體與實(shí)體之間的“關(guān)系”[5]。目前知識圖譜主要分為兩類,一種是通用型知識圖譜,此類型面向通用領(lǐng)域的“結(jié)構(gòu)化的百科知識庫”,側(cè)重構(gòu)建行業(yè)常識性的知識,主要用于搜索引擎和推薦系統(tǒng);另一種為特定領(lǐng)域知識圖譜,即垂直知識圖譜:面向某一特定領(lǐng)域,可看成是一個(gè)“基于語義技術(shù)的行業(yè)知識庫”。通過構(gòu)建不同行業(yè)、企業(yè)的知識圖譜,對行業(yè)企業(yè)內(nèi)部提供知識化服務(wù)。本文所要構(gòu)建的屬于領(lǐng)域知識圖譜,因此接下來主要討論后者。
在特定垂直領(lǐng)域深入發(fā)展的今天,以知識圖譜為技術(shù)基礎(chǔ)的知識服務(wù)頗受重視。王棟等人[6]從數(shù)據(jù)層、知識抽取、本體模式、知識融合以及知識應(yīng)用五個(gè)層面設(shè)計(jì)構(gòu)建以我國甜櫻桃產(chǎn)業(yè)為主題的行業(yè)知識圖譜。毛瑞彬等人[7]從產(chǎn)業(yè)鏈角度出發(fā),著重介紹了產(chǎn)業(yè)鏈知識圖譜的構(gòu)建流程與本體設(shè)計(jì),并提出了基于領(lǐng)域語言模型的知識分類、抽取和融合算法。丁浩宸[8]通過對基于油茶上中下游全產(chǎn)業(yè)鏈相關(guān)數(shù)據(jù)的收集、分類和整理加工構(gòu)建了油茶知識圖譜并開發(fā)了應(yīng)用系統(tǒng),實(shí)現(xiàn)了智能搜索、知識關(guān)聯(lián)、知識問答等功能。陳恒等人[9]抽取了疾病名稱、癥狀、就診科室等六類疾病實(shí)體及六種相應(yīng)關(guān)系與屬性,結(jié)合醫(yī)療知識資源短缺的行業(yè)現(xiàn)狀和知識圖譜的特點(diǎn)構(gòu)建了一個(gè)基于疾病醫(yī)療領(lǐng)域的知識圖譜。而本體層作為核心頂層框架,為知識圖譜的構(gòu)建提供了一個(gè)清晰的結(jié)構(gòu)和規(guī)范的語義。許多等[10]對農(nóng)業(yè)時(shí)空進(jìn)行知識建模,采用自頂向下的構(gòu)建方法對水稻在施肥、營養(yǎng)失衡和作物農(nóng)情方面的知識整理分析,構(gòu)建了涵蓋作物、地塊、營養(yǎng)三方面,涉及農(nóng)業(yè)領(lǐng)域27個(gè)類的精準(zhǔn)施肥時(shí)空本體模型;Wang等人[11]采用半自動構(gòu)建方法對柑橘生產(chǎn)知識進(jìn)行整合,將技術(shù)報(bào)告和書籍中的文字、表格和圖片形式的柑橘生產(chǎn)知識組織并轉(zhuǎn)化為丘陵柑橘施肥和灌溉本體?;诒倔w,為重慶果農(nóng)開發(fā)了施肥、養(yǎng)分失衡和灌溉排水三種柑橘決策服務(wù)。劉桂鋒等人[12]依據(jù)本體原理,運(yùn)用本體構(gòu)建工具Protégé,以國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心的“棉麻類作物病原真菌病害數(shù)據(jù)庫”和“微生物農(nóng)藥數(shù)據(jù)庫”中的數(shù)據(jù)為主要數(shù)據(jù)源,構(gòu)建了棉花病害防治的知識本體。
2 生豬知識圖譜構(gòu)建設(shè)計(jì)
構(gòu)建生豬知識圖譜需綜合考慮到全產(chǎn)業(yè)鏈條,包括產(chǎn)業(yè)鏈上游的飼料、動物保健產(chǎn)品、種豬行業(yè),中游的養(yǎng)殖、屠宰加工行業(yè)以及下游的銷售行業(yè),涵蓋環(huán)節(jié)較多且涉及大量不同來源的數(shù)據(jù)和知識。由于生豬產(chǎn)業(yè)鏈的多環(huán)節(jié)復(fù)雜性,要有效構(gòu)建生豬知識圖譜,需要獲取、整合和清理大量的數(shù)據(jù),并解決數(shù)據(jù)格式、質(zhì)量和一致性等問題。其次,涉及不同領(lǐng)域的知識需要建立多個(gè)知識子圖,如何對各個(gè)子圖進(jìn)行合理的結(jié)構(gòu)設(shè)計(jì)和關(guān)聯(lián)建模,保證知識的準(zhǔn)確性、完整性和可用性是一大難點(diǎn)。本文選取靈活性較強(qiáng)的方法,自頂向下與自底向上相結(jié)合的方式進(jìn)行構(gòu)建[13]。一方面依據(jù)行業(yè)專家經(jīng)驗(yàn)從最頂層的概念開始構(gòu)建頂層本體,然后細(xì)化概念和關(guān)系,形成結(jié)構(gòu)良好的概念層次樹;另一方面從開放的多源數(shù)據(jù)中提取實(shí)體、關(guān)系、屬性等要素,對已構(gòu)建好的數(shù)據(jù)層進(jìn)行概念抽象,進(jìn)一步完善模式層設(shè)計(jì),擴(kuò)充概念。整體的架構(gòu)設(shè)計(jì)如圖1所示主要分為五個(gè)部分:數(shù)據(jù)采集層、知識抽取層、知識融合層、知識存儲層以及圖譜應(yīng)用層。
2.1 本體構(gòu)建
構(gòu)成知識圖譜內(nèi)容的除具體的實(shí)例知識外,還包括了對知識數(shù)據(jù)的描述和定義,即對生豬產(chǎn)業(yè)領(lǐng)域知識的高度概括和抽象,通常用概念,概念屬性以及概念之間的關(guān)系來描述。這部分對數(shù)據(jù)進(jìn)行描述和定義的“元”數(shù)據(jù)被稱為知識體系(Schema)或本體(Ontology)。對于采用自頂向下與自底向上相結(jié)合的構(gòu)建方法,首先應(yīng)構(gòu)建一個(gè)輕量級的知識體系,然后在此基礎(chǔ)上進(jìn)行擴(kuò)展。由于生豬產(chǎn)業(yè)圖譜屬于垂直特定領(lǐng)域的應(yīng)用,對知識的精確性要求也較高,因此本文選擇人工方式進(jìn)行本體描述,包括產(chǎn)業(yè)鏈上、中、下游一類的事實(shí)性知識以及側(cè)重于對生豬價(jià)格波動管理的經(jīng)驗(yàn)性知識,如供需變化、養(yǎng)殖成本與生豬價(jià)格變化之間的關(guān)系。初步的生豬產(chǎn)業(yè)模式圖設(shè)計(jì)詳如圖2所示,其中橢圓代表類別概念,矩形與菱形代表概念屬性。
2.2 數(shù)據(jù)采集
根據(jù)上文本體層的思路結(jié)合對我國生豬產(chǎn)業(yè)的分析可知,所需相關(guān)數(shù)據(jù)大致可分為四大類:上游數(shù)據(jù)、中游數(shù)據(jù)、下游數(shù)據(jù)以及圍繞“生豬價(jià)格”為主題的事件數(shù)據(jù)。其中,上中下游行業(yè)數(shù)據(jù)按照是否具有獨(dú)特性可細(xì)分為兩類,一類是通用的共性數(shù)據(jù),如名稱、法人、聯(lián)系電話、辦公地址等內(nèi)容,另一類是各自行業(yè)特有的數(shù)據(jù),如屠宰加工行業(yè)里的“定點(diǎn)屠宰證號”、動保行業(yè)中的“規(guī)格”“用途”等內(nèi)容。上述產(chǎn)業(yè)數(shù)據(jù)可通過B2B平臺,如“愛采購”“企查查”生豬行業(yè)門戶網(wǎng)站如“豬易網(wǎng)”“中國生豬網(wǎng)”等渠道進(jìn)行收集整理。
最后一類事件數(shù)據(jù)分為三部分,分別是有關(guān)管理部門與機(jī)構(gòu)中的政策、文件報(bào)告等非結(jié)構(gòu)化數(shù)據(jù)、諸如“22省市豆粕平均價(jià)”的結(jié)構(gòu)化數(shù)據(jù)以及同樣是文本類的非結(jié)構(gòu)化數(shù)據(jù):從產(chǎn)業(yè)相關(guān)論文、期刊以及行業(yè)研報(bào)中提取出來的與生豬價(jià)格波動有關(guān)的一系列現(xiàn)象,在本體層中這些現(xiàn)象抽象化分為“供給端現(xiàn)象”“需求端現(xiàn)象”和“其他現(xiàn)象”三大概念。這些事件型數(shù)據(jù)主要來源于國家統(tǒng)計(jì)局、國家發(fā)改委、農(nóng)業(yè)農(nóng)村部等國家相關(guān)部門發(fā)布的統(tǒng)計(jì)數(shù)據(jù)和文件報(bào)告,生豬產(chǎn)業(yè)研報(bào)、論文期刊以及Wind數(shù)據(jù)庫。
2.3 知識抽取
在知識圖譜的構(gòu)建中,知識抽取是構(gòu)建生豬產(chǎn)業(yè)知識圖譜的關(guān)鍵步驟,通過對文本進(jìn)行深度解析,我們可以提取出豐富的文本信息,以構(gòu)建具有格式化形式的知識表示,即三元組[頭實(shí)體,關(guān)系,尾實(shí)體]。對于中文文本語料語法復(fù)雜的情況,毛小麗等[14]提出了基于語義角色標(biāo)注的知識抽取方法,相較于通過上下文構(gòu)造特征向量的抽取方式效果有顯著提升;郭喜躍等[15]提出了一種句法分析和語義特征相結(jié)合的抽取方法,融合了句法依存關(guān)系、語義角色標(biāo)注等原理。本文基于對生豬產(chǎn)業(yè)語料的分析,采用語義角色標(biāo)注與依存句法分析相融合的方式進(jìn)行三元組抽取。
語義角色標(biāo)注是一種淺層語義分析技術(shù),該方法以句子為單位,分析句子的謂詞-論元結(jié)構(gòu),不對句子所包含的語義信息進(jìn)行深入分析。具體來說,語義角色標(biāo)注的任務(wù)就是以句子的謂詞為中心,研究句子中各成分與謂詞之間的關(guān)系,針對句子中的(核心)謂詞來確定其他論元以及其他論元的角色。該方法基于動作施事者A0、受事者A1、時(shí)間TMP、地點(diǎn)DOC等語義角色的劃分,有效地捕捉到了句子中的主謂賓語。然而,在生豬產(chǎn)業(yè)研報(bào)中的文本中經(jīng)常出現(xiàn)多謂詞、多賓語的復(fù)雜句,為了更全面地獲取實(shí)體間的關(guān)系,在此融合依存句法分析來彌補(bǔ)上述方法的不足。首先基于語義角色標(biāo)注提取主語和核心謂詞后,通過三種不同的句法關(guān)系進(jìn)行事實(shí)三元組提取:1)如果存在主語(SBV)和動詞的賓語(VOB)關(guān)系,那么將提取主謂賓關(guān)系的事實(shí)三元組;2)如果存在定語(ATT)關(guān)系和動賓(VOB)關(guān)系,將提取定語后置的事實(shí)三元組;3)如果同時(shí)存在主謂關(guān)系和動補(bǔ)關(guān)系(CMP),則提取含有介賓關(guān)系的主謂動補(bǔ)關(guān)系的事實(shí)三元組。
本文從生豬領(lǐng)域垂直網(wǎng)站中爬取得到143段資訊文本,采用哈工大LTP作為自然語言處理工具的核心引擎,通過調(diào)用LTP的API接口,將文本數(shù)據(jù)生成程序中進(jìn)行處理,得到了句子的分詞、詞性標(biāo)注、依存句法分析結(jié)果,以及語義角色的劃分,最終得到若干條三元組,如表1所示。
另一方面,此方法也存在著一些缺陷,表2是抽取得到的存在錯(cuò)誤、冗余信息以及完整性不足的三元組示例。
其中,第一條的原始文本語句是“工人們正快速地完成生豬放血、噴淋清洗、摘除內(nèi)臟等工序,獸醫(yī)……”。從這兩個(gè)三元組可以看出,該方法缺少了對主語、賓語之間并列(COO)關(guān)系的依存關(guān)系分析。第二條的原始文本語句是“嚴(yán)格執(zhí)行相關(guān)工作人員核酸一天一檢,并突出做好檢驗(yàn)檢疫、消毒、無害化處理和應(yīng)急管理等工作……”,出現(xiàn)了核心謂詞的提取錯(cuò)誤,導(dǎo)致三元組的語義紊亂。第三條的原始文本語句為“神農(nóng)集團(tuán)相關(guān)負(fù)責(zé)人表示:第三季度斷奶仔豬成本是降低的。公司的養(yǎng)殖成本中,仔豬成本是3.82元/千克……”。此三元組的主語缺少完整性,理想情況下應(yīng)為[神農(nóng)集團(tuán)仔豬成本,是,3.82元/千克]。
2.4 知識融合
對構(gòu)建生豬知識圖譜而言,數(shù)據(jù)來源大多基于海量的非結(jié)構(gòu)化數(shù)據(jù),即文本數(shù)據(jù),通過知識抽取提取出三元組后獲得了最基礎(chǔ)的知識單元,但從上一環(huán)節(jié)獲取的三元組由于數(shù)據(jù)多元化加之語料庫重要來源之一的生豬產(chǎn)業(yè)研報(bào)中各產(chǎn)業(yè)分析師表述存在著差異化用詞,仍然存在大量冗余、錯(cuò)誤、不完整的信息,因此進(jìn)行知識融合是完善圖譜構(gòu)建不可或缺的一個(gè)環(huán)節(jié)。實(shí)體對齊作為知識融合中最重要的子任務(wù)之一,在實(shí)體層面上從各方面整合數(shù)據(jù),找出表示相同含義的實(shí)體,對錯(cuò)誤信息進(jìn)行處理從而保證圖譜的質(zhì)量[16]。
本文擬采用基于詞典匹配與相似度匹配相結(jié)合的方法,首先進(jìn)行輸入實(shí)體類型判斷,通過構(gòu)建的命名實(shí)體詞典進(jìn)行匹配查詢,如匹配成功則將實(shí)體名稱替換為詞典中主名稱,否則進(jìn)入匹配相似度計(jì)算。而基于字符串相似度的實(shí)體對齊即將字符串形式的文本進(jìn)行相似度分析并基于此判斷實(shí)體是否指向相同[17]。值得注意的是,對于數(shù)值類型的屬性數(shù)據(jù),如規(guī)格、有效期等需統(tǒng)一處理為描述+數(shù)值范圍+單位。對剩余類型實(shí)體可采用余弦相似度算法,首先進(jìn)行實(shí)體詞匯級別的向量化表示[18],然后計(jì)算這些實(shí)體與同類型實(shí)體間的余弦相似度,用向量空間中兩向量夾角的余弦值作為衡量兩個(gè)實(shí)體之間差異大小的標(biāo)準(zhǔn):
式中:A、B表示詞向量,n表示向量維度,Ai與Bi表示詞向量中的各個(gè)分量,余弦值S越接近1,表明兩個(gè)向量的夾角越接近0度,則兩個(gè)詞向量越相似,兩實(shí)體語義越接近。反之S越接近0,則兩向量越不相似。在此基礎(chǔ)上設(shè)定一個(gè)閾值,若超出此數(shù)值即成為融合對象,否則創(chuàng)建新的實(shí)體[19]。
2.5 知識存儲
完成上述步驟后得到9 194條三元組數(shù)據(jù),本文選擇采用Neo4j數(shù)據(jù)庫進(jìn)行存儲,具體操作如下[20]:將Excel中的三元組數(shù)據(jù)轉(zhuǎn)換成CSV格式數(shù)據(jù),文件主要為實(shí)例與關(guān)系兩部分。實(shí)例文件中包括實(shí)體名稱、地址、品名等屬性,關(guān)系文件中包含第一事件和第二事件以及連接事件的具體關(guān)系詞,如圖3、圖4所示。
上述兩類CSV文件放在Neo4j數(shù)據(jù)庫目錄import文件夾中,即可開始導(dǎo)入。如使用Cypher語言可以快速導(dǎo)入實(shí)例屬性和關(guān)系,如圖5所示。圖6、圖7分別為生豬知識圖譜局部結(jié)構(gòu)與節(jié)點(diǎn)標(biāo)簽展示。
3 結(jié) 論
本文通過剖析生豬產(chǎn)業(yè)中的問題,面向生豬垂直領(lǐng)域,提出了一套構(gòu)建該產(chǎn)業(yè)知識圖譜的方法。從產(chǎn)業(yè)發(fā)展的角度來看,生豬知識圖譜通過行業(yè)專家的經(jīng)驗(yàn)和知識,整合歸納大量產(chǎn)業(yè)知識,有助于統(tǒng)一行業(yè)認(rèn)知,解決信息不對稱的問題;知識圖譜技術(shù)在該領(lǐng)域的應(yīng)用,整合了行業(yè)現(xiàn)狀、政策法規(guī)、市場需求等多方面信息,幫助發(fā)現(xiàn)潛在的知識聯(lián)系和規(guī)律;此外,智能化、信息化程度的提高在應(yīng)對各類產(chǎn)業(yè)突發(fā)事件時(shí)響應(yīng)速度更快,能夠?yàn)橄嚓P(guān)管理部門等提供決策支持,降低決策風(fēng)險(xiǎn),了解行業(yè)現(xiàn)狀和需求并發(fā)現(xiàn)問題和瓶頸,尋找解決方案和技術(shù)突破點(diǎn),從而推動行業(yè)的可持續(xù)發(fā)展。與此同時(shí),本文還有諸多不足之處,如模式層設(shè)計(jì)不完善等問題,在后續(xù)研究中需對這些問題進(jìn)一步補(bǔ)充和完善。
參考文獻(xiàn):
[1] 中商情報(bào)網(wǎng).2022年中國肉類產(chǎn)量及市場結(jié)構(gòu)數(shù)據(jù)分析 [EB/OL].(2023-07-02).https://baijiahao.baidu.com/s?id=1770259179895391828&wfr=spider&for=pc.
[2] 韓智,周法國.基于知識圖譜的高鐵動車設(shè)備檢測系統(tǒng)的本體框架構(gòu)建與維護(hù) [J].現(xiàn)代電子技術(shù),2018,41(6):11-14.
[3] 辛翔飛,王祖力,劉晨陽,等.新階段我國生豬產(chǎn)業(yè)發(fā)展形勢、問題和對策 [J].農(nóng)業(yè)經(jīng)濟(jì)問題,2023(8):4-16.
[4] 陳衛(wèi)洪,王瑩.數(shù)字化賦能新型農(nóng)業(yè)經(jīng)營體系構(gòu)建研究——“智農(nóng)通”的實(shí)踐與啟示 [J].農(nóng)業(yè)經(jīng)濟(jì)問題,2022(9):86-99.
[5] 黃恒琪,于娟,廖曉,等.知識圖譜研究綜述 [J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2019,28(6):1-12.
[6] 王棟,周菲,李穎芳,等.我國甜櫻桃產(chǎn)業(yè)知識圖譜構(gòu)建研究 [J].中國果樹,2023(1):104-108.
[7] 毛瑞彬,朱菁,李愛文,等.基于自然語言處理的產(chǎn)業(yè)鏈知識圖譜構(gòu)建 [J].情報(bào)學(xué)報(bào),2022,41(3):287-299.
[8] 丁浩宸.油茶知識圖譜構(gòu)建與應(yīng)用 [D].北京:中國林業(yè)科學(xué)研究院,2020.
[9] 陳恒,方潔昊,李正光,等.基于醫(yī)療百科網(wǎng)絡(luò)的疾病醫(yī)療知識圖譜構(gòu)建研究 [J].圖書情報(bào)導(dǎo)刊,2023,8(4):58-65.
[10] 許多,魯旺平,許瑞清,等.基于農(nóng)業(yè)時(shí)空多模態(tài)知識圖譜的水稻精準(zhǔn)施肥決策方法 [J].華中農(nóng)業(yè)大學(xué)學(xué)報(bào),2023,42(3):281-292.
[11] WANG Y,WANG Y,WANG J,et al. An Ontology-based Approach to Integration of Hilly Citrus Production Knowledge [J].Computers and Electronics in Agriculture,2015,113:24-43.
[12] 劉桂鋒,楊倩,劉瓊.農(nóng)業(yè)科學(xué)數(shù)據(jù)集的本體構(gòu)建與可視化研究——以“棉花病害防治”領(lǐng)域?yàn)槔?[J].情報(bào)雜志,2022,41(9):143-149+175.
[13] 劉嶠,李楊,段宏,等.知識圖譜構(gòu)建技術(shù)綜述 [J].計(jì)算機(jī)研究與發(fā)展,2016,53(3):582-600.
[14] 毛小麗,何中市,邢欣來,等.基于語義角色的實(shí)體關(guān)系抽取 [J].計(jì)算機(jī)工程,2011,37(17):143-145.
[15] 郭喜躍,何婷婷,胡小華,等.基于句法語義特征的中文實(shí)體關(guān)系抽取 [J].中文信息學(xué)報(bào),2014,28(6):183-189.
[16] 翟嬌嬌.面向知識圖譜構(gòu)建的知識融合問題研究 [D].濟(jì)南:齊魯工業(yè)大學(xué),2021.
[17] 楊媛.音樂領(lǐng)域知識圖譜構(gòu)建框架研究 [J].數(shù)字圖書館論壇,2022(2):40-46.
[18] 宿愷,潘晨輝.電商領(lǐng)域多模態(tài)商品知識圖譜構(gòu)建研究 [J].現(xiàn)代電子技術(shù),2023,46(20):173-177.
[19] 辛輝,謝鎮(zhèn)璽,李朋駿,等.面向食品貯藏領(lǐng)域的知識圖譜構(gòu)建方法研究 [J].計(jì)算機(jī)工程與應(yīng)用,2023,59(22):329-342.
[20] 趙雪芹,楊一凡,于文靜.基于Neo4j圖數(shù)據(jù)庫的工程檔案知識圖譜構(gòu)建及應(yīng)用 [J].檔案與建設(shè),2022(5):48-51.