亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多源異構(gòu)數(shù)據(jù)的市政管理知識(shí)庫(kù)構(gòu)建

        2016-11-23 04:55:44佟明川陳明銳鐘東來(lái)張淑征
        關(guān)鍵詞:語(yǔ)義體系

        佟明川, 陳明銳, 許 斌, 鐘東來(lái), 張淑征

        (1.海南大學(xué) 信息科學(xué)技術(shù)學(xué)院,海南 ???570228;2.清華大學(xué) 信息科學(xué)技術(shù)學(xué)院,北京 100084)

        ?

        基于多源異構(gòu)數(shù)據(jù)的市政管理知識(shí)庫(kù)構(gòu)建

        佟明川1,2, 陳明銳1, 許 斌2, 鐘東來(lái)2, 張淑征1,2

        (1.海南大學(xué) 信息科學(xué)技術(shù)學(xué)院,海南 ???570228;2.清華大學(xué) 信息科學(xué)技術(shù)學(xué)院,北京 100084)

        為了滿足市政管理領(lǐng)域?qū)?shù)據(jù)權(quán)威性和體系完備性的高要求,實(shí)現(xiàn)市政管理領(lǐng)域知識(shí)庫(kù)的自動(dòng)化構(gòu)建,筆者提出了一種基于多源異構(gòu)數(shù)據(jù)的市政管理知識(shí)庫(kù)構(gòu)建模型.采用自頂向下的構(gòu)建模式,完成對(duì)結(jié)構(gòu)化關(guān)系型數(shù)據(jù)、半結(jié)構(gòu)化文本數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)在內(nèi)的多源異構(gòu)數(shù)據(jù)自動(dòng)化知識(shí)抽取,最后設(shè)計(jì)了一個(gè)輕量級(jí)示例系統(tǒng),并對(duì)該方法的執(zhí)行效果進(jìn)行了評(píng)估.實(shí)驗(yàn)結(jié)果表明,本方法在市政管理領(lǐng)域的知識(shí)庫(kù)構(gòu)建上優(yōu)勢(shì)明顯,能夠?qū)崿F(xiàn)對(duì)多種市政管理資源的自動(dòng)化知識(shí)抽取,所生成的概念體系完整清晰,知識(shí)描述恰當(dāng)準(zhǔn)確.

        智慧城市; 市政管理; 多源異構(gòu)數(shù)據(jù); 自動(dòng)化知識(shí)抽??; 領(lǐng)域知識(shí)庫(kù)構(gòu)建

        隨著城市信息化進(jìn)程的日益加快,人們對(duì)城市服務(wù)能力的要求也越來(lái)越高.尤其在市政管理方面,社會(huì)需要政府盡快從管理型向服務(wù)型轉(zhuǎn)變,為公眾提供更為人性化的市政服務(wù),如圖 1城市管理三維分析模型[1]所示.隨著城市規(guī)模的日益擴(kuò)張,城市內(nèi)部各要素間的相互作用也不斷增強(qiáng),這無(wú)疑進(jìn)一步加劇了城市管理的難度.于是學(xué)者們提出了智慧城市的發(fā)展思路,通過(guò)先進(jìn)的信息技術(shù)手段來(lái)緩解城市發(fā)展所帶來(lái)的壓力[2],促進(jìn)城市和諧、可持續(xù)發(fā)展.

        與此同時(shí),知識(shí)工程作為人工智能領(lǐng)域的重要學(xué)科,研究者們開(kāi)展了許多相關(guān)工作[3-4],其中不乏基于領(lǐng)域本體知識(shí)庫(kù)的城市智慧系統(tǒng)構(gòu)建案例[5].知識(shí)庫(kù)構(gòu)建方法大致可分為3類:直接編輯知識(shí)、基于大眾智慧的眾包式構(gòu)建以及自動(dòng)或半自動(dòng)的知識(shí)抽取.其中,直接編輯知識(shí)方式由于受時(shí)間和經(jīng)濟(jì)的成本制約,并不適合大規(guī)模知識(shí)庫(kù)的構(gòu)建;基于大眾智慧的眾包模式則采用互聯(lián)網(wǎng)眾包機(jī)制[6],但過(guò)于依賴激勵(lì)機(jī)制且內(nèi)容的準(zhǔn)確性難以控制,使得知識(shí)庫(kù)在運(yùn)行穩(wěn)定性和體系完備性上得不到保證,市政管理領(lǐng)域涉及到大量的專業(yè)法律法規(guī)和執(zhí)法規(guī)范,對(duì)數(shù)據(jù)的準(zhǔn)確性、權(quán)威性和時(shí)效性都有著極高要求.因此,上述2種方式不適用于目前市政管理領(lǐng)域的知識(shí)庫(kù)構(gòu)建.筆者以自動(dòng)或半自動(dòng)知識(shí)抽取為基礎(chǔ),結(jié)合市政管理領(lǐng)域的數(shù)據(jù)特點(diǎn),提出了基于多源異構(gòu)數(shù)據(jù)的市政管理知識(shí)庫(kù)構(gòu)建方法,實(shí)現(xiàn)了對(duì)異構(gòu)數(shù)據(jù)源的自動(dòng)化知識(shí)抽取,完成了對(duì)市政管理資源的多元多層次語(yǔ)義融合.

        1 相關(guān)工作

        1.1 研究背景及現(xiàn)狀 自20世紀(jì)末以來(lái)電子政務(wù)及其相關(guān)研究[7]便成為研究的熱點(diǎn).中國(guó)作為當(dāng)今城市現(xiàn)代化建設(shè)最為快速的國(guó)家之一,對(duì)城市的信息化進(jìn)程高度重視[8].如今,所有的市政管理部門都擁有自己的電子政務(wù)系統(tǒng)(以下簡(jiǎn)稱部門系統(tǒng)),但由于每個(gè)部門的工作內(nèi)容和業(yè)務(wù)流程不盡相同,使得部門系統(tǒng)所使用的系統(tǒng)結(jié)構(gòu)及數(shù)據(jù)流格式存在明顯差異,這導(dǎo)致部門系統(tǒng)的“孤島”問(wèn)題凸顯.

        以往對(duì)于此類問(wèn)題,業(yè)界通常采用通用數(shù)據(jù)庫(kù)接口技術(shù)[9]解決,但此技術(shù)主要應(yīng)用于關(guān)系型數(shù)據(jù)庫(kù)的數(shù)據(jù)通信,在知識(shí)的存儲(chǔ)和表示上具有明顯的局限性.首先傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)對(duì)知識(shí)的表達(dá)和處理能力差,不支持專門的推理機(jī)制和帶控制的搜索;其次市政管理體系的內(nèi)部邏輯復(fù)雜,關(guān)系型數(shù)據(jù)庫(kù)可能會(huì)導(dǎo)致關(guān)鍵語(yǔ)義的丟失和推理性能的下降.因此,充分考慮了本體知識(shí)庫(kù)在語(yǔ)義表達(dá)和知識(shí)推理方面的優(yōu)勢(shì),提出通過(guò)構(gòu)建市政管理知識(shí)庫(kù)解決上述問(wèn)題[10].

        此外,在數(shù)據(jù)融合方面也已取得了一定的成果[11],包括知識(shí)搜集[12]和數(shù)據(jù)挖掘[13]相關(guān)工作.同時(shí)還開(kāi)展了大量關(guān)于知識(shí)工程技術(shù)的智慧城市研究工作[14-15],目前城市本體的相關(guān)研究主要集中在軌道交通[16]、基礎(chǔ)醫(yī)療[17]等領(lǐng)域,但是市政管理作為城市建設(shè)的重要環(huán)節(jié)卻鮮有針對(duì)該領(lǐng)域的知識(shí)庫(kù)構(gòu)建及研究工作.

        1.2 研究?jī)?nèi)容 針對(duì)市政管理領(lǐng)域的特點(diǎn),在現(xiàn)有的研究基礎(chǔ)上提出了基于多源異構(gòu)數(shù)據(jù)的知識(shí)庫(kù)構(gòu)建方法,該方法采用自頂向下的構(gòu)建模式,強(qiáng)調(diào)了知識(shí)體系的系統(tǒng)化和有序化.整個(gè)構(gòu)建流程可分為知識(shí)庫(kù)構(gòu)建和系統(tǒng)接口設(shè)計(jì)2個(gè)部分,其中知識(shí)庫(kù)構(gòu)建部分包含領(lǐng)域概念化、知識(shí)結(jié)構(gòu)化和語(yǔ)義鏈接3個(gè)階段,方法的構(gòu)建流程如圖 2所示.

        2 多源異構(gòu)數(shù)據(jù)

        市政管理領(lǐng)域?qū)儆趶?fù)雜巨系統(tǒng),為了確保知識(shí)體系的完整性和領(lǐng)域知識(shí)的準(zhǔn)確性,用于知識(shí)庫(kù)構(gòu)建的數(shù)據(jù)源應(yīng)具備多元化的特點(diǎn),需要充分考慮到結(jié)構(gòu)化、半結(jié)構(gòu)化及無(wú)結(jié)構(gòu)化等多源異構(gòu)數(shù)據(jù).

        2.1 結(jié)構(gòu)化部門系統(tǒng)元數(shù)據(jù) 系統(tǒng)元數(shù)據(jù)是指用來(lái)描述系統(tǒng)數(shù)據(jù)的數(shù)據(jù).部門系統(tǒng)元數(shù)據(jù)是領(lǐng)域?qū)<覅⑴c制定的部門系統(tǒng)資源抽象化描述,通常為二維表結(jié)構(gòu).表1中元數(shù)據(jù)每個(gè)元素都有4個(gè)字段對(duì)其描述,即業(yè)務(wù)標(biāo)識(shí)、元素名稱、類型和類別.其中,業(yè)務(wù)標(biāo)識(shí)描述了知識(shí)體系的層次結(jié)構(gòu);元素名稱為元素的說(shuō)明標(biāo)簽;類型為元素基于概念層次的分類;類別則描述了元素的物理特征.

        表1 部門系統(tǒng)元數(shù)據(jù)示例

        2.2 半結(jié)構(gòu)化法律法規(guī)文本 法律法規(guī)是行政執(zhí)法工作的判定依據(jù)和執(zhí)行準(zhǔn)則,原則上每項(xiàng)市政管理業(yè)務(wù)都應(yīng)有一條或若干條法律法規(guī)條款與之對(duì)應(yīng),因此市政管理知識(shí)庫(kù)中必須有覆蓋該領(lǐng)域的所有相關(guān)法律法規(guī)知識(shí).法律法規(guī)通常為無(wú)結(jié)構(gòu)或半結(jié)構(gòu)化的純文本數(shù)據(jù),具有統(tǒng)一的格式規(guī)范.圖 3為與表 1處罰措施相對(duì)應(yīng)的法律法規(guī)條款,展示了法律法規(guī)數(shù)據(jù)的文本內(nèi)容和格式特點(diǎn).

        4、以欺騙手段取得資質(zhì)證書承攬城鄉(xiāng)編制工作

        處罰種類:罰款

        法律依據(jù):

        《城鄉(xiāng)規(guī)劃法》第六十二條第三款:“以欺騙手段取得資質(zhì)證書承攬城鄉(xiāng)編制工作的,由原發(fā)證機(jī)關(guān)吊銷資質(zhì)證書,依照本條第一款規(guī)定處以罰款:造成損失的,依法承擔(dān)賠償責(zé)任.”

        圖3 法律文本格式規(guī)范示例

        使用系統(tǒng)元數(shù)據(jù)的優(yōu)勢(shì)在于其最大程度地保留了市政管理領(lǐng)域的業(yè)務(wù)信息和邏輯關(guān)系,非常適合組織市政管理領(lǐng)域的知識(shí)體系.

        2.3 海量互聯(lián)網(wǎng)數(shù)據(jù) 在當(dāng)今的大數(shù)據(jù)時(shí)代,互聯(lián)網(wǎng)提供了海量的數(shù)據(jù)資源,雖然這些數(shù)據(jù)在知識(shí)密度和數(shù)據(jù)準(zhǔn)確性上遠(yuǎn)不及上述2種數(shù)據(jù)資源,但其獲取成本小,并且可以保證知識(shí)體系的完備性,提升知識(shí)庫(kù)的實(shí)用性.因此,選取互聯(lián)網(wǎng)百科數(shù)據(jù)作為知識(shí)庫(kù)構(gòu)建的外圍補(bǔ)充層,將互聯(lián)網(wǎng)數(shù)據(jù)有選擇地填充到知識(shí)庫(kù)中.

        3 基于多源異構(gòu)數(shù)據(jù)的知識(shí)庫(kù)構(gòu)建

        本構(gòu)建方法具有對(duì)多源異構(gòu)數(shù)據(jù)的知識(shí)轉(zhuǎn)化和處理能力,工作重點(diǎn)在于實(shí)現(xiàn)市政管理領(lǐng)域中,多源異構(gòu)數(shù)據(jù)的自動(dòng)化知識(shí)抽取和語(yǔ)義恢復(fù).整個(gè)過(guò)程可分為領(lǐng)域概念化、知識(shí)結(jié)構(gòu)化及語(yǔ)義鏈接3個(gè)階段.

        3.1 領(lǐng)域概念化 領(lǐng)域概念化主要指市政管理知識(shí)體系的概念模型構(gòu)建.由于市政管理領(lǐng)域?qū)χR(shí)體系的準(zhǔn)確性和完整性要求較高,提出以部門系統(tǒng)元數(shù)據(jù)為基礎(chǔ)的概念體系構(gòu)建方法,該方法強(qiáng)調(diào)了知識(shí)概念體系的系統(tǒng)化和有序化.將表1中的系統(tǒng)元數(shù)據(jù)“類型”屬性作為概念列表自動(dòng)化抽取,所得概念體系,如圖 4所示.

        3.2 知識(shí)結(jié)構(gòu)化 本階段的主要目標(biāo)是完成多源異構(gòu)數(shù)據(jù)的知識(shí)抽取,實(shí)現(xiàn)對(duì)市政管理知識(shí)體系的結(jié)構(gòu)化構(gòu)建.為了保證知識(shí)抽取的效率和質(zhì)量,采取自動(dòng)化的抽取策略,所涉及的異構(gòu)數(shù)據(jù)源包括部門系統(tǒng)元數(shù)據(jù)和純文本法律法規(guī)2類.

        3.2.1 基于部門系統(tǒng)元數(shù)據(jù)的知識(shí)抽取 為了實(shí)現(xiàn)對(duì)部門系統(tǒng)元數(shù)據(jù)中知識(shí)的自動(dòng)化抽取,制定了如下轉(zhuǎn)換規(guī)則

        規(guī)則1 將具有相同“元素名稱”的元素作為同一實(shí)例處理,一個(gè)實(shí)例可能會(huì)有多個(gè)“業(yè)務(wù)標(biāo)識(shí)”與之對(duì)應(yīng);

        規(guī)則2 元素的“類型”字段規(guī)定了該實(shí)例的所屬概念,可以直接與概念體系模型相對(duì)應(yīng);

        規(guī)則3 元素的“類別”字段將作為該實(shí)例的對(duì)象類型屬性(Object Property),用來(lái)描述上下層級(jí)實(shí)例間的語(yǔ)義關(guān)系.

        按照上述轉(zhuǎn)換規(guī)則對(duì)表 1中元數(shù)據(jù)做自動(dòng)化知識(shí)抽取,可得到如下OWL結(jié)果.

        “處罰以欺騙手段取得資質(zhì)證書承攬城鄉(xiāng)規(guī)劃編制工作”

        “C.1.1.1.10.23”

        該OWL片段描述了系統(tǒng)元數(shù)據(jù)中“處罰以欺騙手段取得資質(zhì)證書承攬城鄉(xiāng)規(guī)劃編制工作”實(shí)例及該實(shí)例與其他實(shí)例間的屬性關(guān)聯(lián)關(guān)系.

        轉(zhuǎn)換規(guī)則不但能快速完成系統(tǒng)元數(shù)據(jù)的自動(dòng)化知識(shí)抽取,還可以較好地保留實(shí)體間的語(yǔ)義信息,為后續(xù)知識(shí)推理工作的開(kāi)展提供幫助.圖 5為表 1中系統(tǒng)元數(shù)據(jù)經(jīng)過(guò)知識(shí)抽取后得到的結(jié)果.

        3.2.2 基于純文本法律法規(guī)的知識(shí)抽取 基本思想是設(shè)計(jì)自動(dòng)或半自動(dòng)的算法,從現(xiàn)有的文檔中提取知識(shí).由于法律法規(guī)具有明確的格式規(guī)范,可以通過(guò)劃分基本單元的方式對(duì)其中的知識(shí)逐一抽取.利用法律單元所具有的統(tǒng)一格式規(guī)范,通過(guò)正則匹配等方式實(shí)現(xiàn)法律文本的自動(dòng)化知識(shí)抽取.以圖 3中的法律文本為例,具體步驟如下

        步驟1 法律基本單元以阿拉伯?dāng)?shù)字為劃分,每個(gè)基本單元對(duì)應(yīng)一個(gè)法律實(shí)例;

        步驟2 當(dāng)匹配到以阿拉伯?dāng)?shù)字為開(kāi)頭的字符串時(shí),則為該實(shí)例創(chuàng)建數(shù)據(jù)類型屬性(Data Property)“處罰行為”,匹配所得字符串即為屬性值;

        步驟3 當(dāng)匹配字符串為“處罰種類”時(shí),則為該實(shí)例創(chuàng)建數(shù)據(jù)類型屬性“處罰種類”,其后字符串為屬性值;

        步驟4 當(dāng)匹配字符串為“法律依據(jù)”時(shí),其后文字為該違法行為的法律依據(jù).需要對(duì)這部分作字符串的2次匹配,即引號(hào)前的部分將作為實(shí)例標(biāo)簽(Label)處理;引號(hào)后的部分則作為該法律的具體描述,存儲(chǔ)在注釋(Comment)中;

        步驟5 當(dāng)再次匹配到以阿拉伯?dāng)?shù)字為開(kāi)頭的字符串時(shí),說(shuō)明上一基本單元的知識(shí)抽取工作已經(jīng)基本完成,將跳轉(zhuǎn)到步驟1繼續(xù)處理下一單元,直至所有導(dǎo)入數(shù)據(jù)全部處理完畢.

        按照上述步驟對(duì)3所示的法律基本單元做自動(dòng)化知識(shí)抽取,可得到OWL片段如下

        “《城市道路管理?xiàng)l例》第四十二條第一款”

        “以欺騙手段取得資質(zhì)證書承攬城鄉(xiāng)規(guī)劃編制工作的,由原發(fā)證機(jī)關(guān)吊銷資質(zhì)證書,依照本條第一款規(guī)定處以罰款;造成損失的,依法承擔(dān)賠償責(zé)任.”

        以欺騙手段取得資質(zhì)證書承攬城鄉(xiāng)規(guī)劃編制工作的

        罰款

        3.3 語(yǔ)義鏈接 討論如何從中找出實(shí)體間的內(nèi)在聯(lián)系,實(shí)現(xiàn)實(shí)體的語(yǔ)義鏈接.在市政管理知識(shí)庫(kù)中,語(yǔ)義鏈接主要體現(xiàn)在2個(gè)層面:1)基于領(lǐng)域知識(shí)體系的語(yǔ)義恢復(fù);2)基于互聯(lián)網(wǎng)資源的知識(shí)擴(kuò)充.

        3.3.1 基于領(lǐng)域知識(shí)體系的語(yǔ)義恢復(fù) 在市政管理的知識(shí)體系中,語(yǔ)義關(guān)系主要表現(xiàn)為2種形式:1)市政管理業(yè)務(wù)間的邏輯關(guān)系;2)市政管理業(yè)務(wù)與法律條款間的關(guān)聯(lián)關(guān)系.對(duì)于第一種語(yǔ)義關(guān)系的恢復(fù),已經(jīng)通過(guò)上節(jié)的實(shí)例屬性抽取實(shí)現(xiàn),將主要介紹第二種情況的自動(dòng)化語(yǔ)義鏈接方法,主要通過(guò)計(jì)算活動(dòng)實(shí)例與法律實(shí)例的關(guān)聯(lián)程度實(shí)現(xiàn).

        在市政管理本體知識(shí)庫(kù)中,實(shí)例間通過(guò)構(gòu)建屬性連接實(shí)現(xiàn)語(yǔ)義關(guān)聯(lián).通過(guò)分析法律實(shí)例與活動(dòng)實(shí)例的特征,計(jì)算二者的相似程度來(lái)判斷是否為其建立鏈接關(guān)系,當(dāng)相似度超過(guò)閾值時(shí),則創(chuàng)建“法律依據(jù)”屬性將二者關(guān)聯(lián)起來(lái),此處閾值預(yù)實(shí)驗(yàn)結(jié)果設(shè)置為0.8.該過(guò)程的偽代碼如下.

        While 法律實(shí)例隊(duì)列Q非空

        初始化相似度S=0;

        初始化活動(dòng)實(shí)例隊(duì)列P;

        法律實(shí)例V=隊(duì)列Q的隊(duì)頭元素出隊(duì);

        While 活動(dòng)實(shí)例隊(duì)列P非空

        活動(dòng)實(shí)例W=隊(duì)列P的隊(duì)頭元素出隊(duì);

        S=計(jì)算實(shí)例V與實(shí)例W的相似度;

        If S>閾值

        Then 屬性關(guān)聯(lián)實(shí)例V與實(shí)例W;

        Else 不關(guān)聯(lián)實(shí)例V與實(shí)例W;

        End If

        End While

        End While

        為確保實(shí)例鏈接的準(zhǔn)確性,采用編輯距離算法[18]和余弦相似度算法相結(jié)合的方式來(lái)確定實(shí)例間的相似度.其中,編輯距離算法通過(guò)Apache Common的Levenshtein函數(shù)獲得,余弦相似度計(jì)算公式

        ( 1 )

        其中,x為第一個(gè)句子的向量,y為第二個(gè)句子的向量,右式的分子為向量x與向量y的笛卡兒積,即相同字出現(xiàn)頻度的乘積的和;分母為x向量的模和y向量的模的乘積,向量的模為各向量中元素平方和的二次方跟;n為向量的長(zhǎng)度,i是一個(gè)變量指示器.選取二者的F1-Measure值作為相似度計(jì)算結(jié)果,公式如下

        ( 2 )

        其中,x為第一個(gè)句子的向量,y為第二個(gè)句子的向量,cos sim(x,y)和levin(x,y)分別代表余弦相似度算法和編輯距離算法的相似度計(jì)算值,表 2為部分實(shí)驗(yàn)數(shù)據(jù)的測(cè)試結(jié)果.

        表2 實(shí)體關(guān)聯(lián)度計(jì)算

        表 2中,第三組實(shí)驗(yàn)數(shù)據(jù)即滿足上述實(shí)體關(guān)聯(lián)條件,于是將自動(dòng)添加三元組 將2個(gè)實(shí)例關(guān)聯(lián)起來(lái).

        語(yǔ)義鏈接工作進(jìn)一步完善了市政管理知識(shí)體系,準(zhǔn)確地發(fā)映了業(yè)務(wù)實(shí)例與法律實(shí)例間的語(yǔ)義聯(lián)系.“處罰未取得建設(shè)工程規(guī)劃許可證或者未按照建設(shè)工程規(guī)劃許可證的規(guī)定進(jìn)行建設(shè)”實(shí)例通過(guò)上述語(yǔ)義恢復(fù)工作與多條法律實(shí)例建立屬性鏈接的OWL結(jié)果.

        “處罰未取得建設(shè)工程規(guī)劃許可證或者未按照建設(shè)工程規(guī)劃許可證的規(guī)定進(jìn)行建設(shè)”

        “C.1.1.1.10.25”

        3.3.2 基于互聯(lián)網(wǎng)資源的知識(shí)擴(kuò)充 雖然部門系統(tǒng)元數(shù)據(jù)和純文本法律法規(guī)為市政管理知識(shí)庫(kù)提供了可靠有效的數(shù)據(jù)來(lái)源,但數(shù)據(jù)源在領(lǐng)域信息的描述上仍較為簡(jiǎn)略,且時(shí)常涉及專有名詞,不利于公眾對(duì)知識(shí)體系的理解.于是結(jié)合互聯(lián)網(wǎng)數(shù)據(jù)對(duì)知識(shí)庫(kù)做了進(jìn)一步完善,主要通過(guò)Xlore(http://www.xlore.org/)提供的實(shí)例查找API,可以把城市管理知識(shí)庫(kù)的實(shí)例定位到相應(yīng)在Xlore的實(shí)例.Xlore是清華大學(xué)知識(shí)工程實(shí)驗(yàn)室(KEG)自主研發(fā)的基于百度百科、互動(dòng)百科、中文維基和英文維基等4個(gè)在線百科資源的交叉語(yǔ)義知識(shí)庫(kù),通過(guò)調(diào)用其API為知識(shí)庫(kù)中的大部分概念和實(shí)例找到相應(yīng)的概要描述信息.

        4 市政管理知識(shí)庫(kù)

        為了論證本文所提出的市政管理知識(shí)庫(kù)構(gòu)建方法在的實(shí)際操作過(guò)程中的性能和效果,使用上述方法了構(gòu)建了一個(gè)輕量級(jí)的市政管理知識(shí)庫(kù),并對(duì)該知識(shí)庫(kù)的各項(xiàng)指標(biāo)作了統(tǒng)計(jì)分析.

        本知識(shí)庫(kù)示例是基于新疆維吾爾自治區(qū)克拉瑪依市的市政管理資源構(gòu)建,包括克拉瑪依市部門系統(tǒng)元數(shù)據(jù)共計(jì)7 985項(xiàng),相關(guān)法律法規(guī)共245件1 945項(xiàng).采取本文知識(shí)庫(kù)構(gòu)建方法對(duì)數(shù)據(jù)源進(jìn)行處理,共得到概念14個(gè),實(shí)例4 283項(xiàng)以及屬性47個(gè),涵蓋了與市政管理相關(guān)的組織機(jī)構(gòu)、業(yè)務(wù)活動(dòng)及法律法規(guī)等方面.表3為知識(shí)庫(kù)中各概念及其實(shí)例數(shù)量的分布情況.

        表3 實(shí)例分布情況統(tǒng)計(jì) 個(gè)

        本市政管理知識(shí)庫(kù)共生成三元組25 891條,共包含16個(gè)概念,其頂層概念體系如圖 6所示,其中“人員”和“領(lǐng)域”2個(gè)上層概念是領(lǐng)域?qū)<以诟拍畛槿〉慕Y(jié)果上抽象出來(lái)的,是對(duì)體系層次結(jié)構(gòu)的優(yōu)化與完善.該知識(shí)圖譜中的屬性鏈接反映了不同實(shí)體間的語(yǔ)義關(guān)系.圖 7為“操作者”概念及其實(shí)例的屬性鏈接情況,清晰地刻畫了“操作者”概念及其實(shí)例與其他實(shí)體間的關(guān)系,圖中實(shí)線表示概念與實(shí)例間的從屬關(guān)系,虛線表示實(shí)例間的屬性鏈接關(guān)系.

        鑒于目前尚無(wú)相關(guān)科研成果可供對(duì)比參照,故采用人工校驗(yàn)的方式對(duì)實(shí)驗(yàn)結(jié)果的正確性進(jìn)行驗(yàn)證.將實(shí)驗(yàn)結(jié)果通過(guò)protégé生成可視化的知識(shí)圖譜,由領(lǐng)域?qū)<覍?duì)實(shí)驗(yàn)結(jié)果的正確性進(jìn)行驗(yàn)證,驗(yàn)證結(jié)果表明本文方法所生成的概念體系完備,邏輯關(guān)系正確.相對(duì)于直接編輯知識(shí)和眾包式構(gòu)建等傳統(tǒng)知識(shí)庫(kù)構(gòu)建方法,本文方法更符合市政管理的領(lǐng)域特點(diǎn),在知識(shí)庫(kù)的完備性和準(zhǔn)確性上優(yōu)勢(shì)明顯.

        5 結(jié)束語(yǔ)

        本文論證了市政管理領(lǐng)域的特點(diǎn),采取自頂向下的自動(dòng)化知識(shí)抽取方式,有效地克服了直接編輯知識(shí)、基于眾包模式等構(gòu)建方法在資源成本和信息準(zhǔn)確性上的不足,并提出了基于多源異構(gòu)數(shù)據(jù)的市政管理知識(shí)庫(kù)構(gòu)建方法,實(shí)現(xiàn)了市政管理資源從領(lǐng)域概念化到知識(shí)結(jié)構(gòu)化,再到知識(shí)服務(wù)化的轉(zhuǎn)化過(guò)程;最后鑒于本體知識(shí)具有良好的可移植性,所生成的市政管理知識(shí)庫(kù)可作為中間件為其他城市智慧應(yīng)用提供語(yǔ)義支撐.下一步工作將從以下幾個(gè)方面展開(kāi):1)將更多地關(guān)注于知識(shí)庫(kù)的驗(yàn)證,特別是知識(shí)庫(kù)局部更新的數(shù)據(jù)一致性問(wèn)題;2)將在后續(xù)的工作中設(shè)計(jì)開(kāi)發(fā)基于該系統(tǒng)的城市智能應(yīng)用,進(jìn)一步挖掘市政管理知識(shí)庫(kù)的應(yīng)用價(jià)值.

        [1] 宋剛. 復(fù)雜性科學(xué)視野下的城市管理三維結(jié)構(gòu)[J]. 城市發(fā)展研究,2007,14(6):72-76.

        [2] Ricciardi F, Za S. Smart City Research as an Interdisciplinary Crossroads: A Challenge for Management and Organization Studies. From Information to Smart Society[M]. Switzerland: Springer International Publishing,2015:163-171.

        [3] Davies W K D. Developing Knowledge Cities[M]. Netherlands: Springer,2015:381-424.

        [4] 馬斌, 王金虹, 閆娟娟,等. 基于本體的智能語(yǔ)義檢索模型設(shè)計(jì)與研究[J]. 情報(bào)科學(xué),2015,33(2):46-49.

        [5] Chung T L,Xu B,Zhang P,et al.Constructing City Ontology from Expert for Smart City Management[M]∥Jing Yijia.The Road to Collaborative Gollaboration in China.Switzerland:Springer lnternational Publishing,2014:187-194.

        [6] Getman A P, Karasiuk V V. A crowdsourcing approach to building a legal ontology from text[J]. Artificial Intelligence & Law,2014,22(3):313-335.

        [7] Anthes G. Estonia: a model for e-government[J]. Communications of the Acm,2015,58(6):18-20.

        [8] Schlaeger J. Collaboration in China’s E-Government:A Cultural-Theory Analysis[M]∥Jing Yijia .The Road to Collaborative Governance in China.New York:Palgrave Macmillan US,2015:123-145.

        [9] 黎澤龍, 張陽(yáng), 薛原,等. 基于 XML 的數(shù)據(jù)庫(kù)接口自動(dòng)生成技術(shù)設(shè)計(jì)與應(yīng)用[J]. 計(jì)算機(jī)與數(shù)字工程,2015,43(8):1 547-1 551.

        [10] Bellini P, Nesi P, Rauch N, et al. Ontology bulding vs data harvesting and cleaning for smart-city services[J]. Journal of Visual Languages & Computing,2014,25:827-839.

        [11] Cataldo A, Pinto V D, Rinaldi A M. A Methodological approach to integrate ontology and configurational analysis: proceedings of the 4th International Conference on Complex Systems and Applications Contents, Le Havre France, June 23-26, 2014 [C]. Switzerland: Springer,2014.

        [12] 管君, 謝瑋, 張仰森. 基于多知識(shí)源的語(yǔ)義搭配知識(shí)庫(kù)的構(gòu)建及應(yīng)用[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2013,34(6):2 136-2 140.

        [13] Thakor P, Sasi S. Ontology-based sentiment analysis process for social media content[J]. Procedia Computer Science,2015,53:199-207.

        [14] 楊建萍, 年梅. 基于維基百科網(wǎng)絡(luò)技術(shù)的概念語(yǔ)義網(wǎng)絡(luò)構(gòu)建[J]. 計(jì)算機(jī)與現(xiàn)代化,2016(1):1-5.

        [15] Bellini P, Nesi P, Rauch N. Knowledge base construction process for smart-city services: proceedings of the 19th International Conference on Engineering of Complex Computer Systems on IEEE, Tianjin, August 4-7, 2014 [C]. [S.l.]: IEEE,2014.

        [16] Bermejo A J, Villadangos J, Astrain J J. Ontology based road traffic management, intelligent distributed computing[J]. Studies in Computational Intelligence, 2013, 446(16):103-108.

        [17] Song T M, Park H A, Jin D L. Development of health information search engine based on metadata and ontology.[J]. Healthcare Informatics Research,2014,20(2):88-98.

        [18] 王衛(wèi)紅, 李君. 基于局部變化性的改進(jìn)編輯距離算法[J]. 計(jì)算機(jī)工程,2015,41(7):294-298.

        Constructing Municipal Management Knowledgebase Based on Heterogeneous Data

        Tong Mingchuan1,2, Chen Mingrui1, Xu Bin2, Chung Tonglee2, Zhang Shuzheng1,2

        (1. College of Information Science and Technology, Hainan University, Haikou 570228, China;2. College of Information Science and Technology, Tsinghua University, Beijing 100084, China)

        In our report, to meet the requirement of legitimacy and completeness in the field of municipal management and realize the automation of municipal management knowledgebase constructing, a top down municipal management knowledgebase model based on heterogeneous data was constructed. The model can extract structured data, semi-structured data and unstructured data, and a light weight knowledgebase system for evaluation and presentation purpose was designed. The results showed that the model of domain-knowledgebase construction in the field of municipal management has obvious advantages, which can realize automatic knowledge extraction from a variety of municipal administration resources, and generate a complete concept system and exact knowledge information.

        smart city; municipal management; heterogeneous data; domain knowledgebase construction; automatic knowledge extraction

        2016-02-28

        國(guó)家863計(jì)劃(2013AA01A607); 海南省社會(huì)發(fā)展科技專項(xiàng)(2015SF32)

        佟明川(1990-),男,遼寧撫順人,海南大學(xué)2013級(jí)碩士研究生,研究領(lǐng)域:知識(shí)工程,E-mail: tmc0916@163.com

        陳明銳(1960-),男,海南海口人,教授,博導(dǎo),研究領(lǐng)域:軟件工程,E-mail: 1607885098@qq.com

        1004-1729(2016)03-0228-09

        TP 391

        A

        10.15886/j.cnki.hdxbzkb.2016.0035

        猜你喜歡
        語(yǔ)義體系
        構(gòu)建體系,舉一反三
        語(yǔ)言與語(yǔ)義
        探索自由貿(mào)易賬戶體系創(chuàng)新應(yīng)用
        “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
        如何建立長(zhǎng)期有效的培訓(xùn)體系
        認(rèn)知范疇模糊與語(yǔ)義模糊
        “曲線運(yùn)動(dòng)”知識(shí)體系和方法指導(dǎo)
        “深+N季”組配的認(rèn)知語(yǔ)義分析
        語(yǔ)義分析與漢俄副名組合
        “三位一體”德育教育體系評(píng)說(shuō)
        天堂av国产一区二区熟女人妻| 国产午夜激情视频自拍| 亚洲熟妇色xxxxx欧美老妇| 伊人网在线视频观看| 免费国产黄片视频在线观看| 亚洲综合在线一区二区三区| 久久精品国产亚洲av久五月天| 91综合久久婷婷久久| 国产颜射视频在线播放| 中文字幕被公侵犯的丰满人妻| 男男做h嗯啊高潮涩涩| 91偷拍与自偷拍亚洲精品86| 午夜视频在线瓜伦| 四虎成人精品国产永久免费无码| 久久久久亚洲精品无码网址蜜桃| 少妇愉情理伦片丰满丰满午夜 | 国产精品黄在线观看免费软件| 黄 色 人 成 网 站 免 费| 人妻丰满熟妇av无码区hd| 日韩色久悠悠婷婷综合| 国产夫妻自偷自拍第一页| 精品国产一区二区三区av麻| 免费人成网站在线观看欧美| 大香伊蕉国产av| 伊人网视频在线观看| 亚洲精品aⅴ无码精品丝袜足| 91精品亚洲一区二区三区| 精品人妻午夜中文字幕av四季| 日本护士xxxxhd少妇| 亚洲av综合永久无码精品天堂| 亚洲国产成人久久一区| 亚洲一区区| 青青青视频手机在线观看| 亚洲乱码中文字幕在线播放| 国产精品国产精品国产专区不卡| 亚洲欧美一区二区三区在线| 荡女精品导航| 少妇爽到爆视频网站免费| 中文字幕在线亚洲精品一区| 人妻少妇久久久久久97人妻| 9lporm自拍视频区|