陳祖琴(1.南京大學(xué)信息管理學(xué)院 江蘇南京 210023)(2.江蘇省數(shù)據(jù)工程與知識服務(wù)重點(diǎn)實(shí)驗室(南京大學(xué)) 江蘇南京 210023)
·專題:面向突發(fā)事件應(yīng)急決策的快速響應(yīng)情報體系研究·
面向應(yīng)急情報采集與組織的突發(fā)事件特征詞典編制*
陳祖琴
(1.南京大學(xué)信息管理學(xué)院江蘇南京210023)
(2.江蘇省數(shù)據(jù)工程與知識服務(wù)重點(diǎn)實(shí)驗室(南京大學(xué))江蘇南京210023)
摘要:
文章提出從“分類、分級、分期”三個維度對突發(fā)事件特征屬性進(jìn)行描述和編碼,建立突發(fā)事件特征詞典,輔助應(yīng)急情報采集與組織的方法。首先,利用現(xiàn)有突發(fā)事件分類體系,以及從相關(guān)部門關(guān)于突發(fā)事件的分類、通報等信息中提取的突發(fā)事件分類特征屬性詞及詞間關(guān)系,設(shè)計編碼規(guī)則,建立突發(fā)事件分類詞表;其次,利用相關(guān)文件提取突發(fā)事件各個分類的分級標(biāo)準(zhǔn)并編碼,再針對每個分類下的所有分級制定分期標(biāo)準(zhǔn);再次,采用概念樹的形式存儲突發(fā)事件三個維度的特征屬性,構(gòu)建突發(fā)事件特征詞典;最后,利用構(gòu)建的特征詞典輔助突發(fā)事件情報采集與組織。關(guān)鍵詞:
突發(fā)事件;應(yīng)急情報;特征詞典;情報采集;情報組織頻繁發(fā)生的各類突發(fā)事件,給人們的生命和財產(chǎn)安全造成了巨大威脅,快速有效的應(yīng)急決策,對減少損失起著至關(guān)重要的作用,而有效的情報支持則是決策成功的關(guān)鍵。已有研究成果多將曾經(jīng)發(fā)生的突發(fā)事件經(jīng)驗和教訓(xùn)視為寶貴的信息資源,采集和組織已經(jīng)發(fā)生突發(fā)事件的決策情報,具有重要的意義。國內(nèi)外相關(guān)研究顯示,從情報學(xué)的視角對突發(fā)事件情報進(jìn)行組織及相應(yīng)處理的研究還比較少。鑒于突發(fā)事件的復(fù)雜性和難以預(yù)測性,“情景-應(yīng)對”模式已成為突發(fā)事件應(yīng)對研究的主流,“情景-應(yīng)對”是在對以往事件發(fā)生以及運(yùn)行規(guī)律的認(rèn)識和收斂的基礎(chǔ)上,形成和制定相應(yīng)的應(yīng)對措施。根據(jù)突發(fā)事件情景的特征編制詞典,對突發(fā)事件情報的采集和組織進(jìn)行規(guī)范,對突發(fā)事件應(yīng)對具有積極的作用。
《國家突發(fā)公共事件總體應(yīng)急預(yù)案》對突發(fā)事件的分類、分級原則進(jìn)行了描述,并依據(jù)突發(fā)事件演化階段分期進(jìn)行應(yīng)急處置,基于此作者在文獻(xiàn)[8]中曾提出可以通過突發(fā)事件情景的分類、分級、分期三個維度屬性的相似度來考察突發(fā)事件情景之間的相似度,從而發(fā)現(xiàn)相似情景,實(shí)現(xiàn)應(yīng)急策略復(fù)用。本文將具體描述通過對突發(fā)事件的分類、分級、分期三個維度特征屬性進(jìn)行編碼,構(gòu)建突發(fā)事件特征詞典的方法,為突發(fā)事件情報采集和組織提供工具和保障。
相關(guān)研究中,楊麗英等從較粗的粒度研究了突發(fā)事件新聞?wù)Z料的分類體系和編碼,為本文進(jìn)行分類特征提取提供了一定的借鑒。參考《中國圖書館分類法》的編制原則和體系,首先對突發(fā)事件情景的分類特征屬性概念進(jìn)行編碼建立分類詞表;再針對每個類目,制定相應(yīng)的分級標(biāo)準(zhǔn)并進(jìn)行相應(yīng)的代碼設(shè)置,最后為每個類目下的每個級別的事件設(shè)置事件分期的標(biāo)準(zhǔn)和代碼,得到完整的突發(fā)事件特征屬性編碼。同時,本文綜合比較了關(guān)于領(lǐng)域特征詞典構(gòu)建的部分相關(guān)研究,最終采用概念樹的形式來存儲突發(fā)事件特征詞典。
分類詞表記錄著突發(fā)事件情景特征信息中總結(jié)出來的分類概念以及概念間關(guān)系,主要關(guān)系為上下位關(guān)系,次要關(guān)系為指代關(guān)系。上下位關(guān)系反映了概念之間的包含關(guān)系,指代關(guān)系是對相同概念的不同表達(dá)形式或者概念所指代的不便繼續(xù)細(xì)分的下級概念等進(jìn)行的規(guī)范。分類詞表構(gòu)建包含:(1)確定概念編碼規(guī)則;(2)原始詞表生成;(3)詞表的完善(見圖1)。
圖1 分類詞表構(gòu)建模型
首先,利用現(xiàn)有突發(fā)事件分類體系和一些部門的相關(guān)文件中對突發(fā)事件的分類,提取分類特征屬性詞,根據(jù)制定的概念編碼規(guī)則生成原始分類詞表;其次,根據(jù)突發(fā)事件案例,包括歷史突發(fā)事件案例和當(dāng)前目標(biāo)突發(fā)事件案例,提取分類特征屬性詞,對原始分類詞表進(jìn)行補(bǔ)充和完善,完成最終的分類詞表構(gòu)建。
2.1概念編碼規(guī)則
突發(fā)事件特征詞典里的概念,最主要的關(guān)系是上下位關(guān)系,因此在對概念編碼時按照上下位關(guān)系進(jìn)行分層編碼。根據(jù)編碼,能直觀地看出概念之間的從屬關(guān)系,表現(xiàn)出概念在分類概念樹中的具體位置。編碼的具體規(guī)則為:以概念在分類概念樹中的層級為基礎(chǔ),為概念所處的每一層級分別賦予順序編碼,層級之間用“-”隔開。同時,為了減小編碼的復(fù)雜度,借鑒《中國圖書館分類法》關(guān)于類目復(fù)分和仿分的做法。一方面,設(shè)置通用的復(fù)分表,對諸如事件的發(fā)生時間、地點(diǎn)等,進(jìn)行共性類目的設(shè)置;另一方面,利用仿分的方式簡化子類劃分相似類目的劃分,如“食源性傳染病”屬于食品安全事件的子類,其下級類目與普通“傳染病”的下級類目劃分相似,可以采用仿分的方式。
以“霍亂”為例,對編碼的格式進(jìn)行展示。“霍亂”是“甲類傳染病”的一種,“甲類傳染病”是“傳染病疫情”的子類,他們之間形成上下位關(guān)系,若“傳染病疫情”在構(gòu)建好的詞典里屬于二級概念,它的第一層級編碼為“1”,第二層級編碼為“1”,則賦予“傳染病疫情”編碼“1-1”;“甲類傳染病”屬于三級概念,若其三級編碼為“1”,則賦予“甲類傳染病”編碼“1-1-1”;相應(yīng)地“霍亂”屬于四級概念,其前三級的編碼和上位概念相同,第四級的編碼為“2”,則最后賦予編碼“1-1-1-2”。編碼由變長字符串來存儲,根據(jù)概念所處的位置不同,處于不同層級的概念的編碼長度也不同。
2.2原始詞表生成
原始詞表主要是利用現(xiàn)有突發(fā)事件分類體系,以及相關(guān)部門關(guān)于突發(fā)事件的分類、通報等信息提取分類特征詞來生成?!秶彝话l(fā)公共事件總體應(yīng)急預(yù)案》將突發(fā)事件分為公共衛(wèi)生事件、自然災(zāi)害、社會安全事件、事故災(zāi)難四大類,并列出了相應(yīng)大類的二級類目;《國家特別重大、重大突發(fā)公共事件分級標(biāo)準(zhǔn)(試行)》中對這些類目進(jìn)行了更為詳盡的細(xì)分,本文構(gòu)建的詞表沿用這些大類及其子類,在此基礎(chǔ)上利用各級部門發(fā)布的相關(guān)文件,提取分類特征詞進(jìn)行進(jìn)一步的細(xì)化,劃分出更多層級的子類,最終細(xì)分到較為具體的事件名稱。比如利用國家衛(wèi)生計生委疾病預(yù)防控制局發(fā)布的關(guān)于全國法定傳染病疫情的通報,可以對“傳染病疫情”類目進(jìn)行非常詳細(xì)的劃分。
具體到事件,例如,1988年上海甲型肝炎大流行事件,“甲型肝炎”作為分類特征詞,在詞表中屬于“乙類傳染病”的一個子類,“乙類傳染病”屬于“傳染病疫情”的子類,而“傳染病疫情”屬于“公共衛(wèi)生事件”的子類,“甲型肝炎”、“乙類傳染病”、“傳染病疫情”、“公共衛(wèi)生事件”都是分類詞表的組成概念。
為了對概念的表述進(jìn)行規(guī)范,在詞表中為每個特征詞設(shè)置“備注”字段,將與其具有指代關(guān)系的所有其他表述統(tǒng)一映射到特征詞下,后續(xù)進(jìn)行分類特征屬性詞標(biāo)引時都采用規(guī)范化的特征詞。在規(guī)范特征詞選取時,應(yīng)注意靈活性,以實(shí)用為目的,盡量選取使用范圍較廣、公眾接受度較高的詞,并不強(qiáng)求一定要是學(xué)術(shù)性最強(qiáng)的表達(dá)(分類詞表示例(部分)見表1)。
表1 分類詞表示例(部分)
2.3詞表的完善
突發(fā)事件的突發(fā)性和偶然性決定了原始詞表不可能窮盡所有的類目,在確?;敬箢惒蛔兊那疤嵯?,需要對相應(yīng)類目進(jìn)行不斷擴(kuò)充和完善。對歷史突發(fā)事件案例情景及待決策的目標(biāo)情景,設(shè)計抽取規(guī)則抽取出分類特征屬性詞并利用原始詞表進(jìn)行規(guī)范化標(biāo)引,若抽取的分類特征屬性詞不能在原始詞表中找到某個合適的具體類目進(jìn)行標(biāo)引,則該詞作為新概念進(jìn)行編碼并添加進(jìn)分類詞表中。詞表完善流程描述如下:
(1)抽取案例情景的分類特征屬性詞;
(2)利用原始分類詞表對案例情景分類特征屬性進(jìn)行編碼,若無法找到匹配的類目,則轉(zhuǎn)到第(3)步;
(3)在原始分類詞表中查找案例情景分類特征屬性詞的上位詞,在其上位詞的下級類目添加該分類特征屬性詞,修改原始分類詞表;
(4)經(jīng)過修改的原始分類詞表構(gòu)成了最終的分類詞表。
根據(jù)構(gòu)建的突發(fā)事件分類詞表,針對每個分類設(shè)定其對應(yīng)的分級標(biāo)準(zhǔn)和編碼,再對每個分級設(shè)定相應(yīng)的分期標(biāo)準(zhǔn)和編碼,“分類”、“分級”、“分期”編碼之間用“:”進(jìn)行連接,得到完整的突發(fā)事件特征編碼。
3.1分級標(biāo)準(zhǔn)設(shè)定方法
《國家突發(fā)公共事件總體應(yīng)急預(yù)案》按照各類突發(fā)事件的性質(zhì)、嚴(yán)重程度、可控性和影響范圍等因素,將突發(fā)事分為4級:Ⅰ級(特別重大)、Ⅱ級(重大)、Ⅲ級(較大)和Ⅳ級(一般)。本文沿用這4個分級并據(jù)此對各個具體的突發(fā)事件分類進(jìn)行分級標(biāo)準(zhǔn)設(shè)定,并在具體分級標(biāo)準(zhǔn)設(shè)定過程中,參考《國家特別重大、重大突發(fā)公共事件分級標(biāo)準(zhǔn)(試行)》關(guān)于特別重大、重大突發(fā)事件的劃分標(biāo)準(zhǔn),地方性《突發(fā)公共事件分級標(biāo)準(zhǔn)》以及各級各類部門的專門應(yīng)急預(yù)案和文件的分級標(biāo)準(zhǔn),如《廣東省突發(fā)公共衛(wèi)生事件應(yīng)急預(yù)案》等,設(shè)定具體分類下的分級標(biāo)準(zhǔn)。分級標(biāo)準(zhǔn)設(shè)定方法主要分為:
(1)直接提取分級標(biāo)準(zhǔn)。若各類關(guān)于突發(fā)事件分級的文件中有關(guān)于某個分類的分級標(biāo)準(zhǔn),則直接提取文件中關(guān)于該類的分級標(biāo)準(zhǔn),若分類不存在某個分級,則表示為NULL。例如:針對“肺鼠疫”分類,分級標(biāo)準(zhǔn)可以描述為:
肺鼠疫-Ⅰ級:肺鼠疫在大、中城市發(fā)生并有擴(kuò)散趨勢,或波及兩個以上省份,并有進(jìn)一步擴(kuò)散趨勢。
肺鼠疫-Ⅱ級:肺鼠疫在1個縣(市)范圍內(nèi),1個平均潛伏期內(nèi)發(fā)生5例以上或疫情波及2個以上的縣(市)。
肺鼠疫-Ⅲ級:發(fā)生肺鼠疫病例,1個平均潛伏期內(nèi)病例數(shù)未超過5例,流行范圍在1個縣(市、區(qū))行政區(qū)域內(nèi)。
肺鼠疫-Ⅳ級:NULL。
(2)沿用上位類的分級標(biāo)準(zhǔn)。對于無法在各類分級文件中找到具體類名的分類,通過查找其上位類的方式,直到在分級文件中找到最近的上位類,則該分類可以復(fù)用其在分級文件中的上位類的分級標(biāo)準(zhǔn),進(jìn)行相應(yīng)的分類特征屬性詞替換,生成該分類的分級標(biāo)準(zhǔn)。
例如,關(guān)于“甲型肝炎”,在各類分級文件中無法找到關(guān)于“甲型肝炎”的分級標(biāo)準(zhǔn),但在分級文件中可以查找到最近的上位類 “乙類傳染病”的分級標(biāo)準(zhǔn),以“乙類傳染病-Ⅱ級”為例,其分級標(biāo)準(zhǔn)為“乙類傳染病疫情波及2個以上縣(市),1周內(nèi)發(fā)病水平超過前5年同期平均發(fā)病水平2倍以上”,則“甲型肝炎-Ⅱ級”的分級標(biāo)準(zhǔn)沿用“乙類傳染病-Ⅱ級”的分級標(biāo)準(zhǔn),具體操作方法為以“甲型肝炎”替換“乙類傳染病”:“甲型肝炎疫情波及2個以上縣 (市),1周內(nèi)發(fā)病水平超過前5年同期平均發(fā)病水平2倍以上”。
(3)根據(jù)下位類的分級標(biāo)準(zhǔn)確定上位類的分級標(biāo)準(zhǔn)。對于某個分類,如果無法在各類分級文件中找到具體類名的分類,也無法找到其上位類的分級標(biāo)準(zhǔn),但是可以找到關(guān)于其所有下位類的描述,則可以利用所有下位類的分級標(biāo)準(zhǔn),取并集的方式,生成該類目的分級標(biāo)準(zhǔn)。
(4)參照最接近的同級類目設(shè)置分級標(biāo)準(zhǔn)。若存在某個分類,無法在各類分級文件中找到具體類名的分類,也無法在分級文件中找到最近的上、下位類的分級標(biāo)準(zhǔn),則可以參考與其最接近的同級類目的分級標(biāo)準(zhǔn),設(shè)置其分級標(biāo)準(zhǔn)。
3.2分期標(biāo)準(zhǔn)設(shè)定方法
突發(fā)事件通常遵循一定的生命周期,每一種類型、每一個級別的突發(fā)事件都有其發(fā)生、發(fā)展和減緩的階段,不同的學(xué)者對突發(fā)事件的分期給出了不同的劃分方式。根據(jù)這些學(xué)者對突發(fā)事件的生命周期理論和突發(fā)事件階段劃分研究的探討,以及突發(fā)事件應(yīng)急處理的主要情報需求階段,本文將突發(fā)事件的分期界定為:1(預(yù)警器)、2(爆發(fā)期)、3(緩解期)、4(重建期),并制定了相應(yīng)的基礎(chǔ)性分期標(biāo)準(zhǔn)。
(1)1(預(yù)警器):突發(fā)事件已經(jīng)開始出現(xiàn),或者出現(xiàn)了苗頭,導(dǎo)致突發(fā)事件發(fā)生的因素顯現(xiàn)。
(2)2(爆發(fā)期):突發(fā)事件大量出現(xiàn),影響范圍或者造成的損失快速擴(kuò)大,或者突發(fā)事件造成的損失或影響范圍增長的速度增大。
(3)3(緩解期):突發(fā)事件造成的損失或影響范圍開始減小,或者突發(fā)事件造成的損失或影響范圍增長的速度開始減緩。
(4)4(重建期):突發(fā)事件完全得到控制,造成的損失或者影響范圍不再擴(kuò)大,突發(fā)事件趨于結(jié)束。
最后,利用基礎(chǔ)性分期標(biāo)準(zhǔn),根據(jù)具體分類、分級,進(jìn)行詳細(xì)的分期標(biāo)準(zhǔn)生成。例如,“傳染性非典型肺炎-Ⅰ級”-2(爆發(fā)期)標(biāo)準(zhǔn)為:日新增病例數(shù)或報告發(fā)病地區(qū)數(shù)急劇增加。
突發(fā)事件特征詞典包含了突發(fā)事件“分類”、“分級”、“分期”三個維度的特征,在構(gòu)建過程中首先根據(jù)分類特征詞表和分級、分期標(biāo)準(zhǔn)構(gòu)建突發(fā)事件特征詞表,再采用概念樹的形式來存儲詞典,從而清晰地表示詞典中概念間的相互關(guān)系。概念樹生成包括根據(jù)生成的分類特征詞表,建立分類特征概念樹;以及利用構(gòu)建的分類特征概念樹,根據(jù)特征詞表內(nèi)關(guān)于分級、分期標(biāo)準(zhǔn)的描述,對分類特征概念樹上的節(jié)點(diǎn)添加所有可能的分級、分期節(jié)點(diǎn),形成突發(fā)事件特征概念樹,構(gòu)成最終的特征詞典。
4.1突發(fā)事件特征詞表數(shù)據(jù)結(jié)構(gòu)
根據(jù)對突發(fā)事件“分類”、“分級”、“分期”特征的描述,可以構(gòu)建突發(fā)事件特征詞表,特征詞表中類目的最終編碼格式為:“分類:分級:分期”。分類、分級、分期三個屬性編碼皆不為空則描述一個完整的情景點(diǎn)編碼,否則情景點(diǎn)編碼為空(突發(fā)事件特征詞表的數(shù)據(jù)結(jié)構(gòu)示例見表2)。如以編碼“1-1-2-1:Ⅰ:1”為例,其代表的突發(fā)事件情景應(yīng)為“處于預(yù)警期,特別重大的傳染性非典型肺炎疫情”。
4.2分類特征概念樹構(gòu)建
利用突發(fā)事件分類詞表,查找到“上位詞”為空的分類特征詞作為概念樹的根節(jié)點(diǎn),初始化概念樹。然后順序讀取分類特征詞表,查找在已經(jīng)建立的分類特征概念樹中是否存在該記錄分類特征詞的 “上位詞”,若存在則將該記錄分類特征詞作為其“上位詞”的子節(jié)點(diǎn)加入分類特征概念樹中,否則將該“上位詞”作為分類特征詞加入分類特征概念樹中,再將該記錄的分類特征詞加入概念樹,并備注該詞的指代關(guān)系。讀取完所有記錄,即完成分類特征概念樹的構(gòu)建。分類特征概念樹生成算法為:
表2 突發(fā)事件特征詞表數(shù)據(jù)結(jié)構(gòu)(示例)
算法1分類特征概念樹生成算法
輸入:分類詞表(FVocabulary)
輸出:分類特征概念樹(C_ConceptTree)
C_ConceptTree(FVocabulary)
{
Root=“上位詞”為空的特征詞;//查找根節(jié)點(diǎn)初始化概念樹
For(i=1 to n;i++)//順序讀取FVocabulary中的n條記錄
{
AddtoTree(特征詞i)
{
if(特征詞i的上位詞j存在于概念樹中)
{
添加特征詞i為上位詞j的子節(jié)點(diǎn);
標(biāo)注i的指代關(guān)系;
}
else
AddtoTree(上位詞j)
}
}
同時,根據(jù)突發(fā)事件分類詞表的更新,應(yīng)定期對分類特征概念樹進(jìn)行維護(hù),更新分類特征概念樹的內(nèi)容。
4.3突發(fā)事件特征概念樹構(gòu)建
利用構(gòu)建的分類特征概念樹和突發(fā)事件特征詞表,讀取特征詞表中的每條記錄,按照記錄中的“編碼”字段,在分類特征概念樹中找到相應(yīng)的分類節(jié)點(diǎn),添加“分級”子節(jié)點(diǎn),再在相應(yīng)的“分級”節(jié)點(diǎn)后添加“分期”子節(jié)點(diǎn)。最終,形成突發(fā)事件特征概念樹(見圖2),構(gòu)成完整的突發(fā)事件特征詞典。突發(fā)事件特征概念樹構(gòu)建算法:
算法2突發(fā)事件特征概念樹生成算法
輸入:分類特征概念樹(C_ConceptTree),特征詞表(Vocabulary)
輸出:突發(fā)事件特征概念樹(ConceptTree)
ConceptTree(C_ConceptTree,Vocabulary,)
{
ConceptTree=C_ConceptTree
for(i=1 to m;i++)//順序讀取Vocabulary中的m個分類概念
while(編碼≠NULL)
{
if(Gij不存在于ConceptTree中)//Gij為第i個分類概念的第j個分級
add Gij to ConceptTree;
if(Pijk不存在于ConceptTree中)// Pijk為第i個分類概念的第j個分級的第k個分期
add Pijk to ConceptTree;
}
}
5.1基于特征詞典的應(yīng)急情報采集
目前常用的情報采集技術(shù)主要有基于搜索引擎的情報采集、基于網(wǎng)絡(luò)爬蟲的情報采集和基于主題的情報采集,合理利用突發(fā)事件特征詞典,對這三種方式的應(yīng)急情報采集都具有較好的支持作用。
(1)特征詞典對基于搜索引擎的應(yīng)急情報采集的支持?;谒阉饕娴膽?yīng)急情報采集利用關(guān)鍵詞硬匹配方法借助搜索引擎獲取突發(fā)事件情報資源,以特征詞典內(nèi)的概念及其備注字段的不同表示形式為檢索關(guān)鍵詞,可以全面、準(zhǔn)確地采集各個類型的突發(fā)事件,減少遺漏和重復(fù)。
圖2 突發(fā)事件特征概念樹示例(部分)
(2)特征詞典對基于網(wǎng)絡(luò)爬蟲的應(yīng)急情報采集的支持。基于網(wǎng)絡(luò)爬蟲的應(yīng)急情報采集利用專門的機(jī)構(gòu)、部門等的網(wǎng)站在一定范圍內(nèi)采集突發(fā)事件情報資源,根據(jù)特征詞典可以對這些網(wǎng)站內(nèi)容進(jìn)行篩選,有針對性地采集其中相關(guān)的突發(fā)事件應(yīng)急情報,提高應(yīng)急情報采集的準(zhǔn)確性。
(3)特征詞典對基于主題的應(yīng)急情報采集的支持?;谥黝}的應(yīng)急情報采集預(yù)先確定主題模型,采集特定主題的突發(fā)事件情報資源,其關(guān)鍵問題是主題的表示和主題相關(guān)度的判別。利用特征詞典,可以幫助用戶明確應(yīng)急情報的主題需求并進(jìn)行規(guī)范化表達(dá)。同時,特征詞典類目間的層次關(guān)系,可以作為概念相似度計算的依據(jù),以便更好地判斷主題相關(guān)度。
5.2基于特征詞典的應(yīng)急情報組織
對應(yīng)急情報進(jìn)行表征和序化,是突發(fā)事件特征詞典的另一大功能。對于采集回來的雜亂無章的應(yīng)急情報,首先,以特征詞典為工具進(jìn)行標(biāo)引,實(shí)現(xiàn)情報內(nèi)容特征的規(guī)范化表征,便于對應(yīng)急情報的有效識別。其次,利用特征詞典中類目之間的層次關(guān)系和指代關(guān)系,對經(jīng)過標(biāo)引后的情報進(jìn)行有序化的存儲,實(shí)現(xiàn)情報分門別類的組織,反映出不同突發(fā)事件應(yīng)急情報之間的相互關(guān)系,并將表述形式不一致的同類突發(fā)事件應(yīng)急情報歸類到相同的類目下進(jìn)行存儲,從而提高應(yīng)急情報組織的有效性。
本文以部分“甲肝”爆發(fā)事件為例,展示特征詞典對應(yīng)急情報采集與組織的支持作用。
6.1“甲肝”類目在特征詞典內(nèi)的描述
在特征詞典中,“甲肝”的類目層次為“公共衛(wèi)生事件-傳染病疫情-乙類傳染病-甲肝”,“甲肝”類目及其子類的具體描述如下:
(1)分類屬性。
1-1-2-2甲肝,備注:甲型病毒性肝炎、甲型肝炎入此。
(2)分級屬性。
Ⅰ級:國務(wù)院衛(wèi)生行政部門認(rèn)定的特別重大甲肝爆發(fā)事件。
Ⅱ級:甲肝疫情波及兩個以上縣(市、區(qū)),1周內(nèi)發(fā)病水平超過前5年同期平均發(fā)病水平兩倍以上。
Ⅲ級:甲肝疫情在1個縣(市、區(qū))行政區(qū)域內(nèi),1周內(nèi)發(fā)病水平超過前5年同期平均發(fā)病水平1倍以上。
Ⅳ:縣級以上衛(wèi)生行政部門認(rèn)定的普通甲肝疫情。
(3)分期屬性。
各種級別的甲肝疫情分期標(biāo)準(zhǔn)比較一致,統(tǒng)一描述如下:
1 預(yù)警期:確診少量甲肝病人;
2 爆發(fā)期:日新增病例數(shù)或報告發(fā)病地區(qū)數(shù)急劇增加;
3 緩解期:日新增病例數(shù)減少
4 重建期:疫情得到控制,無新增病例,患者逐漸康復(fù)。
6.2基于特征詞典的情報采集與組織示例
6.2.1基于特征詞典的甲肝情報采集
根據(jù)特征詞典描述,若進(jìn)行基于搜索引擎的采集,在確定采集的關(guān)鍵詞時,應(yīng)同時包括“甲肝、甲型病毒性肝炎、甲型肝炎”,若采集只面對一定級別、一定發(fā)展階段的事件,則根據(jù)特征詞典,進(jìn)一步限定采集的條件。進(jìn)行基于網(wǎng)絡(luò)爬蟲的采集,則在指定的采集網(wǎng)站中,同樣根據(jù)“甲肝、甲型病毒性肝炎、甲型肝炎”來篩選采集內(nèi)容。進(jìn)行基于主題的采集時,特征詞典中關(guān)于該類目的描述,也能幫助用戶明確主題需求。根據(jù)特征詞典,以采集“1988年上海甲肝大爆發(fā)事件”和“2008年貴陽甲肝事件”為例,進(jìn)行具體的描述。
根據(jù)特征詞典中對類目的描述確定采集關(guān)鍵詞,則能同時采集到包括“甲肝、甲型病毒性肝炎、甲型肝炎”的資源,例如:“1988年上海甲肝暴發(fā)”、“1988年毛蚶甲型肝炎事件”、“1988年甲型病毒性肝炎暴發(fā)流行期間死亡病例分析”等分別是以詞典中“甲肝”的不同表述形式來采集的1988年上海甲肝爆發(fā)事件的情報;而“貴陽甲肝事件調(diào)查”、“貴陽市一起高校甲型肝炎暴發(fā)的流行病學(xué)調(diào)查”、“貴陽市某高校甲型病毒性肝炎流行現(xiàn)場消殺干預(yù)措施”等則是以詞典中 “甲肝”的不同表述形式來采集的2008年貴陽甲肝事件的情報。
6.2.2基于特征詞典的甲肝情報組織
根據(jù)特征詞典的概念層次結(jié)構(gòu),“1988年上海甲肝大爆發(fā)事件”和“2008年貴陽甲肝事件”會被作為類目“1-1-2-2甲肝”的子類進(jìn)行存儲,由于分級和分期的不同,關(guān)于這兩個事件的不同時期的情報會被組織在不同的子類下,以便為相應(yīng)等級和發(fā)展階段的“甲肝”事件提供情報支持。以“1988年上海甲肝大爆發(fā)事件”的情報組織為例,該事件分級為Ⅰ級,1988年1月中旬到2月初為事件的爆發(fā)期,因此采集的這個時間段內(nèi)該事件的情報,被組織到同一個類目1-1-2-2:Ⅰ:2下。
突發(fā)事件特征詞典是進(jìn)行應(yīng)急情報采集與組織的有效工具。本文首先通過人工方式,根據(jù)現(xiàn)有突發(fā)事件分類體系,以及相關(guān)部門關(guān)于突發(fā)事件的分類、通報等信息,提取分類特征詞生成原始分類詞表,再隨時根據(jù)突發(fā)事件案例更新原始分類詞表,完善詞表的分類體系。根據(jù)分類詞表,針對每個類目設(shè)置相應(yīng)的分級標(biāo)準(zhǔn)和編碼,再針對每個類目的所屬分級設(shè)置分期標(biāo)準(zhǔn)和編碼,得到完整的突發(fā)事件情景的特征編碼。最后,用概念樹的形式進(jìn)行存儲,生成突發(fā)事件特征詞典。本文主要是對突發(fā)事件特征詞典構(gòu)建方法和特征詞典在應(yīng)急情報采集與組織中的應(yīng)用進(jìn)行了理論探討,在以后的研究中我們將構(gòu)建逐漸完善的突發(fā)事件特征詞典,對詞典的有效性和詞典的利用方法進(jìn)行進(jìn)一步的研究,相信隨著應(yīng)用性研究的深入,突發(fā)事件特征詞典的可用性將得到不斷的提升,從而提高應(yīng)急情報采集的準(zhǔn)確性和完備性,增強(qiáng)應(yīng)急情報組織的有效性。
參考文獻(xiàn):
[1]蔣勛,蘇新寧,劉喜文.突發(fā)事件驅(qū)動的應(yīng)急決策知識庫結(jié)構(gòu)研究[J].情報資料工作,2015(1):25-29.
[2]蔣勛,毛燕,蘇新寧,等.突發(fā)事件驅(qū)動的信息語義組織與跨領(lǐng)域協(xié)同處理模型[J].情報理論與實(shí)踐,2014,37(11):114-123.
[3]劉樑,許歡,李仕明.非常規(guī)突發(fā)事件應(yīng)急管理中的情景及情景-應(yīng)對理論綜述研究[J].電子科技大學(xué)學(xué)報(社科版),2013(6):20-24.
[4]李藐,陳建國,陳濤,等.突發(fā)事件的事件鏈模型[J].清華大學(xué)學(xué)報(自然科學(xué)版),2010,(8):1173-1177.
[5]陳剛,謝科范,劉嘉,等.非常規(guī)突發(fā)事件情景演化機(jī)理及集群決策模式研究 [J].武漢理工大學(xué)學(xué)報 (社會科學(xué)版),2011(4):458-462.
[6]李仕明,劉娟娟,王博,等.基于情景的非常規(guī)突發(fā)事件應(yīng)急管理研究——“2009突發(fā)事件應(yīng)急管理論壇”綜述[J].電子科技大學(xué)學(xué)報社科版,2010(1):1-3,14.
[7]國家突發(fā)公共事件總體應(yīng)急預(yù)案[EB/OL].[2015-02-20].http://www.gov.cn/yjgl/2005-08/07/content_21048.htm.
[8]陳祖琴,蘇新寧.基于情景劃分的突發(fā)事件應(yīng)急響應(yīng)策略庫構(gòu)建方法[J].圖書情報工作,2014,58(19):105-110.
[9]楊麗英,李紅娟,張永奎.突發(fā)事件新聞?wù)Z料分類體系研究[A].中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C].北京:中國中文信息學(xué)會,2006:403-409.
[10]張會昌.基于領(lǐng)域詞典的中文文本相似度匹配[D].濟(jì)南:山東大學(xué),2014.
[11]高銳.基于Web的領(lǐng)域詞典構(gòu)建技術(shù)研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2008.
[12]陸文豪.基于關(guān)系數(shù)據(jù)庫的專業(yè)領(lǐng)域語義詞典構(gòu)建研究[D].上海:復(fù)旦大學(xué),2009.
[13] 江磊.領(lǐng)域詞典的構(gòu)建及其在語法分析中的應(yīng)用[D].南京:南京郵電大學(xué),2011.
[14] 國家特別重大、重大突發(fā)公共事件分級標(biāo)準(zhǔn)(試行)[EB/OL].[2015-02-10].http://www.xjhc.gov.cn/zwgk/ShowArticle. asp?ArticleID=61914.
[15]突發(fā)公共事件分級標(biāo)準(zhǔn)[EB/OL].[2015-02-20].http://www.jinshui.gov.cn/jswwzz/zwgk/yjgl/webinfo/2010/11/128884932 7699257.htm.
[16]廣東省突發(fā)公共衛(wèi)生事件應(yīng)急預(yù)案[EB/OL].[2015-02-20].http://www.gdemo.gov.cn/zt/2013fangxun/yjya/201308/t201 30823_184486.htm.
[17]Steven Fink,Crisis Management:Planning for the Inevitable[M].New York:American Management Association,1986:20-21.
[18]Ian I.Mitroff,Gus Anagnos,Managing Crises Before They Happen:What Every Executive and Manager Needs to Know about Crisis Management[M].New York:American Management Association,2001:30-33.
[19]Mohamed Shaluf I,Ahmadun F R.Disaster types in Malaysia:an overview[J].Disaster Prevention and Management:An International Journal,2006,15(2):286-298.
[20]舒其林.非常規(guī)突發(fā)事件的情景演變及“情景-應(yīng)對”決策方案生成[J].中國科學(xué)技術(shù)大學(xué)學(xué)報,2012,42(11):936-941.
[21]田雪筠.網(wǎng)絡(luò)競爭情報主題采集技術(shù)研究[J].圖書與情報,2014(5):132-137.
[22]徐緒堪,鐘宇翀,魏建香,等.基于組織-流程-信息的突發(fā)事件情報分析框架構(gòu)建[J].情報理論與實(shí)踐,2015(4):70-73.
中圖分類號:
G250.2文獻(xiàn)標(biāo)識碼:
ADOI:
10.11968/tsygb.1003-6938.2015028作者簡介:
陳祖琴(1981-),女,南京大學(xué)信息管理學(xué)院博士研究生,研究方向:知識組織。*本文系
國家社會科學(xué)基金重大項目“面向突發(fā)事件應(yīng)急決策的快速響應(yīng)情報體系研究”(項目編號:13&ZD174)、江蘇省普通高校研究生科研創(chuàng)新計劃項目“基于情景劃分的突發(fā)事件應(yīng)急響應(yīng)策略庫構(gòu)建研究”(項目編號:KYZZ_0047)、中國地震局星火計劃攻關(guān)項目“面向地震應(yīng)急的空間智能決策方法研究”(項目編號:XH15019)與國家自然科學(xué)基金項目“面向知識服務(wù)的知識庫結(jié)構(gòu)研究”(項目編號:71303109)研究成果之一。收稿日期:
2015-06-20;責(zé)任編輯:魏志鵬Intelligence Collection and Organization Based on Unexpected Event Characteristic Dictionary
Abstract
In order to collect and organize the unexpected event intelligence,this paper proposes a method of construction unexpected event characteristic dictionary through the unexpected events'classification,grading and staging.It first extracts classification words and their relationship from the existed classification system of unexpected events and the information in the relevant departments'documents,and codes the classification words to establish the classified thesaurus.Then it extracts and codes the grading from the documents,formulates and codes the staging, constructs the unexpected event characteristic dictionary by concept tree.At last,it utilizes the unexpected event characteristic dictionary to assist intelligence collection and organization.Keywords
unexpected event;unexpected event intelligence;characteristic dictionary;intelligence collection;intelligence organization