亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        自然語言生成技術(shù)在消防安全管理中的應(yīng)用

        2024-01-09 07:02:10劉人杰
        中國人民警察大學學報 2023年12期
        關(guān)鍵詞:管理制度文本模型

        李 棟,劉人杰

        廣東司法警官職業(yè)學院, 廣東 廣州 510520

        一、引言

        當前,人們對消防安全的要求越來越高。這不僅需要進一步研究消防工程技術(shù)和大力培養(yǎng)消防救援隊伍,更需要改進現(xiàn)有消防安全管理模式。然而,目前消防安全管理存在一定不足。首先是民眾消防安全意識淡薄。在經(jīng)濟效益主導觀念影響下,消防安全管理工作一定程度上被忽視[1],部分民眾消防安全意識差,缺乏基本防火、滅火、逃生自救常識[2]。其次是專業(yè)人員不足,消防技術(shù)服務(wù)機構(gòu)部分從業(yè)人員未獲得執(zhí)業(yè)資格,專業(yè)技術(shù)能力不強,難以勝任技術(shù)服務(wù)工作[3]。消防安全主體也缺乏消防安全管理人員,以住宅小區(qū)為例,部分住宅指派非專業(yè)人員兼職消防工作,消防設(shè)施、器材長期無人管理,甚至消防控制室無人值班[4]。此外,日常消防安全管理通常只涉及消防設(shè)施和器材的維護和保養(yǎng),忽略了消防安全宣傳教育、消防演習等。綜上,如何加強消防安全管理成為當前亟待解決的問題。

        而今隨著自然語言生成技術(shù)(Natural Language Generation,NLG)的日趨成熟,出現(xiàn)了以概率學為基礎(chǔ)的大語言模型(Large Language Model,LLM)和以圖數(shù)據(jù)庫為基礎(chǔ)的知識圖譜(knowledge graph)等典型應(yīng)用,為現(xiàn)有消防安全管理模式的改進提供了解決方案。本文探討自然語言生成技術(shù)在消防安全管理領(lǐng)域中的應(yīng)用,為消防安全管理與自然語言生成技術(shù)的結(jié)合應(yīng)用提供借鑒。

        二、自然語言生成與消防信息分析

        (一)自然語言生成研究方法

        自然語言生成是自然語言處理領(lǐng)域中的一個研究方向,通過對關(guān)鍵信息進行規(guī)劃和表達,使計算機能夠像人一樣生成高質(zhì)量的自然語言文本。在諸多應(yīng)用領(lǐng)域中,如智能客服、智能寫作、新聞自動化等,都證明了其潛在的應(yīng)用價值。從整體消防安全管理應(yīng)用來看,自然語言生成系統(tǒng)可分為數(shù)據(jù)層、中間層和自然語言生成層,如圖1所示。

        圖1 自然語言生成系統(tǒng)框架圖

        1. 數(shù)據(jù)層

        在數(shù)據(jù)層,系統(tǒng)需要獲取預(yù)先輸入的數(shù)據(jù)源。數(shù)據(jù)類型主要有文本、數(shù)據(jù)、圖片及視頻,根據(jù)標注與否可分為原始數(shù)據(jù)和標注數(shù)據(jù)。原始數(shù)據(jù)如現(xiàn)行消防安全管理制度中某一條文本身,可作為自然語言處理的語料;標注數(shù)據(jù)如一張消防車道被車輛占用的照片,通過人工標注為占用,則該照片的標簽為“存在占用”,可用于圖像識別算法的訓練。

        2. 中間層

        在中間層,系統(tǒng)將數(shù)據(jù)層中的數(shù)據(jù)解析存儲到數(shù)據(jù)庫或者訓練成機器學習模型。針對不同數(shù)據(jù)格式,分別采用自然語言理解、數(shù)據(jù)處理、圖像識別和視頻分析的方法。

        自然語言理解是將人類語言處理轉(zhuǎn)化為機器語言,處理流程大致分為獲取語料、語料預(yù)處理、特征化(把字和詞表示成向量)、模型訓練,隨后對模型效果進行評價。通過對語言模型的使用,可實現(xiàn)信息檢索、文本分類和自動文摘等[5]。

        數(shù)據(jù)處理是將數(shù)據(jù)源處理后,從中提取有益知識,并用恰當?shù)姆绞綄⒔Y(jié)果展現(xiàn)給終端用戶。其流程通常包括數(shù)據(jù)抽取與集成、數(shù)據(jù)分析、數(shù)據(jù)解釋[6]。數(shù)據(jù)處理結(jié)果存儲在數(shù)據(jù)庫中,根據(jù)數(shù)據(jù)層中數(shù)據(jù)的不同結(jié)構(gòu)可設(shè)計為圖數(shù)據(jù)庫、關(guān)系型數(shù)據(jù)庫等。如對應(yīng)急預(yù)案文本進行信息抽取后的三元組信息(頭實體、尾實體、關(guān)系)可存儲至圖數(shù)據(jù)庫中,從而具有高效的圖遍歷和查詢能力,可通過查詢語句便捷獲取信息;對建筑信息模型IFC4 格式進行消防設(shè)計信息提取,可將建筑內(nèi)部細節(jié)轉(zhuǎn)化為可用于消防合規(guī)性審查所需信息[7]。

        圖像識別是利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術(shù)[8],主要分為以特征提取為核心的傳統(tǒng)方法和以深度神經(jīng)網(wǎng)絡(luò)為核心的深度學習方法,可以實現(xiàn)圖像分類、目標檢測、人臉識別等。

        視頻分析的本質(zhì)是對連續(xù)圖像序列進行處理,其實現(xiàn)方法與圖像識別的實現(xiàn)方法類似?;谏疃葘W習的視頻分析可實現(xiàn)對象分類、對象檢測、路徑跟蹤。其中,對象分類是獲取視頻中對象所屬的類別,對象檢測是獲取對象在視頻圖像中的位置,路徑跟蹤是獲取同一對象在連續(xù)時間內(nèi)的位置信息[9]。

        3. 自然語言生成層

        在自然語言生成層中,需要構(gòu)建一個系統(tǒng)來結(jié)合用戶的即時輸入和中間層組織生成輸出文本。根據(jù)用戶即時輸入的不同,自然語言生成可分為文本到文本的生成和數(shù)據(jù)到文本的生成[10]。

        文本到文本的生成主要研究內(nèi)容為輸入現(xiàn)有文本,對其進行變換和處理,生成一個新文本,主要包括文本縮寫、文本擴展、文本改寫和推理等。(1)文本縮寫是指提取長文本的關(guān)鍵信息生成短文本,其應(yīng)用可分為文本摘要、問題生成和干擾項生成。文本摘要是指根據(jù)原文生成新的文本以表達原文的核心含義;問題生成是指根據(jù)給定的事實輸入和答案,生成自然語言表述的問題;而干擾項生成是為給定的問題回答組合自動生成足夠的干擾選項,以形成適當?shù)倪x擇題[11]。如火災(zāi)應(yīng)急預(yù)案通常包含大量信息,但不是每個人都有時間和精力閱讀整個指南。文本摘要可以自動從應(yīng)急預(yù)案中提取關(guān)鍵信息,生成針對個人的摘要,方便消防工作者和群眾掌握發(fā)生火災(zāi)時具體的行動流程。(2)文本擴展是指將短文本擴展為包含更豐富信息的長文本,其應(yīng)用可分為短文本擴展和主題文章生成。短文本擴展為基于一組長文檔將短文本擴展為類似的長文本;主題文章生成是給定主題集合,生成主題相關(guān)的文本。如在應(yīng)急預(yù)案編寫過程中,文本擴展可根據(jù)使用場所的性質(zhì)生成常見危險源,或根據(jù)消防設(shè)施種類生成對應(yīng)的使用方法,減少應(yīng)急預(yù)案制定的工作量。(3)文本改寫和推理可分為文本風格遷移和對話生成。文本風格遷移是指在保留原文本內(nèi)容的基礎(chǔ)上,生成具有目標風格的文本[12]。如在消防安全宣傳中,由于不同受眾群體對消防安全知識的儲備量存在差異,可以使用文本風格遷移技術(shù),將一篇消防安全知識宣傳文本轉(zhuǎn)換成適合不同知識背景的語言風格,以便更好地理解和接受。對話生成是指自動生成答案來回答給定問題。如通過對話生成技術(shù)可以開發(fā)出智能輔助系統(tǒng),該系統(tǒng)可在實時提供建議和指導的同時協(xié)助人們更好地應(yīng)對不同情況下的緊急救援任務(wù)。

        數(shù)據(jù)到文本的生成主要研究使用恰當而流暢的文本描述結(jié)構(gòu)化的數(shù)據(jù),分別采用基于規(guī)則和模板的方法與基于神經(jīng)網(wǎng)絡(luò)序列生成方法。基于規(guī)則和模板的方法通過將規(guī)范化或半規(guī)范化的數(shù)據(jù)經(jīng)過一系列處理后,模仿人類專家語言模式制作規(guī)則語句模板,生成專業(yè)性較強的文本。此方法通常適用于特定領(lǐng)域如生成醫(yī)學檢驗報告?;谏窠?jīng)網(wǎng)絡(luò)序列生成方法根據(jù)數(shù)據(jù)庫的輸入記錄生成一個內(nèi)容計劃,指定哪些記錄將在文檔中及以何種順序進行語言描述,隨后以給定數(shù)據(jù)作為輸入,按照內(nèi)容計劃生成文本[13]。如以某個地區(qū)既有生產(chǎn)安全事故總體情況作為訓練材料生成內(nèi)容計劃,隨后將當月該地區(qū)的事故數(shù)據(jù)輸入系統(tǒng),以生成月度生產(chǎn)安全事故總體情況。相比較基于規(guī)則的方法,基于神經(jīng)網(wǎng)絡(luò)序列生成方法對數(shù)據(jù)到文本生成的泛化能力更強,但需要龐大的訓練數(shù)據(jù)作為支撐。

        視覺—語言生成屬于數(shù)據(jù)到文本,其目標是生成給定圖像或視頻的解釋或摘要,包括圖像描述、視頻描述和視覺敘事[10]。圖像描述是對給定一幅自然圖像生成一句自然語言描述。視頻描述是對給定一段視頻(通常是幾十秒的短視頻)生成一句準確、細致描述。視覺敘事要求模型對給定圖像序列,在深度理解圖像序列基礎(chǔ)上生成連貫的敘事故事[14]。

        (二)消防信息來源分析

        從對自然語言生成技術(shù)的研究中可以得知,要將其應(yīng)用在消防安全管理領(lǐng)域,必須收集大量消防信息,這些信息可從消防文本和消防數(shù)據(jù)中獲取。(1)可用的消防文本包括政府發(fā)布的消防文件,如各級消防法律、消防系統(tǒng)設(shè)計驗收規(guī)范和消防政策文件;各單位已有的消防管理工作文本,如消防檔案、滅火與應(yīng)急疏散預(yù)案、消防安全隱患檢查報告、消防培訓講稿、消防工作例會記錄等;消防知識文本,如消防行業(yè)教科書、網(wǎng)絡(luò)百科全書、科普文章、火災(zāi)事故案例等。(2)可用的消防數(shù)據(jù)包括既有智慧消防建設(shè)成果,如收集的消防設(shè)施數(shù)據(jù)、對應(yīng)的消防數(shù)據(jù)分析結(jié)果、消防監(jiān)控系統(tǒng)記錄的圖片視頻等;既有消防工作數(shù)據(jù),如各類消防設(shè)施的技術(shù)參數(shù)、防火檢查巡查記錄、建筑信息模型或情況表格等。

        基于上述消防信息資源,可以利用自然語言生成技術(shù)來實現(xiàn)消防安全管理領(lǐng)域的自動化和智能化。通過將這些信息資源輸入到自然語言生成系統(tǒng)中,可自動生成或填充消防安全管理領(lǐng)域的自然語言文本,賦能消防安全管理工作,從而提高消防安全管理的效率和準確性。

        三、自然語言生成技術(shù)在消防安全管理領(lǐng)域的應(yīng)用

        消防安全管理涉及預(yù)防火災(zāi)、減少火災(zāi)損失及保障人員生命和財產(chǎn)安全,涵蓋對消防安全責任的明晰、消防安全制度和管理措施的建立、滅火和應(yīng)急疏散預(yù)案的編制和演練等,均涉及大量文本的撰寫。下面結(jié)合現(xiàn)有技術(shù)具體分析自然語言生成技術(shù)在消防教育培訓和完善消防安全管理制度方面潛在應(yīng)用,如圖2所示。

        圖2 自然語言生成技術(shù)消防應(yīng)用

        (一)消防教育培訓應(yīng)用

        消防教育培訓旨在提高人們對火災(zāi)的認識和了解,培養(yǎng)人們火災(zāi)安全意識和自救互救能力,以減少火災(zāi)事故的發(fā)生和降低火災(zāi)事故的損失。自然語言生成技術(shù)在其中的應(yīng)用主要包括以下幾方面。

        1. 火災(zāi)基礎(chǔ)理論講解

        消防教育培訓的目的是讓受眾掌握防火、滅火、疏散知識體系,只有熟練掌握火災(zāi)基礎(chǔ)理論,才能根據(jù)不同情況選擇合適的策略。當前火災(zāi)基礎(chǔ)知識的講解主要基于教科書內(nèi)容,而在具體消防培訓中,培訓對象學歷層次和專業(yè)不同,對火災(zāi)相關(guān)名詞的了解程度不一,單一的課程內(nèi)容難以滿足需求。文獻[15]針對包含辱罵、侵犯等詞匯的攻擊性言論進行了基于深度學習的短文本去攻擊性研究,提出替換攻擊性詞語和改寫全文文本風格遷移方式?;陬愃七壿?,可對火災(zāi)相關(guān)名詞不同解釋詳細程度進行分級,從而生成適合不同學歷層次的火災(zāi)基礎(chǔ)理論講解文本。如對未接受理工科教育受眾,可結(jié)合具體例子和實際應(yīng)用解釋火災(zāi)相關(guān)名詞,對涉及的化學物質(zhì),增加介紹性文字說明;對低年級學生,則更多使用比喻形式文本,并通過其他文本風格遷移模型生成偏口語化的文本,提升學生群體接受程度。

        2. 消防法律法規(guī)知識普及

        消防從業(yè)人員了解和掌握消防法律法規(guī)非常重要,但消防法律法規(guī)涉及司法、消防、住建多個部門,相關(guān)條文數(shù)量大且更新速度快,對消防從業(yè)人員的學習能力提出一定挑戰(zhàn)。對群眾而言,消防法律法規(guī)學習成本高,難以理解。文獻[16]提出基于自然語言處理技術(shù)構(gòu)建民法法律知識圖譜,利用知識圖譜結(jié)構(gòu),幫助法律工作人員對案件進行分析、處理和判斷。因此,可對消防法律法規(guī)條文進行語法解析生成知識圖譜,并設(shè)計若干查詢語句。在實際使用中,可根據(jù)教學目標篩選出若干條文,如對商業(yè)綜合體員工進行培訓,則可以通過查詢語句輸出本地適用的消防安全管理規(guī)定,以及針對商業(yè)綜合體具體部位的防火規(guī)范要求,從而提升人們對消防法律法規(guī)的認知和理解。

        3. 火災(zāi)應(yīng)急處置能力培訓

        火災(zāi)發(fā)生時,正確的應(yīng)急處理措施可最大程度減少人員傷亡和財產(chǎn)損失。消防教育培訓需要培養(yǎng)人們的應(yīng)急處置能力,從而根據(jù)不同場景,執(zhí)行正確的應(yīng)急處理方法。文獻[17]提出名為GPT-3的大語言模型,通過海量文本、問答、范例作為訓練樣本,可用于文本生成、自然語言理解、對話系統(tǒng)等領(lǐng)域。在大語言模型中,由于海量輸入信息中包括某種情形下火災(zāi)的處置方法,在對其系統(tǒng)進行提問時,會基于多次出現(xiàn)的問答模式輸出正確率最大的回答,同時隨著大語言模型高質(zhì)量訓練樣本數(shù)量和大語言模型參數(shù)的增加,生成的回答將更加準確。此種方法依賴于高質(zhì)量的語料,但由于大語言模型的黑箱特性,輸出的回答可能出現(xiàn)錯誤,因此需要人工進一步修改。因此也可對火災(zāi)應(yīng)急處置知識文本進行語義分析生成知識圖譜,此種方法成本更高但結(jié)果可控。

        4. 自動生成問題

        在上述三種培訓內(nèi)容里,為檢驗學員知識掌握程度,培訓教師往往會設(shè)計一系列問題作為現(xiàn)場問答或課外習題。文獻[18]提出一個通用型的面向跨語言生成的預(yù)訓練模型,并在漢語事實性問答數(shù)據(jù)上進行了問題生成試驗。對于消防知識,可使用類似的神經(jīng)網(wǎng)絡(luò)模型自動生成問題,通過輸入指定教學文本,系統(tǒng)輸出該模型下置信程度最高的問題-答案組。通過這種方式,消防培訓教師可快速生成大量高質(zhì)量練習題,幫助受眾更好地掌握知識。此外,自動生成問題的方法還可以用于自適應(yīng)學習,學員可根據(jù)自己的學習進度,通過系統(tǒng)自動生成練習題。

        5. 消防設(shè)施的辨識和使用

        消防教育培訓中,消防設(shè)施的辨識和使用是一個重要的教學內(nèi)容,其種類繁多,形狀與功能也各不相同,需要有針對性地進行教學。文獻[19]提出名為OFA 的統(tǒng)一的文本圖像多模態(tài)預(yù)訓練模型,可應(yīng)用于各種任務(wù),包括圖像生成、視覺基礎(chǔ)、圖像描述、圖像分類、語言建模等。通過圖像描述技術(shù),可生成消防設(shè)施圖片的文字描述,學員可通過自行拍攝照片生成文字描述來學習消防設(shè)施的特點和使用方法。但目前圖像描述技術(shù)對消防設(shè)施的識別不夠深入,用于模型訓練的圖像描述文本未與國內(nèi)消防規(guī)范結(jié)合,無法根據(jù)消防設(shè)施的型號生成更具體的描述文本,在后續(xù)工作中可加強消防規(guī)范與多模態(tài)模型的耦合。

        總體而言,消防教育培訓應(yīng)用面對的群體多樣性強,學習的連續(xù)性和強度也難以保證,因此當前消防教育培訓主要通過課程、媒體宣傳和平面圖指導等方式相結(jié)合,碎片化程度較高,導致群眾普遍缺乏系統(tǒng)完整的消防知識。自然語言生成技術(shù)所具備的特性適于消防教育培訓行業(yè),如上文通過對火災(zāi)基礎(chǔ)理論教學和消防設(shè)施辨識和使用教學等的分析,分別提出利用文本風格遷移和圖像描述的方法可解決該教學中存在的痛點。就目前而言,利用自然語言生成技術(shù)為消防教育培訓賦能的情況較少,但隨著模型訓練成本的進一步下降和適于自然語言生成的消防文本/數(shù)據(jù)日益豐富,消防教育培訓將會與自然語言生成技術(shù)深度融合,給群眾帶來更加個性化、即時性的消防知識。

        (二)完善消防安全管理制度

        消防安全管理制度要求社會所有個體遵守并執(zhí)行相應(yīng)規(guī)則,使消防管理工作的開展具有一定科學性與規(guī)范性,避免出現(xiàn)盲目管理導致的安全事故[20]。然而,如果缺少消防專業(yè)人士的參與,消防安全管理制度可能存在覆蓋范圍不夠、缺乏可操作性及執(zhí)行不到位的問題,通過自然語言生成技術(shù),可在如下方

        面對消防安全管理制度進行改進。

        1. 制度編寫

        消防安全管理制度是消防安全管理的總綱,需要準確、具體規(guī)定消防管理工作的各個方面。在編寫過程中,存在以下困難:首先,許多單位缺乏消防安全管理制度編寫經(jīng)驗,需要外部專家協(xié)助制定;其次,制度內(nèi)容編寫者需要對相關(guān)法規(guī)、標準和火災(zāi)相關(guān)知識、案例有深入了解,出臺的制度才具有指導性;此外,消防安全管理制度只有與單位內(nèi)部實際情況深度融合,才具有可操作性。

        基于大語言模型的自然語言生成技術(shù)可通過學習消防安全管理制度的范本、單位情況、火災(zāi)案例和防控措施,生成符合標準的消防安全管理制度,并由單位消防安全管理制度編寫者承擔修改職責,如圖3所示。此外,對單位現(xiàn)有建筑信息進行抽取,可將所需要的建筑內(nèi)部細節(jié)轉(zhuǎn)化為文字數(shù)據(jù)的表述,從而作為大語言模型的提示,幫助自然語言生成系統(tǒng)更加準確地生成消防安全管理制度。由于大語言模型通過強化學習思想可將生成的制度符合所給定的制度模板,在制度規(guī)范化上具有優(yōu)勢,此外通過對建筑信息和單位情況的讀取,可將所有相關(guān)的消防安全管理措施羅列出來,方便制度編寫人員進行修改。

        圖3 消防安全管理制度編寫流程

        然而,自然語言生成技術(shù)的黑箱特性可能會導致消防安全管理制度編寫應(yīng)用中存在信息不確定性、錯誤、不完整等問題。因此,可以采取以下措施來解決這些問題:首先,完善自動編寫制度的修改審核機制,確保制度通過專家的修改審核之后才可以發(fā)布,并著重對大語言模型未能根據(jù)新發(fā)布消防法規(guī)修訂內(nèi)容所制定的制度內(nèi)容進行修正。其次,應(yīng)盡量使用高質(zhì)量和時效性的消防安全管理制度作為大語言模型的語料,并按照不同場所性質(zhì)分類,使得生成的制度文本更加具有指導性和適用性。

        2. 制度執(zhí)行

        消防安全管理制度的執(zhí)行是消防安全管理的關(guān)鍵環(huán)節(jié),也是防范火災(zāi)事故、保障人員生命財產(chǎn)安全的最后一道防線。然而,實際執(zhí)行中,由于人員流動性大、制度培訓不到位、員工維護制度的積極性不高等原因,制度執(zhí)行難以達到理想效果,從而導致消防安全管理工作的失誤。

        基于自然語言的歷史火災(zāi)數(shù)據(jù)庫查詢(text-to-SQL),可根據(jù)具體消防安全管理制度和不同場所,生成真實火災(zāi)案例作為管理制度的補充資料。文獻[21]通過構(gòu)建多個深度學習模型來實現(xiàn)自然語言查詢到SQL 語句的轉(zhuǎn)化方法,可實現(xiàn)自然語言查詢數(shù)據(jù)庫內(nèi)容。通過將自然語言數(shù)據(jù)庫查詢技術(shù)與自然語言生成技術(shù)結(jié)合,可生成真實火災(zāi)案例補充資料,使消防安全管理制度中的要求更容易被接受,也可消除人們的僥幸心理。然而,真實火災(zāi)事故往往涉及公民隱私和數(shù)據(jù)安全問題,因此需要通過火災(zāi)模擬結(jié)果作為補充。在后續(xù)研發(fā)中,可由國家統(tǒng)一發(fā)布典型火災(zāi)事故、單位內(nèi)部火災(zāi)案例及可信度高火災(zāi)模擬結(jié)果,三者組成歷史火災(zāi)數(shù)據(jù)庫,并增加火災(zāi)查詢語句語料,提高針對消防安全管理方面的查詢語句生成效果。

        使用自然語言生成技術(shù)可對消防安全管理制度生成針對性的制度執(zhí)行手冊,幫助個體理解執(zhí)行消防安全管理制度。命名實體識別技術(shù)可實現(xiàn)從非結(jié)構(gòu)化的文本中識別出所需的實體及類型,其識別結(jié)果可用于實體關(guān)系抽取、知識圖譜構(gòu)建等眾多實際應(yīng)用[22]。通過命名實體識別技術(shù),可對消防安全管理制度中的關(guān)鍵實體進行識別,如人員、消防設(shè)施、危險源及建筑部位等。在實際應(yīng)用中,可對不同類型人員涉及的管理制度統(tǒng)一摘出,隨后將消防設(shè)施、危險源及建筑部位等信息輸入大語言模型,經(jīng)修改審核輸出具體操作方法,從而生成針對特定類型人員的制度執(zhí)行手冊。

        與消防教育培訓不同的是,利用自然語言生成技術(shù)對消防安全管理制度進行編寫和執(zhí)行對出現(xiàn)錯誤的容忍性更低,專業(yè)性要求更高。在制度編寫上,因為制度的合適與否取決于其應(yīng)用場所和服務(wù)人群,而非消防知識類型的事實性文本,因此制度編寫依賴于人工干預(yù),但日后隨著按各種類型場所和不同受眾的消防安全管理制度文本大規(guī)模共享,自然語言生成制度的準確率將會進一步提高。而制度執(zhí)行是在制度編寫的基礎(chǔ)上解釋制度,因此從制度層面和用戶層面可分別生成輔助文本,以保證制度的準確執(zhí)行。

        四、自然語言生成技術(shù)消防應(yīng)用面臨的挑戰(zhàn)與改進措施

        隨著新一代信息技術(shù)的飛速發(fā)展,自然語言生成技術(shù)在消防安全管理領(lǐng)域中低成本、大規(guī)模的應(yīng)用成為可能,但也面臨著來自技術(shù)、安全和制度等多方面的挑戰(zhàn),急需進一步改進。

        (一)語料庫及數(shù)據(jù)集缺乏問題

        自然語言生成技術(shù)需要大量語料文本進行模型訓練,以ChatGPT 為例,其公開的GPT-3 版本共使用了45 TB 大小的語料及1 750 億個參數(shù)[20],就目前而言,ChatGPT 在公開文本信息較多的領(lǐng)域取得的效果更好。而在消防安全管理領(lǐng)域,相關(guān)制度、語料庫和數(shù)據(jù)集的缺乏目前是一個亟須解決的問題,如文本風格遷移需要大量平行語料、圖像描述需要大量圖像標注數(shù)據(jù)。因此,要解決這個問題,首先,需要各個單位在日常消防安全管理中積累并上傳各類語料和數(shù)據(jù),豐富語料庫和數(shù)據(jù)庫的內(nèi)容,提升自然語言生成應(yīng)用效果;其次,要解決好數(shù)據(jù)共享問題,高質(zhì)量的語料作為消防工作的積累成果,可通過設(shè)立付費機制或共享聯(lián)盟的方法,促進語料之間的共享。

        (二)信息安全問題

        在使用自然語言生成技術(shù)時,使用到的信息涉及單位內(nèi)部建筑細節(jié)、消防數(shù)據(jù)等,對某些單位而言,可能存在數(shù)據(jù)泄露、機密流出等風險。同時,個人在使用服務(wù)器在境外自然語言生成服務(wù)時,也會導致大量中文語料流出,不利于我國在自然語言生成技術(shù)領(lǐng)域與發(fā)達國家的競爭。要解決這些問題,首先,需要大力發(fā)展我國自主可控的消防自然語言生成系統(tǒng),對用戶上傳的消防信息要進行加密和權(quán)限控制,保證數(shù)據(jù)安全;其次,也要防止境內(nèi)消防數(shù)據(jù)、消防資料等被境外通過計算機爬蟲等技術(shù)抓取用于自然語言生成模型訓練,如中國知網(wǎng)已根據(jù)《數(shù)據(jù)出境安全評估辦法》[23]限制境外用戶訪問,體現(xiàn)了我國對自然語言文本資源外泄的防范;最后,要加強對公民的信息安全教育,控制單位內(nèi)消防安全數(shù)據(jù)信息流向,并對違反規(guī)定的行為進行處罰。

        (三)準確性和可靠性問題

        自然語言生成技術(shù)的準確性和可靠性對消防安全管理領(lǐng)域的應(yīng)用至關(guān)重要。如果模型生成的信息不準確或有誤,可能會影響消防工作的決策。因此,要提高自然語言生成技術(shù)的準確性和可靠性,需要進一步改進其算法和模型,加強對語料庫和數(shù)據(jù)集的處理和分析,提高模型的精度和魯棒性。同時,也要以增加人工審核環(huán)節(jié)、生成信息來源的方式,加強對生成內(nèi)容的審查,基于概率學的自然語言生成則需要通過引入第三方插件的方法來解決黑箱問題。另外,也要實時更新自然語言生成技術(shù)中使用的模型或數(shù)據(jù)庫,保證生成的內(nèi)容符合最新的消防法律法規(guī)。

        五、結(jié)束語

        當前自然語言生成技術(shù)通過對人類作品的學習模仿,在許多行業(yè)達到了熟手的程度,深刻改變了人類社會的內(nèi)容產(chǎn)出模式。而消防安全管理領(lǐng)域涉及大量文本的處理,與自然語言生成技術(shù)的許多典型應(yīng)用場景不謀而合。本文首先從自然語言生成技術(shù)的主流應(yīng)用出發(fā),將其劃分為數(shù)據(jù)層、中間層和自然語言生成層,并結(jié)合消防安全管理應(yīng)用分析了應(yīng)用場景,梳理了當前自然語言生成技術(shù)所需的消防文本和消防數(shù)據(jù)。隨后分別探討了自然語言生成技術(shù)在消防教育培訓和消防安全管理制度改進兩個方面的應(yīng)用形式,參考了自然語言生成技術(shù)中的文本風格遷移、問題生成等模型方法,為其實際落地應(yīng)用提供了借鑒。最后剖析了自然語言生成技術(shù)應(yīng)用所存在的普遍問題和在消防安全管理結(jié)合應(yīng)用中存在的特殊問題,包括語料庫及數(shù)據(jù)集缺乏問題、信息安全問題及準確性和可靠性問題。而在實際工作中,如何將自然語言生成技術(shù)真正在消防安全管理中應(yīng)用,還有賴于政府、企業(yè)和高校之間的協(xié)同合作,共同探索自然語言生成技術(shù)在消防安全管理行業(yè)的實際應(yīng)用方式。

        猜你喜歡
        管理制度文本模型
        一半模型
        探討企業(yè)內(nèi)控管理制度的建立與完善
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        食品安全公共管理制度的缺失與完善評析
        消費導刊(2017年24期)2018-01-31 01:28:30
        涉軍中小企業(yè)管理制度創(chuàng)新探討
        3D打印中的模型分割與打包
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
        免费一级国产大片| 99福利网| 久久久久亚洲av无码专区喷水| 日本高清不卡二区三区| 亚洲AV无码一区二区三区性色学| 麻豆国产原创视频在线播放| 久久亚洲av成人无码国产最大| 美国黄色av一区二区| 久久HEZYO色综合| 日日噜噜夜夜狠狠久久无码区| 亚洲码欧美码一区二区三区| 国产大片在线观看三级| 美女自卫慰黄网站| 少妇真实被内射视频三四区| av在线男人的免费天堂| 99re免费在线视频| 亚洲av无码成人网站在线观看 | 巨茎中出肉欲人妻在线视频 | 国产免费一级在线观看| 摸进她的内裤里疯狂揉她动图视频| 精品亚洲av一区二区| 亚洲 无码 制服 丝袜 自拍| 亚洲色婷婷一区二区三区| 久久精品亚州中文字幕| 久久色悠悠亚洲综合网| 国产网站视频| 六月婷婷久香在线视频| 欧美顶级少妇作爱| 日本亚洲中文字幕一区| 中文字幕精品乱码一二三区| 日本a在线免费观看| 五十路熟妇亲子交尾| 国产亚洲精品bt天堂精选| 夜夜爽妓女8888888视频| 丰满少妇在线播放bd| 视频国产一区二区在线| 天堂av在线免费播放| 久久国产成人免费网站| 国产亚洲日韩欧美一区二区三区| 亚洲av无码精品色午夜在线观看| 亚洲sm另类一区二区三区|