陳婭婷,張淑鳳,李佳澤,單琳
(中核戰(zhàn)略規(guī)劃研究總院,北京,100043)
自20世紀(jì)50年代起步以來(lái),裝備科技信息工作發(fā)揮了重要的“耳目、尖兵和參謀”作用,為全面推進(jìn)國(guó)防和軍隊(duì)武器裝備現(xiàn)代化建設(shè)做出重大貢獻(xiàn)[1]。目前,國(guó)家安全環(huán)境日趨復(fù)雜,傳統(tǒng)的裝備科技信息工作面臨著巨大挑戰(zhàn),正處于創(chuàng)新發(fā)展的新時(shí)代。隨著信息技術(shù)飛速發(fā)展,大數(shù)據(jù)等前沿技術(shù)在軍事領(lǐng)域的廣泛應(yīng)用,裝備科技信息工作也迎來(lái)了新的機(jī)遇[2,3]。如何在當(dāng)前復(fù)雜環(huán)境下推動(dòng)裝備科技信息工作創(chuàng)新發(fā)展,如何利用先進(jìn)的信息技術(shù)手段從海量數(shù)據(jù)中獲取有價(jià)值的信息,如何借助大數(shù)據(jù)技術(shù)構(gòu)建有效的裝備科技信息服務(wù)系統(tǒng)架構(gòu),是裝備科技信息工作當(dāng)前亟待研究的問(wèn)題。
裝備科技信息是指與武器裝備建設(shè)、管理和運(yùn)用直接相關(guān)的可供交流的科技信息或科技知識(shí),包括國(guó)內(nèi)外武器裝備建設(shè)、軍事技術(shù)發(fā)展以及國(guó)防科研、生產(chǎn)活動(dòng)中產(chǎn)生的科技報(bào)告、技術(shù)資源等各類科技信息[4]。國(guó)防科技和武器裝備發(fā)展建設(shè)規(guī)劃、計(jì)劃的制定,軍事技術(shù)發(fā)展方向、重點(diǎn)的確定,武器裝備和技術(shù)發(fā)展項(xiàng)目的擬定,都要有相應(yīng)的科技信息作為依據(jù)[5]。裝備科技信息工作對(duì)于提高裝備管理決策效率、促進(jìn)裝備科技創(chuàng)新發(fā)展和加快新裝備形成戰(zhàn)斗力等方面發(fā)揮著重要作用。當(dāng)前,在裝備科技信息工作實(shí)際研究過(guò)程中,仍存在一系列阻礙因素和問(wèn)題困難。
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)成為了整個(gè)時(shí)代發(fā)展的核心,為加速裝備科技信息工作的進(jìn)步提供了前所未有的機(jī)遇[6]。數(shù)據(jù)急劇增多使得裝備科技信息工作擺脫了信息匱乏的局面,但涉及不同領(lǐng)域和平臺(tái)、分布廣泛的信息資源大大增加了信息采集、分析處理的難度。目前,裝備科技信息工作技術(shù)手段落后,科研工作人員人工處置應(yīng)接不暇,疲于奔命,無(wú)法全面搜集、深入處理信息,導(dǎo)致出現(xiàn)信息流失、低效、重復(fù)與失真等情況。然而,裝備科技信息工作追求快速、準(zhǔn)確和全面,迫切需要高效的信息技術(shù)手段提高工作效率和成果質(zhì)量。大數(shù)據(jù)、云計(jì)算、人工智能、自然語(yǔ)言處理等先進(jìn)的信息技術(shù)以其自動(dòng)化、智能化的功能和高效性,當(dāng)仁不讓地成為可靠的中堅(jiān)力量。
同時(shí),由于裝備科技信息工作所使用的信息資源分布在不同的領(lǐng)域和平臺(tái)上,大量信息數(shù)據(jù)掌握在部門(mén)或個(gè)人內(nèi)部,形成諸多孤立的小型信息庫(kù),信息孤島嚴(yán)重,數(shù)據(jù)利用率低,無(wú)法發(fā)揮信息資源共享共用的最大效能,使裝備科技信息工作成果缺乏準(zhǔn)確性和可信性。因此,加強(qiáng)裝備科技信息資源的溝通與合作,建立資源共享平臺(tái),擴(kuò)展信息資源并實(shí)現(xiàn)信息資源共享共用與裝備科技信息工作協(xié)同發(fā)展至關(guān)重要。
大數(shù)據(jù)環(huán)境下的裝備科技信息工作建立在數(shù)據(jù)集中的基礎(chǔ)上,朝著數(shù)字化、智能化、平臺(tái)化方向邁進(jìn),如圖1所示。
圖1 大數(shù)據(jù)環(huán)境下的裝備科技信息工作全流程示意圖
為裝備科技創(chuàng)新發(fā)展提供準(zhǔn)確、可靠的決策服務(wù)需要大量、全面的數(shù)據(jù)支持。在裝備科技信息工作發(fā)展過(guò)程中,已積累了很多數(shù)據(jù),部分已形成數(shù)據(jù)庫(kù),如裝備科技成果庫(kù)、裝備科技項(xiàng)目庫(kù)等結(jié)構(gòu)化數(shù)據(jù)集,但大部分為半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)集,如文本類數(shù)據(jù)、圖形圖像數(shù)據(jù)、音視頻數(shù)據(jù)等。這些數(shù)據(jù)資源規(guī)模越來(lái)越大,結(jié)構(gòu)多樣,存儲(chǔ)位置和形式不一致,但通過(guò)關(guān)聯(lián)與融合,呈現(xiàn)出巨大的分析挖掘與決策的參考價(jià)值。
大數(shù)據(jù)環(huán)境下的裝備科技信息工作,依托云存儲(chǔ)、分布式文件存儲(chǔ)等大數(shù)據(jù)存儲(chǔ)技術(shù),構(gòu)建裝備科技信息工作統(tǒng)一的存儲(chǔ)體系,將在傳統(tǒng)基礎(chǔ)設(shè)施中長(zhǎng)期保存的分散、多樣的電子數(shù)據(jù)和紙質(zhì)文件數(shù)字化,并存儲(chǔ)在存儲(chǔ)設(shè)施中進(jìn)行統(tǒng)一管理,取代了傳統(tǒng)的存儲(chǔ)方式,實(shí)現(xiàn)對(duì)非結(jié)構(gòu)化數(shù)據(jù)的特征提取和半結(jié)構(gòu)化數(shù)據(jù)的內(nèi)容檢索,便于對(duì)裝備科技信息工作的各類數(shù)據(jù)進(jìn)行整理、交叉分析、對(duì)比和深度挖掘。
裝備科技信息工作歷來(lái)以信息收集、處理、分析與提供決策服務(wù)為主。在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)來(lái)源激增給裝備科技信息工作帶來(lái)了豐富的信息資源,使信息多元化、廣泛化,但規(guī)模巨量的數(shù)據(jù)、多樣的數(shù)據(jù)類型、復(fù)雜的數(shù)據(jù)來(lái)源以及數(shù)據(jù)價(jià)值密度的降低也給裝備科技信息工作帶來(lái)了新的挑戰(zhàn)[7,8]。傳統(tǒng)的分析處理手段已無(wú)法處理海量的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),大數(shù)據(jù)時(shí)代開(kāi)啟了裝備科技信息工作新范式,人工智能、機(jī)器學(xué)習(xí)等新興信息技術(shù)使得研究范式向著以數(shù)據(jù)分析為主導(dǎo)的方向轉(zhuǎn)移。從傳統(tǒng)的提出問(wèn)題、搜集相關(guān)信息、分析并生成研究成果轉(zhuǎn)變?yōu)橹鲃?dòng)采集數(shù)據(jù)、根據(jù)規(guī)劃進(jìn)行數(shù)據(jù)挖掘分析、生成研究成果。
依托大數(shù)據(jù)技術(shù),裝備科技信息工作可以更好地構(gòu)建服務(wù)系統(tǒng),借助先進(jìn)的信息技術(shù)和方法工具,在大量采集裝備科技信息數(shù)據(jù)的基礎(chǔ)上,對(duì)裝備科技信息數(shù)據(jù)進(jìn)行科學(xué)有效地組織、存儲(chǔ)、數(shù)據(jù)分析挖掘、成果展示等,從而發(fā)現(xiàn)國(guó)內(nèi)外武器裝備建設(shè)、軍事技術(shù)發(fā)展可能出現(xiàn)的變化,對(duì)國(guó)防科技和武器裝備發(fā)展建設(shè)規(guī)劃提供有力的決策支持,從而促進(jìn)裝備科技信息工作創(chuàng)新發(fā)展。
大數(shù)據(jù)環(huán)境下,利用大數(shù)據(jù)技術(shù)開(kāi)展裝備科技信息工作,建立數(shù)據(jù)驅(qū)動(dòng)型智能裝備科技信息服務(wù)系統(tǒng),通過(guò)知識(shí)庫(kù)、采集和處理系統(tǒng)精確滿足用戶需求[9]?;诖髷?shù)據(jù)技術(shù)的裝備科技信息服務(wù)系統(tǒng)的架構(gòu)如圖2所示,主要為信息采集、信息共享共用、信息智能搜索、信息智能分析和成果展示提供統(tǒng)一管理和使用的平臺(tái)。該系統(tǒng)以裝備科技信息共享共用平臺(tái)為核心,依賴于巨量數(shù)據(jù)的分析挖掘獲得研究成果,利用了機(jī)器學(xué)習(xí)、自然語(yǔ)言處理等信息技術(shù),實(shí)現(xiàn)了裝備科技信息工作從信息采集到應(yīng)用的全流程各環(huán)節(jié)的智能化、規(guī)范化功能。整個(gè)系統(tǒng)綜合考慮了大數(shù)據(jù)的特性以及對(duì)接第三方應(yīng)用系統(tǒng),使得出的結(jié)果更加貼近實(shí)際,并符合科研工作人員的需求。
圖2 基于大數(shù)據(jù)技術(shù)的裝備科技信息服務(wù)系統(tǒng)架構(gòu)
裝備科技信息需求規(guī)劃平臺(tái)提供用戶個(gè)性化信息采集需求定制服務(wù)和海量站點(diǎn)統(tǒng)一管理服務(wù)。用戶個(gè)性化信息采集需求定制服務(wù):用戶統(tǒng)一規(guī)劃信息采集需求,系統(tǒng)根據(jù)用戶提供的信息采集對(duì)象、類型、范圍等需求進(jìn)行數(shù)據(jù)自動(dòng)采集工作。海量站點(diǎn)統(tǒng)一管理服務(wù):實(shí)現(xiàn)對(duì)眾多信息采集渠道進(jìn)行統(tǒng)一管理的功能,構(gòu)建官方、社會(huì)、網(wǎng)絡(luò)等多維度信息采集對(duì)象,采用先進(jìn)的信息技術(shù)對(duì)海量站點(diǎn)進(jìn)行統(tǒng)一監(jiān)督和自動(dòng)實(shí)時(shí)的信息采集,通過(guò)人工智能等信息技術(shù)對(duì)海量站點(diǎn)進(jìn)行訪問(wèn)結(jié)果監(jiān)督和反饋,例如監(jiān)督站點(diǎn)的可用性,自動(dòng)清理故障站點(diǎn);監(jiān)督站點(diǎn)關(guān)聯(lián)站點(diǎn),豐富資源獲取渠道;監(jiān)督站點(diǎn)的訪問(wèn)和資源下載效率。
裝備科技信息共享共用平臺(tái)提供知識(shí)庫(kù)管理服務(wù)和權(quán)限管理服務(wù)。知識(shí)庫(kù)管理服務(wù):在基礎(chǔ)數(shù)據(jù)庫(kù)的基礎(chǔ)上,根據(jù)裝備科技信息資源的類別,利用深度學(xué)習(xí)算法完成關(guān)鍵詞匹配,將數(shù)據(jù)重新分類后形成知識(shí)庫(kù)。通過(guò)將所具有的信息資源以及成果按照統(tǒng)一的分類系統(tǒng),組織和存儲(chǔ)到統(tǒng)一的信息資源庫(kù),并對(duì)同一事項(xiàng)形成的系統(tǒng)信息進(jìn)行統(tǒng)一存儲(chǔ)和管理,消滅信息孤島,實(shí)現(xiàn)信息的有效共享,為管理者和決策者提供全方位的信息,以便于其作出正確的決斷。權(quán)限管理服務(wù):考慮裝備科技信息的特殊性,提供精確的信息共享服務(wù),用戶可根據(jù)裝備科技信息資源和成果的屬性、分類、知悉范圍等要素,對(duì)裝備科技信息資源和成果進(jìn)行訪問(wèn)控制設(shè)置,將操作權(quán)限細(xì)粒度化,實(shí)現(xiàn)信息共享的同時(shí),保障知悉范圍可控和數(shù)據(jù)安全。
裝備科技信息智能搜索平臺(tái)提供用戶個(gè)性化檢索推薦服務(wù)。系統(tǒng)通過(guò)記錄用戶檢索信息的行為和習(xí)慣,將這些記錄進(jìn)行分類和排序,利用深度學(xué)習(xí)方法,給用戶塑造檢索行為畫(huà)像,從而根據(jù)用戶的興趣點(diǎn)提供檢索優(yōu)先排序,達(dá)到精準(zhǔn)推薦的目的。
裝備科技信息智能分析平臺(tái)提供在線數(shù)據(jù)加工服務(wù)。利用提供的機(jī)器學(xué)習(xí)算法,用戶自定義數(shù)據(jù)挖掘模型,對(duì)采集的數(shù)據(jù)進(jìn)行智能分類、統(tǒng)計(jì),根據(jù)用戶目標(biāo)進(jìn)行綜合態(tài)勢(shì)、重點(diǎn)熱點(diǎn)等方向的關(guān)聯(lián)分析,從時(shí)間、人物、背景、項(xiàng)目動(dòng)態(tài)、技術(shù)動(dòng)態(tài)等多維度對(duì)資源進(jìn)行畫(huà)像,從而在海量數(shù)據(jù)資源中挖掘潛在信息,為科研工作人員提供內(nèi)容更深入、范圍更廣闊、聯(lián)系更清晰、分析更細(xì)致的智能分析服務(wù),從而獲得準(zhǔn)確、科學(xué)、可信的結(jié)果
裝備科技信息成果展示平臺(tái)提供可視化服務(wù)。根據(jù)用戶需要,運(yùn)用可視化技術(shù),將裝備科技信息研究成果以圖表、報(bào)告、畫(huà)像、知識(shí)圖譜等多種形式展現(xiàn),加快用戶對(duì)數(shù)據(jù)的理解,便于快捷、清晰的提供裝備科技信息服務(wù)。
信息采集是裝備科技信息工作流程中最重要的也是最基礎(chǔ)的環(huán)節(jié)。然而,目前裝備科技信息的采集由科研工作人員獨(dú)自組織管理,缺少系統(tǒng)規(guī)范的采集程序,在信息采集范圍、質(zhì)量、實(shí)用性以及時(shí)效性等方面沒(méi)有明確的要求。同時(shí),由于科研工作人員技術(shù)水平高低不同,導(dǎo)致采集的信息的質(zhì)量、準(zhǔn)確度和實(shí)用性難以保證,不能客觀真實(shí)地反映出數(shù)據(jù)的結(jié)果。建立規(guī)范、統(tǒng)一的信息采集程序,有助于保證系統(tǒng)能夠收集到足夠全面的信息,大大提高信息的收集速度,以及保證信息的及時(shí)性和有效性。
大數(shù)據(jù)環(huán)境下,數(shù)據(jù)的存儲(chǔ)和傳輸方面都存在著許多的安全問(wèn)題,一旦觸發(fā)很有可能引發(fā)一系列嚴(yán)重問(wèn)題,造成極大的經(jīng)濟(jì)損失,因此無(wú)論是政府機(jī)關(guān)還是企業(yè),都需要對(duì)信息安全問(wèn)題加以重視[10]。裝備科技信息服務(wù)系統(tǒng)的開(kāi)放性和共享性,會(huì)加大病毒感染、數(shù)據(jù)泄露、數(shù)據(jù)強(qiáng)行上傳下載、數(shù)據(jù)惡意刪除、黑客侵?jǐn)_等危害發(fā)生幾率,為此需加大安全技術(shù)投入力度,降低該系統(tǒng)安全故障發(fā)生幾率。目前常規(guī)的運(yùn)維管理方式已經(jīng)無(wú)法滿足大數(shù)據(jù)環(huán)境的快速變化,在實(shí)施信息安全防護(hù)工作的時(shí)候需要考慮到當(dāng)前的信息安全技術(shù)發(fā)展,利用跟蹤監(jiān)測(cè)技術(shù)、加密技術(shù)、數(shù)字簽名等先進(jìn)技術(shù)建立安全防范機(jī)制,對(duì)數(shù)據(jù)信息進(jìn)行保護(hù),從而確保信息系統(tǒng)的安全性,避免數(shù)據(jù)信息遭受到破壞和盜竊。
人才是信息化建設(shè)發(fā)展的根本,裝備科技信息服務(wù)系統(tǒng)的建立和維護(hù)必須要有一支集數(shù)據(jù)分析挖掘與裝備科技信息研究等方面的復(fù)合型人才隊(duì)伍。因此,要建立完善的培訓(xùn)機(jī)制和人才激勵(lì)機(jī)制,在引進(jìn)高技術(shù)人才的同時(shí),積極培養(yǎng)能夠掌握信息化技術(shù)和裝備科技信息研究的學(xué)習(xí)型人才,使工作人員除擁有專業(yè)高效的裝備科技信息工作能力外,還善用互聯(lián)網(wǎng)技術(shù),為信息資源共享共用提供良好的技術(shù)環(huán)境,確保系統(tǒng)的穩(wěn)定、健康發(fā)展。
大數(shù)據(jù)環(huán)境下信息資源豐富,存在著巨大的價(jià)值,構(gòu)建基于大數(shù)據(jù)技術(shù)的裝備科技信息服務(wù)系統(tǒng),有助于高效、準(zhǔn)確的全面收集數(shù)據(jù),挖掘潛藏的信息,為用戶提供準(zhǔn)確科學(xué)的裝備科技信息服務(wù)。