丁波濤
(上海社會科學院信息研究所,上海 200235)
近年來,情報學在和其他學科的競爭中多處于劣勢,在國家科學發(fā)展體系中情報學也未得到應有的重視,甚至被邊緣化[1]。因此,不少專家學者提出應加強對情報學基礎(chǔ)理論的研究,探索出情報學原創(chuàng)性的、內(nèi)生性的理論與方法,避免情報學陷入難以與其他學科區(qū)分的困境[2]。情報學作為一個應用性和交叉性極強的學科,所謂的內(nèi)生理論與方法固然十分值得探索,但是,本文認為更重要的應當是關(guān)注情報學科的社會功能與目標。數(shù)十年來,情報學歷經(jīng)了各種變化,但其發(fā)揮 “耳目、尖兵、參謀” 作用的工作導向沒有變,為政府和社會提供決策咨詢服務的學科任務沒有變,以信息資源為主的研究對象沒有變。為了實現(xiàn)這些目標,情報學必須與時俱進,根據(jù)政府和社會對情報工作的需求變化和信息技術(shù)的發(fā)展變革,來不斷創(chuàng)新和豐富情報學科體系。
人工智能被稱為引領(lǐng)未來的戰(zhàn)略性技術(shù)[3]。習近平總書記強調(diào)指出,人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,要深刻認識加快發(fā)展新一代人工智能的重大意義。與以前的各個重大技術(shù)突破相比,智能技術(shù)以更高水平接近人的智能形態(tài)而存在,其在人類生產(chǎn)、生活的各領(lǐng)域中被廣泛應用,這必將引發(fā)產(chǎn)生新的鏈式突破,推動人類社會從數(shù)字化、信息化和網(wǎng)絡化向智能化的加速躍進。因此,情報學必須搭上人工智能的 “快車” ,推動學科體系的持續(xù)創(chuàng)新,使情報學在新的歷史階段為經(jīng)濟發(fā)展和社會進步提供更大的價值。
20 世紀50 年代初,我國模仿蘇聯(lián)模式建立起覆蓋全國的科技情報系統(tǒng),開啟了中國情報學與情報工作的歷史征程[4]。蘇聯(lián)科技情報體制的理論基礎(chǔ)是米哈依諾夫的情報交流理論,而情報交流理論的核心是正式交流與非正式交流[5]。簡而言之,由科學家和專家完成的情報交流屬于非正式交流過程,以利用科學文獻為基礎(chǔ)的情報交流則屬于正式交流過程[6]。1958 年,美國社會學家門澤爾于提出該理論,米哈依諾夫?qū)ζ溥M行了豐富和完善,并深深地影響了包括蘇聯(lián)和中國在內(nèi)的整個社會主義陣營的科技情報工作體系。
當然,米氏理論也有其歷史和社會的局限性。在此后幾十年中,情報交流理論不斷面臨挑戰(zhàn):一是情報的種類、內(nèi)容與形式的發(fā)展;二是情報交流方式與技術(shù)的發(fā)展[7]。盡管如此,情報交流理論仍是中國情報學的重要理論來源,離開這一理論背景就難以解釋中國特色的情報學和科技情報體制。雖然我國情報學和情報工作的內(nèi)涵與外延均超出了米氏理論的范疇,但正如嚴怡民先生指出的,情報和交流兩個基本概念是密不可分的[8]。如果將米氏理論視作一種思想,而不是在特定歷史背景下對情報開發(fā)利用過程的具體描述,根據(jù)情報交流的主體及其關(guān)系來建立情報交流模式,就不會因為情報內(nèi)容、載體、形式與技術(shù)變化而變化,那么米氏理論仍然是穩(wěn)定的、科學的,能反映情報活動的本質(zhì)[9]。情報學經(jīng)歷了大科學時代、信息資源管理時代、知識管理時代、大數(shù)據(jù)時代等階段,目前正在邁向智能時代,然而,情報交流理論對情報學仍具有強大的解釋功能。
第二次世界大戰(zhàn)極大地程度促進了科學和技術(shù)的發(fā)展,推動科學發(fā)展進入了一個全新階段。1962年,美國耶魯大學的普賴斯教授首次提出 “大科學” (Mega Science) 的概念,用于描述這一新階段[10]。大科學的重要特征是科學活動的大規(guī)模、跨學科和高度復雜,產(chǎn)生了所謂 “信息爆炸” 現(xiàn)象,由此催生了情報學。從此情報成為一種資源,并正式成為一種學科研究對象,情報工作則成為專業(yè)性的工作。此時的情報主要是指科技領(lǐng)域的文獻資源,情報交流過程主要是指經(jīng)典的正式交流和非正式交流。隨著科技工作的復雜化和信息技術(shù)的進步,情報的范圍逐步從科技情報拓展到事實情報、實物情報,而大量電子化、網(wǎng)絡化的信息存儲、傳輸和交互技術(shù)的出現(xiàn),使得正式交流與非正式交流的界限逐步模糊??傮w而言,這一階段情報工作的目標主要是服務科技發(fā)展,工作內(nèi)容以傳統(tǒng)紙質(zhì)以及電子化、網(wǎng)絡化的科技文獻為核心。
20 世紀80 年代末、90 年代初,我國情報學遭遇了嚴重的學科危機,相關(guān)學者對此作了大量分析,本文不再累述。與此同時,西方國家的 “信息資 源 管 理” (Information Resource Management,IRM)理論被引入我國,并迅速地被我國情報學界所接受,引發(fā)了 “情報改信息” 運動。在信息資源管理時代,情報學的研究對象大大地擴展,由科技信息為主轉(zhuǎn)向經(jīng)濟、商業(yè)、社會、人才等幾乎所有信息;由以文獻信息為主轉(zhuǎn)向數(shù)字化、網(wǎng)絡化信息為主。學科領(lǐng)域從科技系統(tǒng)擴展到企業(yè)、政府和社會,信息交流則從知識層面的共享與傳播延伸至信息和數(shù)據(jù)層面的傳輸、交換和共享。
在1998 年前后,產(chǎn)生于西方企業(yè)管理領(lǐng)域的知識管理理論被引入我國,這又掀起了新一輪情報學變革。知識管理理論對情報學的最大影響是將隱性知識納入情報工作對象,從而拓展了情報學管理范圍、提升了管理效能[11]。從過程上看,情報學從僅關(guān)注情報傳播環(huán)節(jié)擴展到對知識的需求、學習、創(chuàng)造,覆蓋了情報開發(fā)利用的全過程。最重要的是知識管理階段的情報學的重心從 “物” 轉(zhuǎn)移到 “人” ,重視將結(jié)構(gòu)化和非結(jié)構(gòu)化信息與人的信息利用規(guī)則結(jié)合起來,可視為情報智能化的雛形。
2010 年以來,大數(shù)據(jù)技術(shù)又一次推動了情報學的研究內(nèi)容與方法的創(chuàng)新和拓展。一方面,隨著物聯(lián)網(wǎng)、社交網(wǎng)絡、云計算等技術(shù)不斷融入人類的生產(chǎn)、生活,大量數(shù)據(jù)得以在網(wǎng)絡平臺和數(shù)據(jù)庫中沉淀和積累,使得以往的隱性大數(shù)據(jù)走向顯性化,情報學研究對象從文獻、圖片、視頻、電子表格等信息轉(zhuǎn)向細粒度的大數(shù)據(jù);另一方面,許多新型數(shù)據(jù)分析技術(shù)的出現(xiàn),使得情報學研究從基于文獻的引文或共現(xiàn)關(guān)系構(gòu)建向基于海量數(shù)據(jù)內(nèi)容的知識語義關(guān)聯(lián);從單純對科學小樣本數(shù)據(jù)的信息組織、存儲與檢索向注重大樣本數(shù)據(jù)的描述識別、分布式存儲與檢索;從基于文本的文獻數(shù)據(jù)信息分析向基于科學大數(shù)據(jù)的跨學科知識整合與分析;從基于網(wǎng)絡內(nèi)容要素的鏈接分析向基于海量數(shù)據(jù)關(guān)系網(wǎng)絡挖掘的轉(zhuǎn)變。
觀察情報學發(fā)展歷史,每一種新型技術(shù)革命均從信息交流內(nèi)容、交流方法、交流技術(shù)等方面不斷賦予情報學新的內(nèi)涵,使得情報學更加豐富,人工智能技術(shù)也是如此。新一代人工智能技術(shù)建立于大數(shù)據(jù)基礎(chǔ)之上,但又超越大數(shù)據(jù)。大數(shù)據(jù)強調(diào)海量異構(gòu)數(shù)據(jù)的整合與分析,而人工智能則強調(diào)利用大數(shù)據(jù)技術(shù)、數(shù)理邏輯、深度學習等來模擬人的思維和行為。
國內(nèi)著名人工智能企業(yè)科大迅飛認為,新一代人工智能技術(shù)可分為:計算智能、感知智能和認知智能三個層面[12]。計算智能使得機器能夠更高效、快速地處理海量的非結(jié)構(gòu)化數(shù)據(jù);感知智能使得機器能夠聽懂人類的語言、看懂世界萬物,使得其信息獲得的廣度極大地拓展;認知智能使得機器能理解、會思考,可自動化處理的情報范圍得到極大地拓展和延伸。總之,在人工智能時代,一方面智能本身是一種研究和管理對象;另一方面也將使情報學產(chǎn)生許多新的智能化信息技術(shù)。表1 簡要分析了情報學的發(fā)展歷程。
表1 情報學的發(fā)展歷程
從情報學發(fā)展歷程來看,人工智能對情報學的影響是全方位的。從邏輯上講,情報交流過程包括三個核心要素:交流主體、交流內(nèi)容和交流過程。三種要素的不同選擇及相互關(guān)系構(gòu)成了完整的社會情報交流系統(tǒng)。人工智能具有極強的滲透力,其不僅改變了情報交流過程,也對交流主體和交流內(nèi)容帶來了深遠的影響,推動情報交流機理的不斷進化。
情報學的發(fā)展從情報交流的主體是科學家和文獻情報工作者,逐步擴展到幾乎所有社會人。簡而言之,人工智能技術(shù)就是用機器模擬人的意識和言行的技術(shù),其將創(chuàng)造一大批 “虛擬人” ,如機器人、智能代理、數(shù)字孿生人等。這些虛擬人或者是對某個具體人的思維進行高真度模擬,或者根據(jù)創(chuàng)造者的安排而具備某種特定思維偏向。近年來,人工智能發(fā)展速度較快,技術(shù)的擬人化程度迅速上升,人工智能被大量應用于呼叫中心、客戶服務、新聞采訪、新聞播報等領(lǐng)域,不少技術(shù)已達到高度仿真、人機不分的程度,未來這些智機器人、智能系統(tǒng)將越來越多地替代人類的工作。
鐘信義先生曾指出,技術(shù)發(fā)展的總體趨勢是 “輔人律” “擬人律” 和 “共生律” ,在未來的人機共生體系中,人和機器將像一個不可分割的有機整體,共存共生[13]。機器能夠根據(jù)人的特征和思維,利用智能化的人機界面,幫助甚至替代人們作出判斷、選擇和決定,并開展與其他人和機器的交互。人類和人工智能間發(fā)生頻繁的依賴性交往和互相作用,觸發(fā)類似于 “互為她者” 的鏡像關(guān)系[14]。新型技術(shù)社會形態(tài)也將催生新型信息交流形態(tài),對情報交流過程的分析若仍限于人與人之間的交流,將難以對高度復雜和多元的社會信息交流過程進行觀察、描述和研究;同時,智能感知、物聯(lián)網(wǎng)(Inter‐net of Things,IOT)、大 規(guī) 模 網(wǎng) 絡(Massive Net‐work)、虛擬現(xiàn)實(Virtual reality,VR)等技術(shù)的廣泛應用,使得大量社會信息交流以人-機、機-機交互的形式而存在。在這種背景下,這些 “虛擬人” 應當納入情報交流主體的范疇,通過對人與機器之間、機器與機器之間的情報交流過程進行深入分析,才能更好地研究情報現(xiàn)象、發(fā)現(xiàn)情報規(guī)律、改進情報服務。
交流主體的虛擬化將對情報學產(chǎn)生重大影響。其一,主體虛擬化將替代人類來進行信息的自動化接收、分析和回應,將極大地加快信息交流的過程,并推動情報工作流程的再造;其二,虛擬主體具有自我學習能力,從自身和其他主體的情報活動中不斷得到訓練,提高智能水平,并可借助邊緣計算網(wǎng)絡將自身的智能 “推送” 給其他主體,從而快速優(yōu)化整個情報交流網(wǎng)絡;其三,虛擬化主體具有很強的嵌入和自適應能力,可將以往必須依靠人類來完成的情報服務嵌入到實際業(yè)務和決策工作的各個環(huán)節(jié),實現(xiàn)按需實時的情報響應。
與情報相關(guān)的概念,包括數(shù)據(jù)、信息、知識、智慧等,這些概念代表了信息資源的不同深度和層級,形成了所謂的 “信息金字塔” ,如圖1 所示,自下而上的信息規(guī)模越來越小,但價值越來越大[15]。人工智能條件下,社會信息化的核心要素是建立在海量信息、大數(shù)據(jù)基礎(chǔ)和知識基礎(chǔ)上的 “智慧” 。相比于從前的各類信息要素, “智慧” 的數(shù)量更稀缺,而質(zhì)量和價值更高,情報學也應當關(guān)注這些更具價值的信息資源。
圖1 “信息金字塔” 模型
事實上,情報這一概念本身就隱含著智慧、智能等屬性。馬費成[16]認為,情報學科發(fā)展應該對 “知識-智能(情報)” 加大關(guān)注力度;梁戰(zhàn)平等[17]對情報與信息進行了剖析,并認為新世紀情報學科應該從文獻信息世界走向知識內(nèi)容世界,再走向智慧目標;孫建軍[18]指出,智慧數(shù)據(jù)觀成為情報資源建設的新導向。
由上文可知,情報學的發(fā)展本身也是一個情報對象不斷拓展和豐富的過程。智能技術(shù)的出現(xiàn),使得情報學的研究對象進一步拓展,將不可描述、不可說明、不可傳遞的人類智慧納入情報管理和利用的范疇,實現(xiàn)了智慧的物化和固化,為智慧的大范圍傳播和復用提供了可能性,使得個體智慧能成為群體智慧,成為一種能讓全社會共享與利用的可復用資源,降低了知識生產(chǎn)和學習培訓的成本,增強了人類社會的整體創(chuàng)造力。
經(jīng)典交流理論中所定義的情報交流,無論是正式交流還是非正式交流,都是一種有意識交流,即人是有意識地、有目的、主動地獲得或傳播情報。非正式交流過程中,情報傳播者和接收者的目標都是十分明確的;在正式交流中,各類科技文獻的作者也是出于各種目標主動傳播自己的作品。所謂的 “歷時交流”[19],是時間跨度上的情報交流過程,情報創(chuàng)造者雖然不能預知情報接收者是誰,但其具有明確的情報傳播故意,也屬于有意識交流。傳統(tǒng)情報學研究所依賴的對象——文獻、社會關(guān)系、學術(shù)網(wǎng)絡,都是建立在情報主體的 “目標性” 基礎(chǔ)之上,即人必須有創(chuàng)造情報、傳播情報、分析情報和利用情報的主觀意圖,并顯化為某種物質(zhì)載體和社會行為,如發(fā)表一篇論文、申請一項專利、參加一個會議、進入一個機構(gòu)學習或工作等,情報工作者才能根據(jù)其有意識留下的活動痕跡,分析其特征與規(guī)律,展開相關(guān)情報服務。
人工智能的出現(xiàn),徹底顛覆了人類的信息活動方式。從人工智能角度來看,無論是人的主動言行還是無意識動作,都代表了人的一種情報。網(wǎng)絡對社會的高度滲透,人的種種社會活動都在網(wǎng)上留下大量痕跡,而大量感知設備的鋪設又會自動捕捉人的數(shù)據(jù)。人工智能技術(shù)可以利用這些數(shù)據(jù)進行 “數(shù)據(jù)畫像” ,從個體層面上,能夠推測其個人身份特征,并較為準確地預測其觀點和行為;從群體行為層面上,可以預測可能發(fā)生的社會事件[20]。這些人類 “無意識” 活動留下的海量數(shù)據(jù),是一種極為重要的新型情報來源。與傳統(tǒng)情報源相比,其具有預測精準、隱蔽性強等特點,更加符合 “情報” 的本質(zhì)屬性。
因此,在人工智能時代,情報交流實現(xiàn)了從有意識情報過程擴展到無意識情報過程,給情報學理論與方法帶來重大影響。如果說情報交流內(nèi)容的智慧化是從縱向上拓展了情報學研究對象;而交流過程的非意識化則從橫向上進行拓展,將大量非意識化的社會活動數(shù)據(jù)納入其中,從而推動情報學研究范疇從科技創(chuàng)新、信息傳播等少數(shù)領(lǐng)域,轉(zhuǎn)向人類社會的幾乎所有活動信息。
經(jīng)典情報交流理論產(chǎn)生于特定歷史階段,其局限性表現(xiàn)為:重視正式交流而輕視非正式交流,著眼于個體層面而非群體層面,只關(guān)注內(nèi)容傳遞而不涉及情報認知。其后,學界從幾個方向?qū)ζ溥M行修正。一是重新定義情報交流類型,如文獻[21]提出了 “半正式交流” (通過網(wǎng)絡自媒體進行的交流)的概念,文獻[22]提出以是否有專職情報人員參與來劃分正式和非正式交流;二是從認知角度出發(fā),將情報交流視為知識交互與吸納過程,將外部情景、情報狀態(tài)和主體的搜索行為、學習能力等納入研究范疇[23];三是從個體和機構(gòu)層面上升到社會層面,研究社會信息交流和社群信息交流問題[24]。
與經(jīng)典的情報交流理論相比,人工智能環(huán)境的情報交流具有以下特點。
1)虛實多元主體
上述幾種修正的交流理論中,情報交流的主體仍然是人。然而在人工智能環(huán)境之中,情報交流的主體可以是人,也可以是 “虛擬人” (機器人、智能代理、數(shù)字孿生人等)。交流主體的多元化使得情報交流類型更加豐富,如圖2 所示。
圖2 人工智能環(huán)境下的情報交流
(1)人-人情報交流。人與人之間的情報交流,經(jīng)典理論中的正式交流、非正式交流以及我國學者提出的 “半正式交流” 都屬于此類。
(2)人-機情報交流。人與智能主體之間的情報交流,包括人與問答機器人、智能客服系統(tǒng)、智能撰稿系統(tǒng)等之間的情報交互。
(3)機-機情報交流。智能主體之間的情報交流,指機器人、智能代理、數(shù)字孿生人等相互之間自動進行的情報交流。
需要指出的是,引入 “虛擬人” 之后的情報交流不同于本體論層面的情報交流,后者的交流主體可以是世界上的一切物體,而前者的交流主體—— “虛擬人” 是智能的、受控的、擬人的,其作用是代理現(xiàn)實世界中的某個人或某個群體來進行情報交流,不具有仿真和代理功能的機器和系統(tǒng)不能納入交流主體。同時,人-機情報交流不同于交流棧理論中的 “棧交流” ,其中的 “棧” 一般是指個人或者文獻情報機構(gòu)(如圖書館、情報所、出版社、咨詢公司等)[25],并不是指智能系統(tǒng)。
2)雙向并行過程
經(jīng)典理論中的情報交流是一個單向過程,即從情報創(chuàng)造者或擁有者到情報用戶的過程,這實際上是情報傳遞過程,現(xiàn)實中的情報交流是由多個不同方向的單向過程組成。但在人工智能環(huán)境下,任何情報交流活動都是包括兩個環(huán)節(jié)的雙向并行過程:一是顯性情報交流,即情報內(nèi)容從發(fā)送方傳遞到接受方;二是隱性情報交流,在顯性情報交流的同時,收受方的情報內(nèi)容偏好、獲取頻率、情報行為甚至獲得情報之后的閱讀過程、分析利用方式等特征情報,又自動地由接受方 “無意識地” 傳遞到發(fā)送方,如圖3 所示。
圖3 人工智能環(huán)境下的顯性和隱性情報交流
3)智能學習認知
智能情報交流系統(tǒng)是由人、機構(gòu)、虛擬人組成的情報交流網(wǎng)絡。其中,不僅有情報傳遞過程,還包含情報認知過程。虛擬主體的引入,使得情報認知具有更豐富的含義,其不僅存在于人與人之間,還存在于人與機器以及機器與機器之間。相比人與人之間基于知識學習的情報認知,智能的虛擬主體通過基于機器學習的智能認知,不僅能更快速地獲取更豐富、更有深度的知識,還可形成具有復雜理解能力和抽象判斷能力的機器智慧,并將其算法化和代碼化,從而實現(xiàn)智慧的可傳遞和可復用。因此,人工智能環(huán)境中的情報交流體系不僅包括信息交流,還包括知識交流和智慧交流。
情報交流理論的新演進,一是內(nèi)涵更加豐富,能涵蓋新技術(shù)條件下社會情報交流系統(tǒng)中的更多領(lǐng)域,人-機交互成為情報學中的重要內(nèi)容;二是解釋力更強,能描述人工智能環(huán)境中極為豐富的情報交流活動;三是帶來了新的挑戰(zhàn),如虛擬主體的定位和責任問題,人-機交流引發(fā)的信息隱私與安全問題等。
鐘義信教授曾提出 “全信息” 理論,含義包括兩方面:一是指 “全信息” 包括語法信息、語義信息和語用信息等全部層次;二是指 “全過程” ,涉及信息獲取、處理、傳遞、再生和施用等全部環(huán)節(jié)[26]。就內(nèi)容而言,傳統(tǒng)情報學主要是研究語法和語義層面的信息;就過程而言,傳統(tǒng)情報學主要研究信息獲取、處理、傳遞等環(huán)節(jié)。由于人工智能被引入情報學而引發(fā)交流主體的虛擬化、交流內(nèi)容的智慧化和交流過程的非意識化,使得情報學將更多層次的信息內(nèi)容、更多領(lǐng)域的工作環(huán)節(jié)納入學科研究范疇,使情報學真正成為一門 “全信息理論” 學科。本文將從新情報觀、新過程觀和新方法論三個角度,論述人工智能環(huán)境下情報學的新拓展,如圖4 所示。
圖4 人工智能環(huán)境下情報學科體系拓展
對于如何理解和界定 “情報” ,學科發(fā)展經(jīng)歷了從 “小情報觀” (Intelligence) 到 “大情報觀” (Information) 的過程,到目前基本形成了DIKW(Data-Information-Knowledge-Wisdom)或DIKI(Da‐ta-Informtaion-Knowledge-Intelligence) 的體系。人工智能環(huán)境下,情報內(nèi)容的智慧化使得智慧本身也成為一種情報,進一步豐富了情報的內(nèi)涵,形成多元融合的新情報觀。
(1)情報內(nèi)容的多元化。體現(xiàn)在人工智能的物化載體——算法、模型等成為一種新的情報工作對象,并具有與傳統(tǒng)情報源(數(shù)據(jù)、信息、知識等)具有同等重要的地位。特別是在數(shù)據(jù)開放的環(huán)境中,面對同樣的數(shù)據(jù),采用不同算法將可能帶來完全不同的決策結(jié)果。如果不能獲取這些算法、模型等新型情報來推測特定機構(gòu)、人物的意識與偏好,就無法完成 “耳目、尖兵、參謀” 的情報職能。換言之,以往智慧是作為情報分析的結(jié)果,現(xiàn)在智慧也成為情報工作的 “原料” 。
(2)智慧-情報的融合。智能感知、智能數(shù)據(jù)分析、智能信息處理、智能知識發(fā)現(xiàn),將傳統(tǒng)信息鏈中的信息單元都融為一體,形成新的情報形式——智慧情報,其具有需求敏感性、數(shù)據(jù)多源性、分析智能性和服務嵌入性等新特點,并可以實現(xiàn)用數(shù)據(jù)智慧地計算情報需求,用數(shù)據(jù)智慧地描述當前形勢、競爭環(huán)境以及動態(tài)變化等新功能[27]。劉煒先生認為,智慧數(shù)據(jù)是有語義的、可計算的、能夠自主行為的信息單元,是信息、知識以及語義三者的集合體[28]。智慧情報的本質(zhì)是實現(xiàn)了語法、語義、語用情報的統(tǒng)一。
(3)情報生態(tài)的擴展。波普爾在1972 發(fā)表的《客觀知識》提出 “三世界” 理論,將世界分為 “物質(zhì)世界(W1)” “精神世界(W2)” 和 “人工世界(W3) ”[29]。從信息學的角度來看, “W3” 可定義為已編碼的且可共享的信息的世界[30]。人工智能條件下,利用智能技術(shù)對復雜系統(tǒng)進行建模,利用計算實驗對復雜系統(tǒng)進行分析,W3 的外延得到極大擴張;同時,通過物質(zhì)世界與人工世界之間的虛實互動,形成 “ACP” (Artificial Societies +Computational Experiments + Parallel Execution)[31]和 “CPSS” (Cyber-Physical-Social Systems)[32]體 系。W3 的擴張,以及三個世界之間互動關(guān)系的復雜化,使得情報生態(tài)更加豐富多樣。如圖5 所示。
圖5 人工智能環(huán)境中的情報生態(tài)
圖6 人工智能環(huán)境中的新型情報過程
情報學具有鮮明的過程屬性,情報過程規(guī)定了情報工作的問題域及方法論[33]。盡管情報學自出現(xiàn)以來一直隨著經(jīng)濟社會和科學技術(shù)的發(fā)展變革而在不斷變,但情報工作的核心過程基本固定,主要包括需求定義、信息檢索、信息清洗、信息分析、信息展現(xiàn)以及報告撰寫與提交等環(huán)節(jié)[34],這是一個起于情報需求、終于情報提交的線性、開環(huán)過程,如圖6 所示。
人工智能引發(fā)的情報主體虛擬化、內(nèi)容智能化和交流過程非意識化,促使情報工作各環(huán)節(jié)的自動化與智能化。這不僅加快了情報過程的速度,而且推動情報過程由線性、單向的情報過程轉(zhuǎn)向多向、閉環(huán)、嵌入式過程。其具有以下特征。
(1)情景驅(qū)動。傳統(tǒng)的 “情報需求-情報收集-情報分析-情報交付” 的情報過程是由需求驅(qū)動的。智能情報過程是情景驅(qū)動的,將互聯(lián)網(wǎng)、智能終端、感知設備、大數(shù)據(jù)智慧分析系統(tǒng)、智慧情報應用進行整合和關(guān)聯(lián),智能地察覺組織的內(nèi)外部變化并判斷情報切入情景,自動啟動情報工作流程。
(2)深度嵌入。近年來,信息化發(fā)展促使嵌入式服務需求快速增長[35]。傳統(tǒng)上所采用依靠情報人員進行組織嵌入、學科嵌入和知識嵌入,效率低、深度差。而通過虛擬智能主體可實現(xiàn)在決策過程各環(huán)節(jié)的深度嵌入,從而實時跟蹤、學習和分析用戶的行為與意圖,并提供信息聚合、知識存儲、情報保障、個性化服務等功能。
(3)快速迭代。人工智能智慧情報系統(tǒng),通過需求的自動發(fā)現(xiàn)、數(shù)據(jù)的自動聚類、信息的自動分析、交互的自動開展以及報告的自動撰寫,在短時間內(nèi)形成情報結(jié)果,然后在與情報用戶的互動反饋中,不斷更精準定位用戶的情報需求,并修正情報采集、分析和展示策略,從而使情報服務在短時間能調(diào)整至更優(yōu)狀態(tài)。
(4)過程閉環(huán)。今天人們面對的決策問題比以往更加復雜,決策環(huán)境的不確定性和動態(tài)性,均對現(xiàn)有的決策理論和方法提出了挑戰(zhàn)[36]。借助于智能代理、深度學習、移動應用等手段,情報系統(tǒng)和決策系統(tǒng)能夠?qū)崿F(xiàn)深度融合。智能情報系統(tǒng)能及時感知決策情景、決策需求、決策執(zhí)行和決策效果,并自動將決策效果的輸出作為情報系統(tǒng)的輸入,再快速迭代啟動新一輪情報過程,使情報結(jié)果得到不斷優(yōu)化。
方法論是人們認識世界、改造世界的根本方法。情報學方法論是關(guān)于情報方法的知識或體系,研究如何使科學化的情報研究得以有效、有序的運用,并使各種情報方法的知識得以整合,增強情報人員研究情報和情報規(guī)律的能力[37]。人工智能在情報學中的應用,一方面,傳統(tǒng)情報學以文獻數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)作為主要分析對象,將轉(zhuǎn)為關(guān)注非結(jié)構(gòu)化數(shù)據(jù)和其他類型數(shù)據(jù)[38];另一方面,將引入智能感知、協(xié)同分析、視覺搜索、自然語言處理、情境感知、信息可視化、邊緣計算等新技術(shù)和方法,驅(qū)動情報學方法論發(fā)生新的變革。
(1)從有機分析到無機分析。傳統(tǒng)情報工作中雖然大量引進了計算機、網(wǎng)絡以及各類先進的信息分析系統(tǒng),但人仍然是情報工作的主體,信息技術(shù)只是起到輔助支撐作用。然而,當前人工智能飛速發(fā)展,已經(jīng)表現(xiàn)出遠遠超出人類的強大分析能力和分析速度,傳統(tǒng)的以人工分析為主的方法體系(有機分析),必然將被計算機智能化分析方法為主的新型方法體系(無機分析)所取代。
(2)從確定性方法到不確定性方法。目前,情報學在研究中普遍采用的是確定性研究方法論[39],只能處理那些邊界明確的問題以及概率性問題,而大量的社會復雜問題都是開放的、可能性問題,只有依靠人來完成。近年來,人工智能不斷發(fā)展與創(chuàng)新,其對于不確定性研究對象的分析能力已經(jīng)超過了人類,而且對于大量的、多維的數(shù)據(jù)分析占有絕對優(yōu)勢。因此,未來模糊邏輯、貝葉斯網(wǎng)絡、模糊神經(jīng)網(wǎng)絡等不確定性方法將被廣泛引入情報研究之中。
(3)從實證分析到知識自動發(fā)現(xiàn)。傳統(tǒng)的 “假設-模型-驗證” 的科學模式是一種自上而下的決策分析過程[40],在新的技術(shù)環(huán)境下,這種基于實證的研究方法已經(jīng)過時[41]。人工智能時代的情報分析,將從海量數(shù)據(jù)中自動發(fā)現(xiàn)強關(guān)聯(lián)規(guī)則,是一種自下而上的知識發(fā)現(xiàn)過程。事實上,知識發(fā)現(xiàn)(Knowl‐edge Discovery in Database,KDD)概念的首次提出是在1989 年的第11 次國際人工智能聯(lián)合學術(shù)會議上[42]。只有借助人工智能,情報工作才能突破淺層次的數(shù)據(jù)庫檢索、查詢和分析,轉(zhuǎn)向?qū)π畔⑦M行整合、分析和推理,將信息自動地變成知識和智慧,以指導實際問題的求解并預測未來發(fā)展。
情報學因視野不同而具有不同的學科范式,而學科范式?jīng)Q定了方法范式。本文根據(jù)情報學的三大學科范式[43]來劃分研究方法部類,并分析各類研究方法在人工智能環(huán)境下的改進方向,如表2 所示。
情報分析是情報工作的核心環(huán)節(jié)?,F(xiàn)實中,由于情報分析需要與特定的學科知識和行業(yè)經(jīng)驗相結(jié)合,其難度較文獻檢索和服務更大,因此,許多情報機構(gòu)將重點放在文獻和信息層面,并沒有真正將情報分析作為重點。例如,包昌火等[47]、蘇新寧[48]等學者指出,許多科技情報所非常重視建立文獻中心,但卻疏忽情報的分析與研究,造成情報工作重點的偏移。
在人工智能時代,知識可以由人工智能輔助而產(chǎn)生,知識服務也將由經(jīng)驗主導轉(zhuǎn)向強關(guān)聯(lián)規(guī)則主導[49]。新一代人工智能的核心技術(shù)是深度學習,能從大數(shù)據(jù)中自動發(fā)現(xiàn)規(guī)則,而規(guī)則一旦被發(fā)現(xiàn)就可以用于預測,從而將許多傳統(tǒng)上被認為是隱性的、依附于大腦的人類智慧,轉(zhuǎn)化為計算機算法,實現(xiàn)了復雜知識的自動化。
利用人工智能技術(shù),情報機構(gòu)可以將各種學科知識和行業(yè)經(jīng)驗轉(zhuǎn)化為代碼化的規(guī)則與模式,并融入智能化情報分析系統(tǒng)之中,從而降低情報分析與特定行業(yè)知識的依賴度;同時,情報工作與決策過程的深度嵌套,使得智能化情報分析系統(tǒng)能夠在情報過程的快速迭代中不斷優(yōu)化規(guī)則與模式,驅(qū)動無機分析精度的提升。
因此可以預見,在基于人工智能的情報技術(shù)環(huán)境中,情報工作人員將能自主完成對學科情報和行業(yè)情報的深度分析,情報機構(gòu)也將由以文獻資料和一般性分析結(jié)果提供為主,轉(zhuǎn)向?qū)I(yè)化的行業(yè)和領(lǐng)域知識提供者,從而實現(xiàn)情報分析的回歸。
表2 人工智能環(huán)境下情報學方法的改進[44-46]
近年來,情報工程化是情報學科研究的重要話題。所謂工程化是指把經(jīng)驗、技巧、知識、常識進行固化、理論化和規(guī)范化,構(gòu)建一個可重復創(chuàng)造有價值產(chǎn)品的最優(yōu)系統(tǒng)[50]。情報工程是以工程化思維實施情報工作活動人流程,是整合工程思維和情報理論、方法和技術(shù)于具體情報實踐的過程之中,實現(xiàn)信息來源大數(shù)據(jù)化、信息處理自動化、情報流程集成化、系統(tǒng)結(jié)構(gòu)復雜化和系統(tǒng)運作協(xié)同化[51]。
傳統(tǒng)情報工作模式對于特定專業(yè)知識和行業(yè)經(jīng)驗的依賴較多,導致情報過程與情報人員高度耦合,造成情報流程難以切分,這也是以往情報工作難以工程化的原因所在。只有在人工智能環(huán)境中,才能實現(xiàn)情報工作經(jīng)驗、技巧、知識和常識的固化,使其脫離于具體個人,將情報服務由個體勞動轉(zhuǎn)為工程作業(yè),從而使情報工程化成為可能。情報服務工程化的總體目標是提升情報服務的效率和質(zhì)量,主要通過以下五方面來實現(xiàn)。
一是情報工作的模塊化。人工智能技術(shù)促進情報工作的標準化與模塊化,從而將一個完整的 “事實-數(shù)據(jù)-信息-知識-智能” 的情報流程切為不同業(yè)務環(huán)節(jié),并分派給不同的部門和人員,實現(xiàn) “專業(yè)的人做專業(yè)的事” ,情報工作效率和質(zhì)量得以大大提升。
二是情報服務的協(xié)同化。決策環(huán)境的日趨復雜以及情報研究從特定專業(yè)轉(zhuǎn)向綜合,均需要協(xié)同化的情報服務[52]。利用人工智能技術(shù)將各領(lǐng)域數(shù)據(jù)實現(xiàn)集成融合,使得信息提供者、工具開發(fā)者、情報分析者和情報用戶等不同主體可以在一個統(tǒng)一規(guī)范平臺中實現(xiàn)協(xié)同工作[53],實現(xiàn)情報工作體系的整體優(yōu)化。
三是情報服務的平臺化。人工智能通過對情報人員進行深度學習,可以將以往必須由人來完成的情報分析工作轉(zhuǎn)化為基于云計算的在線情報分析服務,即所謂 “情報分析即服務” (intelligence analyt‐ics-as-a-service,IAaaS)[54],實現(xiàn)情報發(fā)現(xiàn)和情報分析服務的網(wǎng)絡化、自動化和智能化,并實現(xiàn)情報服務的按需供給。
四是情報服務的可重復。借助于人工智能對情報分析的背景知識和分析技巧等進行固化,形成若干可持續(xù)、可重復的情報分析流程,使得情報分析從以前的基于個人經(jīng)驗的 “手工作坊式” 生產(chǎn)方式,轉(zhuǎn)向基于標準流程的 “流水線” 生產(chǎn)方式。文獻[55]以美國印第安納大學高級可視化實驗室(Ad‐vanced Valudation Labs,AVL)為例對這一過程進行了分析。
五是情報服務的過程可控。情報研究過程如何決定著情報產(chǎn)品質(zhì)量的高低[56]。以往的情報質(zhì)量控制主要是后向控制,即在情報結(jié)果出來后,才能對情報服務質(zhì)量進行評判。而在情報工程化之后,情報機構(gòu)和情報用戶可通過對過程進行規(guī)范化監(jiān)管來控制情報質(zhì)量。
黃長著先生[57]曾指出,情報工作既包含隱蔽情報,也包括從公開渠道獲得文件、資料來判斷一個國家的趨勢和走向。不過傳統(tǒng)情報工作對象的主體仍是文獻、資料、數(shù)據(jù)庫以及一些特殊情報源等,而且往往越稀缺、越隱蔽、越不為人所知,情報就越有價值。
然而,信息不一定是秘密才有價值。在大數(shù)據(jù)時代,互聯(lián)網(wǎng)、Web 2.0、傳感器以及政府數(shù)據(jù)開放、企業(yè)年報等都提供了源源不斷的信息供應。與傳統(tǒng)情報源相比,開源情報(Open Source Intelli‐gence,OSINT)不僅成本更低、更及時、更準確,而且能提供特定目標或事件的發(fā)展背景和整體視圖。例如,對重大國際事件,利用開源情報不僅可以獲知某國官方的真實觀點,還可以評估該國不同社會群體的看法,并隨著時間的推移跟蹤其變化趨勢和規(guī)律,從而使我國在相關(guān)合作和談判中占據(jù)主動。
同時,美國中央情報局專家指出,開源情報是公開、免費的,但并不意味著是容易的[58]。開源情報不僅數(shù)量龐大,而且是多來源、多語種、多介質(zhì)、多類型、多結(jié)構(gòu)和多文化背景,需要將高級信息搜索與處理技術(shù)與多外語技能、多元文化知識、特定專業(yè)背景以及情報敏感性結(jié)合起來,才能對其進行有效的分析處理,難度較高。人工智能技術(shù)提供了強大的智能計算以及情景感知、自動翻譯等能力,情報機構(gòu)可以更加便利而準確地利用開源情報,對特定機構(gòu)或人員的行為特征、活動規(guī)律和未來動向進行判斷。因此,開源情報逐漸得到全球的重視。據(jù)估算,2017 年全球開源情報市場規(guī)模為28.66 億美元,預計到2023 年將超過70 億美元[59]??梢灶A測,在人工智能環(huán)境中,開源情報在情報工作中的地位將大大上升,成為情報工作的主流內(nèi)容之一。
本文對人工智能時代情報學科的創(chuàng)新發(fā)展進行了較為全面系統(tǒng)的探討。首先,本文基于情報交流理論,回顧了情報學的歷史發(fā)展階段:大科學時代、信息資源管理時代、知識管理時代、大數(shù)據(jù)時代和人工智能時代;其次,本文分析了人工智能環(huán)境下情報交流理論的演進,包括交流主體虛擬化、交流內(nèi)容智能化和交流過程非意識化;第三,本文從新情報觀、新過程觀和新方法論三個維度,分析了人工智能時代情報學科的拓展;最后,本文分析了人工智能對情報工作的影響,包括情報分析的回歸、情報工程化和開源情報的重要性提升。本文對情報交流理論、情報學科體系和情報工作的分析,既有助于對新技術(shù)環(huán)境中情報理論的創(chuàng)新發(fā)展提供思路,也可以為情報系統(tǒng)和情報服務的智能化創(chuàng)新提供參考。
當然,本文對情報學創(chuàng)新發(fā)展的探討側(cè)重于理論與方法層面上的分析,實效如何還需要在情報學發(fā)展轉(zhuǎn)型過程的實踐中進行總結(jié)和驗證。同時,新一代人工智能技術(shù)革命方興未艾,尤其是強人工智能的步伐越來越近,其具備與人類相近甚至更高水平的智慧能力,將可能完全重構(gòu)情報的概念以及情報主體、情報方法,對情報學科和情報工作產(chǎn)生顛覆性影響,這也需要我們緊密跟蹤人工智能技術(shù)創(chuàng)新發(fā)展不斷進行深化研究。