余 璐
(上海市地方志辦公室,上海 200030)
Web3.0視角下的地方志信息化平臺建設構想
余 璐
(上海市地方志辦公室,上海 200030)
對Web3.0的含義及特點進行介紹,并結合方志工作本身的內容,以互聯網未來發(fā)展趨勢的視角來審視目前方志信息化平臺建設中存在的問題,并提出改進構想:進一步加強相關信息間、終端間的“互聯互通”;重視用戶需求,使用相關技術和方法,加強分析研判;嘗試打造“個性化”的信息化服務平臺。
Web3.0;地方志;信息化;平臺建設
近年來,全國范圍內地方志數據庫(數字方志館)規(guī)??焖贁U容,地情網站群覆蓋面逐步擴大,方志業(yè)務信息系統建設加速推進,方志新媒體矩陣初具規(guī)模,“互聯網+地方志”已經成為開發(fā)利用地方志資源的重要手段。①《“互聯網+地方志”成為開發(fā)利用地方志資源重要手段》,http://news.dahe.cn/2016/04-28/106777313.html.互聯網技術本身也在日新月異,目前互聯網整體向Web3.0時代轉進的演變軌跡值得方志工作者們密切關注,尤其需要地方志信息化平臺建設者們加以分析研究,業(yè)界應當緊跟信息技術發(fā)展趨勢,以求得修志工作的與時俱進和社會服務功能的持續(xù)拓展。
計算機軟件發(fā)布后會不斷更新,隨之有了不同的版本號,如1.0版本、2.0版本、3.0版本等,版本號越大,則該版軟件越新,其功能也就越完善?;ヂ摼W從業(yè)者借用這樣的概念,也給互聯網標上了版本號,不同的版本號代表著互聯網不同的歷史發(fā)展階段。
第一代互聯網,稱為Web1.0。這一時期的網站以靜態(tài)單向閱讀為特征,網站提供給用戶的內容是網站編輯處理過的,用戶處于被動的地位,幾乎不參與網絡內容的生產。Web1.0時代的代表站點為新浪,搜狐,網易等三大門戶。②《Web1.0、2.0、3.0分別是什么意思?》,https://www.zhihu.com/question/19911163.Web1.0具有精英文化屬性,Web1.0時代也可稱之為“聚眾時代”:當人們缺乏信息的時候,發(fā)布信息的互聯網門戶就是最有價值的,就是網絡的中心節(jié)點,這些門戶網站以信息的獲取、發(fā)布、整理為核心,想盡辦法把各種信息匯集起來,讓用戶去瀏覽,信息傳遞模式就是“互聯網—用戶”的單向模式。
第二代互聯網,稱為Web2.0。這一時期的網絡已發(fā)展成可讀寫式、互動參與的實時網絡。網站的內容不再由網站編輯單向提供,而是主要基于用戶提供,即所謂UGC(User Generated Content,用戶生產內容),網站的興旺發(fā)達依賴于用戶的積極參與和主動建設。①《Web2.0》,來自“百度百科”,網址:https://baike.baidu.com/item/web2.0/97695?fr=aladdin.Web2.0時代的代表站點有:新浪博客、騰訊微博、Facebook(臉譜網)、Twitter(推特)等各類社交網站。另外,各種形形色色的論壇和貼吧、著名的A站(Acfun)、B站(bilibili)、Youtube等視頻網站,甚至連興盛一時但現已沉寂的開心網、chinaren校友錄等均可歸為Web2.0網站。Web2.0具有草根文化屬性,Web2.0時代也可稱之為“分眾時代”:這一時期,每個網民都成為了信息的節(jié)點,每個節(jié)點充當一個信息源,出現了“去中心化”的趨勢,大量的網站失去了原先對信息資源的獨占權,它們對各個網絡節(jié)點(通常是普通用戶)上傳來的信息進行匯總、梳理、篩選和再發(fā)布,信息的傳遞模式變成了“互聯網—用戶—互聯網”“用戶—用戶”“用戶—互聯網”的多向模式。Web2.0是一次互聯網理念的升級換代,由原來的自上而下的由少數資源控制者集中控制主導的互聯網體系,轉變?yōu)樽韵露系挠蓮V大用戶集體智慧和力量主導的互聯網體系,這極大地激發(fā)了個人創(chuàng)作和貢獻的潛能,使得互聯網創(chuàng)造力上升到新的量級。②曹方,Web3.0的夢想與現實[J].上海信息化,2012(9):9.Web2.0相關的主要技術有RSS(新聞聚合)、Blog(博客)、Wiki(維基)、Tag(社會書簽)、IM(即時通信)、SNS(社會網絡服務)等。這些技術的共同特點是,進一步突出網絡信息生產中普通網民的作用,并且通過各種應用方式使網民之間產生更加密切牢固的關系。③王玲芳,淺談Web3.0時代高校圖書館的新發(fā)展[J].內蒙古科技與經濟,2009(22):125.
現在正是Web2.0大行其道,方興未艾之時,但已有不少互聯網從業(yè)者對下一代互聯網的發(fā)展提出了前瞻性的看法。Web3.0是何樣貌,目前眾說紛紜,沒有統一定義。但是,幾乎所有人都認為Web3.0應當包含“語義網”(Semantic Web)技術。④完顏鄧鄧,Web3.0環(huán)境下的公共數字文化資源整合平臺建設研究[J].圖書館學研究,2015(23):20.
通俗地說,語義網就是能夠根據語義進行判斷的網絡。也可以說,語義網是一種能理解人類語言的智能網絡,它不但能夠理解人類的語言,而且還可以使人與電腦之間的交流變得像人與人之間的交流一樣輕松。因為語義網中的計算機能利用自己的智能軟件,在搜索數以萬計的網頁時,通過“智能代理”從中篩選出相關的有用信息,而不像現在的萬維網,只能羅列出數以萬計的搜索結果(其中包含著大量無用的信息),這將使人類從繁重低效的搜索勞作中解放出來。⑤《語義網》,https://baike.baidu.com/item/語義網/118508?fr=aladdin.語義網這一Web3.0核心概念的提出,是為了因應Web2.0時代信息泛濫的困境。伴隨著網民的生產力被解放,網上內容呈現爆炸式增長,人類卻面臨另一個尷尬的處境:我們現在已被天文數字般(而且仍然在以幾何級數增長)的網絡信息所淹沒,即使擁有搜索引擎(機器的幫助)和相關知識類論壇、社交網絡(人的幫助),還是面臨“答非所問”的窘境或陷入各種意無意的誤導之中(如百度醫(yī)療信息的搜索結果是以“競價排名”的方式呈現)。在互聯網上,要精確地找到對個人有價值的東西,已經越來越難。
構建語義網是一個雄心勃勃的設想,它對網絡的智能化,以及網站間底層數據的標準化、開放性提出了很高的要求,目前其發(fā)展面臨一些技術瓶頸⑥《語義網是什么?有什么好處?》,https://www.zhihu.com/question/19550885.,但國內外已有一些相關研究成果應用于生產和生活領域⑦⑧⑨⑩《Facebook推出Graph API:語義網的未來?》,https://news.cnblogs.com/n/62843/.,隨著近年來人工智能技術的跨越式發(fā)展,語義網的未來值得期待,Web3.0時代的曙光已出現在我們面前。
基于“語義網”這一Web3.0的核心概念,我們可以得出關于Web3.0樣貌的大致描述:Web3.0以語義網為基礎,將互聯網中雜亂無章的微內容標準化、信息化,整合各種底層數據庫,建立龐大的底層數據庫的信息交換機制,通過智能交互的信息平臺將信息反饋給用戶。①夏昌銘.Web3.0環(huán)境下互動學習平臺構建[J].圖書情報論壇,2011(5):52.Web3.0網絡模式就是基于用戶需求的智能過濾器和多元化需求滿足平臺②張揚.Web的發(fā)展與圖書館參考咨詢服務“從Web1.0到Web3.0”[J].科技情報開發(fā)與經濟,2009(18):8-9.,它主要有以下特征:
1.主動篩選性(或智能性)
Web3.0被視為智能網絡,它會主動提取用戶的上網痕跡及其產生的各種數據,來分析研究用戶的需求。用戶每次在網站停駐,都會讓網站變得“更懂你一點”,網站的搜索引擎能不斷為用戶提供更有針對性的、更有價值的服務,這是Web3.0能做到對海量信息進行有效篩選、智能匹配用戶需求的主要原因。
2.兼容交互性
語義網的構建,要求各網站間的底層數據(元數據)之間開放交互,這相當于將全世界的網絡節(jié)點(即互聯網本身)看成一個超級數據庫。每個網絡服務器都是這一數據庫中平等的存儲單元和平等的查詢入口。用戶上網時,只需輸入查詢命令即可,不用考慮本系統和其它服務器系統是否存在兼容性,以及本查詢語句是否適合其他服務器的調用程序等問題。③夏昌銘.Web3.0環(huán)境下互動學習平臺構建[J].圖書情報論壇,2011(5):52.基于Web3.0構建的網絡平臺還可實現統一平臺的多終端兼容訪問,人們可以通過移動網絡、有線電視網、互聯網(特指PC端),使用獨立的操作系統或應用程序隨時隨地訪問網站。④完顏鄧鄧.Web3.0環(huán)境下的公共數字文化資源整合平臺建設研究[J].圖書館學研究,2015(23):21.
3.個性化聚合
Web2.0時代,涌現出大量的社會網絡站點、博客、微博、維基百科、視頻音頻點播等,Web3.0聚焦于對Web2.0時代創(chuàng)造的這些數據集進行聚合。它按照對于用戶需求的分析結果,基于Widget(微件)、Mashup(糅合)技術等主動地對Web2.0的交流平臺進行個性化組配,聚合平臺的各種個性化應用。用戶上網時無需暫離網頁,因為瀏覽器已經集成了用戶需要的各種exe及app,用瀏覽器即可以實現復雜的系統程序才具有的功能。由此,每個人上網點開瀏覽器時,不再是統一的界面,而是個性化的專屬于個人的門戶網站,你在生活中的所有需求幾乎都可以在這個網站中得到“一站式”滿足。⑤《Web1.0、2.0、3.0分別是什么意思?》,https://www.zhihu.com/question/19911163.
綜合上述三項特征,我們可以說,Web3.0時代,將是互聯網在“互聯互通”“平等、自由、開放、共享”的發(fā)展道路上的自然延伸,Web3.0這一概念是互聯網從業(yè)者“以人為本”的服務理念的深度體現。
目前國內已建成的方志信息化平臺主要分兩類:一類是PC端的網站,一類是移動端的微信公眾號。
PC端的網站又可分為地方志工作機構的官方網站,以及地情資料數據庫(數字方志館、地方志文本數據庫)這兩大類。這些信息化平臺仍然停留在Web1.0時代,其信息傳播模式是“互聯網—用戶”的單向模式,頁面也只能靜態(tài)閱讀。即使有部分網站開設了互動交流的欄目(如廣東省情網開設有“網上太史公”欄目),但用戶的反饋對于網站內容的生產幾乎不起任何作用。另外,全國各地的地情資料數據庫無法實現共聯互通?,F在假設,某位用戶想在社會主義新方志的記載中獲取有關21世紀頭幾年內全國各地互聯網發(fā)展狀況的信息,那么他必須逐個訪問全國各地已建成的地情資料數據庫(用戶多半不知道這些數據庫的位置和收錄資料情況,先要通過百度搜索到網址,再進入后細細查詢)。而且,數據庫中自帶的搜索引擎也不能進行精準查找。今以“上海通網站”(上海市地方志辦公室官網)為例,在網頁上端的搜索欄中輸入關鍵詞“互聯網”后,反饋結果里存在大量的無用信息,必須要用戶根據自己的需求來逐個篩選(圖1)??傊?,目前情況下,用戶若想在PC端網站完整而精確地獲取地情資料,則需要耗費大量的時間和精力,雖然比沒有互聯網、方志文本沒有數字化時的實地查詢省了不少功夫,但總體效率還是較低。
圖1 在上海通網站搜索欄中輸入 “互聯網”后得到的搜索結果
至于移動端的微信公眾號,從微信本身的技術屬性分析,無疑屬于Web2.0范疇的信息化平臺。據方志從業(yè)者研究分析,地方志微信公眾號總量偏低、各地比例不均衡,而且普遍關注度低,閱讀量、點贊量、轉發(fā)率都不理想。究其原因有宣傳力度不夠,內容形式欠佳,故而無法吸引讀者關注。①趙明明,吳韻.全國地方志微信公眾號發(fā)展述評[J].中國地方志,2016(10):29-30.由此可見,大多數地方志微信公眾號提供的內容與用戶的服務需求之間不匹配。
總體而言,目前國內地方志信息化平臺發(fā)展落后于時代的腳步。
中國地方志指導小組辦公室副主任劉玉宏在談到“十三五”時期全國地方志信息化工作的指導思想時,曾明確指出:“(要)順應‘互聯網+’發(fā)展趨勢,以應用需求為導向,以融合創(chuàng)新為動力,以重點工程為抓手,以新一代信息技術為支撐,按照集約發(fā)展、融合共享的工作思路,大力推進地方志信息化建設,為提升地方志事業(yè)科學化、信息化、現代化水平作出新貢獻?!雹佟秳⒂窈暝谌珖胤街鞠到y信息化工作會議上的講話》http://szw.wuxi.gov.cn/doc/2016/06/01/1065244.shtml.以Web3.0的視角來審定目前地方志信息化平臺建設中存在的問題,提出以下改進構想:
前文已述,現在全國各處方志文本數據庫(地情資料數據庫、數字方志館)之間的數字信息無法互聯互通,造成了一個個分散封閉的“信息孤島”,為用戶深入查詢帶來不便。面對這一困境,《全國信息方志與數字方志建設工程實施方案》已明確提出:“依托國家數字方志館,建成全國規(guī)模最大的地方志全文數據庫(包括目錄數據庫、提要數據庫)”“國家數字方志館是地方志全文數據庫的基礎平臺。通過開發(fā)全國地方志資源管理系統,把全國的數字化志書、年鑒、地情資料、舊志、史志期刊、音視頻、圖片等資源集中起來,建設地方志數字資源中心?!雹凇蛾P于印發(fā)〈全國信息方志與數字方志建設工程實施方案〈的通知》(2017年2月10日下發(fā)),http://www.difangzhi.cn/zgdfz/zcfg/201702/6912408e509641cd86323e07734c962b.shtml.一個統一的、完整的方志文本數據庫,對于用戶(尤其是專業(yè)研究者)不啻為一個大福音。不過,“囊括古今”尤有缺憾,“包羅萬象”才是Web3.0“互聯互通”的真諦。已有使用方志文庫數據庫的專業(yè)學者指出:即使我們將已知已有的所有方志實現了數字化,實現了文本知識的自動抽取,簡單時間的自動系年、分析,以及可視化呈現,它所面對的對象也僅僅是所有方志,超越了方志范圍的其他地情信息便無能為力了。未來應注重在與其他數據庫(如古代詩文數據庫等文獻數據庫)實現數據交流的基礎上,擴大文獻范圍、建立文獻關聯、發(fā)現隱含信息,進而實現自動分析。③劉京臣.他者視閾中的數字方志建設——以燕行錄中的薊州為中心[J].中國地方志,2017(5):33,41-42.
Web3.0時代的網絡具有良好的兼容性,多種終端之間可以實現自由交互。其實,隨著移動互聯網技術和云計算技術的發(fā)展,目前方志信息資源在多種終端之間提供兼容化的服務已經不再是難題。當今社會,智能手機、平板電腦、電子閱讀器等移動終端在公眾之間廣泛普及,廣播電視也成為公眾獲取公共文化資源的途徑之一,電腦不再是唯一的訪問網絡的終端設備,公眾獲取信息資源的習慣隨之發(fā)生變化,對多終端(尤其是移動端)訪問的需求越來越迫切。方志信息工作者應針對終端設備的模塊性質,通過定制使用底層數據庫的通信協議等方式,屏蔽不同終端設備之間的異構性,使得用戶可以使用電腦、手機、平板電腦、電子閱讀器、智能電視、電視機頂盒等各種終端設備訪問地方志信息化平臺,方便他們隨時聯通,隨地接入,隨心應用,以此來吸引用戶。目前,業(yè)界已有“開發(fā)國家數字方志館手機客戶端”,打造掌上方志館的計劃,筆者期待方志工作者未來在電子閱讀器(kindle等)領域、在有線電視領域(如IPTV等)也能耕耘出一片天地。
Web3.0時代的網絡之所以是智能網絡,就是因為它會持續(xù)地獲取網絡用戶的上網數據,不斷主動地進行分析用戶需求,提供高度匹配性內容。其中,基于語義檢索功能的智能搜索引擎尤其令人向往。當然,目前統一、高級的語義網絡并未出現,搜索引擎技術發(fā)展受限于此,以google(谷歌)、baidu(百度)為代表的主流搜索引擎整體檢索效率還不能達到Web3.0時代的美妙設想。不過,一些商業(yè)服務類網站(如購物網站、視頻音頻播放網站)已開始采納Web3.0精確匹配的理念,紛紛利用用戶數據抓取技術、用戶網上痕跡追蹤技術、用戶行為分析技術等,以求對用戶實現精準營銷。近年來有過網上購物體驗的人,都會發(fā)現在瀏覽淘寶、天貓、京東等購物網站時,它們會自動記錄下你以往的瀏覽信息和搜索痕跡,然后會在側邊欄中以“推薦商品”“同類商品”“精選商品”等門類呈現一些推送信息,以此作為促銷手段。如喜馬拉雅FM①喜馬拉雅FM是中國知名的音頻分享平臺,海量內容包括有聲書,相聲段子,音樂,新聞,綜藝娛樂、兒童、情感生活、評書、外語、培訓講座、百家講壇、廣播劇、歷史人文、電臺、商業(yè)財經、IT科技、健康養(yǎng)生、校園電臺、汽車、旅游、電影、游戲等20多個分類,上千萬條聲音。的app體量并不龐大,但其中已經集成了智能推薦功能,一個移動端的用戶(不管是否在喜馬拉雅FM上注冊過),只要使用過這款應用,收聽過一些音頻節(jié)目,它便會通過收集到的數據(通常是用戶已聽節(jié)目的門類與收聽頻次等),以“猜你喜歡”的形式向你推薦同類型的精彩節(jié)目,這也部分免去了用戶在海量音頻節(jié)目中搜索甄別的功夫。方志信息要提升傳播效能,方志工作要擴大社會影響,關鍵在于找準目標受眾,分析用戶需求?!懊裳劭癖肌比菀住澳限@北轍”,“盲人摸象”可能“以偏概全”。以往修志者普遍不重視用戶需求,多憑經驗來推斷甚至臆測讀者對于方志文本及地情資料的閱讀喜好,如此作為,怎能奢談方志“飛入尋常百姓家”?方志工作者應當學習借鑒當今互聯網商業(yè)實踐領域中的先進經驗,我們也可以在網頁中內嵌上網痕跡追蹤、用戶行為分析等程序插件,運用Web3.0的理念來加強方志用戶需求的分析研判工作。某個用戶究竟是專業(yè)研究者(方志文本的深度用戶),還是地情資料的普通讀者(僅對地情信息感興趣,并無專業(yè)學術能力),亦或是參與方志編纂的專業(yè)人員,瀏覽網站的人是哪類人居多、比例如何,三類人瀏覽時間的長短、頻次、時段等等具體信息,對我們分層制定和改進傳播策略都大有裨益。另外,獲取用戶需求的方式,除了被動地等待用戶上網,還有搭建互動交流平臺,組建相關網絡社群這樣主動引導的手段?,F在很多Web2.0時代普遍的溝通互動做法,諸如針對不同的用戶(專業(yè)研究者、普通讀者、修志工作者)分別設立網絡論壇、組建QQ群、微信群,開通微信公眾號留言評論功能等,業(yè)界運用得都較少,需要我們盡快補上這些“短板”,避免工作方法上的“代差”。下面介紹一個微信公眾號溝通互動實例:
2016年9月1日,微信公眾號“靜安方志”發(fā)布一文,名為《偶遇滬上舊影》。該文提到編輯部在搬遷整理舊物時偶然發(fā)現數本相冊,內附舊照百余張,面對昔日斑駁舊痕,不禁感慨萬千云云。該文結尾又說:“文中部分圖片說明要素不完整,如有讀者知曉正確圖片信息要素(時間、地點等),請留言分享,將贈送精美禮品?!蔽南铝粞詤^(qū)內,有七位讀者留言,或提供時間場地信息,或指正原文中照片說明文字的錯誤。有位叫“兔斯基”的讀者在提供協助后,又滿懷深情地講:“(我)在靜安生活了一輩子了。有機會再來參與辨認哦?!弊髡咭矡崆榈鼗貜汀巴盟够?,感謝其協助答疑解惑,并請其在微信平臺留下聯系方式,將有禮品奉上。由此,作者讀者皆大歡喜,這就是一次頗為成功的互動。
上述實例說明,現在的互聯網世界中,信息提供者(或生產者)同信息消費者之間的身份已經模糊難辨。加強與用戶的互動交流,同他們形成緊密牢固的社群關系,不但能使我們更好地服務于他們,也可使用戶來幫助我們生產地情信息(這就是UGC,即用戶生產內容)。
Web3.0“智能篩選”“個性化聚合”的特征,預示著一個充分滿足用戶個性化需求的互聯網時代即將到來。筆者由此設想,未來的方志信息化平臺可以為每個用戶提供個性化的信息服務,用戶可以根據自己的需求來設計個人門戶,自由定制資源和服務,而無需面對功能龐雜內容繁瑣的統一界面:一個僅對地情信息、鄉(xiāng)土歷史感興趣的讀者,可以在自己的個人門戶中聚合地情普及讀物、視頻等內容,干巴巴的志書文字無需出現在他面前;一個專業(yè)研究者,可以在自己的專屬界面中集成其相關領域的所有地情信息,非研究領域的志書資料則自動屏蔽;一個修志工作者,可以在自己的網上工作室里組配上文字編輯模塊、檔案查詢入口、資料整理模塊、修志知識學習材料,指導信息反饋等內容。由此,大家各取所需,各得其所。
Web3.0以其智能、個性、精準的特征引領互聯網的未來發(fā)展方向。方志工作者應當順應時勢,以公眾需求為核心,以Web3.0的視角來審視地方志信息化平臺構建的課題,努力實現信息資源的有效聯通與充分整合,為用戶提供多向交互、多終端兼容、個性化的方志信息服務,擴大地方志工作的社會影響力,促進地方志工作持續(xù)發(fā)展。
K291/297
B
1003-434X(2017)06-0044-07