,,
(廣西壯族自治區(qū)圖書館,廣西 南寧 530022)
為深入貫徹落實中共中央辦公廳、國務院辦公廳《關于加快構建現(xiàn)代公共文化服務體系的意見》精神,“十三五”期間,文化共享工程擬依托國家公共文化數(shù)字支撐平臺,在地級市(區(qū))、縣(區(qū))構建區(qū)域性公共文化綜合服務管理平臺(以下簡稱“服務管理平臺”),實現(xiàn)對基層公共文化服務網(wǎng)絡設施及惠民項目的綜合智能管理,實現(xiàn)基本公共數(shù)字文化資源的全域共建共享。
服務管理平臺將信息技術、數(shù)字技術、網(wǎng)絡技術等現(xiàn)代科學技術和傳播手段應用于公共文化服務體系建設,充分利用與集成文化共享工程等重點文化惠民項目基礎設施與應用平臺資源,構建標準統(tǒng)一、互聯(lián)互通的公共數(shù)字文化服務網(wǎng)絡,在基層實現(xiàn)共建共享,實現(xiàn)“一站式”服務,為公共文化服務體系提供強有力的數(shù)字化支撐,進一步提升公共數(shù)字文化資源的服務效能。
本文從技術層面對服務管理平臺的構建進行研究,包括服務管理平臺的體系框架和實現(xiàn)互聯(lián)互通、“一站式”服務的關鍵技術路徑。
實現(xiàn)公共數(shù)字文化資源的全域共建共享,是服務管理平臺的基本要求。當前各省都普遍存在公共文化信息基礎設施、數(shù)字文化資源建設發(fā)展失衡的問題??v向來看,省、市、縣級基礎設施和數(shù)字文化資源建設發(fā)展水平失衡,縣級的基礎設施不足且老化嚴重,數(shù)字文化資源匱乏;橫向來看,同級公共文化機構的發(fā)展失衡,圖書館、文化館、博物館等公共文化機構在基礎設施和數(shù)字文化資源建設發(fā)展水平同樣存在較大差異。服務管理平臺,擬從硬件和數(shù)字資源的層面解決基礎設施、數(shù)字文化資源建設發(fā)展失衡的問題。為此,服務管理平臺將構建一個三層的體系架構,整合各公共文化機構的數(shù)字文化資源,為各公共文化機構提供標準統(tǒng)一、互聯(lián)互通的“一站式”的公共數(shù)字文化服務。如圖1所示。
圖1 服務管理平臺體系架構圖
從整體上來看,服務管理平臺主要分為三個層次,體系框架可概括為“1+6+5”模式,主要包含1個平臺:區(qū)域性公共數(shù)字文化云支撐平臺;6個系統(tǒng):統(tǒng)一用戶系統(tǒng)、統(tǒng)一檢索系統(tǒng)、智能推送系統(tǒng)、元數(shù)據(jù)收割系統(tǒng)、垂直搜索引擎系統(tǒng)、統(tǒng)計分析系統(tǒng);5個服務平臺:文獻信息服務平臺、知識創(chuàng)新學習平臺、休閑娛樂服務平臺、信息技術服務支持平臺、數(shù)字資源智能訂制與推送平臺等。體系框架的三個層次如下:
云計算是一種以數(shù)據(jù)為中心的密集型超級計算模型,通過虛擬化技術把各層次功能封裝為抽象實體,將IT相關的能力以服務的方式提供給用戶,允許用戶在不了解提供服務的技術、沒有相關知識以及設備操作能力的情況下,通過Internet獲取所需服務。
云管理平臺通過虛擬化技術實現(xiàn)軟件應用與底層硬件的隔離,提高設備的使用效率,簡化軟件的重新配置過程。各公共文化服務機構通過云管理平臺,自主申請計算資源(CPU、存儲、網(wǎng)絡等),安裝系統(tǒng)和部署應用,消除各公共文化服務機構之間的基礎設施差別,實現(xiàn)硬件資源的共建共享。
云計算系統(tǒng)需要并行為大量用戶提供服務,必須具有高吞吐率和高傳輸率的特點,應引入海量數(shù)據(jù)分布式存儲技術和海量數(shù)據(jù)管理技術,以保證系統(tǒng)的高可用性、高可靠性和經(jīng)濟性,為服務管理平臺提供硬件支撐。
中間層通過元數(shù)據(jù)收割、垂直搜索引擎等技術,對區(qū)域內各類型文化機構的結構化數(shù)據(jù)和非結構化數(shù)據(jù)進行整合,實現(xiàn)數(shù)據(jù)資源的共建共享。
服務管理平臺,采用OAI-PMH元數(shù)據(jù)收割技術和Handle標碼技術,實現(xiàn)對各類型公共文化服務機構的結構化數(shù)字資源自動收割、關聯(lián)整合、智能定位和分布式云備份,采用垂直搜索引擎技術對各類型公共文化服務機構非結構化數(shù)字資源進行智能采集。同時,服務管理平臺與全國公共數(shù)字文化支撐平臺與中間層對接,使服務管理平臺能夠利用其豐富的資源。
中間層通過對各類型數(shù)據(jù)的收割、采集、整理,為服務管理平臺提供數(shù)據(jù)支撐。
服務管理平臺的應用層包括五大平臺(文獻信息服務平臺、知識創(chuàng)新學習平臺、休閑娛樂服務平臺、信息技術服務支持平臺、數(shù)字資源智能訂制與推送平臺)。應用層通過中間層的數(shù)據(jù)支撐,分別實現(xiàn)五個平臺的數(shù)字資源服務和管理,提供“一站式”的公共數(shù)字文化服務。
虛擬化技術作為云計算的核心技術,在服務管理平臺的數(shù)據(jù)中心構造過程中扮演著非常重要的角色。傳統(tǒng)的應用模式中,IT資源互相之間不連通,無法根據(jù)業(yè)務的變化實現(xiàn)動態(tài)調整,利用率較低。云計算把IT資源都變成一個個池子,再基于這些基礎架構的資源池上去建設應用,以服務的方式去交付資源?;凇俺鼗钡睦砟睿瑓^(qū)域性公共數(shù)字文化支撐平臺應搭建計算池、存儲池、網(wǎng)絡池和安全池,減少設備釆購數(shù)量,降低故障點,提高業(yè)務系統(tǒng)的可用性,提升整體數(shù)據(jù)中心的資源利用率。
云計算模式安全風險集中,因此可將整個數(shù)據(jù)中心的網(wǎng)絡設計分為兩部分:后端是采用云計算相關技術、支持多架構融合的業(yè)務資源網(wǎng),網(wǎng)絡、計算、存儲資源構建成虛擬的資源池;前端則是采用傳統(tǒng)的模塊化數(shù)據(jù)中心的結構。這樣將前端服務和后端支撐相對分離,保障其安全性。
實現(xiàn)虛擬化關鍵在于,虛擬化層必須能夠截獲計算元件對物理資源的直接訪問,并將其重新定向到虛擬資源池中。虛擬化層可通過純軟件的方法或利用物理資源提供的機制來實現(xiàn)這種“截獲并重定向”,因此虛擬化系統(tǒng)可分為軟件虛擬化和硬件虛擬化兩種。
Intel在服務器處理器領域市場占有率超過90%,其服務器處理器產(chǎn)品線廣泛支持Virtualization Technology(VT)虛擬化技術,可采用通用的x86平臺,在系統(tǒng)管理程序層支持下支持虛擬化,實現(xiàn)較高性能。
當前市場上常見的服務器虛擬化程序包括VMware vSphere、Microsoft Hyper-V、Xen、KVM等。VMwared在虛擬化市場占有較大份額,但VMware的閉源且按照CPU數(shù)量授權的特性,使得在大規(guī)模部署上存在一定隱患;而Hyper-V成熟度有待提高,虛擬Linux系統(tǒng)存在大量兼容性問題,使用場景受限;Xen是半虛擬化技術,非常依賴于Domain 0虛擬機,比較難以配置和使用,部署會占用相對較大的空間。
相比之下,KVM是基于Linux完全原生虛擬化擴展的x86硬件全虛擬化解決方案,通過可加載的內核模塊支持廣泛的虛擬機操作系統(tǒng),比如Linux、BSD、Solaris、Windows等。在KVM架構中,虛擬機實現(xiàn)為常規(guī)的Linux進程,由標準Linux調度程序進行調度,每個虛擬CPU顯示為一個常規(guī)的Linux進程,這使KVM能夠使用Linux內核的所有功能。綜合來看,KVM應該是最佳選擇。
在存儲系統(tǒng)中,同時支持SAN與NAS的統(tǒng)一存儲業(yè)已成為主流。統(tǒng)一存儲具有具備規(guī)劃整體存儲容量的能力,避免分別對數(shù)據(jù)塊及文件存儲支持相關的容量利用率方面的問題,存儲資源池配置靈活以及積極支持服務器虛擬化等特點。
由于機械硬盤已經(jīng)逐漸成為數(shù)據(jù)中心的瓶頸,為改善核心數(shù)據(jù)庫與應用系統(tǒng)的響應速度,應引入固態(tài)硬盤(SSD)技術,將應用程序中部分I/O壓力較大的數(shù)據(jù)放置在SSD磁盤上;同時可以將部分SSD空間虛擬成存儲系統(tǒng)緩存,大幅度提升整個存儲系統(tǒng)的緩存命中率,尤其是在虛擬化架構下,效果更加明顯;采用自動分層技術,存儲系統(tǒng)后臺自動調整數(shù)據(jù)存放位置,優(yōu)化存儲訪問方式,提升應用訪問效率。此外,還應采用同步鏡像、異步備份等方式對數(shù)據(jù)進行保護,若有條件可以考慮實現(xiàn)數(shù)據(jù)異地備份。
數(shù)據(jù)中心是云計算的核心支撐平臺,隨著云應用的廣泛部署,數(shù)據(jù)中心的通信模式和業(yè)務需求出現(xiàn)了根本性變化。這些變化具體包括:1)數(shù)據(jù)中心的網(wǎng)絡規(guī)模和負載出現(xiàn)了指數(shù)級增長;2)主要的流量模式由傳統(tǒng)“南北流量”轉變?yōu)椤皷|西流量”;3)更多時延敏感和數(shù)據(jù)密集型業(yè)務在數(shù)據(jù)中心內運行;4)一些虛擬化技術,如虛擬機實時遷移,需要網(wǎng)絡提供更好的支持。
這些變化對數(shù)據(jù)中心的交換機提出了更高的性能要求。結合數(shù)據(jù)中心網(wǎng)絡未來的發(fā)展趨勢,在接入層采用10GE交換架構,在核心層采用40GE/100GE交換架構成為一種必然選擇。
在核心層交換機選擇上,應采用數(shù)據(jù)中心級交換機產(chǎn)品。傳統(tǒng)的園區(qū)網(wǎng)交換機一般采用“Crossbar+共享緩存”的交換架構,這種架構限制了設備的可靠性和性能。而數(shù)據(jù)中心級交換機產(chǎn)品將控制平面與轉發(fā)平面物理分離,采用獨立的引擎板和交換網(wǎng)板,同時采用CLOS多級交換架構,多塊交換網(wǎng)板同時分擔業(yè)務流量,可實現(xiàn)數(shù)倍于單級交換的能力,引擎切換時不影響轉發(fā),可實現(xiàn)零丟包,從而滿足云計算數(shù)據(jù)中心高可靠性、高擴展性、低時延等需求。
另外,交換機參數(shù)還要考慮MAC表項。在云計算數(shù)據(jù)中心內部,虛擬化以及東西向流量導致更多的MAC表項,4K個Vlan遠不能滿足大規(guī)模云計算數(shù)據(jù)中心的需求,為此數(shù)據(jù)中心交換機必須支持Vxlan。Vxlan采用24bit的網(wǎng)絡標識,用戶可以創(chuàng)建16M相互隔離的虛擬網(wǎng)絡,這使得大規(guī)模多租戶的云環(huán)境中具有了充足的虛擬網(wǎng)絡分區(qū)資源。
云計算模式下,以分布式計算和虛擬化為代表的技術得到廣泛應用,導致傳統(tǒng)的安全邊界已經(jīng)消失,數(shù)據(jù)在數(shù)據(jù)中心內部之間的交互增加,需要滿足海量數(shù)據(jù)交互下的安全檢測需求。同時,云計算模式下,用戶可以按需用云端資源,合法用戶可能會利用云端資源進行非法的操作,使得整個云計算環(huán)境的內部安全面臨著重大挑戰(zhàn)。
為應對這些安全挑戰(zhàn),對于業(yè)務資源網(wǎng),應構建大二層的網(wǎng)絡環(huán)境,以滿足虛擬化和資源的動態(tài)遷移需求,同時將安全策略部署在網(wǎng)絡端口,確保安全策略得到落實;云管理平臺上也應開啟或部署安全虛擬設備套件,如可集成于VMware vCenter Server的VMware vShield、OpenStack中的Security Group等。對于前端管理網(wǎng),可根據(jù)傳統(tǒng)的信息安全等級保護的安全要求,在不同的區(qū)域邊界部署安全策略,同時,針對于數(shù)據(jù)中心出口安全風險集中的問題,采取針對性的安全防御措施。
服務管理平臺建設過程中,業(yè)務系統(tǒng)需要從傳統(tǒng)的建設模式遷移到資源池模式的云計算系統(tǒng)里,將形成超大規(guī)模的數(shù)據(jù)中心或多數(shù)據(jù)中心平臺。云管理平臺需要對龐大的虛擬化計算資源進行智能化的自主管理,實現(xiàn)資源的集中化管理和業(yè)務系統(tǒng)的快速交付,不同硬件平臺虛擬化系統(tǒng)的統(tǒng)一調用、管理和監(jiān)控。云計算基礎設施管理平臺應具備以下功能:資產(chǎn)管理、資源管理、用戶管理、云平臺用戶門戶、云平臺監(jiān)控等。
服務管理平臺在運行中會產(chǎn)生海量的數(shù)據(jù),需要進行大量的計算,一個大數(shù)據(jù)處理的框架成為必然的要求。鑒于Google相關技術的非開源特性,從運行安全與實施成本考慮,建議選擇Hadoop開發(fā)團隊的技術。
Hadoop的框架最核心的設計就是HDFS和MapReduce。HDFS為海量的數(shù)據(jù)提供了分布式存儲解決方案,它的架構建立在大量普通配置的計算機組成的集群上。而Map/Reduce為海量的數(shù)據(jù)提供了并行編程模型。
Hadoop有著優(yōu)秀的數(shù)據(jù)處理能力,將其搭建在OpenStack上,可以實現(xiàn)私有云與大數(shù)據(jù)的協(xié)作,發(fā)揮協(xié)作效應,還可以有效地節(jié)省網(wǎng)絡帶寬。同時,虛擬化使得Hadoop部署更為簡易,除了主要的NameNode,其他的DataNode完全可以使用OpenStack中Heat云編排功能,通過Cloud Formation實現(xiàn)定制集群,而虛擬化本身的安全與便捷,都可以大大減輕維護團隊的運維壓力。
垂直搜索引擎是針對某一個行業(yè)的專業(yè)搜索引擎,它相比通用搜索引擎,具有更專業(yè)、更準確的特點。管理平臺中的垂直搜索引擎主要將公共文化服務機構的網(wǎng)站的非結構化數(shù)據(jù),通過模板化的信息抽取技術,轉換成結構化的數(shù)據(jù),存入倉儲。
垂直搜索引擎通過網(wǎng)絡爬蟲對區(qū)域內各公共文化服務機構的信息資源進行采集和整合,為用戶提供公共文化信息檢索服務,其流程為:網(wǎng)絡爬行—中文分詞—索引—檢索。
4.1.1 網(wǎng)絡爬行。區(qū)域內的公共文化服務機構數(shù)量不多,且固定,因此可采用定向采集的策略,使用固定的URL庫,對各公共文化服務機構的網(wǎng)站頁面信息進行抽取。并且,由于其頁面多為網(wǎng)站系統(tǒng)生成,網(wǎng)頁結構固定,在網(wǎng)頁信息抽取方法上,使用模板化的抽取方式比較簡單、準確,維護量也不會太大難以接受。無論從內容還是復雜程度來說,一個簡單的模板化爬蟲就可以滿足對區(qū)域內各公共文化服務機的非結構化信息或半結構化信息的爬取。爬取的網(wǎng)頁保存到網(wǎng)頁庫中。
4.1.2 中文分詞。中文分詞是將一個中文序列切分成一個個單獨的詞的過程。中文分詞的準確性,直接影響檢索結果的查全率和查準率。目前,Lucene是個不錯的選擇,Lucene是一個構建具體的搜索引擎工具包,在網(wǎng)絡上得到廣泛的應用,成熟度高。它將構建一個完善的檢索系統(tǒng)功能以Java類和接口的形式向廣大開發(fā)者提供,為構建自定義的功能提供了強大的靈活性。通過實現(xiàn)Lucene的Analyzer接口,使用其自帶的org.apache.lucene.analysis.cn中文語言分詞器,可以實現(xiàn)不錯的分詞效果。
4.1.3 索引。經(jīng)過分詞處理,還需要通過預定義的元數(shù)據(jù)標準,分析網(wǎng)頁的文檔信息,生成網(wǎng)頁的元數(shù)據(jù),然后對提取的元數(shù)據(jù)信息建立索引。Lucene框架主要包括兩個功能:建立索引和檢索索引。使用Lucene分析索引網(wǎng)頁庫的關鍵詞和網(wǎng)頁的文檔信息,采用倒排索引技術,生成倒排表和索引詞表。通過建立索引可以明顯加快檢索的響應速度。
4.1.4 檢索。檢索功能主要實現(xiàn)為一個接口。接口接收檢索關鍵詞,對檢索關鍵詞進行切詞操作,然后在索引中進行匹配,將匹配的結果以XML流的形式返回。這個接口可以由統(tǒng)一檢索系統(tǒng)調用。
元數(shù)據(jù)收割系統(tǒng)基于OAI-PMH協(xié)議,自動地定期收割各公共文化服務機構的結構化數(shù)據(jù),將其存入倉儲,并通過Handle標碼技術實現(xiàn)數(shù)字資源的智能定位。
OAI-PMH協(xié)議提供了一個基于元數(shù)據(jù)獲取的獨立于具體應用的互操作框架。在OAI-PMH框架中有兩個級別的參與者,分別是數(shù)據(jù)提供者DP(Data Providers)和服務提供者SP(Service Providers)。DP以OAI-PMH方式發(fā)布元數(shù)據(jù),而SP以OAI-PMH為基礎獲取元數(shù)據(jù)來提供增值服務。SP通過收集器(harvester)發(fā)布OAI-PMH請求,向DP的倉儲中獲取元數(shù)據(jù)。DP響應和處理OAI-PMH協(xié)議的六種請求(6個OAI-PMH命令動詞),將元數(shù)據(jù)發(fā)布給SP的收集器。OAI-PMH協(xié)議通過這樣一個相對簡單的框架實現(xiàn)了元數(shù)據(jù)共享。
基于全球統(tǒng)一標碼(Handle)的標碼技術是起源于互聯(lián)網(wǎng)、應用于物聯(lián)網(wǎng)的一種標識符號。它賦予互聯(lián)網(wǎng)上的各種對象文檔、圖像、多媒體等一個唯一、合法、安全和永久的標識,通過這個標識可以實現(xiàn)對被標識對象的解讀、定位、追蹤、查詢、應用等功能??蛇x取區(qū)域內基礎設施和網(wǎng)絡條件較好的公共文化服務機構節(jié)點作為SP(同時也是DP),其余節(jié)點作為DP。SP部署收割服務器,包含注冊功能模塊、日志統(tǒng)計分析模塊、元數(shù)據(jù)檢索模塊。收割服務器通過設置收割策略,對各公共文化服務機構發(fā)布的元數(shù)據(jù)進行定時智能的收割,通過Handle標碼技術實現(xiàn)數(shù)字資源的智能定位。
4.2.1 收割策略。元數(shù)據(jù)收割系統(tǒng)在SP的管理系統(tǒng)中提供對收割策略的定制。收割策略包括收割狀態(tài)、收割時間和周期。收割狀態(tài)分開關閉和開放,決定是否對其進行收割。收割周期可以設置收割的頻率,一般設置為24小時,即每天進行一次元數(shù)據(jù)的更新。收割時間指開始收割的時間點,各收割輪次盡量避免設置為同一時間,減輕收割服務器的壓力。
4.2.2 服務智能定位。收割的元數(shù)據(jù)對象是分布式的,可能存在URL因為數(shù)字對象物理位置改變,IP更換、系統(tǒng)遷移、網(wǎng)站改版或文件目錄調整導致資源無法訪問的“死鏈”問題。解決這個問題可采用與國際接軌的,全球統(tǒng)一標碼(Handle)的標碼系統(tǒng)(HandleSystem),對各類文化資源依據(jù)國際標準逐一進行注冊,注冊系統(tǒng)與全球注冊系統(tǒng)建立對接,負責數(shù)字資源地址的解析服務。
智能推送系統(tǒng)通過支撐平臺的Hadoop架構和數(shù)據(jù)挖掘工具,以用戶系統(tǒng)的數(shù)據(jù)智能分析用戶的行為,從而推送符合用戶需求偏好的信息。
4.3.1 數(shù)據(jù)準備。對服務管理平臺進行數(shù)據(jù)挖掘,首先要做數(shù)據(jù)準備,分三個階段:1)數(shù)據(jù)集成。要采集不同的公共文化機構不同系統(tǒng)的用戶數(shù)據(jù)顯然難度較大且效率低下,因此,服務管理平臺采取從五大平臺和統(tǒng)一檢索、統(tǒng)一用戶功能模塊產(chǎn)生統(tǒng)一的用戶數(shù)據(jù),保存到用戶行為數(shù)據(jù)庫的辦法來完成數(shù)據(jù)集成。2)數(shù)據(jù)選擇。從用戶行為數(shù)據(jù)庫中選取相關數(shù)據(jù)或樣本,為知識發(fā)現(xiàn)的目標搜索和選擇有關的數(shù)據(jù),這里不包括同模式數(shù)據(jù)的轉換和數(shù)據(jù)的統(tǒng)一和匯總,只需能辨別出需要分析的數(shù)據(jù)集合即可。3)數(shù)據(jù)預處理。檢查數(shù)據(jù)的完整性及一致性,消除噪聲等。對數(shù)據(jù)進行清理和充實等預處理工作,包括對數(shù)據(jù)編碼,數(shù)據(jù)庫中字段的不同取值轉換成數(shù)碼形式,這將有利于搜索。
4.3.2 數(shù)據(jù)挖掘流程。將數(shù)據(jù)準備完成后,將進行數(shù)據(jù)挖掘。傳統(tǒng)的數(shù)據(jù)挖掘流程為:1)確定挖掘目標,即確定要發(fā)現(xiàn)的知識類型。2)選擇算法,即根據(jù)確定的目標選擇合適的數(shù)據(jù)挖掘算法。3)數(shù)據(jù)挖掘,即運用所選擇算法,提取相關知識并以一定的方式表達。4)進行結果表達與解釋,即通過現(xiàn)在的可視化技術,完成模式評估(對在數(shù)據(jù)挖掘步驟中發(fā)現(xiàn)的模式/知識進行評估)以及知識表示(表示相關技術,呈現(xiàn)所挖掘的知識)。
鑒于服務管理平臺的數(shù)據(jù)內容來源于多個公共文化機構,數(shù)據(jù)屬性之間相互獨立性大,可以采用樸素貝葉斯算法來進行分類,數(shù)據(jù)處理可以下放到Map/Reduce中計算完成。例如Hadoop的k-means算法的處理過程主要有兩部分:第一部分是初始聚類中心,并把數(shù)據(jù)集樣本分為一定大小的數(shù)據(jù)塊,以便并行處理。第二部分及時啟動Map和Reduce任務進行算法的并行化處理,直至產(chǎn)生聚類結果,將處理結果寫入HDFS,也可放入存儲集群,以供查詢層使用。
圖2 數(shù)據(jù)挖掘簡易流程圖
統(tǒng)一檢索系統(tǒng)將垂直搜索引擎采集的數(shù)據(jù)和通過元數(shù)據(jù)收割系統(tǒng)收割的數(shù)據(jù)整合,并提供一站式檢索服務。
為了提升用戶檢索體驗,提供智能化、專業(yè)化的檢索,應引入領域本體(Ontology)。本體可以是一個表現(xiàn)為樹形結構的知識庫。如頂層類可以是“公共文化”,之下可以有“戲劇”,“戲劇”又可包含“桂劇”“壯劇”等,類似于圖書館使用的分類法,但本體還要構建推理規(guī)則。引入本體,是在用戶輸入檢索關鍵詞,進行切詞后,由本體的推理擴展模塊進行擴展,然后將擴展的結果發(fā)給垂直搜索引擎和元數(shù)據(jù)收割系統(tǒng)進行匹配。經(jīng)過擴展的結果,并不是簡單的原始關鍵詞,而是經(jīng)過推理的關鍵詞集合,更能準確專業(yè)地表達用戶的檢索意圖,因而檢索的結果也更符合用戶的需求。
用于給各系統(tǒng)提供用戶認證服務,使用戶平滑使用平臺的各種服務。目前,對于統(tǒng)一用戶系統(tǒng),市場上已經(jīng)有了很多成熟的產(chǎn)品。其主要功能是用戶管理、安全認證、訪問控制、單點登錄服務和日志審計。通過統(tǒng)一用戶系統(tǒng),為用戶訪問本管理平臺的各個應用平臺提供方便的登錄認證服務。
統(tǒng)計分析系統(tǒng)分別對硬件資源、數(shù)字資源進行統(tǒng)計分析,并使用數(shù)據(jù)挖掘工具產(chǎn)生更豐富的、關聯(lián)指向性更強的報表提供給文化部門作為決策輔助信息。在硬件資源方面,通過對區(qū)域性公共數(shù)字文化支撐平臺的日志進行統(tǒng)計分析,掌握硬件資源的利用情況,及時發(fā)現(xiàn)基礎設施的瓶頸,進行有針對性的資源擴展,降低盲目的投資。在數(shù)字資源方面,通過元數(shù)據(jù)收割系統(tǒng)和垂直搜索引擎的日志,統(tǒng)計分析數(shù)字資源總量和資源訪問統(tǒng)計。
各類型公共文化服務機構現(xiàn)有的信息系統(tǒng)多為獨立系統(tǒng),系統(tǒng)平臺各不相同,建設的數(shù)字資源也結構不一,為典型的“信息孤島”群體。
服務管理平臺采用元數(shù)據(jù)收割技術和標碼技術,實現(xiàn)對各類型公共文化服務機構結構化數(shù)字資源進行自動收割、關聯(lián)整合、智能定位、分布式云備份;采用垂直搜索引擎技術對各類型公共文化服務機構非結構化數(shù)字資源進行智能采集,通過統(tǒng)一檢索技術實現(xiàn)同構數(shù)字資源和異構數(shù)字資源的“一站式”服務。
通過自建和購置,整合優(yōu)質數(shù)字資源和聚集行業(yè)資深專家學者,建立以高質量深度數(shù)字資源內容研發(fā)和系統(tǒng)知識切片為核心,融合先進的用戶行為分析的數(shù)據(jù)挖掘,為用戶提供針對性個性化服務,進行精于在線學習體驗設計和學習體驗設計的系統(tǒng)與個人的B2C在線知識創(chuàng)新學習平臺。內容包括寫作、外語、美術、音樂、舞蹈和進城務工技能、農(nóng)業(yè)種養(yǎng)技術等,發(fā)揮系統(tǒng)構建學習型社會、促進人的素質提高的作用。
以舞臺藝術、電影電視、展覽圖片、音樂歌曲、有聲讀物、動漫連環(huán)畫等資源為基礎,提供片花、票務和評論等服務,通過檢索、推薦等應用方式,建立弘揚正能量,寓教于樂,提高個人修養(yǎng)的休閑娛樂服務平臺。
服務管理平臺通過統(tǒng)計分析系統(tǒng)和云管理系統(tǒng),在信息技術服務支持平臺實現(xiàn)數(shù)字資源的使用反饋統(tǒng)計,平臺運行數(shù)據(jù)的可視化,并提供對業(yè)務培訓的技術支持。
數(shù)字資源智能訂制與推送平臺通過數(shù)據(jù)分析各類型公共文化服務機構的相關數(shù)據(jù)元素,建立統(tǒng)一標準和模型,并利用數(shù)據(jù)挖掘工具,生成知識數(shù)據(jù)庫,形成區(qū)域內公共數(shù)字文化資源關聯(lián)的可視化模型,實現(xiàn)信息交互功能和數(shù)字資源的個性化定制與智能推送,同時為相關文化主管部門制定發(fā)展規(guī)劃,有針對性地提高資源利用率提供決策參考。
“互聯(lián)網(wǎng)+”時代的到來,使得信息資源的存在和傳播方式發(fā)生了根本改變,人們不僅能夠更為便捷地獲取知識,而且獲取文化資源的公平性和文化服務的多樣性也得到了彰顯。區(qū)域性公共文化綜合服務管理平臺的成功構建,必將會是形成一個知識信息的集散中心、一個特色資源數(shù)據(jù)的共建共享平臺、一個文化信息的互動窗口,也必將會帶來一場文化服務模式的變革。
建設區(qū)域性公共文化綜合服務管理平臺,利用數(shù)字化資源、智能化技術、網(wǎng)絡化傳播,加強公共數(shù)字文化資源整合開發(fā),推進文化資源數(shù)字化,拓寬公共數(shù)字文化資源服務渠道,推廣一站式服務,建設全域共享、互聯(lián)互通的公共數(shù)字文化服務平臺,將極大改變目前公共文化發(fā)展不均衡的問題,特別是西部地區(qū)和貧困地區(qū)基層公共文化單位服務能力不足的現(xiàn)狀,從而更好地發(fā)揮公共文化單位在構建現(xiàn)代公共文化服務體系、推進文化大發(fā)展大繁榮、實現(xiàn)中華民族偉大復興中國夢歷史進程中的作用。
[]
[1]劉國樂,何建波,李 瑜.Xen與KVM虛擬化技術原理及安全風險[J].北京:保密科學技術,2015(4).
[2]王曉慶.基于云計算的南京財經(jīng)大學數(shù)據(jù)中心建設研究[D].南京:南京郵電大學計算機學院,2013:40.
[3]曉 杉,王 琨,顧華璽,等.云計算數(shù)據(jù)中心光互連網(wǎng)絡:研究現(xiàn)狀與趨勢[J].北京:計算機學報,2015(7).
[4]李 虎,來慶濤,王維鐵,等.云計算基礎設施的建設與研究[C]∥電力行業(yè)信息化優(yōu)秀論文集2014—2014年全國電力行業(yè)兩化融合推進會暨全國電力企業(yè)信息化大會獲獎論文,2014.
[5]垂直搜索引擎[EB/OL].[2015-12-25].http:∥baike.baidu.com/link?url=nCIHEUyVNHB1SaDQPdYtrA1jG-Ruc5iuIDwwbEFnI_6NtofN60ptlAFqmcEP78ZySNwlALCHWSY-CnGCGsLhnp4_.
[6]李 進.基于本體的垂直搜索引擎研究[D].長春:長春工業(yè)大學,2013.