張利永
(南京圖書館,江蘇 南京 210018)
在物質(zhì)文明快速發(fā)展之后,精神文明與物質(zhì)文明發(fā)展出現(xiàn)“內(nèi)輪差”,為此推動全民閱讀活動,營造濃厚的社會閱讀風(fēng)氣,推動文化發(fā)展,提高居民素質(zhì),提升文化軟實力,是黨和國家建設(shè)文化強國目標(biāo)的重要舉措。
近年來,對于圖書館相關(guān)指數(shù)的研究呈上升態(tài)勢,研究的方向有:城市閱讀指數(shù)、H指數(shù)研究、閱讀指數(shù)調(diào)查等。2015年8月份,中國的第一份閱讀指數(shù)報告在廣東省中山市發(fā)布。這份報告是由清華大學(xué)、中山市委網(wǎng)信辦和全通教育聯(lián)合發(fā)布的。這項研究通過數(shù)據(jù)化研究,抓取了當(dāng)當(dāng)網(wǎng)和京東商城在2014年7月至2015年7月一年時間內(nèi)書籍銷售情況,同時該報告還抓取了2 944個微博、微信閱讀類賬號的數(shù)據(jù),照顧到了新媒體閱讀受眾,研究樣本具有廣泛性。通過這項研究的結(jié)論,能夠看到:我國的北上廣深地區(qū)人均購書最多,體現(xiàn)了閱讀與經(jīng)濟發(fā)展?fàn)顩r的正相關(guān)性;手機已成為大眾閱讀的第一途徑;在傳統(tǒng)的紙質(zhì)書領(lǐng)域,青少年讀者占據(jù)了半壁江山。
圖書館是公共文化服務(wù)中的重要一環(huán),是建設(shè)書香社會的重要基地。圖書館每天會接納眾多的讀者前來閱讀、休閑。這些讀者每天在圖書館的活動會產(chǎn)生大量的數(shù)據(jù)資源,對于圖書館管理者而言,這是未開發(fā)的“礦產(chǎn)資源”,蘊含了大量的有用信息。然而,在以往的管理中,這些數(shù)據(jù)并未被有效利用。以現(xiàn)有的技術(shù)資源,可對讀者的閱讀行為、閱讀環(huán)境、閱讀活動、閱讀愛好、來源背景等做分析和加工,形成體現(xiàn)圖書館特質(zhì)的相關(guān)數(shù)據(jù),即圖書館指數(shù)。圖書館指數(shù)就是一個數(shù)據(jù)集合,它把閱讀量、閱讀意愿、閱讀熱度、閱讀頻率、社會投入等各項具體指標(biāo)按照預(yù)設(shè)規(guī)則組合在一起,析出綜合反映居民閱讀情況的數(shù)值。它跳出了單純的閱讀指數(shù)的框架,是閱讀指數(shù)的廣義延伸。
圖書館的數(shù)據(jù)資源數(shù)量龐大,但不是所有的數(shù)據(jù)都可以被認為是大數(shù)據(jù)。有些“孤島數(shù)據(jù)”與外界的客觀對象沒有聯(lián)系或很少有聯(lián)系,是一種靜態(tài)數(shù)據(jù),比如書目、館藏等。我們需要的是與其他對象有客觀聯(lián)系的數(shù)據(jù),這才是有用的大數(shù)據(jù)。依據(jù)科學(xué)性、導(dǎo)向性、前瞻性的原則,在數(shù)據(jù)采集、指標(biāo)標(biāo)定、數(shù)據(jù)分析、理論研究方面強調(diào)客觀與科學(xué),對占有的數(shù)據(jù)資源進行再加工,從蕪雜的數(shù)據(jù)中過濾出符合規(guī)則的數(shù)據(jù)。數(shù)據(jù)來源于圖書館產(chǎn)生的基礎(chǔ)資源,包括業(yè)務(wù)系統(tǒng)與服務(wù)系統(tǒng),從數(shù)據(jù)的屬性來看,包括基礎(chǔ)性數(shù)據(jù)和運行數(shù)據(jù)兩大部分。
圖書館基礎(chǔ)性數(shù)據(jù)指機構(gòu)的設(shè)施設(shè)備、服務(wù)資源、人員、用戶情況數(shù)據(jù):1)圖書館設(shè)施設(shè)備數(shù)據(jù):包括建筑、功能空間、各類軟硬件設(shè)施設(shè)備數(shù)據(jù)。2)圖書館服務(wù)資源:包括圖書、報刊、古籍、聲像等傳統(tǒng)文獻資源數(shù)據(jù),以及電子書、多媒體、數(shù)據(jù)庫等數(shù)字資源。實體資源信息包括揭示資源的主題、語種、形態(tài)等內(nèi)容描述性信息,也包括資源相關(guān)的館藏置、數(shù)量、購買時間、新增情況等其他描述性與統(tǒng)計性信息。3)圖書館讀者背景數(shù)據(jù):指讀者相關(guān)的個體詳細信息。
圖書館運行數(shù)據(jù)是圖書館進行業(yè)務(wù)開展、讀者服務(wù)所產(chǎn)生的數(shù)據(jù),是基礎(chǔ)性數(shù)據(jù)中的要素發(fā)生服務(wù)或使用時產(chǎn)生的服務(wù)數(shù)據(jù)與行為數(shù)據(jù),包括:1)圖書館傳統(tǒng)業(yè)務(wù)與管理數(shù)據(jù):采訪編目數(shù)據(jù)、典藏流通數(shù)據(jù)、活動開展數(shù)據(jù)、讀者流量數(shù)據(jù)。2)圖書館數(shù)字與信息服務(wù)數(shù)據(jù):公共檢索數(shù)據(jù)、文獻傳遞數(shù)據(jù)、數(shù)字資源檢索服務(wù)數(shù)據(jù)、移動網(wǎng)絡(luò)數(shù)據(jù)、互聯(lián)網(wǎng)訪問數(shù)據(jù)。3)圖書館各類傳感器和監(jiān)控設(shè)備數(shù)據(jù):通過紅外技術(shù)、視頻技術(shù)、定位技術(shù)所獲取到的各樓層、架位、室內(nèi)任意位置的讀者流量數(shù)據(jù)。4)RFID數(shù)據(jù):無線射頻技術(shù)獲取的數(shù)據(jù)信息。
1)圖書館讀者流量統(tǒng)計系統(tǒng),利用視頻分析技術(shù)、紅外技術(shù)、門禁刷卡等技術(shù)統(tǒng)計分析館內(nèi)區(qū)域人流量、滯留時間。2)圖書館館情調(diào)研統(tǒng)計系統(tǒng),主要采集圖書館資源、服務(wù)類的統(tǒng)計信息數(shù)據(jù)。3)電子閱覽室管理系統(tǒng),對電子閱覽室進行用機管理、讀者管理、上網(wǎng)行為管理、報表分析等功能。4)數(shù)字圖書館服務(wù)平臺,包括圖書館門戶網(wǎng)站、移動APP應(yīng)用、社交公眾平臺等。5)數(shù)字資源服務(wù)系統(tǒng),包括統(tǒng)一檢索、數(shù)字資源數(shù)據(jù)庫。6)數(shù)字圖書館專業(yè)服務(wù)系統(tǒng),包括聯(lián)合參考咨詢、文獻傳遞、館際互借等。7)數(shù)字圖書館運行統(tǒng)計分析系統(tǒng),包括訪問日志、系統(tǒng)運行日志。
傳統(tǒng)的數(shù)據(jù)采集方式已經(jīng)不能夠滿足現(xiàn)實的需要如普查、抽樣調(diào)查和統(tǒng)計報表等。大數(shù)據(jù)采集的來源方式有以下幾種:1)傳統(tǒng)數(shù)據(jù)ETL。采用E(抽取 Extract)、T(轉(zhuǎn)置 Transform)、L(加載 Load)將來自不同數(shù)據(jù)庫中的數(shù)據(jù)按照統(tǒng)一的模型集成整合到采集數(shù)據(jù)庫中,是獲取數(shù)據(jù)的重要方式。2)日志信息。信息化平臺在運行中會產(chǎn)生大量日志,需要從不同的日志產(chǎn)生地收集,集中存儲便于集中統(tǒng)計分析處理。3)媒體流獲取。媒體流技術(shù)是網(wǎng)絡(luò)音、視頻技術(shù)發(fā)展到新高度的產(chǎn)物,涉及數(shù)據(jù)的采集、處理、編碼、解碼、傳輸?shù)榷囗椉夹g(shù)。4)網(wǎng)絡(luò)數(shù)據(jù)獲取。網(wǎng)絡(luò)數(shù)據(jù)獲取指通過網(wǎng)絡(luò)爬蟲工具或公開API等方式從互聯(lián)網(wǎng)上抓取數(shù)據(jù)。網(wǎng)頁中的數(shù)據(jù)是非結(jié)構(gòu)化的,將其存儲為統(tǒng)一的本地數(shù)據(jù)文件之前,需要進行結(jié)構(gòu)化處理。5)傳感器獲取。傳感器是系統(tǒng)檢測外界數(shù)據(jù)的是一種檢測裝置,將收集到的信息以一定的方式轉(zhuǎn)換為能傳輸、處理、存儲、應(yīng)用的電子流。
數(shù)據(jù)挖掘就是從海量的、非完整的、有背景噪聲的、非關(guān)聯(lián)的應(yīng)用數(shù)據(jù)中,發(fā)現(xiàn)蘊含其中的、當(dāng)前不為人所知的但經(jīng)處理能形成有價值數(shù)據(jù)的過程?;诓杉拇髷?shù)據(jù),形成數(shù)據(jù)池,對數(shù)據(jù)進行篩選、分析、揭示內(nèi)在聯(lián)系。根據(jù)實際需求,可以預(yù)設(shè)場景,建立關(guān)于讀者的特征分析指標(biāo),如對讀者的職業(yè)、知識結(jié)構(gòu)、興趣、偏好、個性、忠誠度等的判別。在讀者特征分析的基礎(chǔ)上,進行讀者聚類與分群的研究,發(fā)現(xiàn)群體需求與熱點。作為一種發(fā)現(xiàn)規(guī)律、探索未來的活動,這不是主觀臆斷的唯心主義,而是建立在科學(xué)的數(shù)據(jù)分析之上。
從水平和垂直兩個維度深度整合,匯聚、整合公共文化服務(wù)機構(gòu)各級各類信息,建立文化系統(tǒng)大數(shù)據(jù)的采集、處理、應(yīng)用綜合服務(wù)平臺。充分利用互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、移動技術(shù),從多個渠道收集用戶、資源、環(huán)境信息,實現(xiàn)2A服務(wù)模式,即無所不在的網(wǎng)絡(luò)互聯(lián)服務(wù)(Anywhere)和隨時的數(shù)據(jù)智能融合服務(wù)(Anytime)。多元跨域數(shù)據(jù)融合,深度融入互聯(lián)網(wǎng),加強與機構(gòu)外部的合作,充分利用互聯(lián)網(wǎng)絡(luò)、機構(gòu)外部數(shù)據(jù)資源為自己服務(wù)。重視人的主體地位,重視關(guān)注用戶視角的大數(shù)據(jù)分析和服務(wù)設(shè)計,積極利用來自政府、市場、社會的資源,協(xié)同實現(xiàn)公共文化傳承服務(wù)能力提升。向聯(lián)合體、集群化管理的方式發(fā)展,實現(xiàn)知識與信息的整合,大數(shù)據(jù)將作為指導(dǎo)公共文化基礎(chǔ)設(shè)施建設(shè)、資源配備、服務(wù)與管理的決策基礎(chǔ)。
數(shù)據(jù)分析需要建立統(tǒng)計指標(biāo)或數(shù)學(xué)模型對主觀變量進行確定。需要關(guān)注讀者閱讀終端類型、閱讀終端地理位置、用戶位置移動數(shù)據(jù)、個性化服務(wù)歷史數(shù)據(jù)、用戶需求反饋數(shù)據(jù),科學(xué)判定讀者的個性化服務(wù)需求和最佳服務(wù)方式。數(shù)據(jù)挖掘的一般過程為:數(shù)據(jù)收集—數(shù)據(jù)處理—數(shù)據(jù)變換—數(shù)據(jù)挖掘—模式評估—內(nèi)容表示(圖1)。這是一個數(shù)據(jù)篩選、降維、轉(zhuǎn)換的過程,消除沒用的“臟數(shù)據(jù)”,對經(jīng)過規(guī)范化改造的數(shù)據(jù)進行分析和建模,分析過程中建立各項指標(biāo)和變量,通過規(guī)則聚類,發(fā)現(xiàn)內(nèi)在規(guī)律和特征,為建立圖書館指數(shù)奠定數(shù)據(jù)基礎(chǔ)。
圖1 大數(shù)據(jù)分析過程
閱讀指標(biāo)的選取與確立原則有適時性、客觀性、針對性、導(dǎo)向性,能夠真實反映社會群體的閱讀狀況,并能根據(jù)環(huán)境的變化調(diào)整部分指標(biāo)。科學(xué)合理地建立指標(biāo)選取、權(quán)重處理、系統(tǒng)分析體系。通過建立科學(xué)的圖書館指數(shù)體系來量化閱讀行為,走精細化管理道路,為了解居民閱讀現(xiàn)狀與閱讀環(huán)境提供重要參考。
閱讀量:藏書量是衡量一個圖書館綜合實力的指標(biāo),對于個人或群體而言,閱讀量是衡量讀書多寡的指標(biāo),涉及讀書調(diào)查的活動基本都會用到這個指標(biāo)。
閱讀意識:內(nèi)心對于閱讀的渴望程度。由于個體的差異每個人對于閱讀渴望程度有所不同,甚至是區(qū)域間的群體閱讀意識也有差異,將閱讀意識作為一衡量指標(biāo),出發(fā)點是對于未來的閱讀行為的預(yù)測。
閱讀頻率:在強調(diào)閱讀量的同時,也應(yīng)看到閱讀頻率,此項指標(biāo)體現(xiàn)被調(diào)查對象閱讀的連續(xù)性。
閱讀環(huán)境:閱讀環(huán)境至關(guān)重要,在公共場合需要營造溫馨舒適的閱讀環(huán)境,要讓大眾喜歡閱讀、享受閱讀。對于圖書館而言就是場館功能布局與陳設(shè),跨出圖書館的范圍就是地區(qū)內(nèi)的公共文化設(shè)施的配備與分布,人口密度與圖書館之間的關(guān)聯(lián),大的社會環(huán)境就是要營造“書香社會”。
社會投入來自政府和民間。雖然總體上公共圖書館以政府主辦為主,但在部分地區(qū)也已經(jīng)出現(xiàn)了民辦圖書館,它們不同于官辦圖書館,是官辦圖書館的重要補充。社會投入對于圖書館事業(yè)的發(fā)展有重要的決定作用,沒有投入就沒有發(fā)展。
政府支持力度:發(fā)展圖書館事業(yè),倡導(dǎo)全民閱讀,沒有政府持續(xù)的投入與支持如同無源之水。公共圖書館是純公益性事業(yè)單位,公共文化事業(yè)的發(fā)展與地方政府的全力支持不可分割,可以說離開政府支持,圖書館事業(yè)發(fā)展就會停滯。
閱讀熱度:區(qū)域內(nèi)功能區(qū)劃和人口素養(yǎng)分布的差異會導(dǎo)致人群閱讀行為的差異,閱讀活動頻繁程度自然也存在差異。將讀者閱讀活動的原始數(shù)據(jù)通過技術(shù)處理,用顏色的明亮程度表示地區(qū)讀者活躍程度(熱衷讀者和閱讀頻率),活躍程度從低到高依次描述為紫色、藍色、黃色、橙色。數(shù)據(jù)來自讀者的注冊信息(手機號、微信號),通過位置定位確認其來館頻率、活動區(qū)域、來源地,高亮區(qū)域為該區(qū)域內(nèi)閱讀人群較集中、閱讀頻率較高。使用熱力圖可以清晰地看到區(qū)域內(nèi)的閱讀活動,圖形化展示與文字報告相比較,一目了然。以南京圖書館為例,其坐落于玄武區(qū)大行宮地區(qū),該地區(qū)讀者活躍度高,呈橙色表示,地理位置近,自然來館頻率高。較遠市區(qū),呈紫色均勻分布,顯示讀者均勻分布于市區(qū)(圖2)。
圖2 南京圖書館讀者在市區(qū)的分布和聚集度
形成指數(shù)的最終目的是發(fā)布到公共的空間,讓社會大眾知曉。通過微博、微信公眾號、圖書館網(wǎng)站,定期發(fā)布。
指數(shù)的發(fā)布需要采用一定的表達方法,不同的表達方式效果各異,選擇一個適合的表達方式尤為重要。經(jīng)過實踐證明,對于內(nèi)容信息量較大的,采用蜘蛛網(wǎng)圖是一個比較合適的選擇,蜘蛛圖又稱戴布拉圖、雷達圖,在財務(wù)報表中應(yīng)用較多,將其引入到表征圖書館指數(shù)是考慮到其直觀明了的視覺效果。在一個圖表上展示包含多個維度的信息時,隨著維度的增加,一般的圖表將無法充分和直觀的展現(xiàn)這些信息,而文字描述又過于干澀。引入特定的圖表可以直觀地表現(xiàn)機構(gòu)運營者的意圖。公眾對于信息的表達傾向于簡單明了的方式,一個表達方式即使設(shè)計再精妙,但難以理解,也不為公眾所接受。
經(jīng)調(diào)研,設(shè)計的戴布拉圖設(shè)計指標(biāo)有閱讀量(I1)、閱讀意識(I2)、閱讀頻率(I3)、閱讀環(huán)境(I4)、閱讀熱度(I5)、社會投入(I6)、政府支持力度(I7)。指標(biāo)的設(shè)立依據(jù)當(dāng)下社會閱讀的趨勢和需求做出,新需求的出現(xiàn)會促進指標(biāo)的更迭。指標(biāo)的具體數(shù)值基于原始數(shù)據(jù),綜合地域人口環(huán)境,通過一定的算法得出。一般而言,以每個行政區(qū)域為繪圖單位,多個行政區(qū)域形成多個戴布拉圖。在同一個坐標(biāo)系下,多個戴布拉圖可以重疊放置,以顏色區(qū)分。以圖3為例,藍色、紅色區(qū)域各指代南京某區(qū)的閱讀指數(shù)中各指標(biāo)值,數(shù)據(jù)簡潔明了,主題性強,易于理解。在生活節(jié)奏飛快的當(dāng)下,容易為公眾所認可和接受。圖書館指數(shù)LI(library index),是將戴布拉圖中的各個指標(biāo)進行加權(quán)處理后生成的綜合指數(shù)。表示為LI=∑In*Pn,其中In為各指標(biāo)原始數(shù)據(jù),Pn為各指標(biāo)在指數(shù)體系中的權(quán)重比例。In和Pn是動態(tài)可調(diào)的,會根據(jù)社會需求的發(fā)展適時調(diào)整內(nèi)容和權(quán)重,這也是一個逐步完善的過程。
圖3 閱讀指數(shù)
“忠厚傳家久,詩書繼世長。”閱讀可以啟迪心智,可以傳承文化,對個人和社會而言就是“開卷有益”,閱讀能增強城市精神凝聚力,讀書活動是精神領(lǐng)域的享受,對個人和社會的影響是全方位的。社會倡導(dǎo)全民閱讀,著重于觀念上的引導(dǎo)。醇厚書香徐徐而來,帶來的是沉穩(wěn)和優(yōu)雅,祛除的是浮躁和粗俗,禮賢驅(qū)逐暴戾,理智占據(jù)主流。公眾的價值觀念悄然而變,書香社會漸成氣候,最終將使城市成為一座因熱愛讀書而受人尊重的城市。
全民閱讀調(diào)查提供的更多是直觀的數(shù)據(jù),一方面是信息量有限,另一方面對數(shù)值背后的信息未做進一步的解析。如果要研究區(qū)域的整體閱讀詳情,單靠閱讀率、閱讀量這樣的指標(biāo),不具有科學(xué)的區(qū)分度,而引入圖書館指數(shù)就能把握整體,反映較全面的閱讀狀態(tài),比如閱讀意識、閱讀熱度、社會投入、政府支持力度、閱讀環(huán)境等。
對于一個公益非盈利性質(zhì)的公共文化服務(wù)機構(gòu),從信息傳遞角度出發(fā),圖書館需要營銷。圖書館的定位不能僅限于信息服務(wù),還需要衍生與滲透,向著信息服務(wù)、參考咨詢、政府參謀、立法決策方向發(fā)展,立足于專業(yè),多維度滲透,所謂“一專多能”。營銷的目的就是加強圖書館與讀者之間的聯(lián)系,讓圖書館與讀者之間能無障礙交流。
圖書館指數(shù)包含的豐富內(nèi)容能夠改變過去圖書館刻板的公眾形象,以生動活潑的個性對外展示,能夠成為圖書館營銷的重要抓手。圖書館指數(shù)的發(fā)布,能夠在互聯(lián)網(wǎng)時代樹立一塊行業(yè)招牌,凸顯個體形象,為公眾所熟知,乃至成為社會關(guān)注的焦點。
圖書館指數(shù)以量化的指標(biāo)表征居民的閱讀情況,以期提升全民閱讀水平納入到社會建設(shè)的統(tǒng)籌規(guī)劃中,促進閱讀活動,打造了良好的閱讀氛圍,促使人們養(yǎng)成崇尚閱讀、自覺閱讀的習(xí)慣。國務(wù)院政府工作報告中已經(jīng)連續(xù)多次提出要建設(shè)書香社會,各級政府對于公共文化服務(wù)的投入持續(xù)加大、在提供高質(zhì)量的閱讀資源、改善公共圖書館環(huán)境等舉措上持續(xù)發(fā)力,這將有助于提升本地居民的閱讀水平,促進社會整體閱讀氛圍的形成。
國外圖書館行業(yè)在政府的決策領(lǐng)域發(fā)揮了重要的作用,甚至此項工作已成為工作一部分。可以將引入圖書館指數(shù)為契機,積極與各級人大、政協(xié)溝通交流,根據(jù)用戶的個性化需求, 在公共圖書館的網(wǎng)站上建立決策信息服務(wù)平臺,建立個性化的信息庫,幫助決策機構(gòu)利用好外部資源,了解和掌握社會輿情。大數(shù)據(jù)應(yīng)用為政策制定提供科學(xué)依據(jù)。傳統(tǒng)決策方式缺乏多來源、全方位的充分信息支撐,決策者決策前獲取的信息是片面的、有選擇性的,有了大數(shù)據(jù)支撐,決策的方式就可能改變。圖書館指數(shù)有利于主動評測政府在文化建設(shè)方面的實際成效,借居民閱讀行為與認知調(diào)查之分析,表達出社會元素對閱讀方式的影響,闡釋來自圖書館的社會觀點,通過連續(xù)性地監(jiān)測與發(fā)布,清晰地呈現(xiàn)全民閱讀的基本建設(shè)和閱讀文化的發(fā)展軌跡。