張園芳
(華中師范大學 信息管理學院,湖北 武漢 430079)
大數(shù)據(jù)環(huán)境下,用戶行為信息不斷增加,用戶對信息的需求量也不斷提高,如何從海量信息中提取出有效信息并為用戶提供服務,是個性化服務研究的關鍵。個性化服務是以用戶為中心, 基于用戶信息使用行為、習慣、偏好、特點及用戶特定的需要, 向用戶提供滿足其個性化需求的信息內(nèi)容和系統(tǒng)功能的服務。個性化服務不僅應用于電子商務和影視音樂領域,在圖書管理、數(shù)字城市、醫(yī)療、教育等領域也得到了廣泛的應用。圖書情報學科領域,自1999年美國國會圖書館與信息技術聯(lián)合會(LITA)的圖書館專家將“個性化服務”列為圖書館發(fā)展的研究內(nèi)容,國內(nèi)也相繼展開相關研究。本文以圖書情報學科領域為例,從研究的時間、作者、機構等個性化服務研究現(xiàn)狀、研究熱點、研究演化趨勢等內(nèi)容對2009-2018年10年間我國個性化服務的相關文獻進行梳理,并通過可視化的方式呈現(xiàn),使之能夠直觀的了解圖書情報領域個性化服務研究現(xiàn)狀及發(fā)展趨勢。
本文數(shù)據(jù)來源于中國知網(wǎng)的中國學術期刊網(wǎng)絡出版總庫,以“主題=個性化服務”作為檢索項,檢索年份選擇2009-2018年,期刊來源為CSSCI,檢索日期2019年10月8日。初步檢索,獲得文獻755篇,經(jīng)過對檢索結果篩選,去掉年度索引、篇名索引、精選文摘以及不相關文獻后共獲得有效文獻729篇。
本文采用文獻計量的方法對個性化服務研究的文獻時序分布、作者分布、機構分布以及關鍵詞進行分析,借助SATI進行作者、機構、關鍵詞詞頻統(tǒng)計,而知識圖譜能夠通過共引分析和共現(xiàn)分析,以可視化的形式呈現(xiàn)某一領域在一定時期內(nèi)的研究熱點、演進歷程和發(fā)展趨勢,通過Citespace對個性服務研究的關鍵詞進行聚類分析、突變詞分析以及時區(qū)分析,進一步揭示我國2009-2018年個性化服務的研究熱點及研究演化趨勢,為個性化服務相關研究提供參考。
將篩選好的數(shù)據(jù)按照發(fā)文年度加以梳理,得出圖1的2009-2018年我國近10年個性化服務研究的發(fā)文量趨勢圖。發(fā)文數(shù)量的變化可以直觀地看到某學科在特定時間段內(nèi)研究熱度的變化,是衡量該學科在該時間段內(nèi)發(fā)展態(tài)勢的重要指標,對分析發(fā)展動態(tài)和預測未來趨勢具有重要的意義。如圖1所示,2010年前,發(fā)文量呈上升趨勢,國內(nèi)個性化服務研究最早開始于2000年后一直保持研究熱度,在2010年發(fā)文量達到最高值;2010-2015年,發(fā)文量逐漸趨于相對穩(wěn)定的狀態(tài),2015年以后,發(fā)文量有逐年下降的趨勢,2019年發(fā)文在33篇左右。
對作者的分析主要從高產(chǎn)作者和與作者合作關系這兩方面入手,作者發(fā)文量可以揭示作者對具體領域研究的持續(xù)性、深度以及貢獻大小。首先對從CNKI獲取的729篇文獻按照作者對其發(fā)文量進行統(tǒng)計,根據(jù)普賴斯定律,高產(chǎn)作者的最低發(fā)文量 m=0.749*nmax1/2(nmax是最高產(chǎn)作者發(fā)文量),本研究發(fā)文量最多的作者是陳臣,共計21篇,計算得出高產(chǎn)作者最低發(fā)文量m≈3.96篇,因此高產(chǎn)作者的發(fā)文量應大于4篇,根據(jù)統(tǒng)計,發(fā)文量在4篇及以上的作者共18位,如表1所示。
表1 高產(chǎn)作者發(fā)文量
圖1 發(fā)文量
圖2 作者合著關系
同時,將處理好的數(shù)據(jù)導入Citespace進行作者合作分析,時間限定在2009-2018年,1年為一個時間片段,生成作者合作關系網(wǎng)絡,如圖2所示。圖中節(jié)點大小表示作者發(fā)文量的多少,節(jié)點越大表示發(fā)文量越多,節(jié)點之間的連線表示作者之間的合作關系,連線的粗細,代表作者之間合作關系的密切程度,連線的多少,代表作者之間的合作數(shù)量多少。如圖2所示,陳臣的節(jié)點最大,是最高產(chǎn)的作者,其次是馬曉婷,且兩位作者之間是合作關系。核心作者在對推動學科發(fā)展,開拓領域的深度和廣度方面都發(fā)揮著重要作用。此外還可以發(fā)現(xiàn)何勝、曹紅兵的連線最多,說明他們已經(jīng)形成了一定規(guī)模的合作小團體,其形成有利于加快個性化服務研究工作的進展,但合作關系還局限于團體內(nèi)部合作,與其他機構的學者之間的合作較少。
圖3 機構合作關系
個性化服務研究機構主要集中在高校和高校圖書館,發(fā)文量前五的研究機構依次是蘭州財經(jīng)大學信息工程學院23篇、蘭州財經(jīng)大學信息中心20篇、武漢大學信息管理學院20篇、南京大學信息管理學院18篇、天津農(nóng)學院圖書館7篇。其中,蘭州財經(jīng)大學信息工程學院和信息中心匯集了陳臣、馬曉亭等,說明其對個性化服務研究關注密切,科研成果產(chǎn)出豐碩,其研究內(nèi)容主要集中在圖書館、數(shù)字圖書館;武漢大學信息管理學院明均仁等,研究內(nèi)容是數(shù)字信息服務;南京大學信息管理學院陳雅、鄭建明等,研究內(nèi)容集中在數(shù)字圖書館,天津農(nóng)學院圖書館解金蘭等,研究內(nèi)容集中在圖書館服務,服務模式。由Citespace生成的機構之間的合作關系網(wǎng)絡,如圖3所示,分別形成了以廣西大學圖書館、中國科學院國家科學圖書館為代表的合作團體,也有武漢大學信息管理學院、華南師范大學經(jīng)濟與管理學院為代表的單向合作團體,說明個性化服務研究已經(jīng)形成一定規(guī)模的研究合作機構,這對個性化服務進一步發(fā)展起到促進作用。
文獻的關鍵詞或標題詞是文章核心內(nèi)容的濃縮和提煉,如果某一關鍵詞或標題詞在其所屬領域反復出現(xiàn),則可以反映出該關鍵詞或標題詞所表征的研究主題是當前研究熱點。本文借助SATA對關鍵詞進行預處理,并統(tǒng)計關鍵詞頻次,關鍵詞頻次之和占全部關鍵詞總頻次的40%以上就能代表該領域的研究熱點。本文通過SATA對獲得文獻進行關鍵詞抽取、清洗,經(jīng)統(tǒng)計獲到關鍵詞1 231個,總頻次2 779,對頻次大于等于8次的33個關鍵詞進行統(tǒng)計,共計頻次1 151次,占總頻次的41%,如表2所示。
表2 關鍵詞頻次表(頻次≥8)
對文獻研究主題的分析可以準確掌握個性化服務研究的動態(tài)、發(fā)展方向和研究熱點。聚類分析是共詞分析方法的一種重要輔助手段, 通過聚類分析, 能把關系密切的主題聚集在一起形成類團,本文通過Citespace對關鍵詞進行聚類分析,聚類結果如圖4所示,形成高校圖書館、個性化信息服務、圖書館、個性化服務、自適應服務、信息資源整合、Web 2.0、用戶需求、知識服務、搜索引擎、公共圖書館、大數(shù)據(jù)12個聚類。
圖4 個性化服務研究主題聚類
圖5是2009年-2018年我國個性化服務研究前10的突變詞,突變詞分析是通過詞頻的變化來分析正在興起或突然涌現(xiàn)的新的熱點主題,可以了解某一時期的學術前沿話題。根據(jù)圖5,2014年前的服務模式、Web2.0、用戶需求突變詞持續(xù)研究時間較短,在2014年以后出現(xiàn)了新的研究內(nèi)容,大數(shù)據(jù)、小數(shù)據(jù)、智慧圖書館、移動圖書館、微信公眾號從出現(xiàn)到2018年持續(xù)研究,說明它們是個性化服務研究的熱點內(nèi)容。
結合表2、圖4、圖5分析看出,圖書館、高校圖書館、數(shù)字圖書館、個性化信息服務、大數(shù)據(jù)、知識服務等關鍵詞的頻次較高,而大數(shù)據(jù)、移動圖書館、小數(shù)據(jù)、Web2.0、智慧圖書館等的突顯強度較高。綜合分析,我國近10年圖書情報領域的個性化服務研究熱點主要集中在3個方面:圖書館個性化服務、圖書館服務技術應用、個性化服務內(nèi)容。
圖5 個性化服務研究Top10突變詞
(1)圖書館個性化服務,包括各類型的圖書館個性化服務,如高校圖書館、數(shù)字圖書館、公共圖書館、智慧圖書館,個性化服務是圖書館研究關注的重點,而高校是圖書館個性化服務研究的重要機構,匯集了大量研究人員和圖書資源。信息時代,讀者的個性化信息需求不斷增加,使得圖書館個性化服務顯得尤為重要,通過個性化服務,不僅能滿足讀者的個性需求,也能促進圖書館資源開發(fā)。大數(shù)據(jù)時代,圖書館服務也從傳統(tǒng)服務形式逐漸向數(shù)字圖書館、移動圖書館、智慧圖書館轉變,李嘉華認為智慧圖書館是基于系統(tǒng)文獻資源、智能知識服務和智慧保障支撐的新型知識服務體系, 它不是一個機構, 而是一種服務形式。
(2)圖書館服務技術應用,圖書館服務技術包括數(shù)據(jù)挖掘、Web2.0、大數(shù)據(jù)、云計算、RSS等,尤其是大數(shù)據(jù)相關技術,大數(shù)據(jù)的研究和應用已經(jīng)在互聯(lián)網(wǎng)、商業(yè)智能、咨詢與服務、醫(yī)療服務、零售業(yè)、金融業(yè)、通信等行業(yè)顯現(xiàn),并產(chǎn)生了巨大的社會價值。大數(shù)據(jù)環(huán)境下,圖書館利用大數(shù)據(jù)相關技術來挖掘、整合讀者的行為信息,更好的定位用戶的需求,從而為讀者提供有針對性的個性化服務。
(3)個性化服務內(nèi)容,包括信息服務、知識服務、學科服務、隱私保護等,針對不同用戶需求,為用戶提供相應的服務,圖書情報領域的圖書館知識服務研究重點主要側重于知識服務理論研究、技術研究、服務模式研究3個方面,其中服務模式研究是最為活躍的研究內(nèi)容。大數(shù)據(jù)環(huán)境下也更加關注隱私保護問題,馬曉亭分析了大數(shù)據(jù)時代圖書館個性化服務用戶隱私保護存在的問題, 并提出大數(shù)據(jù)環(huán)境下圖書館用戶個性化服務隱私保護的對策與方法。
Citespace的時區(qū)圖可以用來對個性化服務研究的發(fā)展演化趨勢進行分析,時區(qū)圖從時間維度表示知識演進過程,時區(qū)圖可以清晰地呈現(xiàn)出研究內(nèi)容的更新及相互影響情況。結合文獻和圖6時區(qū)圖分析,將我國近10年個性化服務研究發(fā)展劃分為兩個階段,第一個階段是2009年-2012年,包含了圖書館、高校圖書館、個性化推薦、個性化信息服務、知識服務等關鍵詞,這一階段的研究集中在個性化服務模式、個性化服務技術在圖書館中的應用,其中個性化服務模式主要包括定制式服務、主動推送式服務以及互動式服務,從針對用戶需求的定制服務到根據(jù)用戶行為信息主動推送服務再到交互式服務,化被動為主動,深入挖掘用戶的隱性需求,不斷提升用戶體驗。個性化服務技術包括Web2.0和云計算,Web2.0通過博客、RSS、百科全書、網(wǎng)摘、社會網(wǎng)絡、P2P、即時信息等形式向用戶提供個性化服務,云計算除了提供基礎設施服務,還提供平臺、軟件等服務,圖書館利用云計算技術將軟件、硬件和服務加以整合形成資源池,在此基礎上形成網(wǎng)絡,利用綜合云應用,針對個性化需求,提供各類服務。
第二個階段是2013-2018年,大數(shù)據(jù)時代,出現(xiàn)了移動圖書館、智慧圖書館、隱私保護、大數(shù)據(jù)挖掘、用戶畫像、社交網(wǎng)絡等關鍵詞,這一階段的個性化服務研究主要關注服務模式和體系、用戶行為、隱私保護,曾子明等在分析個性化推薦智慧服務需求的基礎上構建了智慧圖書館個性化推薦服務體系,并提出智慧服務模式的保障機制。何勝等設計一種利用用戶日志庫提取用戶顯性興趣和隱性需求本體的個性化服務方案,將用戶行為本體建模和大數(shù)據(jù)挖掘技術相結合為用戶提供個性化服務。為用戶提供個性化服務需要收集用戶的個人信息,因此在利用大數(shù)據(jù)技術進行信息分析和挖掘時可能會侵犯用戶個人隱私,針對大數(shù)據(jù)環(huán)境下個性化服務用戶隱私保護問題,趙天昀從政策法規(guī)和技術層面提出用戶隱私信息保護機制的方法。
圖6 時區(qū)分布
本文以我國2009-2018年圖書情報領域的個性化服務相關文獻為研究對象,對我國個性化服務文獻的研究現(xiàn)狀、研究熱點、研究演化趨勢等進行文獻計量、聚類分析,并以可視化方式呈現(xiàn),經(jīng)過綜合分析,主要從以下3個方面進行總結:
(1)文獻研究現(xiàn)狀。從發(fā)文量看,2009年-2018年10年間,我國圖情領域個性化服務研究的文獻量總體呈現(xiàn)緩慢下降的趨勢,從作者合作情況看,研究者合作小團體較少,合作關系局限在研究機構內(nèi)部,除了兩個合作團體,其他大部分研究者都是獨立作者;從機構合作情況看,已經(jīng)形成一定規(guī)模的研究合作組織。
(2)研究熱點。通過關鍵詞聚類、突顯詞分析,我國近10年圖書情報領域的個性化服務研究熱點主要集中在圖書館個性化服務、圖書館服務技術應用、個性化服務內(nèi)容3個方面,隨著大數(shù)據(jù)時代的來臨,圖書館服務已經(jīng)從傳統(tǒng)的服務形式轉變?yōu)橹腔蹐D書館的智慧服務,個性化服務涉及的用戶隱私問題也引起了更多關注;并利用大數(shù)據(jù)技術對用戶行為特征進行深入挖掘,發(fā)掘用戶的隱性需求,為用戶提供針對性強的個性化服務。
(3)研究演化趨勢。信息時代,個性化服務研究的演化和大數(shù)據(jù)息息相關,圖書情報領域的個性化服務主要集中在圖書館領域,早期,圖書館的個性化服務主要集中在圖書館服務模式、環(huán)境個性化,服務內(nèi)容個性化以及服務技術的應用;大數(shù)據(jù)時代,更多關注大數(shù)據(jù)環(huán)境下圖書館服務模式和體系、用戶行為、隱私保護等內(nèi)容。