用戶畫像是基于對用戶大數(shù)據(jù)的挖掘、分析、提煉,將用戶行為、愛好、年齡等具體特征抽象成個體或群體用戶標簽,作為真實用戶的虛擬代表的技術。智庫是基于人們對知識和信息的深度需求而產(chǎn)生的提供高水平信息篩選、情報分析、決策支持等咨詢服務的組織,智庫的核心在于“智”的體現(xiàn),即服務對象精準、內(nèi)容深入。用戶畫像代表了資源及服務的主要受眾和目標群體的需求,可作為智庫準確把握用戶需求的有效工具。
近年來,國內(nèi)圖書館界關于應用用戶畫像進行個性化精準服務的研究逐步升溫。如從知識服務、閱讀推廣、場景推薦、主動定制等方面提出了基于用戶畫像的圖書館個性化智慧服務策略[1];通過挖掘高校圖書館研究間的用戶行為規(guī)律特征,為研究間設施改進、精準服務提供了數(shù)據(jù)支撐[2];利用用戶畫像對圖書館閱讀推廣、資源推薦、精準服務模式進行了研究[3-7]等。但關于通過用戶畫像輔助學科深度智庫服務的研究相對較少。2019年在中國智庫索引(Chinese Think Tank Index,CTTI)中,高校智庫有399家.其中與醫(yī)學相關的藥品、醫(yī)療衛(wèi)生政策、健康政策等類型的智庫17家,僅占4.26%。醫(yī)學是直接影響人類健康發(fā)展的重要學科,其學習、教學、實踐及科研的要求都較高,學科智庫的構建對于該學科人才培養(yǎng)及發(fā)展規(guī)劃至關重要。
醫(yī)學圖書館開展專業(yè)智庫服務的必要性主要體現(xiàn)在專業(yè)特點、人員特征及機構組成等3方面。
就專業(yè)特點而言,醫(yī)學兼具研究與實踐,學科難度大、科研需求強烈,對學生、教師及科研人員的研究及實踐水平要求較高。學科館員不但要有扎實的學科基礎,還需要學科專家的準確引領、深度指導才能有助于專業(yè)素養(yǎng)的不斷提升。
就人員特征而言,醫(yī)學專業(yè)高年級學生和教師在其學習、教學、實驗、看診、科研、報獎、立項等各項工作中,均需要高水平智庫為其提供指導或決策參考。
就機構組成而言,醫(yī)學院校通常會有附屬醫(yī)院作為其臨床醫(yī)院。由于機構性質(zhì)、職業(yè)分工的區(qū)別,其績效、考核評價標準、體系皆有不同,若要更加科學合理地進行考核評價,則需要專業(yè)智庫提供參考依據(jù)。
首先,要依托“全資源”。需統(tǒng)籌圖書館、院系及附屬醫(yī)院的各類科研及實踐資源,包括實體資源及人才資源。
其次,用戶畫像要細致、準確。醫(yī)學智庫服務存在教學、科研、實踐及管理等多類型需求,其用戶畫像建模應針對不同人群、從不同維度進行。
第三,選擇合適的組織服務機構。圖書館具備資源、空間、人員等優(yōu)勢,擅于各類資源統(tǒng)籌分配,用戶數(shù)據(jù)收集,用戶畫像構建、服務的組織與提供等工作,是最適合支撐、組織、協(xié)助開展醫(yī)學智庫建設及服務的機構。
綜上,開展基于用戶畫像的醫(yī)學圖書館智庫服務的核心思路為:以醫(yī)學圖書館、院系及附屬醫(yī)院的各類資源及專業(yè)人員為智庫資源基礎,通過對用戶個人屬性、信息行為等數(shù)據(jù)的統(tǒng)計、分析、提煉,從研究方向、需求層次、資源類別等不同維度進行用戶個人或群體畫像建模,遵循需求對應、距離優(yōu)先、場景優(yōu)先的原則,進行目標用戶與資源或服務的精準匹配,在圖書館組織協(xié)調(diào)下提供深度咨詢服務。
按照醫(yī)學專業(yè)智庫服務的核心思路,本文從基礎數(shù)據(jù)、畫像構建、數(shù)據(jù)關聯(lián)、服務應用4個層面構建了基于用戶畫像的醫(yī)學智庫服務模式(圖1)。
圖1 基于用戶畫像的醫(yī)學智庫服務架構
3.1.1 用戶及資源數(shù)據(jù)
用戶數(shù)據(jù):包括自身屬性數(shù)據(jù)(如姓名、性別、年齡、職稱、年級、專業(yè)等)、信息行為數(shù)據(jù)(如檢索及借閱記錄、下載點擊行為、參與培訓、空間利用、服務預約)以及社交互動數(shù)據(jù)(如意見反饋、資源評論、分享推薦等),其深度組合是刻畫用戶信息行為、反映信息需求的重要基礎。
資源數(shù)據(jù):醫(yī)學因其專業(yè)性強,且兼具教學、科研及實踐的多項要求,其智庫資源不僅要包含各類館藏資源,還要收集醫(yī)學院系資料室、實驗室及附屬醫(yī)院等機構的各類型資源(包括文獻、場地、實驗設備、醫(yī)療環(huán)境及服務專家等)。
3.1.2 數(shù)據(jù)采集及標引
在移動、互聯(lián)、社交、大數(shù)據(jù)的背景下,圖書館用戶及資源數(shù)據(jù)均出現(xiàn)了大規(guī)模、多樣化、互聯(lián)性、更迭性等特點。面對新型數(shù)據(jù)特點,需對其收集及處理方式進行相應調(diào)整。首先,數(shù)據(jù)類型的多樣性要求采取傳統(tǒng)問卷、實地調(diào)研以及各類系統(tǒng)統(tǒng)計相結合的方式實現(xiàn)數(shù)據(jù)收集與統(tǒng)計;其次,由于數(shù)據(jù)結構的不同,異構數(shù)據(jù)的結構化融合、分類與標引必須制定統(tǒng)一標準,便于數(shù)據(jù)加工及匹配;再次,數(shù)據(jù)處理模塊需要具備良好的數(shù)據(jù)兼容性、較高的更新頻率及計算能力,以實現(xiàn)及時的更新迭代,保證用戶畫像及資源數(shù)據(jù)實時更新。
3.2.1 用戶畫像類型
個體畫像:個人用戶智庫需求特征的刻畫需要綜合自身屬性數(shù)據(jù)、信息行為數(shù)據(jù)以及社交數(shù)據(jù),并通過不同維度的組織,刻畫出個人用戶智庫服務需求。
群體畫像:將具有同一特征屬性的用戶劃分為一個群體,通過聚類分析提取群體特征,并利用語義相關性發(fā)現(xiàn)潛在特征,再按需從不同維度進行組織及群體畫像。
受眾畫像:從資源或服務的利用角度,將同類型或同一資源或服務的受眾劃分為一個群體,并通過提取群體用戶特征,深度刻畫出目標用戶的典型特征,亦可發(fā)掘其他關聯(lián)需求。
3.2.2 針對智庫服務的用戶畫像構建
用戶畫像的構建是應用各種屬性標簽的組合還原用戶的特征及需求。從原始用戶數(shù)據(jù)到用戶標簽的形成,應根據(jù)數(shù)據(jù)的不同屬性分別采取人工整理、系統(tǒng)統(tǒng)計、數(shù)據(jù)挖掘及智能學習等方法對原始數(shù)據(jù)信息進行特征提取、聚類、標引,再將用戶標簽按不同維度組合,完成用戶畫像建模,使之成為制定差異化精準智庫服務的依據(jù)。
3.2.2.1 用戶畫像標簽提取方法
用戶數(shù)據(jù)分為結構性和非結構性兩類。用戶的個人屬性及信息行為這類事實型結構數(shù)據(jù)可通過系統(tǒng)提取并進行特征提取及標引;針對評論、反饋、分享等非結構性信息則要利用文本挖掘、聚類分析、語義關聯(lián)等方法進行特征標簽提取。
同時,還應注意數(shù)據(jù)的實時性與潛在性。用戶對于智庫服務的需求存在階段性變化,如隨著年級、職稱、研究領域的變化,用戶畫像也會改變。再者,對于如分享、評論、轉(zhuǎn)發(fā)等社交信息行為,均可能蘊藏著用戶對某項資源或服務的態(tài)度,因此要利用深度學習、SOM神經(jīng)網(wǎng)絡聚類和優(yōu)化分析等算法,分析用戶對資源或服務的態(tài)度與傾向,并結合其他屬性標簽發(fā)現(xiàn)其潛在的服務需求。
3.2.2.2 用戶畫像構建維度
構建醫(yī)學用戶畫像,可從專業(yè)方向、需求層次及服務類別3個維度展開,呈現(xiàn)出用戶“在什么領域、對哪種資源或服務、有何程度的需求”。
專業(yè)需求維度:用戶的研究及興趣領域體現(xiàn)在所屬專業(yè)、資源利用及成果產(chǎn)出等方面。首先從不同數(shù)據(jù)庫提取用戶信息行為數(shù)據(jù)的分類信息,再以教育部學科分類為基礎,根據(jù)《中國圖書館分類法》及Web of Science學科分類進行人工劃歸、映射,從而標引用戶“專業(yè)方向”,確定其當前的研究或興趣領域。
需求層次維度:對于相同的資源或服務,處于不同學習、科研階段的用戶需求差異較大??筛鶕?jù)“用戶身份”(包括年級、職稱等)、“需求文獻類型”及“在某一領域或某一研究方向發(fā)表論文數(shù)量”等指標,對用戶進行科研層次維度的特征刻畫。
服務類別維度:可從資源的角度,對某種智庫資源或服務的受眾進行群體畫像。首先對智庫服務進行統(tǒng)一標引,并根據(jù)用戶預約、使用、反饋等行為數(shù)據(jù),判斷其短期或長期的興趣點及服務需求。
服務的“智慧”在于其與目標用戶需求的精確匹配,因此要求在資源與資源、資源與用戶、用戶與用戶之間建立準確的語義關聯(lián)及映射,從而實現(xiàn)智庫與用戶需求的高度匹配。
一方面依據(jù)資源的學科、類型、歸屬、功能提供方式等屬性對其進行分類標引,并通過語義分析建立資源間的知識關聯(lián)及衍生關系,形成智庫知識網(wǎng)絡。
另一方面要通過用戶畫像的構建將用戶與智庫資源、人員進行特征及語義關聯(lián)、需求匹配,形成資源利用網(wǎng)絡;最后,利用用戶社交互動信息建立用戶與用戶之間的語義關系網(wǎng)絡,從而形成資源傳播網(wǎng)絡。
在智庫知識網(wǎng)絡、資源利用及傳播網(wǎng)絡的共同作用下,實現(xiàn)智庫服務目標人群的鎖定及擴展和智庫資源與服務的精準送達。
針對醫(yī)學專業(yè)的智庫服務內(nèi)容主要包括資源推薦、專題研討、培訓講座、深度咨詢、情報分析、知識產(chǎn)權等。為更好地滿足臨床、實驗、教學、評估等服務需求,智庫服務主要依據(jù)用戶畫像開展嵌入式智庫服務,也可依托圖書館信息空間預約或周期性開展。
嵌入式智庫服務的特點在于需求滿足準確、服務高效并貫穿需求全過程,因此要求圖書館在綜合醫(yī)學各院系、重點實驗室、動物中心、附屬醫(yī)院等多方資源的基礎上,幫助醫(yī)療團隊或個人構建用戶畫像,按照需求對應、距離優(yōu)先、場景優(yōu)先的原則,科學地組織并分配各類智庫資源,實現(xiàn)智庫資源與用戶需求的高效匹配。
圖書館信息空間的優(yōu)勢在于擁有多種圖書館資源及教學等軟硬件設施,并配有信息技術人員及學科專家、教師,各類研修間的設置也便于開展中小型學習、交流、研討活動。圖書館可依托信息空間,依據(jù)用戶畫像,按需求、內(nèi)容、層次的不同,組織相關智庫資源,針對目標用戶開展資源推薦、專題培訓、主題討論等智庫服務。
依據(jù)用戶類型及服務功能的不同,醫(yī)學圖書館智庫服務可分為資源推薦服務、嵌入式服務及信息空間服務(圖2)。
圖2 基于用戶畫像的醫(yī)學智庫服務功能結構
依據(jù)個人用戶或群體用戶畫像進行資源推薦是智庫服務的重要內(nèi)容。針對個人用戶,通過系統(tǒng)提取個人屬性及信息行為數(shù)據(jù)進行分類標引,并對評論、分享數(shù)據(jù)進行語義分析,從而挖掘其潛在需求。將用戶行為特征標簽與潛在需求標簽結合生成實時用戶畫像,據(jù)此進行目標用戶的資源服務推送。如針對畫像標簽為“大四,臨床醫(yī)學,考研”的用戶,為其推薦臨床醫(yī)學專業(yè)綜合評價較高的考研書籍及相關培訓信息。
針對群體用戶,可按用戶或資源特征進行不同維度的用戶群分類。既可按年級、身份、職稱分類,如將“研二”學生劃分為用戶群體進行特征提取后生成“資料檢索”“論文開題”“專題指導”“信息素養(yǎng)教育”等特征標簽,針對該用戶群推薦相關書籍或檢索技能、論文撰寫的專題培訓,以及智庫中服務特征匹配的教師;也可按資源受眾分類,如針對《人體解剖學圖譜》,構建該書的受眾畫像,通過借閱記錄發(fā)現(xiàn)該書被本科二年級學生借閱較多,并在該書評論中發(fā)現(xiàn)“可以將此書和3D解剖數(shù)據(jù)庫一起用,對考前復習特管用”的信息,由此判斷3D解剖數(shù)據(jù)庫也是該書受眾的連帶需求資源。所以該書受眾畫像標簽為“大學生,本科二年級,醫(yī)學,考試”,據(jù)此可向目標用戶群體進行書籍及數(shù)據(jù)庫的推薦。
嵌入式智庫服務強調(diào)服務的主動性及與需求對應的準確性。一方面,圖書館應定期更新用戶畫像,并深入到臨床或科研一線提供服務;另一方面,在確保用戶畫像準確的前提下,按臨床醫(yī)療、教學科研或?qū)W科發(fā)展等不同用戶需求提供準確的嵌入式智庫服務。
4.2.1 針對臨床醫(yī)療的智庫服務
臨床醫(yī)療智庫服務在醫(yī)療大數(shù)據(jù)前提下,基于用戶或病情畫像的診療決策支持、醫(yī)療信息推薦等進行智庫服務。既可通過對用戶大數(shù)據(jù)的多維統(tǒng)計分析,輔助醫(yī)生進行多視角診療決策、病因追溯、疾病建模、自動診療方案建議;也可基于病情畫像和診斷推薦算法,根據(jù)患者診斷治療數(shù)據(jù),研究生理和疾病指標進行聚類分析,實現(xiàn)病情畫像,提取治療參數(shù)設置并進行個性化方案推薦[8];還可基于奇異值分解技術的協(xié)同過濾與融合畫像的推薦算法,幫助用戶實現(xiàn)病情與醫(yī)生的精準推薦,為患者提供自動或者半自動的分診[9]。
4.2.2 針對科研團隊的嵌入式智庫服務
針對科研團隊的智庫服務是嵌入到整個科研過程中,在科研不同階段,有針對性、連貫而系統(tǒng)地幫助科研團隊在選題、規(guī)劃、立項、報獎、專利申請等方面提供深度咨詢服務,需要基于科研團隊的群體畫像,得到其當下特征標簽。如“呼吸與危重癥醫(yī)學”“醫(yī)療器械”“臨床診療”“呼吸系統(tǒng)疾病”“項目申報”“情報分析”等,經(jīng)智庫系統(tǒng)進行資源及人員匹配后,組織學科館員、情報小組及科研申報部門相關人員對該課題組進行科研成果分析、學科前沿與熱點分析、科技查新、立項申報指導等服務。
4.2.3 針對學科發(fā)展及人才評估的智庫服務
醫(yī)學院校管理層用戶對于醫(yī)學智庫服務的需求主要圍繞在對學科競爭情報分析及人才的評估、考核、引進等方面。此類服務內(nèi)容及周期相對固定,但由于學科或單位的不同,其采用的評估標準是服務價值體現(xiàn)的關鍵因素。圖書館需利用調(diào)研、采訪等方式主動收集用戶需求,通過對非結構性信息的文本挖掘、聚類分析及語義關聯(lián),提取出其現(xiàn)實與潛在的需求特征,構建用戶畫像,同時應組織圖書館情報人員對其他同類標準進行調(diào)研,并協(xié)調(diào)科研、管理等部門專家進行綜合評議,從而靈活、準確地制定出適合本單位及單位中不同人群的評價、考核標準。在此基礎上提供的學科發(fā)展分析、人才考核、引進等智庫服務能夠準確、高效地為本單位發(fā)展規(guī)劃提供決策支持。
圖書館信息空間的智庫服務主要依托圖書館空間的場地、設備、資源及專業(yè)信息人員,其特點體現(xiàn)在依托用戶畫像進行智能預約、主題活動的組織及開展。
空間智能預約通過對傳統(tǒng)預約系統(tǒng)的改進,將周期性智庫服務的內(nèi)容及服務人員特點體現(xiàn)在預約信息中,通過用戶對場地、服務內(nèi)容、服務人員的預約及使用行為、意見反饋等數(shù)據(jù)提取特征進行用戶畫像,并利用深度學習技術挖掘用戶與資源的語義關聯(lián),建立語義相關性匹配模型,從而進行預約內(nèi)容、人員、時間的推薦。
主題活動基于大量用戶行為及屬性數(shù)據(jù)。通過從年級、專業(yè)、資源及服務受眾等維度的劃分,針對不同群體進行特征提取及用戶畫像,進而針對目標用戶組織名師講壇、系列培訓、閱讀推薦、知識競賽等專題主題活動。
醫(yī)學智庫是助力醫(yī)學學科發(fā)展、人才引進、教學實踐、臨床診斷、科研獎項申報的重要途徑,用戶畫像能有效促進智庫服務準確、深入和系統(tǒng)地展開,使之充分體現(xiàn)出“智慧”的特征。但隨著智庫發(fā)展帶來的用戶數(shù)據(jù)、知識資源、設備資源的快速增加,醫(yī)學智庫體系將面臨更大的挑戰(zhàn),不僅要有完善的智庫系統(tǒng)進行基礎數(shù)據(jù)的收集、實時用戶畫像及匹配算法的不斷優(yōu)化,還要有具備強大的數(shù)據(jù)處理及存儲能力的模塊,以確保大量異構數(shù)據(jù)及生物特征數(shù)據(jù)的高效存儲及處理。同時,生物識別技術在醫(yī)療及信息行業(yè)的逐步應用,也將促使人體生物特征成為用戶畫像的重要元素,由此帶來的用戶信息利用、開放與隱私保護也是需要不斷深入研究的問題。