楊彥榮,張 瑩
(1.西北農(nóng)林科技大學(xué)網(wǎng)絡(luò)與教育技術(shù)中心,楊凌 712100;2.西北農(nóng)林科技大學(xué)圖書館,楊凌 712100)
隨著互聯(lián)網(wǎng)和新一代信息技術(shù)的飛速發(fā)展,當(dāng)前人類社會(huì)已經(jīng)從信息時(shí)代步入數(shù)據(jù)時(shí)代,大數(shù)據(jù)已經(jīng)成為新時(shí)期信息技術(shù)和產(chǎn)業(yè)發(fā)展的重要方向。在大數(shù)據(jù)時(shí)代的背景下,用戶畫像作為描述目標(biāo)用戶特征,洞察用戶興趣需求,實(shí)現(xiàn)用戶個(gè)性化服務(wù)的重要工具,目前已廣泛應(yīng)用于各種電商平臺(tái)以及個(gè)性化的信息服務(wù)推送領(lǐng)域,尤其是在電商平臺(tái),用戶畫像能精準(zhǔn)了解和預(yù)測(cè)用戶需求以及定位客戶群體,受到商家和企業(yè)的日益關(guān)注。隨著網(wǎng)絡(luò)技術(shù)的進(jìn)步和信息化的推進(jìn),數(shù)字資源得到了迅速發(fā)展,高校圖書館的資源數(shù)據(jù)量呈爆炸式增長(zhǎng),浩瀚如煙的數(shù)字資源使得用戶產(chǎn)出了信息迷航。鑒于此,圖書館可通過用戶畫像技術(shù)了解用戶的需求,洞察用戶興趣以及個(gè)性化偏好等,以此為用戶提供個(gè)性化、精細(xì)化服務(wù),實(shí)現(xiàn)圖書館從信息服務(wù)向知識(shí)服務(wù)轉(zhuǎn)型。
交互設(shè)計(jì)鼻祖Alan Cooper在研究中最早提出用戶畫像并對(duì)這一概念給出了定義,他指出用戶畫像是通過不同的呈現(xiàn)方式對(duì)用戶真實(shí)數(shù)據(jù)的刻畫,是建立在一系列真實(shí)數(shù)據(jù)之上的目標(biāo)用戶模型[1]。簡(jiǎn)言之,利用各種數(shù)據(jù)挖掘技術(shù)采集并清洗用戶的社會(huì)屬性、生活習(xí)慣和消費(fèi)行為等信息,并通過標(biāo)簽映射的方式抽象出用戶畫像模型。文獻(xiàn)[2]等將用戶畫像描述為一種刻畫用戶需求和興趣偏好的形象集合。余孟杰[3]認(rèn)為用戶畫像是從對(duì)海量用戶數(shù)據(jù)中挖取出特定的,潛在的用戶信息,并以標(biāo)簽化的形式呈現(xiàn)出用戶全貌,用戶畫像是用戶信息面貌的虛擬刻畫,其目標(biāo)是實(shí)現(xiàn)精準(zhǔn)服務(wù)。隨著互聯(lián)網(wǎng)和大數(shù)據(jù)理念的深入,如何利用大數(shù)據(jù)實(shí)現(xiàn)精準(zhǔn)服務(wù)已成為企業(yè)日益關(guān)注的焦點(diǎn),用戶畫像作為一種了解和預(yù)測(cè)客戶、精準(zhǔn)定位客戶群體的有效工具,被廣泛應(yīng)用于社交網(wǎng)絡(luò)、金融、電子商務(wù)等領(lǐng)域。
David Travis認(rèn)為一個(gè)令人信服、全面、精準(zhǔn)化的用戶畫像應(yīng)具有基本性(Primary research)、真實(shí)性(Realistic)、目標(biāo)性(Objectives)、獨(dú)特性(Singular)、移情性(Empathy)、數(shù)量(Number)和應(yīng)用性(Applicable)7個(gè)基本條件[4]。文獻(xiàn)[5]認(rèn)為圖書館領(lǐng)域在以數(shù)據(jù)驅(qū)動(dòng)的主路線下,用戶畫像應(yīng)該滿足6個(gè)條件:時(shí)效性、可迭代性、交互性、區(qū)隔性、知識(shí)性以及聚類性。
隨著人工智能、大數(shù)據(jù)領(lǐng)域的悄然興起,圍繞用戶畫像的相關(guān)研究也相繼展開,并逐步成為眾多學(xué)者關(guān)注的熱點(diǎn)。用戶畫像研究在國(guó)外圖書館領(lǐng)域開展較早,在20世紀(jì)80年代,英國(guó)國(guó)家書目和Blaise-line通過對(duì)用戶地使用情況進(jìn)行相關(guān)性分析,并以此為依據(jù)對(duì)其服務(wù)進(jìn)行優(yōu)化[6]。用戶畫像技術(shù)算法是國(guó)外學(xué)者主要的研究方向,如統(tǒng)計(jì)分析、聚類分析算法、加權(quán)算法、分類算法、樸素貝葉斯網(wǎng)絡(luò)、深度學(xué)習(xí)方法等受到學(xué)者們的關(guān)注,不同的研究采用取不同的算法構(gòu)建用戶畫像模型,從而刻畫用戶顯性的特征和潛在的特征。
國(guó)內(nèi)圖書館領(lǐng)域?qū)τ脩舢嬒裱芯窟€起步發(fā)展階段,相關(guān)研究成果較少,并且大多研究還停留在理論階段。陳慧香[7]等人詳細(xì)闡述了用戶畫像的概念、特性以及作用,并深入分析了用戶畫像建模的相關(guān)算法與技術(shù)、框架模型設(shè)計(jì)及構(gòu)建流程,為圖書館基于用戶畫像的服務(wù)重新研究奠定了基礎(chǔ)。劉速[8]詳細(xì)闡述了天津圖書館用戶畫像構(gòu)建的具體方法和步驟,并對(duì)常用的用戶畫像分析方法,如用戶關(guān)系圖譜、多維度交叉分析、可視化統(tǒng)計(jì)描述等方法進(jìn)行了比較。潘宇光[9]將用戶畫像理論融入到構(gòu)建智慧圖書館的過程中,從圖書館的智慧構(gòu)建和智慧服務(wù)角度,提出用戶畫像的構(gòu)架與實(shí)現(xiàn)途徑。
用戶畫像在海量的用戶數(shù)據(jù)中產(chǎn)生和形成的,構(gòu)建用戶畫像是為了還原用戶信息,數(shù)據(jù)來源于所有用戶相關(guān)的數(shù)據(jù),因此數(shù)據(jù)源是構(gòu)建用戶畫像的基礎(chǔ)。隨著大數(shù)據(jù)技術(shù)的發(fā)展和應(yīng)用,圖書館各信息資源系統(tǒng)之間實(shí)現(xiàn)了互通互聯(lián),尤其是統(tǒng)一身份認(rèn)證的應(yīng)用,以及移動(dòng)終端的普及,給用戶帶來方便的同時(shí),也產(chǎn)生了異構(gòu)化、立體化和多樣化的數(shù)據(jù),豐富了用數(shù)據(jù)類型,拓展了用戶數(shù)據(jù)的來源。高校圖書館構(gòu)建用戶畫像的首要工作是確定數(shù)據(jù)源,圖書管理系統(tǒng)、書目檢索系統(tǒng)、圖書館網(wǎng)站、移動(dòng)圖書館等都是用戶數(shù)據(jù)的主要來源,用戶數(shù)據(jù)可分為相對(duì)穩(wěn)定的靜態(tài)信息數(shù)據(jù)和變化較快的動(dòng)態(tài)信息數(shù)據(jù)兩類。
標(biāo)簽是基于用戶數(shù)據(jù)分析后人為規(guī)定的高度精煉的用戶特征標(biāo)識(shí),人能很方便地理解每個(gè)標(biāo)簽含義,使模糊的用戶立體化、形象化。為用戶建立標(biāo)簽?zāi)P褪菢?gòu)建用戶畫像的核心工作和首要任務(wù),用戶標(biāo)簽建模就是對(duì)用戶的靜態(tài)信息數(shù)據(jù)和動(dòng)態(tài)信息數(shù)據(jù)進(jìn)行分析以及語(yǔ)義化抽象出,從而形成短文本化標(biāo)簽,再逐級(jí)分類形成基本信息、內(nèi)容偏好、行為特征、心理特征和社交網(wǎng)絡(luò)標(biāo)簽?zāi)P汀?/p>
用戶畫像構(gòu)建一般包含數(shù)據(jù)整合層、數(shù)據(jù)標(biāo)簽層以及畫像應(yīng)用層。數(shù)據(jù)整合層又可以分為數(shù)據(jù)采集和數(shù)據(jù)處理,通過對(duì)圖書館各種來源數(shù)據(jù)進(jìn)行采集,再進(jìn)行集成、轉(zhuǎn)換、歸約、清洗等預(yù)處理操作后形成原始數(shù)據(jù)庫(kù)文件。用戶畫像構(gòu)建的關(guān)鍵是數(shù)據(jù)標(biāo)簽層,通過對(duì)用戶信息進(jìn)行統(tǒng)計(jì)、分類、聚類分析等技術(shù),將用戶信息語(yǔ)義化和短文本化,以標(biāo)簽的形式呈現(xiàn)立體化的用戶形象。畫像應(yīng)用層是在建模結(jié)果分析的基礎(chǔ)上,采用不同的可視化技術(shù),將用戶各個(gè)維度的標(biāo)簽呈現(xiàn)出來。
高校圖書館個(gè)性化推薦服務(wù)已獲得了令人矚目的成績(jī),在提升資源推薦服務(wù)質(zhì)量及資源利用率方面已取得良好的效果。但在用戶需求感知方面,依然以傳統(tǒng)的用戶需求調(diào)研為主,以分析小體量結(jié)構(gòu)化數(shù)據(jù)分析用戶需求,難以精準(zhǔn)、全面刻畫用戶需求,因而可能導(dǎo)致個(gè)性化信息服務(wù)質(zhì)量差、效率低等問題。隨著大數(shù)據(jù)技術(shù)的深入發(fā)展,在用戶描述與建模上用戶畫像具有天然巨大有優(yōu)勢(shì),因而在分析用戶信息需求時(shí),通過構(gòu)建用戶畫像完成對(duì)用戶個(gè)人習(xí)慣以及興趣等內(nèi)在需求信息的刻畫,從而構(gòu)建起通往用戶興趣的橋梁,為個(gè)性化推薦服務(wù)提高數(shù)據(jù)基礎(chǔ)。
盜竊圖書、惡意下載資源、圖書超期、破壞公共環(huán)境及書刊污染等不良用戶行為時(shí)有發(fā)生,針對(duì)這些嚴(yán)重的用戶失信行為,圖書館往往采用警告或輕微罰款方式,其效果不是甚好,起不來威懾失信用戶的作用。用戶信用管理是抑制用戶失信現(xiàn)象的有效途徑之一,通過收集用戶數(shù)據(jù),分析用戶信用數(shù)據(jù),將用戶信用納入個(gè)人征信記錄,對(duì)高校圖書館不同層次用戶進(jìn)行信用評(píng)分分級(jí),建立用戶信用分級(jí)管理。對(duì)圖書館不同信用評(píng)分的用戶,賦予不同權(quán)限,并給予一定的獎(jiǎng)勵(lì)和處罰,可以優(yōu)化用戶管理,靈活服務(wù),促進(jìn)館藏資源利用。
高校圖書館可利用用戶畫像來了解用戶的整體興趣和需求走向,根據(jù)用戶使用圖書館資源的行為習(xí)慣,設(shè)計(jì)或調(diào)整圖書館資源的配置、空間布局、科學(xué)管理。高校圖書館管理層可借助用戶畫像技術(shù)及時(shí)發(fā)現(xiàn)用戶的特征信息和興趣偏好,掌握用戶需求的變化,從而為決策制定的科學(xué)合理性、高效性提供可靠的數(shù)據(jù)支持。