胡 婧,陳添源,詹慶東,林藝山
當前“賦能存量、做優(yōu)增量、把握變量”是高校圖書館(以下簡稱“高校館”)面向“十四五”規(guī)劃加強信息資源建設(shè)和業(yè)務(wù)創(chuàng)新的重要理念之一[1]。然而高校館在發(fā)展新用戶和開拓新服務(wù)的營銷服務(wù)過程中,存在用戶流失現(xiàn)象[2]。提升用戶留存成為高校館重要工作,該如何在存量和增量中提高用戶留存,防止用戶流失呢?有鑒于此,構(gòu)建適宜于高校館業(yè)務(wù)實踐的用戶留存分析框架和實證方法成為亟待解決的問題。而隨著高校館信息化建設(shè)加速,眾多業(yè)務(wù)平臺中存儲著大量的用戶行為數(shù)據(jù),借助大數(shù)據(jù)工具加強用戶行為分析,提升高校館的精準服務(wù),這種研究范式日益受到關(guān)注和認可。本文以此為出發(fā)點,以數(shù)據(jù)驅(qū)動模式開展用戶留存分析,從高校館的用戶行為數(shù)據(jù)中識別用戶留存行為特征,洞察用戶生命周期的每個階段或關(guān)鍵節(jié)點的用戶留存群體差異特征,進而制定分群營銷服務(wù)策略,以期為高校館提升用戶服務(wù)精準化水平提供借鑒。
綜合相關(guān)研究[3-4],用戶留存分析起源于經(jīng)濟學和管理學領(lǐng)域,用于定量分析用戶經(jīng)過一段時間仍舊繼續(xù)使用該產(chǎn)品或服務(wù)的行為,在給定的統(tǒng)計時間窗口內(nèi),留存用戶占新增用戶的比例即為用戶留存率,它是體現(xiàn)產(chǎn)品或服務(wù)是否具備可持續(xù)發(fā)展和用戶黏性的重要指標。傳統(tǒng)市場營銷中,業(yè)務(wù)增長重心在于獲取新用戶。隨著移動互聯(lián)網(wǎng)和大數(shù)據(jù)迅猛發(fā)展,用戶對同質(zhì)產(chǎn)品和服務(wù)的選擇和獲取途徑得到極大豐富,用戶流量紅利逐漸消失,用戶增長從“流量”轉(zhuǎn)變到“留量”,用戶留存率被視為用戶增長的關(guān)鍵指標[5],尤其忠誠用戶的留存行為特征被列入傳統(tǒng)平臺邁入轉(zhuǎn)型和升級的重要參照[6]。用戶留存分析陸續(xù)被運用于旅游網(wǎng)站[7]、學術(shù)虛擬社區(qū)[8]、移動App[9]等領(lǐng)域,學者們不斷探索運用各種模型或算法分析和識別用戶留存的關(guān)鍵行為特征??v觀既有研究,它們以用戶生命周期為主線,挖掘業(yè)務(wù)關(guān)鍵節(jié)點的用戶留存行為,推動用戶拉新、促活和留存,提高服務(wù)營銷收益。
高校館用戶留存研究集中在平臺服務(wù)、閱讀推廣和移動閱讀等。平臺服務(wù)方面,劉薇[10]調(diào)研廣州大學城13所高校館微信公眾號的用戶運營情況,探討提高用戶獲取、留存和活躍度的公眾號運營策略。閱讀推廣方面,任運月等[11]以閱讀推廣活動的用戶“拉新”“留存”“促活”作為目標維度,調(diào)查40所圖書館采用不同運營策略及其與實現(xiàn)目標的關(guān)系;戴和忠等[12]提出基于用戶閱讀行為的圖書質(zhì)量評測算法,將用戶留存數(shù)據(jù)作為重要指標。移動閱讀方面,鄭德俊等[13]、明均仁等[14]基于扎根理論設(shè)計用戶訪談,通過結(jié)構(gòu)方程模型分析影響“微信讀書”“超星移動圖書館”這兩個移動閱讀平臺用戶流失的主要因素,探討提升用戶留存率、預(yù)防用戶流失的對策;朱雅彬[15]在用戶調(diào)研基礎(chǔ)上,通過SVM算法識別移動圖書館用戶流失特征,提出用戶留存對策。
綜上所述,用戶留存作為衡量服務(wù)質(zhì)量和需求匹配度的核心指標,研究范式走向系統(tǒng)化,從單純統(tǒng)計分析發(fā)展到數(shù)據(jù)挖掘、模型深度運用。它聚焦了用戶生命周期的產(chǎn)品認知、用戶促活、留存與轉(zhuǎn)化等,這種以數(shù)據(jù)驅(qū)動結(jié)合業(yè)務(wù)場景和用戶行為特征來洞察用戶留存關(guān)鍵影響因素的研究模式契合圖書館提高精準服務(wù)水平的現(xiàn)實需要與轉(zhuǎn)型探索,可以為開展精準化服務(wù)帶來基于數(shù)據(jù)驅(qū)動的輔助決策。但是,高校館用戶留存研究還停留在引入相關(guān)概念對服務(wù)方式展開定性分析;定量實證方面,更多是基于主觀意識層面的訪談和調(diào)研;僅有的基于用戶行為分析也只是將用戶留存作為評測圖書質(zhì)量的一個指標。此外,多從用戶流失角度出發(fā),反向探討提高用戶留存的策略,鮮有從用戶留存分析角度展開,也未有文獻利用數(shù)據(jù)尋找影響用戶留存的核心要素和分群開展精準營銷的方法。鑒于此,本研究嘗試以高校館的戰(zhàn)略目標和業(yè)務(wù)服務(wù)場景為出發(fā)點,以數(shù)據(jù)驅(qū)動用戶增長的研究視角構(gòu)建圖書館業(yè)務(wù)情境下的用戶留存分析框架,并選取具備全量數(shù)據(jù)特征的典型業(yè)務(wù)實踐作為實證研究對象,探索基于用戶行為數(shù)據(jù)的留存行為特征識別和用戶分群,為高校館在資源與服務(wù)定位、用戶維系和創(chuàng)新服務(wù)等方面提供精準化服務(wù)的決策輔助。
用戶留存貫穿于用戶與產(chǎn)品或服務(wù)交互的全過程。在用戶生命周期的不同階段均有用戶留存的關(guān)鍵行為特征。為識別和區(qū)分不同生命周期階段的用戶留存,典型分析框架采用同期群分析算法(Cohort Analysis)[16],以具有某種共同的行為特征、同處于某一相同時期兩個維度進行用戶識別,具備這兩個特征的用戶稱為一個同期群。
確定時間劃分標準是同期群分析的關(guān)鍵,各領(lǐng)域根據(jù)用戶在服務(wù)場景中的交互特征確立分期時間標準,如互聯(lián)網(wǎng)營銷用戶留存時間劃分通常有次日留存、7日留存和五周留存3類[17]。然而在大數(shù)據(jù)環(huán)境下,區(qū)分不同用戶的需求和行為特征更多是通過消費者的具體行為和建立新的以用戶生命周期為基礎(chǔ)的模型來完成分析。以行為數(shù)據(jù)變動并動態(tài)修正的NES模型[18]認為,可以通過用戶產(chǎn)品使用周期,將用戶類型分為新用戶N(New Customer)、主力用戶E(Existing Customer)和睡眠用戶S(Sleep Customer)等時長區(qū)間。其中睡眠用戶可動態(tài)分級為瞌睡用戶S1、半睡用戶S2及沉睡用戶S3等時長。故此,基于高校館用戶服務(wù)的實際業(yè)務(wù)場景,本文將同期群分析與NES模型的大數(shù)據(jù)營銷模式相結(jié)合,基于數(shù)據(jù)驅(qū)動識別和劃分不同的用戶留存區(qū)間值。
開展用戶留存分析的最終目標是實現(xiàn)分群的精準化營銷,提升服務(wù)效益。精準化營銷的前提是基于數(shù)據(jù)挖掘的用戶細分。因此,基于數(shù)據(jù)驅(qū)動的用戶留存分析需要在用戶行為數(shù)據(jù)集分析的基礎(chǔ)上建立用戶留存分群標準,結(jié)合業(yè)務(wù)場景進一步描述和分析影響用戶留存的行為指標體系。在用戶細分研究領(lǐng)域,RFM模型是經(jīng)典的基于數(shù)據(jù)分析的用戶分群模型,通過R(Recency,最近一次消費)、F(Frequency,消費頻率)、M(Monetary,消費金額)3個指標的組合來劃分用戶群體,是衡量用戶價值的重要工具[19]。該模型廣泛應(yīng)用于客戶關(guān)系管理分析,并在使用過程中衍生出眾多改進的RFM模型。在圖書館領(lǐng)域,對RFM模型的改進主要用于熱門圖書評價[20]、圖書館用戶畫像[21]等研究。為有效描述圖書館各項業(yè)務(wù)的用戶留存關(guān)鍵行為要素,本研究將以RFM模型為指標體系基礎(chǔ),結(jié)合用戶生命周期和服務(wù)復(fù)用周期等行為特征進行指標重構(gòu),從而全面描述圖書館服務(wù)的用戶留存行為標簽體系。
在確立同期群分析的區(qū)間劃分之后,根據(jù)高校館業(yè)務(wù)場景和可獲取的用戶行為特征構(gòu)建數(shù)據(jù)驅(qū)動的用戶留存分析框架,見圖1。在該分析框架中,以高校館提升各項服務(wù)的用戶留存率為戰(zhàn)略目標,根據(jù)業(yè)務(wù)服務(wù)目標自上而下分解用戶留存行為的核心指標,繼而對接業(yè)務(wù)系統(tǒng)平臺定義和抽取數(shù)據(jù)字段;然后,采集、清洗和存儲與此相關(guān)的用戶行為數(shù)據(jù),以同期群分析法劃分和確立用戶留存區(qū)間范圍,繼而以用戶價值模型為基礎(chǔ)重構(gòu)用戶留存的行為標簽體系;采用聚類分析探究不同用戶留存群體的分群和特征差異,最后討論不同分群的留存行為特征及與其相適宜的營銷服務(wù)策略。
圖1 高校圖書館的用戶留存實證分析框架
為描述不同用戶留存階段的行為特征,從用戶維系、用戶忠誠和用戶價值等視角出發(fā),以衡量用戶價值的RFM模型作為指標體系基礎(chǔ),將用戶生命周期和服務(wù)復(fù)用周期融入RFM模型進行指標重構(gòu),組成用戶留存行為標簽體系。指標R為用戶最近一次使用圖書館該項服務(wù)的時間,指標F為用戶在選定時間段內(nèi)使用該項服務(wù)的次數(shù),這兩項指標的變化體現(xiàn)用戶留存行為的異動狀況;指標M改造為指標C,衡量用戶使用該項服務(wù)付出的等待時間成本;新加入的指標L(用戶生命周期)體現(xiàn)用戶的服務(wù)忠誠度,表征用戶與服務(wù)之間的黏性;指標S(服務(wù)復(fù)用周期)則體現(xiàn)用戶二次使用服務(wù)的時間間隔,是衡量用戶留存行為的關(guān)鍵指標和開展營銷服務(wù)的最佳時間節(jié)點。最終的用戶留存行為標簽體系如圖2所示。
圖2 高校圖書館用戶留存行為指標的RFCLS體系
本文選取一站式資源檢索平臺——福建省高校數(shù)字圖書館(以下簡稱“FULink”)文獻提供系統(tǒng)為用戶留存分析的實證對象,該平臺整合了課題組所在館的館藏數(shù)字資源,通過共建共享模式向用戶提供一站式的資源檢索、瀏覽和文獻提供服務(wù),是用戶獲取各類學術(shù)資源的重要入口,支持用戶快速獲取館藏的各類數(shù)字資源,也提供缺藏資源的文獻提供服務(wù)。以此平臺開展基于數(shù)據(jù)驅(qū)動的用戶留存分析實證研究,既是探索提升平臺使用率、用戶復(fù)用率以及服務(wù)可持續(xù)發(fā)展的重要途徑之一,也能發(fā)現(xiàn)和獲取影響平臺可持續(xù)增長的關(guān)鍵因素。根據(jù)圖1的用戶留存分析框架,在平臺日志系統(tǒng)采集用戶行為的全量數(shù)據(jù),通過基于NES模型的同期群分析法和圖2所示的RFCLS行為標簽體系識別和獲取用戶留存行為的特征數(shù)據(jù),據(jù)此分析和討論契合于不同用戶留存階段的營銷服務(wù)策略。
根據(jù)文獻提供服務(wù)的業(yè)務(wù)流程,通過Web開發(fā)者工具抓取FULink的日志頁面,對每條行為數(shù)據(jù)進行HTML代碼解析,以用戶留存分析的數(shù)據(jù)集需求設(shè)計10個存儲字段。字段分為兩類:一是文獻申請用戶的行為信息,包含申請ID、申請郵箱、申請時間、申請標題和申請文獻類型;二是文獻提供的響應(yīng)信息,包含響應(yīng)狀態(tài)、響應(yīng)題名、響應(yīng)成員館、響應(yīng)時間和響應(yīng)文獻類型。為獲取上述確立的文獻提供服務(wù)相關(guān)字段數(shù)據(jù)集,通過編寫爬蟲代碼,調(diào)用xml2和rvest函數(shù)包將獲取的行為數(shù)據(jù)逐條按照字段爬取,利用cbnid函數(shù)組配為數(shù)據(jù)框(DataFrame)格式,依次采集和導(dǎo)入到MySQL數(shù)據(jù)庫存儲。對各字段進行缺失值、異常值、空值處理及字段類型轉(zhuǎn)換,共獲取近5年(2016-2020)38,126名用戶文獻申請共計458,035條。
在Jupyter Notebook數(shù)據(jù)分析平臺上連接MySQL數(shù)據(jù)庫讀取用戶行為數(shù)據(jù),以用戶名為關(guān)鍵詞索引統(tǒng)計文獻申請數(shù)來看,四分位數(shù)為(1,2,8,6363),均值13大于Q3分位數(shù)8,這說明總體差異較大,存在部分文獻服務(wù)需求極強的用戶。而從每篇文獻的響應(yīng)時效來看,其統(tǒng)計四分位數(shù)為(3,5,6,7474),均值12(小時)遠大于Q3分位數(shù)6,說明響應(yīng)時效總體差異較大,大部分的文獻響應(yīng)時效有待提升。以每個自然月為觀察窗口,計算每月文獻提供數(shù)量和月增長率并繪制增長曲線,如圖3所示,文獻提供數(shù)量和月增長率均呈季節(jié)性波動變化且逐步下降。
圖3 FULink文獻提供服務(wù)的月增長率及每月文獻提供數(shù)量曲線圖
在用戶行為數(shù)據(jù)集通過計算增加“用戶初次使用時間”“最后一次使用時間”兩個字段,相減獲取本次實證時間統(tǒng)計窗口內(nèi)每個用戶的生命周期值。對數(shù)據(jù)集以用戶名和申請文獻日期為索引組合升序排序,對每個用戶依次統(tǒng)計其首次使用日期,新增FirstRequestDate列加入數(shù)據(jù)集。新增RetentionDays字段用于存放下一條文獻提供記錄的申請日期與FirstRequestDate字段的時間差值,并轉(zhuǎn)換為天數(shù),即為每個用戶的服務(wù)復(fù)用周期值。其均值、四分位數(shù)等數(shù)據(jù)特征見表1。
表1 FULink文獻提供服務(wù)的用戶生命周期和服務(wù)復(fù)用周期的值分布(單位:天)
從表1第二列看出,用戶生命周期均值為181天,中位數(shù)為3天,說明部分生命周期很長的忠實用戶拉高均值。生命周期值為0天的用戶占46.7%,這部分用戶沒有留存,僅使用一次服務(wù)就流失了。去除這部分用戶比例,用戶生命周期均值為339天。匯總留存用戶的生命周期值分布發(fā)現(xiàn),1-90天用戶數(shù)占比35%,遠高于90-181天的12%;37%用戶的生命周期集中在0.5-2年,屬于較高質(zhì)量客戶;生命周期在2年以上有15.8%的用戶群體,他們擁有極高的用戶粘性。
從表1第三列看出,用戶服務(wù)復(fù)用周期均值為92天,中位數(shù)為45天,說明大部分用戶的服務(wù)復(fù)用時間間隔集中在1.5個月以內(nèi)。進一步統(tǒng)計,32.7%用戶集中在1-7天,52.5%用戶集中在17天(Q1分位數(shù)),說明大部分的用戶在半個月左右會再次使用文獻提供服務(wù)。
根據(jù)NES理論,以45天為文獻提供服務(wù)的復(fù)用周期單元值,結(jié)合實際使用場景分為新用戶、存量用戶和沉睡用戶等不同時長區(qū)間,存量用戶區(qū)間還細分為主力用戶E0、瞌睡用戶S1和半沉睡用戶S2等不同周期值,其NES周期值分布情況見表2。
表2 FULink文獻提供服務(wù)的用戶NES周期值分布
根據(jù)前述確立用戶留存分析的框架思路,將用戶生命周期和服務(wù)復(fù)用NES周期各區(qū)間時長值相結(jié)合按時序排列,確立以(0,7,30,45,60,90,180,242,365,1462)為初始留存區(qū)間端點,通過同期群分析計算用戶的留存區(qū)間分布情況。左側(cè)閉區(qū)間表示全為使用2次及以上的留存用戶。留存區(qū)間計算過程如下:利用Pandas的數(shù)據(jù)分箱cut函數(shù)對RetentionDays字段依次進行(0,7,30,45,60,90,180,242,365,1462)的同期群留存區(qū)間統(tǒng)計,統(tǒng)計結(jié)果如表3所示。從表3來看,文獻提供服務(wù)的年留存率達到35%。除周留存率和月留存率相對穩(wěn)定之外,其余區(qū)間的用戶留存率處于波動變化中,留存率最低降到13.1%,但文獻申請均值最高增長到19篇。其中,主力用戶E0區(qū)間的留存率整體較低,瞌睡用戶S1區(qū)間的留存率最高,這說明可以在上述這些用戶留存區(qū)間節(jié)點上探索通過各種用戶促活手段來提升用戶留存率的途徑。
表3 用戶留存區(qū)間的各項留存指標值
3.5.1 數(shù)據(jù)獲取
依據(jù)前述構(gòu)建的文獻提供服務(wù)用戶留存行為標簽體系RFCLS,對每個指標的用戶行為數(shù)據(jù)獲取定義如表4所示。指標R通過統(tǒng)計其最后一次文獻獲取時間再與時間窗口截止日期進行相減來獲取,指標F利用統(tǒng)計函數(shù)sum()對各時間窗口期的每個用戶的文獻獲取數(shù)量進行求和,指標C則通過匯總計算每個用戶的平均等待時間成本來獲取,指標L通過計算用戶首末兩次文獻獲取時間的差值來獲取,其中同一天多次使用視為一次。指標S的數(shù)據(jù)獲取方法是以用戶名為索引,按照升序排序后計算服務(wù)復(fù)用的間隔天數(shù)。這5個指標從用戶留存意愿、用戶粘性、使用頻次、用戶沉沒成本和服務(wù)復(fù)用等方面描述文獻提供服務(wù)的用戶留存特征。
表4 文獻提供服務(wù)的用戶留存行為指標定義
3.5.2 聚類分析
根據(jù)用戶留存行為指標體系,對現(xiàn)有數(shù)據(jù)集按設(shè)計字段抽取相應(yīng)數(shù)據(jù)匯聚成每個用戶的留存行為特征集,在Jupyter Notebook平臺連接MySQL導(dǎo)入數(shù)據(jù)并展開聚類前的描述性統(tǒng)計分析,見表5。各行為指標數(shù)值的標準方差和均值較大,呈現(xiàn)右偏態(tài)分布。通過Corr函數(shù)對上述5個行為指標進行相關(guān)性分析,各變量之間相關(guān)系數(shù)均<0.4,變量之間獨立,非常適宜采用Kmeans聚類分析。從表5看,個別指標變量取值差異較大。為取消量綱不一致的影響,采用Standard Scaler函數(shù)對所有待聚類數(shù)據(jù)標準化和歸一化處理,通過縮放特征達到最終聚類結(jié)果的量綱一致。
表5 用戶留存行為指標變量描述性統(tǒng)計(2016.01-2019.12)
Kmeans聚類是一種無監(jiān)督學習的算法,考慮到實證數(shù)據(jù)集存在右偏態(tài)分布,易產(chǎn)生極值離群點干擾。為確保實證聚類結(jié)果輔助業(yè)務(wù)決策的可行性,參照相關(guān)聚類分析,采用多次使用隨機種子確定待選的簇數(shù),以Elbow肘曲線法結(jié)合輪廓系數(shù)(Silhouette Coefficient)評價方式共同確立最佳聚類[22]。采用機器學習Scikit-learn庫的Kmeans算法,初始設(shè)定聚類個數(shù)為2~9,模型運算結(jié)果見圖4(a)。隨著K值遞增,最佳聚類數(shù)為3~9個,而通過輪廓系數(shù)發(fā)現(xiàn)K=4時,silhouette score為0.4。圖4(b)顯示,除第一個聚類少量樣本的輪廓系數(shù)<0,整體聚類結(jié)果的分離度較好。故此,本次實證選取聚類個數(shù)K=4。
圖4 Kmeans聚類分析的Eblow肘方法及輪廓系數(shù)評價結(jié)果圖
3.5.3 群體差異分析
經(jīng)Kmeans聚類分析后,根據(jù)用戶在RFCLS五個留存行為指標的特征差異命名4個聚類群,聚類結(jié)果的中心值見表6。在Jupyter Notebook平臺通過statsmodels庫中的anova_lm函數(shù)對4個聚類群體展開方差分析,5個用戶留存行為指標均存在顯著差異。在同期群分析獲取的各區(qū)間段上,周留存、當月留存、90天留存和半年留存等區(qū)間均存在顯著差異。從表6所顯示的最終聚類中心看出,聚類影響較大的指標C、指標F和指標S等3個行為指標對于聚類劃分起著顯著的分群作用。上述5個用戶留存行為指標的分析結(jié)果可以用雷達圖(見圖5)表示出來。
表6 文獻提供服務(wù)不同用戶留存群體的最終聚類中心
圖5 FULink文獻提供服務(wù)用戶留存群體的行為指標雷達圖
實證結(jié)果表明,F(xiàn)ULink文獻提供服務(wù)的文獻數(shù)量和月增長率均呈季節(jié)性逐步下降,年用戶留存率35%,統(tǒng)計時間窗口內(nèi)的用戶生命周期為1年左右?;贜ES理論分析的服務(wù)復(fù)用周期分布規(guī)律顯示,周留存、月留存、半年留存等區(qū)間是提升用戶留存率的最佳節(jié)點。研究數(shù)據(jù)表明,用戶留存提高5%,服務(wù)收益就會提高25%[23]。本次實證分析顯示,用戶留存曲線的持續(xù)走低,說明該資源服務(wù)平臺與用戶需求的匹配已出現(xiàn)不平衡,急需根據(jù)不同用戶留存群體的特征差異實施精準化營銷服務(wù)。故此,對上述4個聚類展開用戶留存群體的特征畫像描述,繼而討論與之相適宜的營銷服務(wù)策略。
此類用戶留存群體占比最大,屬于新用戶類型,RFCLS等5個指標的聚類中心特征值較低,用戶生命周期均值為180天,32.7%用戶生命周期在半年以上。周留存率為37.8%,月留存率為34.5%,文獻數(shù)的均值為57篇,響應(yīng)時效均值為13小時。從用戶服務(wù)復(fù)用的時間區(qū)域分布看,間隔15天用戶占比50%,隨后就進入睡眠狀態(tài)或者直接流失,該群體在本次實證時間窗口內(nèi)用戶留存率為10%。而通過對已獲取文獻的學科主題展開文本匯聚挖掘,中文文獻需求集中于“計算機科學、土木工程、電子商務(wù)、物流、物聯(lián)網(wǎng)、供應(yīng)鏈、復(fù)合材料”等研究領(lǐng)域,英文文獻需求集中于“智能控制、心理學、微生物、分析化學”等研究領(lǐng)域。
拉新用戶群的顯著特征為快速下降的用戶留存率,應(yīng)圍繞周留存、15天留存和月留存等關(guān)鍵節(jié)點實施服務(wù)營銷,加強核心服務(wù)功能的使用引導(dǎo)和用戶交互的及時反饋,觸發(fā)用戶完成關(guān)鍵行為,激活用戶認可服務(wù)的核心價值。例如通過開拓用戶成長的積分增長體系不斷激發(fā)用戶對平臺的使用,持續(xù)滿足用戶在資源獲取服務(wù)場景中的使用需求,解決用戶在其他同質(zhì)平臺獲取缺藏資源的時效痛點,推動拉新用戶向平穩(wěn)留存群轉(zhuǎn)化。
此類用戶群屬于存量用戶類型,指標L和指標S聚類中心特征值較高,服務(wù)復(fù)用的間隔時間均在223天以后,生命周期均值為2年,可見該用戶群體的活躍度較低。文獻數(shù)的均值為69篇,響應(yīng)時效均值為9小時。相較于拉新用戶群,這兩個指標均有提升,而且該群體在實證時間窗口內(nèi)用戶留存率為88%。對篇名、文獻類型等挖掘匯聚顯示,中外文獻數(shù)量比例為2∶1,期刊論文、學位論文等文獻類型需求較多,“人工智能、土木工程、云計算、物聯(lián)網(wǎng)、公共管理、化學化工”等研究領(lǐng)域的文獻居多。
基于“留存率高、活躍度低”的留存行為特征,應(yīng)采用用戶激勵和提高互動的促活營銷策略提升用戶留存率。例如在各類資源服務(wù)場景中提供多種用戶接觸點,強化核心功能指引和觸發(fā)服務(wù)復(fù)用頻次,培養(yǎng)用戶的使用習慣和平臺功能發(fā)掘的能力,輔助簽到、積分和等級成長等用戶激勵機制提高活躍度,讓用戶一有資源獲取需求就立即聯(lián)想到平臺,推動用戶向平穩(wěn)留存群轉(zhuǎn)化。
此類用戶群屬于忠誠用戶類型,指標R、指標F和指標L聚類中心特征值較高,用戶生命周期均值為2.6年,文獻數(shù)的均值為362篇,服務(wù)復(fù)用間隔時間為39天,響應(yīng)時效均值為13小時,用戶活躍度最高,該分群在本次實證時間窗口內(nèi)用戶留存率為95%。對篇名、文獻類型等挖掘匯聚顯示,中外文獻數(shù)量比例為4∶1,期刊論文、學位論文、電子圖書等文獻類型需求最多,研究領(lǐng)域集中在“土木工程、材料科學與工程、產(chǎn)業(yè)經(jīng)濟、大數(shù)據(jù)、物聯(lián)網(wǎng)、算法模型、化學化工”等。
上述留存行為指標表明該群體形成了較好的價值感知和品牌忠誠。但優(yōu)化用戶體驗和擴展多元化的服務(wù)場景,沉淀用戶儲值成本和滿足個性化需求,才能提升服務(wù)品牌力和用戶忠誠度,進而減少用戶流失。對于平穩(wěn)留存的忠誠用戶群體,持續(xù)提升文獻響應(yīng)時效是第一要素,并將一站式檢索、資源整合揭示、文獻分析與可視化等功能深度融入其資源獲取情境之中,根據(jù)用戶訪談、問卷調(diào)研等形式獲取新功能需求,做好功能迭代與平臺升級,持續(xù)輸出服務(wù)價值才能保持用戶留存。
此類用戶群屬于易流失用戶類型,指標R聚類中心特征值最大,服務(wù)復(fù)用間隔時間為33天,其中(365,1462]區(qū)間僅有30%,生命周期均值為1.1年,響應(yīng)時效均值為386小時,但是文獻數(shù)的均值為88篇,這說明該聚類群體的短期文獻獲取需求強烈,響應(yīng)時效均值較長引起用戶流失,該群體在本次實證時間窗口內(nèi)用戶留存率為29.3%。挖掘匯聚顯示,中外文獻數(shù)量比例為3∶1,期刊論文和學位論文等文獻類型需求最多,研究領(lǐng)域集中在“化工材料、企業(yè)管理、跨境電商、知識產(chǎn)權(quán)”等。
上述流失用戶群的留存行為特征表明該群體存在短期獲取數(shù)字資源的需求,且集中于周留存和月留存區(qū)間,文獻響應(yīng)時效差的比例較高。故此,可以根據(jù)該群體的學科資源需求特征制定針對性的分組用戶召回策略。例如統(tǒng)計分析響應(yīng)時效差的文獻學科屬性,及時擴充相應(yīng)學科領(lǐng)域的數(shù)字資源,優(yōu)化響應(yīng)時效,在開展學科服務(wù)中側(cè)重文獻提供服務(wù)的場景復(fù)現(xiàn)和服務(wù)引導(dǎo),喚醒用戶對核心服務(wù)價值的再認知,減緩用戶留存率下降的態(tài)勢。
結(jié)合數(shù)據(jù)驅(qū)動的用戶留存實證,通過用戶生命周期和服務(wù)復(fù)用特征挖掘、基于NES理論的同期群分析、RFM模型指標重構(gòu)及K-Means聚類分析等一系列數(shù)據(jù)分析方法將高校館數(shù)字資源服務(wù)的用戶留存群體劃分為拉新用戶群、選擇留存群、平穩(wěn)留存群和流失用戶群,識別和分析了影響用戶可持續(xù)增長的留存行為指標,從服務(wù)場景定位、平臺功能升級和用戶激勵等角度給出了相適宜的營銷服務(wù)發(fā)展策略。構(gòu)建的用戶留存分析框架為高校館業(yè)務(wù)實踐開展差異化精準服務(wù)、有針對性地分配服務(wù)資源、更精準地達成戰(zhàn)略目標提供更為精準化的數(shù)據(jù)支撐和決策建議。
本研究仍具有一定的局限性:一是雖然從后臺日志采集了文獻提供服務(wù)的用戶行為全量數(shù)據(jù),保證了各項分析和用戶留存結(jié)果的普適性。但是,由于平臺尚缺乏用戶身份的認證管理,本次實證獲取的用戶留存行為特征較為有限。未來,用戶留存分析框架仍需進一步采集和補充用戶在其他高校館業(yè)務(wù)平臺中更為豐富的留存行為,從而增強用戶留存分析在支撐高校館精準營銷服務(wù)方面的適用性。二是本次實證獲取的用戶留存和營銷服務(wù)策略建議,還需借助后續(xù)平臺功能拓展、用戶行為數(shù)據(jù)跟蹤、模型迭代修正和疊加增量數(shù)據(jù)等方式不斷驗證用戶留存分析支撐高校館用戶增長的合理性和有效性。