蔡明成,范守城,楊 艷,王家喜,袁術(shù)平
(重慶生產(chǎn)力促進中心,重慶 401147)
1999 年,福建省南平市為解決“三農(nóng)”問題創(chuàng)建了以科技特派員為主題的新型農(nóng)村科技服務(wù)體制機制。20多年來,科技特派員以“做給農(nóng)民看、帶著農(nóng)民干、幫著農(nóng)民賺”的方式深入農(nóng)民生產(chǎn)生活,成為了農(nóng)村創(chuàng)新創(chuàng)業(yè)的主體和農(nóng)村科技服務(wù)的主力軍之一。2022 年,中央一號文件再次明確提出“深入推行科技特派員制度”,同時強調(diào)“推進智慧農(nóng)業(yè)發(fā)展”“著眼解決實際問題,拓展農(nóng)業(yè)農(nóng)村大數(shù)據(jù)應(yīng)用場景”。因此,在邁進大力推進農(nóng)業(yè)農(nóng)村高質(zhì)量發(fā)展,全面實施鄉(xiāng)村全面振興的新時期,進一步壯大科技特派員隊伍,提高科技服務(wù)水平,做好科技助農(nóng)興農(nóng),是推動農(nóng)業(yè)科技創(chuàng)新的重要助力。
如今,科技服務(wù)進入大數(shù)據(jù)時代,面臨著關(guān)鍵信息難以識別、數(shù)據(jù)缺乏關(guān)聯(lián)、人工依賴度高等難題。如何利用大數(shù)據(jù)提高科技服務(wù)的智能化、精準(zhǔn)化水平是需要解決的重要方面之一。用戶畫像作為一種數(shù)據(jù)分析手段,可精準(zhǔn)分析用戶特征,成為近幾年來較為熱門的數(shù)據(jù)分析工具[1]??梢灶A(yù)見,隨著大數(shù)據(jù)的不斷應(yīng)用,用戶畫像應(yīng)用于科技特派員服務(wù)領(lǐng)域,有利于科技特派員精準(zhǔn)對接、農(nóng)業(yè)技術(shù)、農(nóng)業(yè)信息精準(zhǔn)推送,以及農(nóng)產(chǎn)品的精準(zhǔn)營銷等。然而,在科技特派員服務(wù)領(lǐng)域中,用戶畫像技術(shù)的研究較為缺乏,相關(guān)的實踐應(yīng)用也較少。本文介紹用戶畫像的概念,梳理該技術(shù)的主要實現(xiàn)流程,綜述用戶畫像在科技特派員科技服務(wù)領(lǐng)域的應(yīng)用,以期為該技術(shù)的研究與進一步應(yīng)用提供重要思路。
用戶畫像的基礎(chǔ)源于深入挖掘的用戶大數(shù)據(jù),是對用戶數(shù)據(jù)特征的真實反映[2]。隨著用戶畫像技術(shù)的更迭與應(yīng)用拓展,其定義得到了補充,認為用戶畫像不僅可作為單個用戶的標(biāo)簽化,也是包含大量用戶信息的一個集合,可代表群體用戶的偏好。此外,隨著大數(shù)據(jù)技術(shù)的發(fā)展,用戶畫像出現(xiàn)了新的內(nèi)涵。有研究認為,用戶畫像是基于大數(shù)據(jù)的數(shù)學(xué)模型,是將現(xiàn)實用戶的抽象化體現(xiàn),其主要核心內(nèi)容是構(gòu)建用戶標(biāo)簽體系。另一方面,用戶畫像是將大數(shù)據(jù)技術(shù)和用戶數(shù)據(jù)進行有效連接,提取用戶的特征屬性并將其標(biāo)簽化,每個標(biāo)簽代表用戶的一種維度,所構(gòu)建的用戶模型由全部標(biāo)簽共同進行描述[3]。
用戶畫像的特征主要包括基本性、真實性、同理性、獨特性、目標(biāo)性和應(yīng)用性[4]。針對不同的時期和不同學(xué)科領(lǐng)域來說,對用戶畫像的特征理解存在一定的差異,但是其特征核心是保持一致的。例如,徐芳等研究認為,在以用戶實際信息數(shù)據(jù)為基礎(chǔ)構(gòu)建的虛擬畫像模型中,具備了全面性、代表性及真實性等特征[5]。
用戶畫像的實現(xiàn)包括數(shù)據(jù)收集、用戶畫像模型構(gòu)建、畫像更新三個方面,其過程如圖1所示。
圖1 用戶畫像實現(xiàn)過程
1.2.1 數(shù)據(jù)收集
用戶畫像構(gòu)建的基礎(chǔ)工作是用戶多維度的信息數(shù)據(jù)收集,其中數(shù)據(jù)的完整程度和有效性是影響畫像模型是否精準(zhǔn)的重要因素?,F(xiàn)有的數(shù)據(jù)收集方式多樣,例如可以通過深度訪談、問卷調(diào)查直接獲取,但這種方式較繁瑣且無法持續(xù)更新;另外,可以通過編寫程序或數(shù)據(jù)采集器進行數(shù)據(jù)爬取,其優(yōu)點是時效性較強并且非結(jié)構(gòu)化。另外,對于挖掘到的用戶數(shù)據(jù),通常會分為2 大類,即用戶維度和領(lǐng)域維度。其中,用戶維度主要包括用戶的人口統(tǒng)計信息,如姓名、年齡等,一般可在用戶的注冊或申請信息中獲得穩(wěn)定的相關(guān)數(shù)據(jù);領(lǐng)域相關(guān)數(shù)據(jù)主要由用戶的職業(yè)行為、心理、興趣等組成(見圖2),存在數(shù)據(jù)量大、變化快等特點,需對其進行階段性更新。
圖2 用戶數(shù)據(jù)的分類
1.2.2 用戶畫像的模型構(gòu)建
已有研究表明,用戶畫像的構(gòu)建方法可分為基于統(tǒng)計方法的建模和基于模型的建模?;诮y(tǒng)計的建模是以數(shù)學(xué)方法為基礎(chǔ),對收集的各種數(shù)據(jù)(或數(shù)據(jù)占比)進行量化處理,隨后針對量化后的各項指標(biāo)進行分析。如Beneventuto 等利用統(tǒng)計方法對社交網(wǎng)絡(luò)用戶進行分析,分別對網(wǎng)絡(luò)會話的間隔時間和會話長度分布進行最佳擬合,并對各網(wǎng)絡(luò)用戶的活動頻率進行分析,進一步揭示個人對其他用戶相關(guān)資料(如簡歷、照片、視頻等)的訪問頻次[6]。陳錦輝利用高校學(xué)生的基本屬性、行為特征等數(shù)據(jù),統(tǒng)計分析了不同特征的用戶數(shù)量及分布,建立了高校學(xué)生用戶畫像系統(tǒng)[7]。如今,基于模型構(gòu)建用戶畫像運用更多,如利用向量空間模型、貝葉斯網(wǎng)絡(luò)等來進行建模,其優(yōu)勢是在結(jié)構(gòu)化數(shù)據(jù)的基礎(chǔ)上,可實現(xiàn)對非結(jié)構(gòu)化數(shù)據(jù)的更深入分析,構(gòu)建全面、精準(zhǔn)的用戶畫像模型。然而,基于模型構(gòu)建的用戶畫像存在擴展性相對較低的缺點,且易受數(shù)據(jù)稀疏性的影響,可能出現(xiàn)結(jié)果的偏差。因此,對用戶畫像模型的構(gòu)建還需要深入研究,也具有巨大的潛力。
1.2.3 用戶畫像的動態(tài)更新
在用戶畫像過程中,離線數(shù)據(jù)僅能對用戶短期內(nèi)的偏好進行統(tǒng)計,導(dǎo)致用戶畫像出現(xiàn)偏差。因此,針對不斷更新、增多的數(shù)據(jù)量,通常采用基于以往衰減規(guī)律、基于時間窗口或基于反饋等方法用于用戶畫像更新。如郝水龍在基于層次向量空間模型的研究中,設(shè)計了用戶興趣模型表示和實時更新機制,并且在已有的研究基礎(chǔ)上,設(shè)計并改進了針對用戶興趣的自適應(yīng)機制,最終實現(xiàn)了用戶興趣的動態(tài)實時更新[8]。而王穎舒等建立了增量數(shù)據(jù)實現(xiàn)模型,依據(jù)其算法規(guī)則,存儲并生成了不同版本的用于興趣偏好模型,以此為基礎(chǔ)用于興趣模型的更新計算,從而達到用戶畫像更新的目的[9]。
目前,尚未有以科技特派員大數(shù)據(jù)為基礎(chǔ)的用戶畫像研究,但針對科技專家的畫像研究較多。如陳文俊等以專家畫像在評標(biāo)管理中的應(yīng)用為背景,對專家畫像評價維度和各個維度的評價標(biāo)準(zhǔn)進行量化,可基本反映專家的特性,且具有較好實用性[10]。另外,在專家同行評議推薦中,聶志璇通過網(wǎng)絡(luò)爬取專家相關(guān)數(shù)據(jù),設(shè)計了專家的用戶畫像模型,并采用了生產(chǎn)與庫存管理的相關(guān)方法進行后續(xù)更新,可對各領(lǐng)域?qū)<疫M行精準(zhǔn)推薦,在召回率、精準(zhǔn)性和綜合評定指標(biāo)中均有顯著提升[11]。胡承芳等通過建立瀾湄水資源合作領(lǐng)域?qū)<規(guī)煜到y(tǒng),構(gòu)建了基于時空屬性的用戶畫像和人才畫像模型,實現(xiàn)了基于瀾湄合作需求的人才智能推薦,進一步實現(xiàn)了以大數(shù)據(jù)為基礎(chǔ)的專家智能推薦支持[12]。以上研究表明,利用專家大數(shù)據(jù)進行用戶畫像,可有效解決專家信息共享途徑缺乏、信息來源單一、推薦精準(zhǔn)性不足等問題??梢灶A(yù)見,將用戶畫像技術(shù)應(yīng)用于科技特派員的選派、服務(wù)等過程中是推動科技特派員服務(wù)工作的有效途徑之一。
如今,我國農(nóng)業(yè)信息化發(fā)展勢頭迅猛,與“三農(nóng)”相關(guān)的幾乎所有企業(yè)、農(nóng)戶、合作社等的信息化水平也在不斷改進與提高,但在發(fā)展過程中表現(xiàn)出了數(shù)據(jù)量的爆發(fā)式增長。因此,如何在大量數(shù)據(jù)中深入提取企業(yè)、農(nóng)戶的自身特點、發(fā)展趨勢、發(fā)展需求等是急需解決的問題。為完成農(nóng)業(yè)企業(yè)畫像系統(tǒng)的構(gòu)建,竇旭蒙提出并建立了一套標(biāo)準(zhǔn)的數(shù)據(jù)存儲方案和成熟的數(shù)據(jù)緩存方案,該方案的應(yīng)用將有效推動農(nóng)業(yè)企業(yè)的生產(chǎn)發(fā)展[13]。在對農(nóng)戶的用戶畫像研究方面,針對農(nóng)戶的特征性描述研究較多,為農(nóng)戶的畫像及其他業(yè)務(wù)應(yīng)用提供了重要的基礎(chǔ)支撐。有研究對7 000多名推特用戶進行了問卷調(diào)查,主要收集了對農(nóng)業(yè)相關(guān)信息的了解程度和自身需求等數(shù)據(jù),利用用戶本體概念對農(nóng)戶進行了畫像,有效分析了農(nóng)戶的農(nóng)業(yè)信息傳播行為[14]。另外,為了進一步對農(nóng)戶的潛在需求進行分析,構(gòu)建群體農(nóng)戶畫像具有重要的意義。如張辰姊利用K-means 算法分析了大量農(nóng)戶的信息需求,利用非參數(shù)檢驗法對不同農(nóng)戶群體的信息需求差異進行鑒定,最后深入分析了農(nóng)戶信息需求與來源渠道之間的關(guān)系,為全面深入剖析農(nóng)戶的需求提供了重要的數(shù)據(jù)支撐,也為科技特派員精準(zhǔn)對接與服務(wù)提供了理論依據(jù)[15]。
農(nóng)業(yè)發(fā)展需要新的動力,在科技特派員制度的推行下,農(nóng)業(yè)企業(yè)、種養(yǎng)殖大戶、農(nóng)戶等的農(nóng)產(chǎn)品產(chǎn)量得到提升,但如何從農(nóng)產(chǎn)品銷售端提高其收入仍是需解決的問題。黃佳如等以徐州牛蒡醬為研究對象,通過在多個互聯(lián)網(wǎng)平臺(如百度、京東等)收集相關(guān)數(shù)據(jù)并進行分析,構(gòu)建了徐州牛蒡醬的用戶畫像模型,針對性地提出了牛蒡醬的營銷方案[16]。趙芳華等以香油制品為例,以香油現(xiàn)有市場、用戶和產(chǎn)品信息為基礎(chǔ),構(gòu)建了與香油密切相關(guān)的多維度的用戶畫像,并以此作為品牌服務(wù)策略實施的重要依據(jù)[17]。除了針對農(nóng)產(chǎn)品畫像的精準(zhǔn)營銷策略之外,在傳統(tǒng)農(nóng)產(chǎn)品的管理和營銷模式方面,胡欣從數(shù)字展會的角度出發(fā),提出了基于大數(shù)據(jù)分析的運作模式,可有針對性地展出農(nóng)產(chǎn)品給參展群體,以此帶動相關(guān)農(nóng)業(yè)產(chǎn)業(yè)發(fā)展[18]。楊路明等提出應(yīng)建立以大數(shù)據(jù)為基礎(chǔ)的可供網(wǎng)上交易渠道的云南農(nóng)產(chǎn)品網(wǎng)站,推動農(nóng)產(chǎn)品的精準(zhǔn)營銷,實現(xiàn)農(nóng)產(chǎn)品信息的完整與對稱[19]。杜柯籽等從云南省農(nóng)業(yè)會展角度出發(fā),利用GCN 圖卷積神經(jīng)網(wǎng)絡(luò)模型,構(gòu)建了農(nóng)業(yè)展會參與者的用戶畫像,并進行預(yù)測分析,最終設(shè)計并建立了應(yīng)用于農(nóng)產(chǎn)品展會中的精準(zhǔn)推薦系統(tǒng),該系統(tǒng)的應(yīng)用將提高農(nóng)業(yè)展會用戶匹配的精準(zhǔn)度,促進農(nóng)產(chǎn)品的交易[20]。
在實踐過程中,科技特派員的服務(wù)情況、服務(wù)評價等隨時將發(fā)生變化,農(nóng)業(yè)企業(yè)、合作社、農(nóng)戶等的需求、偏好等受到多種因素的影響,呈現(xiàn)出多樣性、潛在性的特點,但已有的用戶畫像中,如科技特派員、企業(yè)、農(nóng)戶等主要是靜態(tài)畫像,因此,在用戶的時效性數(shù)據(jù)方面,如何建立一種實時更新機制,以保障用戶畫像的動態(tài)更新和精準(zhǔn)刻畫,是該技術(shù)在科技特派員服務(wù)領(lǐng)域急需解決的問題。
如前所述,用戶畫像技術(shù)已在科技專家、農(nóng)戶、農(nóng)產(chǎn)品等相關(guān)領(lǐng)域得到廣泛應(yīng)用。因此,可利用用戶畫像技術(shù)從基本信息、學(xué)術(shù)領(lǐng)域、服務(wù)評價等多維度對科技特派員進行畫像,實現(xiàn)科技特派員與農(nóng)業(yè)企業(yè)、合作社、種養(yǎng)殖大戶等的精準(zhǔn)對接和服務(wù)。另外,科技特派員科技服務(wù)在產(chǎn)業(yè)末端的農(nóng)產(chǎn)品銷售端尚存在諸多不足。在數(shù)字農(nóng)業(yè)和智慧農(nóng)業(yè)不斷推進與發(fā)展的時期,對企業(yè)、農(nóng)戶、農(nóng)產(chǎn)品等數(shù)據(jù)(如農(nóng)產(chǎn)品信息、人群需求特點、市場現(xiàn)狀趨勢等)的存儲與收集等也得到不斷豐富與提升,將為用戶畫像的進一步應(yīng)用提供良好的數(shù)據(jù)基礎(chǔ)??梢灶A(yù)測,未來的用戶畫像技術(shù)將在科技特派員精準(zhǔn)對接和服務(wù),科技特派員服務(wù)的農(nóng)產(chǎn)品精準(zhǔn)營銷,以及農(nóng)民生產(chǎn)和消費等各個方面得到更加廣泛的應(yīng)用,為進一步推動鄉(xiāng)村振興提供重要的技術(shù)支撐。