亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)技術(shù)的圖書館用戶畫像模型建構(gòu)策略

        2020-06-19 07:50:33劉穎
        現(xiàn)代電子技術(shù) 2020年9期
        關(guān)鍵詞:畫像分類圖書館

        劉穎

        摘? 要: 針對(duì)在數(shù)字圖書館用戶畫像模型建構(gòu)工作中用戶數(shù)據(jù)分類效果較差的問題,提出基于大數(shù)據(jù)的數(shù)字圖書館用戶畫像模型建構(gòu)策略。通過運(yùn)用大數(shù)據(jù)網(wǎng)絡(luò)與圖書館系統(tǒng)全面性獲取用戶操作信息;利用關(guān)鍵詞抽取技術(shù)完成信息抽取,并采用分類技術(shù)實(shí)現(xiàn)用戶分類,以此提升模型構(gòu)建信息抽取分類能力;依據(jù)用戶畫像模型格式,設(shè)定用戶畫像標(biāo)簽體系,完成模型構(gòu)建工作。通過與采用策略前構(gòu)建方法的對(duì)比實(shí)驗(yàn)結(jié)果可以看出,采用所提策略后得到的用戶人群區(qū)分人數(shù)與樣本人數(shù)相同,而采用此策略前結(jié)果與樣本人數(shù)相差較大。由此可以得出,此策略可有效解決用戶數(shù)據(jù)分類效果較差的問題。

        關(guān)鍵詞: 圖書館用戶畫像模型; 大數(shù)據(jù)技術(shù); 用戶畫像標(biāo)簽體系; 關(guān)鍵詞抽取; 數(shù)字圖書館; 圖像分析

        中圖分類號(hào): TN911.73?34; G250.76? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? 文章編號(hào): 1004?373X(2020)09?0055?03

        A construction strategy for library users′ portrait model based on big data technology

        LIU Ying

        (Changchun Normal University, Changchun 130032, China)

        Abstract: For the poor classification effect of user data in the construction of digital library user portrait model, a big data based construction strategy of digital library user portrait model is proposed. The operation information of the library users is comprehensively obtained by means of big data network and library system. The keyword extraction technology is used to complete information extraction and the classification technology is used to achieve user classification, so as to improve the competence of information extraction and classification in the model construction. The user portrait label system is set up according to the format of user portrait model to complete the model construction. A contrast experiment was performed to compare the effect of the construction method before using the proposed strategy with that after using the proposed strategy. The experimental results show that the number of user group classification obtained after using the proposed strategy is the same as the number of samples, while that obtained before using the proposed strategy is quite different from the number of samples. Therefore, it is concluded that the proposed strategy can effectively deal with the poor classification effect of user data.

        Keywords: library user portrait model; big data technology; user portrait label system; keyword extraction; digital library; image analysis

        0? 引? 言

        隨著信息技術(shù)的進(jìn)步,數(shù)字圖書館應(yīng)運(yùn)而生。這是一種利用數(shù)字技術(shù)完成文獻(xiàn)處理與存儲(chǔ)的電子圖書館。實(shí)質(zhì)來講,數(shù)字圖書館是一種利用多媒體制作的分布式信息系統(tǒng)[1]。通過將不同載體、不同地址位置的信息資源利用數(shù)字技術(shù)存儲(chǔ),完成跨越區(qū)域、面向大眾的網(wǎng)絡(luò)查詢與傳播。在數(shù)字圖書館的應(yīng)用中,對(duì)用戶畫像的研究與構(gòu)建是其日后發(fā)展的基礎(chǔ)[2?3]。用戶畫像是理解目標(biāo)用戶、具象化用戶形象、明確服務(wù)目標(biāo)的重要表達(dá)形式之一。用戶需求是數(shù)字圖書館的基礎(chǔ),數(shù)字圖書館構(gòu)建用戶畫像需獲取用戶的體征數(shù)據(jù),精準(zhǔn)了解用戶的需求,以可視化的方式顯示用戶的喜好,從而實(shí)現(xiàn)數(shù)字圖書館用戶服務(wù)提供方式由粗放走向精細(xì)的目標(biāo)。就目前數(shù)字圖書館用戶畫像模型構(gòu)建中存在分類效果較差的問題,本文提出用戶畫像模型構(gòu)建策略。

        在此次提出的策略中,采用大數(shù)據(jù)技術(shù)完成用戶畫像模型構(gòu)建改進(jìn)。大數(shù)據(jù)技術(shù)對(duì)于用戶畫像模型中的數(shù)據(jù)處理具有重要作用,綜合運(yùn)用定性與定量方式實(shí)現(xiàn)模型的精準(zhǔn)構(gòu)建,以此保證數(shù)字圖書館服務(wù)內(nèi)容精準(zhǔn)化、服務(wù)定位精準(zhǔn)化、服務(wù)功能用戶化、服務(wù)系統(tǒng)智慧化。

        1? 基于大數(shù)據(jù)的數(shù)字圖書館用戶畫像模型建構(gòu)策略設(shè)計(jì)

        針對(duì)原有用戶畫像模型構(gòu)建過程中發(fā)現(xiàn)的問題,提出相應(yīng)的用戶畫像模型構(gòu)建策略。為提升用戶畫像模型構(gòu)建結(jié)果的分類效果,從用戶信息獲取、信息分析方法以及信息過濾處理方法方面提出對(duì)策,以此完成模型構(gòu)建的優(yōu)化提升工作。將此次設(shè)計(jì)的策略分成幾個(gè)方面,具象化顯示其內(nèi)容,采用圖像體現(xiàn),具體內(nèi)容如圖1所示。

        在策略提出的過程中,對(duì)用戶信息的處理為策略的核心部分。采用大數(shù)據(jù)技術(shù)增強(qiáng)對(duì)用戶信息的整合處理能力,用戶信息是用戶畫像模型構(gòu)建的基礎(chǔ),通過上述部分提升模型構(gòu)建的分類效果,為數(shù)字圖書館服務(wù)。

        1.1? 全面性獲取用戶操作信息

        使用數(shù)字圖書館的用戶都有自己特定的背景知識(shí)與個(gè)人愛好。構(gòu)建用戶畫像可以幫助數(shù)字圖書館將用戶喜愛設(shè)定為計(jì)算機(jī)可以理解的形式[4],實(shí)現(xiàn)信息化處理。在獲取用戶操作信息時(shí),需要對(duì)用戶的信息展開全面的采集。為保證采集結(jié)果的可靠性與全面性,設(shè)定采集內(nèi)容如表1所示。

        采用上述設(shè)定完成對(duì)用戶操作信息的獲取。將獲取到的信息采用統(tǒng)一數(shù)據(jù)項(xiàng)名稱存儲(chǔ)至數(shù)據(jù)庫內(nèi),以便于數(shù)據(jù)信息的抽取?;谟脩魯?shù)據(jù)信息過于龐大,在信息獲取的過程中,應(yīng)用大數(shù)據(jù)網(wǎng)絡(luò)完成信息的部分采集工作,其余部分通過數(shù)字圖書館自身的信息記錄完成。采用此方法可保證數(shù)據(jù)來源的多樣性,為模型構(gòu)建提供充分的數(shù)據(jù)來源[5?6]。

        1.2? 引用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)信息精準(zhǔn)分類

        應(yīng)用采集到的信息數(shù)據(jù)完成信息抽取工作。采取關(guān)鍵詞抽取技術(shù)結(jié)合文本挖掘技術(shù)的形式,從數(shù)據(jù)樣本內(nèi)容中挖掘用戶的個(gè)人信息,并采用關(guān)鍵詞的形式體現(xiàn)。在文本挖掘的過程中,直接獲取到的數(shù)據(jù)不能直接作為模型構(gòu)建的源數(shù)據(jù)。一方面,獲取到的數(shù)據(jù)中存在較多的重復(fù)數(shù)據(jù);另一方面,數(shù)據(jù)易出現(xiàn)不完整的情況,造成模型組成缺失的問題[7?9]。因而,將獲取的數(shù)據(jù)應(yīng)用大數(shù)據(jù)技術(shù)中的分布式處理技術(shù),得到處理結(jié)果,使其可以更好地適用于分類算法。數(shù)據(jù)信息的抽取流程如圖2所示。

        采用上述流程完成數(shù)據(jù)抽取過程。在數(shù)據(jù)抽取中引入更新機(jī)制,將抽取后的本體數(shù)據(jù)與用戶興趣不斷地匹配與修正,最終獲得數(shù)據(jù)抽取結(jié)果?;诔槿√幚斫Y(jié)果,使用大數(shù)據(jù)技術(shù)中的分類算法完成用戶畫像模型的數(shù)據(jù)分類。設(shè)定完成預(yù)處理以及抽取后的用戶數(shù)據(jù)樣本集合為[W={w1,w2,…,wn}],[wn∈Rn],其中,[R]為自然數(shù),[n=1,2,…,n]。綜上可知,[W]的類別劃分為[{A1,A2,…,Am}],[m∈n]。則有:

        [Ai≠?,? ? i=1,2,…,m] (1)

        [A1?A2?…?Am=W] (2)

        [Ai?Aj=?,? ? i,j=1,2,…,m且i≠j] (3)

        式中[i,j]表示分類的序號(hào)。通過式(1)完成集合分類,確保集合結(jié)果不為空。將式(1)獲取到的集合展開進(jìn)行交集處理,保證處理后的集合為樣本數(shù)據(jù),最后通過式(3)完成信息的分類。通過多次計(jì)算保證數(shù)據(jù)分類的精準(zhǔn)度。

        1.3? 設(shè)定用戶畫像標(biāo)簽體系

        在模型構(gòu)建的過程中,除對(duì)原始數(shù)據(jù)的采集與處理外,還需建立相應(yīng)的畫像標(biāo)簽體系。據(jù)研究可知,用戶畫像是真實(shí)用戶的虛擬代表,是一種建立在真實(shí)數(shù)據(jù)上的目標(biāo)用戶模型[10?12]。因而,在構(gòu)建中將模型體現(xiàn)為一種多元化多因素的畫像,具體格式如圖3所示。

        通過上述格式可知,用戶畫像就是一種將用戶信息標(biāo)簽化的技術(shù),將用戶通過標(biāo)簽顯示,便于數(shù)字圖書館實(shí)現(xiàn)對(duì)用戶科學(xué)管理。標(biāo)簽體系是模型構(gòu)建的標(biāo)準(zhǔn)之一,因而設(shè)定標(biāo)簽內(nèi)容如表2所示。

        采用上述標(biāo)簽,結(jié)合分類處理后的基本屬性信息,完成用戶畫像模型的構(gòu)建。至此,針對(duì)模型分類效果較差的問題,基于大數(shù)據(jù)的數(shù)字圖書館用戶畫像模型建構(gòu)策略提出完畢。

        2? 仿真實(shí)驗(yàn)

        根據(jù)現(xiàn)有數(shù)字圖書館用戶畫像模型存在的問題,提出相應(yīng)的畫像模型構(gòu)建策略。為保證提出策略的有效性,構(gòu)建測(cè)試環(huán)境,完成策略使用效果研究。在測(cè)試中,采用與傳統(tǒng)用戶畫像模型對(duì)比的方式得出相應(yīng)的測(cè)試結(jié)果,完成研究。

        2.1? 設(shè)定實(shí)驗(yàn)環(huán)境

        此次實(shí)驗(yàn)的硬件環(huán)境為Windows 7操作系統(tǒng),內(nèi)存為10 GB。大數(shù)據(jù)技術(shù)以C語言開發(fā)工具為基礎(chǔ),大數(shù)據(jù)計(jì)算使用Python2.7編碼實(shí)現(xiàn)。實(shí)驗(yàn)?zāi)繕?biāo)設(shè)定為某數(shù)字圖書館,其中部分用戶為數(shù)據(jù)源,共包含10 000條用戶行為數(shù)據(jù),具體內(nèi)容如表3所示。

        由于用戶畫像具有其自身的特殊性,只能表示用戶的個(gè)人畫像與組群畫像。此次實(shí)驗(yàn)僅對(duì)用戶的群組畫像展開研究,采用大數(shù)據(jù)平臺(tái)對(duì)數(shù)據(jù)分組處理。將處理后的數(shù)據(jù)通過本文提出的策略二次加工,得出實(shí)驗(yàn)結(jié)果,并對(duì)比其分類效果。將實(shí)驗(yàn)樣本中的特征數(shù)據(jù)通過表格形式顯示[13?14],具體如表4所示。

        以信息樣本為實(shí)驗(yàn)指標(biāo),設(shè)定在此次實(shí)驗(yàn)以來,自北部地區(qū)的1999年后出生的男性用戶、來自中部地區(qū)1979—1999年的女性用戶以及來自中部地區(qū)的1979年前出生的女性用戶為用戶畫像模型的構(gòu)建目標(biāo),并采用本文策略后的用戶畫像分類效果作為實(shí)驗(yàn)對(duì)比對(duì)象,通過按要求劃分用戶人數(shù)與樣本人數(shù)差異體現(xiàn)。

        2.2? 實(shí)驗(yàn)結(jié)果

        采用上述設(shè)定完成實(shí)驗(yàn)過程,將實(shí)驗(yàn)結(jié)果通過數(shù)據(jù)形式顯示,具體如圖4所示。

        通過實(shí)驗(yàn)結(jié)果可以看出:在使用本文提出策略前,用戶畫像分類結(jié)果與樣本人數(shù)相差較大,由此,可以斷定在使用策略前,采用原有用戶分類結(jié)果獲得的用戶畫像模型精度較差。采用這種用戶畫像對(duì)于數(shù)字圖書館而言,是具有較大弊端的,不易于數(shù)字圖書館對(duì)用戶群體的分析與自身的內(nèi)部優(yōu)化。采用本文提出的策略展開模型構(gòu)建工作,所得到的分類結(jié)果與樣本人數(shù)一致,不存在誤差,與采用策略前的結(jié)果相比,采用策略后的分類結(jié)果明顯優(yōu)于原有結(jié)果[15]。由此可知,本文提出的針對(duì)原有的用戶畫像模型構(gòu)建具有顯著的作用,可有效提升用戶畫像模型構(gòu)建的精度與用戶群體區(qū)分效果。

        3? 結(jié)? 語

        本文通過使用大數(shù)據(jù)技術(shù)完成對(duì)數(shù)字圖書館用戶畫像模型構(gòu)建工作。通過實(shí)驗(yàn)結(jié)果可知,此次研究中提出的策略可有效改善原有模型構(gòu)建中的問題。此次設(shè)計(jì)結(jié)果有效利用大數(shù)據(jù)技術(shù),保證數(shù)字圖書館中海量的用戶數(shù)據(jù)得到良好的應(yīng)用,并以此服務(wù)于用戶畫像工作,保證數(shù)字圖書館日后的信息化發(fā)展。在此次研究中,仍存在一些不足,例如,數(shù)據(jù)處理方面的設(shè)定較為簡單,不能充分體現(xiàn)大數(shù)據(jù)技術(shù)的應(yīng)用過程等。在日后的研究中,對(duì)上述問題仍需改進(jìn)。

        參考文獻(xiàn)

        [1] 陳艷,李君亮.大數(shù)據(jù)技術(shù)的詮釋學(xué)分析[J].學(xué)術(shù)探索,2018(7):7?12.

        [2] 鄭正廣,馮必成,趙明月.基于大數(shù)據(jù)技術(shù)的騰訊王卡用戶畫像構(gòu)建研究[J].郵電設(shè)計(jì)技術(shù),2017(9):52?56.

        [3] 王憲朋.基于視頻大數(shù)據(jù)的用戶畫像構(gòu)建[J].電視技術(shù),2017,41(6):20?23.

        [4] 楊潤佳.大數(shù)據(jù)驅(qū)動(dòng)下主動(dòng)防御網(wǎng)絡(luò)安全性評(píng)估技術(shù)[J].計(jì)算機(jī)測(cè)量與控制,2018,26(10):304?308.

        [5] 張鈞.基于用戶畫像的圖書館知識(shí)發(fā)現(xiàn)服務(wù)研究[J].圖書與情報(bào),2017(6):60?63.

        [6] 劉速.淺議數(shù)字圖書館知識(shí)發(fā)現(xiàn)系統(tǒng)中的用戶畫像:以天津圖書館為例[J].圖書館理論與實(shí)踐,2017(6):103?106.

        [7] 李恒超,林鴻飛,楊亮,等.一種用于構(gòu)建用戶畫像的二級(jí)融合算法框架[J].計(jì)算機(jī)科學(xué),2018,45(1):157?161.

        [8] 張海濤,崔陽,王丹,等.基于概念格的在線健康社區(qū)用戶畫像研究[J].情報(bào)學(xué)報(bào),2018,37(9):912?922.

        [9] 王樂,倪維健,林澤東,等.基于模型堆疊的上網(wǎng)行為日志用戶畫像方法[J].山東科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,37(5):70?78.

        [10] 萬倩,歐陽峰,趙明.知識(shí)圖譜在廣電網(wǎng)絡(luò)運(yùn)營大數(shù)據(jù)分析中的應(yīng)用[J].廣播與電視技術(shù),2018,45(12):79?86.

        [11] 劉丹,張興剛,任淑敏.基于用戶畫像的高校圖書館閱讀療法模式[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2018,27(7):68?71.

        [12] 張海旭,胡訪宇,趙家輝.基于話單數(shù)據(jù)的移動(dòng)通信用戶畫像研究[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2018,27(11):271?277.

        [13] 單曉紅,張曉月,劉曉燕.基于在線評(píng)論的用戶畫像研究:以攜程酒店為例[J].情報(bào)理論與實(shí)踐,2018,41(4):99?104.

        [14] 周景.基于商業(yè)智能WLAN的用戶畫像分析系統(tǒng)的設(shè)計(jì)及應(yīng)用[J].微型電腦應(yīng)用,2019,35(8):143?145.

        [15] 洪芳林,邢文明.基于大數(shù)據(jù)平臺(tái)的圖書館利用有聲閱讀平臺(tái)開展用戶服務(wù)研究[J].四川圖書館學(xué)報(bào),2019(4):33?37.

        猜你喜歡
        畫像分類圖書館
        威猛的畫像
        分類算一算
        “00后”畫像
        畫像
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        圖書館
        教你一招:數(shù)的分類
        飛躍圖書館
        去圖書館
        无码中文字幕久久久久久| 天天影视性色香欲综合网| 亚洲另类自拍丝袜第五页| 91精品日本久久久久久牛牛| 久久青青草原一区网站| 少妇真人直播免费视频| 一本一道av无码中文字幕| 国产短视频精品区第一页| 国产在线观看免费不卡视频| 久久亚洲道色综合久久| 欧美极品少妇无套实战| 国产91吞精一区二区三区| 色婷婷一区二区三区四| 免费午夜爽爽爽www视频十八禁| 九九久久精品无码专区| JIZZJIZZ国产| 精品一区2区3区4区| 久久久久久自慰出白浆| 国产无遮挡又黄又爽又色| 最近最新中文字幕| 狠狠躁天天躁中文字幕 | 杨幂国产精品一区二区| 亚洲国产综合人成综合网站| 亚洲精品成人片在线观看精品字幕| 男女扒开双腿猛进入免费看污| 区一区一日本高清视频在线观看| 东北熟妇露脸25分钟| 国产女人高潮叫床免费视频| 久久中文字幕无码一区二区| 亚洲大胆视频在线观看| 国产欧美日韩va另类在线播放| 亚洲精品无码久久久久sm| 无遮挡很爽视频在线观看| 国产精品国产三级野外国产| 国产一区二区内射最近更新| 中文人妻无码一区二区三区| 日本一区二区三区一级片| 日韩av无码久久一区二区| 男女扒开双腿猛进入免费看污| 亚洲蜜桃视频在线观看| 国产精品高清网站|