亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        新媒體環(huán)境下基于用戶畫像的智慧圖書館建設(shè)*

        2018-09-21 08:38:38常盛
        科技與創(chuàng)新 2018年18期
        關(guān)鍵詞:分類圖書館用戶

        常盛

        ?

        新媒體環(huán)境下基于用戶畫像的智慧圖書館建設(shè)*

        常盛

        (長春市圖書館,吉林 長春 130021)

        分析了當(dāng)前圖書館數(shù)字化服務(wù)形勢,指明了建立讀者標(biāo)簽庫的意義,闡述了現(xiàn)代圖書館基于用戶畫像的構(gòu)架、關(guān)鍵算法、標(biāo)簽庫建立、高維向量相似度計算、實(shí)現(xiàn)路徑等內(nèi)容。

        用戶畫像;智慧圖書館;新媒體;智能化水平

        面對信息化時代向大數(shù)據(jù)時代的轉(zhuǎn)型期,傳統(tǒng)圖書館基于簡單供給方式的粗獷服務(wù)方式難以滿足公眾的閱讀需求,由于用戶數(shù)據(jù)缺乏有效分析與訓(xùn)練,形成用戶習(xí)慣及喜好盲區(qū),個體閱讀的差異性成為精準(zhǔn)化服務(wù)的難點(diǎn)。建設(shè)以數(shù)字化、網(wǎng)絡(luò)化、智能化的現(xiàn)代信息技術(shù)為基礎(chǔ),以互聯(lián)、高效、便利為主要特征,將綠色發(fā)展和數(shù)字惠民作為本質(zhì)追求的現(xiàn)代化圖書館[1]成為時代的必然要求,民眾對圖書館服務(wù)的智能化水平要求日益提高。在海量數(shù)據(jù)中及時、有效地推送用戶所需的內(nèi)容,成為智慧圖書館的基礎(chǔ)功能,而了解用戶的個性化需求成為首要任務(wù)。

        1 建立用戶畫像數(shù)據(jù)模型

        相比于傳統(tǒng)行業(yè)經(jīng)驗(yàn)進(jìn)行的簡單用戶特點(diǎn)描述,現(xiàn)代化的用戶畫像建立在數(shù)據(jù)挖掘的基礎(chǔ)之上,通過分析用戶社會屬性、生活習(xí)慣、消費(fèi)行為等信息抽象出用戶偏好的標(biāo)簽[2]。基于OOA(面向?qū)ο蠓治觯┑乃枷?,用戶畫像模型的建立過程是建立在數(shù)以十萬普通讀者閱讀習(xí)慣、行為等屬性的抽象過程。以O(shè)O(面向?qū)ο螅榛A(chǔ)的用戶畫像類具有較好數(shù)據(jù)結(jié)構(gòu)和實(shí)現(xiàn)性,同時,具備繼承、多態(tài)、封裝等屬性。

        1.1 唯一標(biāo)識的確立

        唯一標(biāo)識是準(zhǔn)確識別用戶的基礎(chǔ)。隨著新媒體技術(shù)的發(fā)展,在缺乏頂端設(shè)計的情況下,各類系統(tǒng)被引入圖書館應(yīng)用,用戶唯一標(biāo)識使用變得混亂。發(fā)展初期的身份證號、讀者證號、電子郵箱、電話號碼,逐漸轉(zhuǎn)變?yōu)槲⑿盘枴⑻詫毺?、QQ號等第三方登陸標(biāo)識?;靵y的唯一標(biāo)識雖然讓數(shù)據(jù)記錄缺乏唯一性、處理變得復(fù)雜,但在信息獲取維度上獲得了更多的擴(kuò)展。圖書館可通過以下3種方式實(shí)現(xiàn)唯一標(biāo)識的統(tǒng)一,進(jìn)而實(shí)現(xiàn)用戶畫像數(shù)據(jù)庫中記錄的唯一性和完備性:①激勵用戶完善信息的方式(成本高,難以大規(guī)模開展);②跨平臺檢索ID強(qiáng)打通(基于平臺差異性,難于實(shí)現(xiàn));③提取特征向量通過機(jī)器學(xué)習(xí)模糊拉通(適合大規(guī)模數(shù)據(jù))。

        1.2 用戶畫像的標(biāo)簽

        根據(jù)描繪用戶特征的信息分類可分為靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)。靜態(tài)數(shù)據(jù)是指基本屬性、家庭、單位等穩(wěn)定性較好的信息;動態(tài)數(shù)據(jù)是指瀏覽行為、查詢、下載等變化性較大的信息。人的描述屬性是極為復(fù)雜的,畫像屬性也必然伴隨著高維度和高復(fù)雜性而變化,龐大的屬性標(biāo)簽也將提高數(shù)據(jù)挖掘運(yùn)算的復(fù)雜度,因此,按照目標(biāo)進(jìn)行適當(dāng)?shù)膶傩栽O(shè)計是一種擇優(yōu)策略。

        一般情況下靜態(tài)信息主要包含人口屬性、行業(yè)屬性、閱讀偏好、社交數(shù)據(jù)等;動態(tài)信息一般包括訪問行為、興趣特征、場景、消費(fèi)特征等。具體如圖1所示。

        圖1 主要信息示意圖

        1.3 標(biāo)簽權(quán)重

        表1 文獻(xiàn)分類標(biāo)簽表(單位:次)

        分類A分類B分類C分類D 讀者A5320 讀者B2141 讀者C0420

        計算可得,讀者A標(biāo)簽1的=0.5,=1.22,-=0.61,對應(yīng)填入文獻(xiàn)分類-權(quán)重表如表2所示。

        表2 文獻(xiàn)分類權(quán)重表

        分類A分類B分類C分類D 讀者A0.610.330.220 讀者B0310.140.550.39 讀者C00.730.360

        其次,相對于文獻(xiàn)分類之外,讀者關(guān)于訪問行為、訪問觸點(diǎn)、返回次數(shù)等標(biāo)簽對于預(yù)測讀者獲取文獻(xiàn)內(nèi)容具有較大價值,以訪問時長為例,讀者對于某類文獻(xiàn)瀏覽時間占據(jù)其訪問時間總長比例越大,說明該讀者對該類文獻(xiàn)的需求越高,因此建立權(quán)重計算方式為:

        式(1)中:s—end?s—start為某類文獻(xiàn)的駐留時間;end?start為訪問平臺總長。

        由于文獻(xiàn)的分類多元化,其訪問時長的標(biāo)簽也絕非單一數(shù)值,而是一個差異化增長的一組數(shù)值,隨機(jī)選取一個讀者的訪問時長記錄制作其標(biāo)簽表如表3所示。

        表3 訪問時長標(biāo)簽表(單位:s)

        分類A分類B分類C分類D分類E 讀者A03020080

        計算繪制其權(quán)重表如表4所示。

        表4 訪問時長權(quán)重表

        分類A分類B分類C分類D分類E 讀者A00.230.1500.61

        2 聚類及群體畫像

        為提高內(nèi)容預(yù)測的精準(zhǔn)性,發(fā)掘讀者閱讀行為的潛在關(guān)聯(lián)和規(guī)律,用戶畫像標(biāo)簽庫的建立將是動態(tài)的過程,但過于精確的用戶畫像預(yù)測降低了投入產(chǎn)出比。因此,將用戶畫像標(biāo)簽進(jìn)行聚類,進(jìn)而形成群體畫像,一方面提升了整體服務(wù)效能;另一方面,將具有相似閱讀偏好的讀者聚集,易于組織專題性閱讀推廣活動。聚類技術(shù)屬于無監(jiān)督學(xué)習(xí),實(shí)現(xiàn)算法較多劃分法、層次法、密度算法等,但在文獻(xiàn)分類標(biāo)簽每個讀者的閱讀偏好呈現(xiàn)為向量形式,即可將讀者偏好的聚類轉(zhuǎn)化為向量相似度的檢索。

        cos()的取值范圍為[-1,1],值越大表明夾角越小,相反夾角越大。使用MATLAB:=1-pdist(,'cosine')可以計算其夾角余弦。

        但在實(shí)際應(yīng)用中,面對龐大的讀者群體,該方法的遍歷比較過程時間復(fù)雜度極高(^2),無法在實(shí)際中大規(guī)模應(yīng)用。高維向量相似度可采用LSH(Location Sensitive Hash)位置敏感哈希函數(shù)進(jìn)行算法實(shí)現(xiàn)。原數(shù)據(jù)樣本空間臨近的數(shù)據(jù)點(diǎn)經(jīng)過映射和變形后,在新的數(shù)據(jù)空間仍有較大概率相鄰。

        對于任意,屬于,如果從集合到的函數(shù)族={1,2,…,n}對距離函數(shù),滿足條件[4]:(,)≤,且滿足[()=()] ≥1;(,)>+,[()=()]≤2這些條件,則稱是敏感位置。原始數(shù)值落入不同數(shù)值桶,進(jìn)而完成的讀者閱讀文獻(xiàn)的喜好分類實(shí)現(xiàn)聚類。

        3 建設(shè)路徑

        用戶畫像技術(shù)的應(yīng)用是現(xiàn)代圖書館數(shù)據(jù)挖掘和人工智能技術(shù)應(yīng)用的典型應(yīng)用,要求圖書館在用戶數(shù)據(jù)采集、存儲、使用上要有科學(xué)的規(guī)劃和系統(tǒng)的建設(shè),絕非一朝一夕之功,可以按照快速原型或是迭代式的發(fā)展模式,按照一般圖書館的建設(shè)方式可以總結(jié)成以下形式:接觸點(diǎn)數(shù)據(jù)采集→形成標(biāo)簽層→讀者數(shù)據(jù)特征化→形成用戶畫像數(shù)據(jù)庫。

        [1]王世偉.論智慧圖書館的三大特點(diǎn)[J].中國圖書館學(xué)報,2012(06):22-28.

        [2]王慶.基于“用戶畫像“的圖書館資源推薦模式設(shè)計與分析[J].現(xiàn)代情報,2018(03):105-109.

        [3]宗成慶.統(tǒng)計自然語言處理[M].北京:清華大學(xué)出版社,2008.

        [4]Piotr Indyk.data-dependent LSH algorithms[EB/OL].http://people.csail.mit.edu/indyk,2015.

        中國圖書館學(xué)會閱讀推廣課題(編號:YD2016B39);吉林省圖書館學(xué)、情報與文獻(xiàn)學(xué)科研課題(編號:WK2018C140);長春市文廣新局調(diào)查研究項(xiàng)目“圖書館推動全民閱讀戰(zhàn)略的對策與研究”

        2095-6835(2018)18-0138-02

        G250.7

        A

        10.15913/j.cnki.kjycx.2018.18.138

        〔編輯:張思楠〕

        猜你喜歡
        分類圖書館用戶
        分類算一算
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        圖書館
        小太陽畫報(2018年1期)2018-05-14 17:19:25
        教你一招:數(shù)的分類
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        飛躍圖書館
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        久久精品国产免费观看三人同眠| 欧洲AV秘 无码一区二区三| 国产偷2018在线观看午夜| 亚洲专区一区二区在线观看| 加勒比日本东京热1区| 国产美女黄性色av网站| 日韩av天堂一区二区三区在线| 精品国内日本一区二区| 无遮挡呻吟娇喘视频免费播放| 国产精品乱码在线观看| 欧美成人a视频免费专区| 99精品人妻少妇一区二区三区| 亚洲一区二区国产激情| 日韩一区国产二区欧美三区| 国内少妇偷人精品视频免费| 国产短视频精品区第一页| 成人av在线免费播放| 国产三级精品三级男人的天堂| 黄片视频免费在线观看国产| 成在线人av免费无码高潮喷水| 国语少妇高潮对白在线| 国产欧美亚洲另类第一页| 国产精品久久夜伦鲁鲁| 日韩一本之道一区中文字幕| 国产精品久久久爽爽爽麻豆色哟哟 | 亚洲国产av一区二区三| 99热婷婷一区二区三区| 中文字幕有码人妻在线| 国产精品久免费的黄网站| 久久久久亚洲av片无码下载蜜桃| 亚洲综合无码一区二区| 欧美国产伦久久久久久久| 在线观看免费视频发布白白色 | 国产精品亚洲专区无码不卡| 亚洲av无码成人精品区狼人影院| 亚洲精品国偷拍自产在线观看蜜臀| 国产成人精品视频网站| 亚洲中文字幕乱码第一页| 久久偷看各类wc女厕嘘嘘偷窃| 躁躁躁日日躁| 久久久精品456亚洲影院|