亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)驅(qū)動與目標(biāo)驅(qū)動的個性化比較

        2012-10-20 09:49:44中國聯(lián)合網(wǎng)絡(luò)通信有限公司河南分公司
        河南科技 2012年12期
        關(guān)鍵詞:數(shù)據(jù)挖掘個性化驅(qū)動

        中國聯(lián)合網(wǎng)絡(luò)通信有限公司 河南分公司 王 方

        河南工程學(xué)院 蘇玉召

        河南日報報業(yè)集團 大河網(wǎng) 黃文睿

        數(shù)據(jù)驅(qū)動與目標(biāo)驅(qū)動的個性化比較

        中國聯(lián)合網(wǎng)絡(luò)通信有限公司 河南分公司 王 方

        河南工程學(xué)院 蘇玉召

        河南日報報業(yè)集團 大河網(wǎng) 黃文睿

        最近很多關(guān)于個性化研究和開發(fā)的科技創(chuàng)新,在商業(yè),公共服務(wù)業(yè),搜索引擎和電子服務(wù)網(wǎng)站等領(lǐng)域都有了全新的發(fā)展。但是個性化是一個快速發(fā)展的領(lǐng)域,對于個性化概念的認(rèn)識,不同的研究者和開發(fā)者對個性化的理解也各不相同,所持觀點也各不盡同。

        本文,筆者對幾種關(guān)于個性化的重要觀點進(jìn)行了總結(jié)歸納。一般來說,個性化定制某些供應(yīng)功能,通過這些功能呈現(xiàn)給用戶,能夠根據(jù)用戶的需要和目的等滿足用戶的需要。提供給用戶的功能包括內(nèi)容,服務(wù),產(chǎn)品推薦,交流和電子商務(wù)交互。這些服務(wù)的提供者可以是電子商務(wù)網(wǎng)站,搜索引擎和公共服務(wù)網(wǎng)站等類似的站點,用戶可以是網(wǎng)上購物者和訪問網(wǎng)站者。

        設(shè)計個性化過程最常用的方法稱為“數(shù)據(jù)驅(qū)動”,也稱為“向前”方法。這種方法的特點是:先收集所需的數(shù)據(jù),然后建立用戶模型,再使用數(shù)據(jù)挖掘算法,最后評價個性化的影響。但是,人們更喜歡“向后”的方法設(shè)計個性化過程,也稱為“目標(biāo)驅(qū)動”,這是因為人們預(yù)先設(shè)定了目標(biāo),然后再設(shè)計個性化的每個階段。相比較而言,后者是前者的反過程。

        一、個性化過程

        個性化組成過程大致可以分為5個階段:用戶信息收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、個性化推薦和用戶評價。在個性化開發(fā)的具體階段,可以進(jìn)行功能的細(xì)化。同時,個性化在應(yīng)用過程中,根據(jù)用戶的評價,調(diào)整個性化策略,從而改進(jìn)個性化質(zhì)量。根據(jù)個性化方案的不同設(shè)計思想,可以有多種形式的個性化過程。本文,筆者重點討論基于數(shù)據(jù)驅(qū)動和目標(biāo)驅(qū)動的個性化過程,個性化過程如圖1所示。

        1.數(shù)據(jù)驅(qū)動的個性化過程。數(shù)據(jù)驅(qū)動的個性化采用“自底向上”的設(shè)計思想,如圖1(a)所示。

        (1)從不同的交互渠道收集用戶信息開始個性化過程。比如通過Web,電話和直接發(fā)送郵件等。也可以通過各種各樣的數(shù)據(jù)源獲取每個用戶盡可能全的信息。

        (2) 一旦用戶信息收集完畢,就要對收集的信息進(jìn)行清理,也就是把一些冗余的,與用戶個性化不相關(guān)的數(shù)據(jù)清除,使數(shù)據(jù)格式規(guī)范化。

        (3) 在開發(fā)用戶個性化應(yīng)用中一個關(guān)鍵問題時,經(jīng)過數(shù)據(jù)預(yù)處理的數(shù)據(jù),識別用戶的興趣愛好生成用戶模型,并按照一定的格式存儲起來。

        (4)用戶模型構(gòu)建完成后,進(jìn)行數(shù)據(jù)挖掘為每個用戶匹配合適的內(nèi)容和服務(wù)。進(jìn)行數(shù)據(jù)挖掘的技術(shù)包括:推薦系統(tǒng),基于統(tǒng)計學(xué)的預(yù)測方法,基于規(guī)則的系統(tǒng),專家指導(dǎo)發(fā)送內(nèi)容和服務(wù)的管理規(guī)則。

        (5)在完成數(shù)據(jù)挖掘后,個性化信息將被發(fā)送到每一個用戶??梢圆捎靡韵聨追N方法發(fā)送個性化信息:可視化,相關(guān)性有序列表和可選擇無序列表等。

        (6)個性化呈現(xiàn)的效果評價可采用的方法包括:精度,用戶生命期,用戶忠誠度和購買的商品。個性化評估結(jié)果的好壞,依賴于個性化過程前5個階段采用技術(shù)的復(fù)雜程度。

        (7)個性化系統(tǒng)對用戶的評價進(jìn)行反饋,可以用于調(diào)整并改進(jìn)前6個階段的功能。反饋決定是否需要收集更多的用戶信息,在數(shù)據(jù)預(yù)處理時候是否對冗余數(shù)據(jù)進(jìn)行清理,如何建立更好的用戶模型,如何選擇或開發(fā)更好的數(shù)據(jù)挖掘算法,如何對用戶的信息進(jìn)行優(yōu)化,或者采用更多和更復(fù)雜的評價方法。如果反饋階段能夠恰當(dāng)?shù)丶傻絺€性化過程中,與每個用戶交互的質(zhì)量逐步得到提高,個性化將會進(jìn)入良性循環(huán)。

        2.目標(biāo)驅(qū)動的個性化過程。目標(biāo)驅(qū)動的個性化過程采用“自頂向下”的設(shè)計方法,之所以稱為“目標(biāo)驅(qū)動”,這是因為需要預(yù)先設(shè)定目標(biāo),然后再設(shè)計個性化的每個階段。而“數(shù)據(jù)驅(qū)動”是先收集數(shù)據(jù),然后再建立用戶模型。這和商業(yè)管理的思想相一致:即我們無法管理不能預(yù)測的事情。換言之,我們設(shè)計個性化首先要確定目標(biāo),然后開始下一階段工作的實施。目標(biāo)驅(qū)動與數(shù)據(jù)驅(qū)動個性化的階段類似,但過程相反。

        (1)設(shè)定個性化評價指標(biāo),明確哪些因素會對個性化服務(wù)質(zhì)量起到關(guān)鍵性作用。個性化系統(tǒng)可以采用1種或者多種評價指標(biāo),比如,用戶滿意度,用戶生命期,用戶忠誠度和購買的商品。從這些評價指標(biāo)中可以分析用戶的興趣愛好。

        (2)設(shè)定了個性化評價指標(biāo)后,圍繞這些指標(biāo)選擇采用哪些內(nèi)容,以何種方式推薦呈現(xiàn)給用戶??梢圆捎脦追N方法呈現(xiàn)個性化信息,包括:可視化,相關(guān)性有序列表和選擇性無序列表等。用戶興趣愛好也體現(xiàn)在推薦呈現(xiàn)內(nèi)容與方式上。

        (3)根據(jù)推薦呈現(xiàn)內(nèi)容,選擇合適的數(shù)據(jù)挖掘算法。與數(shù)據(jù)驅(qū)動個性化過程類似,可以采用的數(shù)據(jù)挖掘技術(shù)包括推薦系統(tǒng),基于統(tǒng)計學(xué)的預(yù)測方法,基于規(guī)則的系統(tǒng),專家指導(dǎo)發(fā)送內(nèi)容和服務(wù)的管理規(guī)則等。

        (4)數(shù)據(jù)挖掘所需的數(shù)據(jù)由用戶模型所提供。

        (5)數(shù)據(jù)預(yù)處理的結(jié)果用于生成用戶模型。

        (6)用戶信息收集。這一步與數(shù)據(jù)驅(qū)動個性化過程的最大不同就是根據(jù)預(yù)先設(shè)定的目標(biāo)是逐步向下推移,直到最后發(fā)現(xiàn)需要收集哪些數(shù)據(jù)。這樣做的優(yōu)點是能夠避免做無用功,要做到“有的放矢”。

        (7)在個性化應(yīng)用完成后,根據(jù)用戶評價結(jié)果,把反饋調(diào)整策略集成到個性化的前6個階段。與數(shù)據(jù)驅(qū)動個性化過程所不同的是,目標(biāo)驅(qū)動是根據(jù)需要預(yù)先設(shè)定各個階段需要的技術(shù),然后再實施到個性化的每個階段中,最后根據(jù)用戶評價結(jié)果,把反饋調(diào)整策略集成到個性化的各個階段。數(shù)據(jù)驅(qū)動采用的是“推演技術(shù)”,從收集用戶信息開始,一直到用戶評價結(jié)束,進(jìn)而反饋調(diào)整個性化每個階段的策略。

        3.二者比較。目標(biāo)驅(qū)動的個性化過程從指定用于決定個性化影響的用戶評價開始,選擇的評價指標(biāo)決定將要推薦呈現(xiàn)給用戶的個性化內(nèi)容屬于哪種類型。推薦呈現(xiàn)給用戶的個性化內(nèi)容,又決定了采用的數(shù)據(jù)挖掘技術(shù)如何挖掘來自用戶模型的數(shù)據(jù)。用戶模型的生成,決定了用戶信息預(yù)處理所采取的技術(shù),判斷哪些數(shù)據(jù)是冗余的,哪些數(shù)據(jù)是必需的。最后,建立全面的用戶模型決定了需要收集哪些用戶信息,以及如何收集需要的信息。很顯然,在這個過程中,有一些階段采用的技術(shù)針對性較強,需要額外處理的步驟會減少很多。

        數(shù)據(jù)驅(qū)動的個性化過程從用戶信息收集開始個性化過程,由于無法確定哪些信息是必需的,所以,應(yīng)盡可能多的收集。如果收集太多的信息,則會造成2點麻煩:一是加重服務(wù)器負(fù)擔(dān),例如收集信息時間過長將影響系統(tǒng)性能;二是收集太多的冗余數(shù)據(jù)會給數(shù)據(jù)預(yù)處理階段帶來困難。用戶模型生成后,經(jīng)過數(shù)據(jù)挖掘技術(shù)處理,推薦呈現(xiàn)給用戶的內(nèi)容可能不是用戶感興趣和愛好的項目,這會使得個性化系統(tǒng)進(jìn)行較大的調(diào)整,可能需要重新從策略上調(diào)整個性化過程中每個階段的技術(shù)。因此,數(shù)據(jù)驅(qū)動的個性化過程比目標(biāo)驅(qū)動的個性化過程要復(fù)雜得多。

        由于目標(biāo)驅(qū)動方法,從一開始就要預(yù)定目標(biāo),所以,與數(shù)據(jù)驅(qū)動方法相比較而言,其優(yōu)點是能夠讓個性化實現(xiàn)“良性循環(huán)”,從而為投資者帶來更多的收益。然而,目標(biāo)驅(qū)動方法在個性化文獻(xiàn)研究中從來沒有出現(xiàn)過,筆者的推測有待在未來的研究中證實。此外,其他影響個性化過程設(shè)計的因素還包括可信度和個性化過程中潛在的干擾等。這些情況也是有待于在個性化過程中進(jìn)行研究。

        目標(biāo)驅(qū)動的個性化過程能夠更好地實現(xiàn)良性循環(huán),其優(yōu)點也是不言而喻:一方面,如果商業(yè)網(wǎng)站個性化實現(xiàn)了良性循環(huán),將會為商家?guī)聿粩嘣鲩L的利潤。如果公共服務(wù)網(wǎng)站個性化實現(xiàn)了良性循環(huán),將會為公眾提供及時,快捷的便民服務(wù);另一方面,良性循環(huán)對于個性化系統(tǒng)適應(yīng)不斷變化的環(huán)境和提高個性化服務(wù)也至關(guān)重要。

        良性循環(huán)的對立面是去個性化過程。從開始時,用戶對供應(yīng)的結(jié)果不滿意便會發(fā)生去個性化情況。如果這種情況一直發(fā)展下去,或是系統(tǒng)沒能及時做出調(diào)整,用戶就不愿意繼續(xù)使用個性化系統(tǒng)。去個性化在很大程度上影響著工程是否成功。因此,個性化開發(fā)者面臨的一個巨大挑戰(zhàn)就是如何實現(xiàn)良性循環(huán)。

        二、目標(biāo)驅(qū)動的個性化集成

        目前,大部分個性化只是實現(xiàn)了前面5個階段的功能,再復(fù)雜一些的系統(tǒng)也只是實現(xiàn)了個性化用戶評價功能,還沒有很好地實現(xiàn)反饋循環(huán)。因此,當(dāng)前個性化急待解決的問題是如何研究好的評價方法,個性化策略調(diào)整方法和合適的反饋循環(huán)。實現(xiàn)個性化良性循環(huán)依賴于2個關(guān)鍵步驟:個性化過程中6個階段的每1個階段都要選擇最好的技術(shù);個性化過程的每1個不同階段集成時都要有充分的原則依據(jù)。本節(jié),筆者討論通過目標(biāo)驅(qū)動設(shè)計原理,分析個性化過程的幾個關(guān)鍵技術(shù)及其特點。

        1.評價個性化。評價個性化最常用的方法是采用精度來度量,也就是說,通過精度和推薦的相關(guān)性能反映出喜歡或者不喜歡為其推薦商品的程度。但是基于精度的度量方法不能反映出更復(fù)雜和微妙的個性化,所以,一些研究者建議采用一些更有效、更全面的個性化度量方法。

        2.推薦呈現(xiàn)。個性化系統(tǒng)提供不同的呈現(xiàn)方式,由用戶根據(jù)其各自的職業(yè),習(xí)慣和年齡等特點進(jìn)行選擇。電子商務(wù)系統(tǒng)為用戶推薦呈現(xiàn)個性化信息的方式通常有:描述,相關(guān)性列表,可選集合和可視化等類型。有一種發(fā)送方法就是著名的“拉、推”方法。“拉”是通知用戶有一些可用的個性化信息,但是沒有顯示處來,需要用戶主動發(fā)送請求?!巴啤笔前研畔l(fā)送給沒有使用個性化的用戶。

        3.數(shù)據(jù)挖掘。數(shù)據(jù)挖掘是從數(shù)據(jù)源發(fā)現(xiàn)不明顯的,潛在有用的和以前未知的信息,通過數(shù)據(jù)挖掘為用戶生成個性化推薦。根據(jù)推薦方法的不同可分為:基于內(nèi)容的推薦,協(xié)作推薦和混合推薦等。

        (1)基于內(nèi)容的推薦。系統(tǒng)為用戶推薦的是用戶過去愛好的項目,例如內(nèi)容、服務(wù)和商品。這種基于內(nèi)容的推薦,分析用戶對某些點擊率高的項目的共性,只有與用戶過去喜歡的項目類似時才會推薦給用戶。

        (2)協(xié)作推薦。當(dāng)系統(tǒng)推薦的項目與用戶的興趣和愛好相似時,才被推薦給用戶。

        (3)混合推薦。綜合基于內(nèi)容和協(xié)作的推薦可以有以下2種方法:一種方法是分離基于內(nèi)容和協(xié)作過濾的方法,單獨建立系統(tǒng),然后把2個系統(tǒng)產(chǎn)生的結(jié)果綜合起來,形成最終的推薦結(jié)果;另外一種方法是,把基于內(nèi)容和協(xié)作的技術(shù)綜合到1個獨立的推薦系統(tǒng)中產(chǎn)生推薦結(jié)果,而不是把2種技術(shù)建立的系統(tǒng)分離開來。

        4.生成用戶模型。用戶信息的收集可以通過多種渠道來實現(xiàn),例如Web,電話和郵件等。可以通過調(diào)查的方式顯示收集,也可以通過人口統(tǒng)計學(xué)原理和心理行為學(xué)收集用戶信息。這些信息收集完成后,可以進(jìn)行處理和清洗,并存儲到數(shù)據(jù)倉庫中以便進(jìn)一步分析使用。

        猜你喜歡
        數(shù)據(jù)挖掘個性化驅(qū)動
        基于模糊PI控制的驅(qū)動防滑仿真系統(tǒng)分析
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        屈宏斌:未來五年,雙輪驅(qū)動,砥礪前行
        堅持個性化的寫作
        文苑(2020年4期)2020-05-30 12:35:12
        軌旁ATC系統(tǒng)門控柜接收/驅(qū)動板改造
        新聞的個性化寫作
        新聞傳播(2018年12期)2018-09-19 06:27:10
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        上汽大通:C2B個性化定制未來
        基于S3C6410的Wi-Fi驅(qū)動移植實現(xiàn)
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        日韩精品人妻中文字幕有码| 久久综合九色综合网站| 亚洲AV永久无码制服河南实里| 亚洲成AV人久久| av天堂网手机在线观看| 亚洲av无码乱码在线观看性色| 人人添人人澡人人澡人人人人| 国产av一区二区三区丝袜| 久久熟女少妇一区二区三区| 久久aaaa片一区二区| 亚洲av日韩av高潮潮喷无码 | 中出高潮了中文字幕| 丝袜美腿亚洲综合一区| 久久亚洲精品情侣| 波多野吉衣av无码| 无码人妻丰满熟妇区免费| 国内自拍视频一区二区三区 | 久久亚洲私人国产精品va| 无遮挡网站| 亚洲第一页在线观看视频网站| 欧美老妇牲交videos| 国产成人无码一区二区三区在线| av深夜福利在线| 美女被内射很爽的视频网站| 五月丁香六月综合缴清无码| 波多野结衣免费一区视频| 精品一区二区三区人妻久久| 中文字幕在线看精品乱码| 国偷自产视频一区二区久| 久久国产亚洲高清观看5388| 国产精品天堂在线观看 | 黑丝美腿国产在线观看| 无码人妻丰满熟妇区五十路| 欧美亚洲日韩国产区| 亚洲高清一区二区三区视频| 在线人成视频播放午夜| 国产成人综合色在线观看网站| 日本色偷偷| 亚洲一区二区国产一区| 特黄特色的大片观看免费视频| 日本久久久免费高清|