亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多智能體協(xié)同的多源信息搜索方法

        2015-01-06 08:21:17褚衍杰徐正國
        計(jì)算機(jī)工程 2015年2期
        關(guān)鍵詞:馬爾科夫數(shù)據(jù)源概率

        褚衍杰,徐正國

        (信號盲處理國家重點(diǎn)實(shí)驗(yàn)室,成都610041)

        基于多智能體協(xié)同的多源信息搜索方法

        褚衍杰,徐正國

        (信號盲處理國家重點(diǎn)實(shí)驗(yàn)室,成都610041)

        針對實(shí)時、多源、海量數(shù)據(jù)條件下用戶所需信息的獲取問題,提出一種面向?qū)ο蟮?、基于多智能體協(xié)同的多源信息搜索模型,以對象為中心,在反饋循環(huán)搜索的過程中,完善對象描述模型并實(shí)現(xiàn)多源數(shù)據(jù)中關(guān)聯(lián)對象信息的獲取,提高多源信息獲取的全面性和準(zhǔn)確性。設(shè)計(jì)基于Q學(xué)習(xí)的協(xié)同控制算法,針對馬爾科夫?qū)ο笈c非馬爾科夫?qū)ο蠼o出相應(yīng)的決策方法。實(shí)驗(yàn)結(jié)果表明,該協(xié)同控制算法比概率轉(zhuǎn)移矩陣及概率統(tǒng)計(jì)算法具有更好的信息獲取能力。

        多智能體;信息搜索;多源信息;面向?qū)ο?Q學(xué)習(xí);協(xié)同機(jī)制

        1 概述

        隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,尤其是移動互聯(lián)網(wǎng)日益深入人們的日常生活,各種數(shù)字化信息呈爆炸式增長,據(jù)IDC(International Data Corporation)公司統(tǒng)計(jì), 2011年全球被創(chuàng)建和被復(fù)制的數(shù)據(jù)總量為1.8 ZB (1021),其中75%來自個人(圖像、視頻、音樂等)[1];大數(shù)據(jù)、云計(jì)算等技術(shù)提供了海量數(shù)據(jù)處理的基本技術(shù),但是如何從繁雜多樣的多源數(shù)據(jù)中有效獲取用戶需要的信息仍是一個有待深入研究的課題。

        多智能體技術(shù)是一項(xiàng)利用多個智能體組成有機(jī)整體,并相互協(xié)同、服務(wù)以共同完成一個任務(wù)的人工智能技術(shù),能夠有效地實(shí)時解決動態(tài)復(fù)雜問題。文獻(xiàn)[2]提出一種利用移動智能體在多個網(wǎng)站搜索特定信息的系統(tǒng)及相應(yīng)算法,但未解決多種數(shù)據(jù)類型(如文本、圖片、視頻等)的協(xié)同搜索問題。文獻(xiàn)[3]構(gòu)建一個基于多智能體系統(tǒng)的知識管理模型;文獻(xiàn)[4]建立基于多智能體系統(tǒng)的多級庫存智能管理系統(tǒng);文獻(xiàn)[5]設(shè)計(jì)了以智能車為載體的區(qū)域監(jiān)控系統(tǒng);文獻(xiàn)[6]利用多智能體建模與仿真的方法分析了大眾生產(chǎn)系統(tǒng)在不同情況下的穩(wěn)定性;文獻(xiàn)[7]將多智能體系統(tǒng)應(yīng)用到城市管理領(lǐng)域,設(shè)計(jì)城市自動應(yīng)急聯(lián)動系統(tǒng);文獻(xiàn)[8]提出利用分布值函數(shù)的多智能體協(xié)同算法;文獻(xiàn)[9]提出利用多智能體交通濾波效應(yīng)的分布式協(xié)同控制算法;文獻(xiàn)[10]分析了復(fù)雜網(wǎng)絡(luò)特性對大規(guī)模多智能體協(xié)同算法的影響。本文借鑒上述模型、方法,將多智能體系統(tǒng)應(yīng)用到多源信息的協(xié)同搜索問題中,提出多智能體協(xié)同模型及協(xié)同算法。

        2 基于多智能體協(xié)同的多源信息搜索模型

        用戶關(guān)心的信息一般可以概括為2種:面向?qū)ο蟮男畔⒑兔嫦蜻^程的信息。面向?qū)ο蟮男畔⑹侵赣脩絷P(guān)心某個對象,例如人、組織、物品、文章等的相關(guān)信息;面向過程的信息是指用戶關(guān)心某個事件的發(fā)展進(jìn)程。由于對事件過程描述的復(fù)雜性,在信息搜索的過程中,一般也以事件過程中相關(guān)對象的特征為搜索要素,因此可以用一種對象描述模型來表示信息模型。根據(jù)用戶關(guān)心內(nèi)容的不同,對象模型具有不同的形式,且可以在信息搜索過程中進(jìn)行更新。一般而言,對象的基本模型包含以下因素:[對象名,對象身份特征,對象行為特征],例如,某人可以描述為[姓名,籍貫,年齡,民族,電話號碼,聯(lián)系人,聯(lián)系時間],在信息搜索過程中可以根據(jù)需要逐漸更新學(xué)歷、微博賬號、微博內(nèi)容等要素。

        2.1 模型介紹

        多智能體協(xié)同的多源信息搜索模型利用不同的智能體處理不同類型的數(shù)據(jù),并融合多種結(jié)果作為最終的對象信息,結(jié)構(gòu)如圖1所示。

        圖1 多智能體協(xié)同的多源信息搜索模型

        多智能體協(xié)同的多源信息搜索模型結(jié)構(gòu)具體如下:

        (1)協(xié)同控制智能體:負(fù)責(zé)根據(jù)用戶的搜索要求、對象知識庫和對象描述模型,制定下達(dá)搜索任務(wù),協(xié)調(diào)不同的智能體完成不同的子任務(wù)。

        (2)智能體群:即圖1中的智能體A、智能體B等,具體完成數(shù)據(jù)分析的子任務(wù);這些智能體可以具有相同的功能,并行處理數(shù)據(jù),也可以具有不同的功能,處理不同類型的數(shù)據(jù)。

        (3)素材數(shù)據(jù)采集智能體:由多個素材數(shù)據(jù)采集智能體組成,負(fù)責(zé)從不同的數(shù)據(jù)源采集素材數(shù)據(jù)。在數(shù)據(jù)源眾多、數(shù)據(jù)采集設(shè)備有限的條件下,需要利用原始素材庫及對象知識庫的統(tǒng)計(jì)信息制定合理的數(shù)據(jù)采集策略。

        2.2 信息搜索流程

        信息搜索流程如下:

        (1)用戶下達(dá)信息搜索任務(wù)。

        (2)協(xié)同控制智能體根據(jù)任務(wù)內(nèi)容,初始化對象模型。

        (3)協(xié)同控制智能體根據(jù)對象模型和對象知識庫中已有的知識制定搜索子任務(wù),分發(fā)給智能體群中的各智能體;協(xié)同控制智能體根據(jù)各子任務(wù)內(nèi)容,將素材數(shù)據(jù)的篩選條件下達(dá)到素材數(shù)據(jù)采集智能體。

        (4)素材數(shù)據(jù)采集智能體實(shí)時進(jìn)行數(shù)據(jù)采集,將原始數(shù)據(jù)存入原始素材庫。

        (5)智能體群中的各智能體從原始素材庫中采集要素信息,完成分析處理任務(wù),通知協(xié)同控制智能體,將結(jié)果存入對象知識庫,并更新對象描述模型。

        (6)協(xié)同控制智能體判斷任務(wù)完成情況,若達(dá)到用戶的要求,則結(jié)束任務(wù),否則轉(zhuǎn)步驟(3),直至達(dá)到要求。

        在圖1中,素材數(shù)據(jù)采集智能體面臨從多源數(shù)據(jù)中提高獲取有效素材效率的問題,該問題已在文獻(xiàn)[11]中詳細(xì)論述;協(xié)同控制智能體面臨協(xié)調(diào)智能體群處理多源、多類型數(shù)據(jù)的問題,下面將針對該問題提出協(xié)同控制算法。

        3 多源信息搜索協(xié)同控制方法

        用戶關(guān)心的對象數(shù)據(jù)經(jīng)常會在多個數(shù)據(jù)源、多種類型數(shù)據(jù)之間跳轉(zhuǎn),其跳轉(zhuǎn)規(guī)律通常蘊(yùn)含了該對象的行為特性,基于Q學(xué)習(xí)的協(xié)同控制算法利用Q學(xué)習(xí)思想訓(xùn)練對象的出現(xiàn)記錄,從而解決控制多智能體群在何時處理哪個數(shù)據(jù)源中哪類數(shù)據(jù)的問題。

        3.1 Q學(xué)習(xí)

        Q學(xué)習(xí)是一種傳統(tǒng)的多智能體強(qiáng)化學(xué)習(xí)方法,通過智能體與環(huán)境交互得到外部環(huán)境的回報,從而決定下一步的動作。Q學(xué)習(xí)把智能體的學(xué)習(xí)過程看作一個Markov決策過程(Markov Decision Proccss, MDP),即智能體根據(jù)當(dāng)前內(nèi)部狀態(tài)、外部狀態(tài)、固定的狀態(tài)轉(zhuǎn)移概率,以最大化將來的總體回報為目標(biāo),決定下一步采取的動作并得到一個即時回報。

        Q學(xué)習(xí)中定義Q值為按照某一個策略執(zhí)行一系列動作得到的回報的總和,其一步更新算法如下[12]:其中,st∈S表示t時刻的狀態(tài);at∈A表示t時刻采取的動作;P(st,at,st+1)表示在狀態(tài)st下執(zhí)行動作at,轉(zhuǎn)化到狀態(tài)st+1的概率;r(st,at)表示在狀態(tài)st下執(zhí)行動作at得到的回報;γ表示折扣因子,描述時間遠(yuǎn)近對回報的影響;α表示學(xué)習(xí)率。

        在Q學(xué)習(xí)中,累計(jì)回報函數(shù)表示為Vπ(s)=Qπ(s,a),按照策略與狀態(tài)動作對的映射尋找最優(yōu)策略,即π:s→a,可以得到最優(yōu)策略如下:

        通過反復(fù)迭代執(zhí)行動作-更新Q值,Q值將逐步逼近最優(yōu)策略Q?(s,a)。

        通過對Q學(xué)習(xí)算法的介紹可以發(fā)現(xiàn),Q學(xué)習(xí)算法通過學(xué)習(xí)訓(xùn)練過程中動作與環(huán)境回報之間的對應(yīng)關(guān)系,實(shí)現(xiàn)尋找最優(yōu)策略的目的,與多源信息搜索問題中希望通過對象數(shù)據(jù)的出現(xiàn)規(guī)律預(yù)測下一步動作的問題類似,因此下面提出基于Q學(xué)習(xí)的協(xié)同控制方法。

        3.2 基于Q學(xué)習(xí)的協(xié)同控制方法

        在多源信息搜索的協(xié)同控制問題中,利用Q表訓(xùn)練對象的出現(xiàn)記錄,其中有以下問題需要關(guān)注:

        (1)系統(tǒng)狀態(tài)與動作:系統(tǒng)狀態(tài)S表征系統(tǒng)發(fā)現(xiàn)對象信息的情況,可以直接使用發(fā)現(xiàn)對象的數(shù)據(jù)源和數(shù)據(jù)類型(s,d)表示,即共有M×N種狀態(tài),且可以變換為S=s+(d-1)×M,狀態(tài)間可以任意跳轉(zhuǎn);系統(tǒng)執(zhí)行的動作a表示處理某數(shù)據(jù)源的某類數(shù)據(jù),同樣有M×N種動作。

        (2)環(huán)境回報函數(shù):Q學(xué)習(xí)算法的環(huán)境回報函數(shù)r(st,at)表征在狀態(tài)st下執(zhí)行動作at,將得到的回報應(yīng)用在多源信息搜索問題中,表示在相應(yīng)數(shù)據(jù)源、數(shù)據(jù)類型中發(fā)現(xiàn)對象信息的價值,該價值可以由用戶通過歷史經(jīng)驗(yàn)對數(shù)據(jù)源、數(shù)據(jù)類型的重要程度評價得到,也可以統(tǒng)計(jì)單位時間內(nèi)在數(shù)據(jù)源、數(shù)據(jù)類型內(nèi)獲取的對象信息數(shù)量確定,環(huán)境回報函數(shù)示例如圖2所示。

        圖2 環(huán)境回報函數(shù)示例

        (3)對象特性:傳統(tǒng)的Q學(xué)習(xí)算法采用二維Q表存儲Q值,相當(dāng)于默認(rèn)對象下一狀態(tài)僅由其當(dāng)前狀態(tài)確定,符合馬爾科夫過程的特點(diǎn);在多源信息搜索問題中,對象的特性未知,有可能不符合馬爾科夫過程的特點(diǎn),因此對Q表進(jìn)行改進(jìn),采用多維Q表,則Q表的維度表示了對象前后相關(guān)狀態(tài)的數(shù)量;從經(jīng)驗(yàn)上看,對象的相關(guān)狀態(tài)數(shù)量不會太多,基于Q學(xué)習(xí)的協(xié)同控制算法(圖3)采用三維Q表。下面根據(jù)對象是否符合馬爾科夫過程特點(diǎn)將對象稱為馬爾科夫?qū)ο蠛头邱R爾科夫?qū)ο蟆?/p>

        圖3 基于Q學(xué)習(xí)的協(xié)同控制算法流程

        基于Q學(xué)習(xí)的協(xié)同控制算法具體步驟如下:

        (1)初始化系統(tǒng)內(nèi)部狀態(tài),系統(tǒng)內(nèi)部狀態(tài)為(s-,s0,s+),其中,s0表示對象最近一次出現(xiàn)的狀態(tài);s-表示s0的前一個狀態(tài);s+表示s0的后一個狀態(tài)。

        (2)初始化Q表,Q(i,j,k)=0(1≤i,j,k≤M×N),初始化環(huán)境回報函數(shù),為便于仿真,此處假設(shè)環(huán)境回報函數(shù)由人工設(shè)定,實(shí)際使用時可以統(tǒng)計(jì)獲取。

        (3)當(dāng)有新的對象出現(xiàn)記錄g={gs,gd}時,更新s+=gs+(gd-1)×M;更新Q值表,一步更新公式為Q(s-,s0,s+)=Q(s-,s0,s+)+r(s+)。

        (5)對象屬性判斷:系統(tǒng)初始時,無歷史信息,無法確定對象屬性,同時執(zhí)行步驟(6)、步驟(7);系統(tǒng)運(yùn)行一段時間后,統(tǒng)計(jì)馬爾科夫決策和非馬爾科夫決策對下一步動作的預(yù)測與對象下一步實(shí)際狀態(tài)相同的次數(shù),選擇預(yù)測正確次數(shù)大的決策屬性作為對象屬性。

        (8)執(zhí)行下一步動作,處理狀態(tài)s+對應(yīng)的{s,d}數(shù)據(jù),對應(yīng)公式為:

        其中,表示向下取整,等待新的對象出現(xiàn)記錄,轉(zhuǎn)步驟(3)。

        分析算法步驟可以看出,算法計(jì)算量主要集中在預(yù)測下一步動作時求Q值矩陣的最大值,馬爾科夫決策的復(fù)雜度為O(M2N2),非馬爾科夫決策的復(fù)雜度為O(MN),因此算法總的復(fù)雜度為O(M2N2),能夠滿足實(shí)時處理的需求。

        4 實(shí)驗(yàn)驗(yàn)證與結(jié)果分析

        為驗(yàn)證算法性能,在Matlab 2012上對算法進(jìn)行仿真驗(yàn)證。驗(yàn)證系統(tǒng)結(jié)構(gòu)如圖4所示,其中,對象記錄生成模塊負(fù)責(zé)生成馬爾科夫?qū)ο蠛头邱R爾科夫?qū)ο蟮某霈F(xiàn)記錄;對象信息價值統(tǒng)計(jì)模塊負(fù)責(zé)按照環(huán)境回報函數(shù)統(tǒng)計(jì)不同算法獲取的對象信息價值,作為比較算法性能的依據(jù)。為了說明算法性能,下面對比了本文算法、轉(zhuǎn)移概率矩陣算法以及概率統(tǒng)計(jì)算法的性能(“Q學(xué)習(xí)2”表示本文算法的馬爾科夫決策,“Q學(xué)習(xí)3”表示本文算法的非馬爾科夫決策),其中轉(zhuǎn)移概率矩陣算法是指利用對象出現(xiàn)記錄,統(tǒng)計(jì)對象在各狀態(tài)間的轉(zhuǎn)移概率矩陣,并根據(jù)當(dāng)前狀態(tài)的最大轉(zhuǎn)移概率值確定下一步動作;概率統(tǒng)計(jì)算法是指統(tǒng)計(jì)對象在各狀態(tài)的歷史出現(xiàn)記錄作為對象在該狀態(tài)出現(xiàn)的概率,下一步動作為向出現(xiàn)概率最大的狀態(tài)對應(yīng)的數(shù)據(jù)源、業(yè)務(wù)派遣處理智能體。

        圖4 驗(yàn)證系統(tǒng)結(jié)構(gòu)

        在下面實(shí)驗(yàn)中,如無特殊說明,實(shí)驗(yàn)數(shù)據(jù)條件為:M=5,N=5,對象在各數(shù)據(jù)源、數(shù)據(jù)類型的出現(xiàn)符合正態(tài)分布;每次實(shí)驗(yàn)初始時對象出現(xiàn)記錄數(shù)為0,然后生成對象出現(xiàn)位置并預(yù)測下一步動作,每種方法生成并預(yù)測1000次,統(tǒng)計(jì)獲取的對象信息價值;每種實(shí)驗(yàn)給出10次實(shí)驗(yàn)的結(jié)果。

        實(shí)驗(yàn)結(jié)果中的2個性能指標(biāo)定義如下:(1)信息價值是指歷次預(yù)測正確時的環(huán)境回報函數(shù)累計(jì)求和;(2)信息獲取率是指算法獲取的信息價值與搜索次數(shù)的比值。

        4.1 環(huán)境回報函數(shù)對算法性能的影響

        環(huán)境回報函數(shù)是本文算法與轉(zhuǎn)移概率矩陣算法的主要區(qū)別之一,為了說明環(huán)境回報函數(shù)的影響,按照圖5給出的2種回報函數(shù)設(shè)置進(jìn)行實(shí)驗(yàn),結(jié)果如圖6所示。

        圖5 2種環(huán)境回報函數(shù)設(shè)置

        圖6 環(huán)境回報函數(shù)對算法性能影響的對比

        在圖6(a)中,本文算法的馬爾科夫決策和轉(zhuǎn)移概率矩陣算法的實(shí)驗(yàn)結(jié)果基本一致,都比概率統(tǒng)計(jì)算法有顯著提高,這是由于所有的回報函數(shù)值都設(shè)為1時,本文算法退化為和轉(zhuǎn)移概率矩陣算法相同,從本質(zhì)上講,兩者對下一步動作的預(yù)測都是基于馬爾科夫模型的概率轉(zhuǎn)移矩陣;圖6(a)中有個別實(shí)驗(yàn)結(jié)果有微小區(qū)別,是由于兩者第一次訓(xùn)練需要的數(shù)據(jù)量不同造成的,本文算法需要3次記錄生成第一個Q值,而轉(zhuǎn)移概率矩陣算法只需要2次記錄;在圖6(b)中,由于環(huán)境回報函數(shù)分為5級,本文算法的優(yōu)勢得以體現(xiàn),比轉(zhuǎn)移概率矩陣算法性能提升在40%~50%左右,說明了環(huán)境回報函數(shù)的有效性。

        4.2 算法綜合性能分析

        圖7(a)和圖7(b)分別給出了對于馬爾科夫?qū)ο笈c非馬爾科夫?qū)ο?4種方法的整體性能對比。圖7(a)的學(xué)習(xí)次數(shù)為1000次,圖7(b)的學(xué)習(xí)次數(shù)為10 000次,本文算法采用圖5的第2種環(huán)境回報函數(shù)。

        圖7 算法整體性能對比

        由圖7(a)可以看出,對于馬爾科夫?qū)ο?在訓(xùn)練次數(shù)為1000的條件下,本文算法的馬爾科夫決策效果最好,轉(zhuǎn)移概率矩陣算法效果次之;由圖7(b)可以看出,對于非馬爾科夫?qū)ο?在訓(xùn)練次數(shù)為10 000的條件下,本文算法的非馬爾科夫決策效果最好,馬爾科夫決策次之,轉(zhuǎn)移概率矩陣算法和概率統(tǒng)計(jì)算法的性能較差。上述結(jié)果說明當(dāng)算法假定的對象特性與實(shí)際相符時,算法效果最好,實(shí)際使用時需要根據(jù)情況選擇適當(dāng)算法。

        圖8(a)和圖8(b)分別給出了對于馬爾科夫?qū)ο蠛头邱R爾科夫?qū)ο?4種算法的性能收斂趨勢。圖8(a)針對馬爾科夫?qū)ο?進(jìn)行了1次實(shí)驗(yàn),預(yù)測10 000次;圖8(b)針對非馬爾科夫?qū)ο?進(jìn)行了1次實(shí)驗(yàn),預(yù)測100 000次。

        圖8 算法收斂性對比

        由圖8(a)可以看出,對于馬爾科夫?qū)ο?本文算法的馬爾科夫決策的信息獲取率最高,且收斂速度較快。在學(xué)習(xí)次數(shù)為500左右時,算法信息獲取率達(dá)到20%左右,此后持續(xù)增長,在學(xué)習(xí)次數(shù)為3 000左右之后增速放緩,趨于平穩(wěn);另外,3種算法收斂后的性能按照轉(zhuǎn)移概率矩陣算法、本文算法的非馬爾科夫決策、概率統(tǒng)計(jì)算法的順序性能依次降低。

        由圖8(b)可以看出,對于非馬爾科夫?qū)ο?本文算法的非馬爾科夫決策的信息獲取率最高,且收斂速度較快。在學(xué)習(xí)次數(shù)為5 000左右時,算法信息獲取率達(dá)到20%左右,此后持續(xù)增長,在學(xué)習(xí)次數(shù)為20 000左右后增速放緩,趨于平穩(wěn);另外,3種算法收斂后的性能按照本文算法的馬爾科夫決策方法、轉(zhuǎn)移概率矩陣算法、概率統(tǒng)計(jì)算法的順序性能依次降低。在學(xué)習(xí)次數(shù)小于3 000次左右的情況下,本文算法的馬爾科夫決策的性能比其他3種算法好。

        另外,上述實(shí)驗(yàn)是對象在各數(shù)據(jù)源、數(shù)據(jù)類型正態(tài)分布的情況下進(jìn)行的,在現(xiàn)實(shí)中根據(jù)對象分布特性的不同,算法性能提升效果有所不同。一般來說,對象分布越不均勻,算法效果越好。

        通過上述實(shí)驗(yàn)驗(yàn)證,發(fā)現(xiàn)本文算法的特性如下:

        (1)基于Q學(xué)習(xí)的協(xié)同控制算法中分別針對2種類型的對象設(shè)計(jì)了馬爾科夫決策和非馬爾科夫決策。馬爾科夫適用于馬爾科夫?qū)ο蠡蛘叻邱R爾科夫?qū)ο蟮珜W(xué)習(xí)次數(shù)較少的情況;非馬爾科夫決策適用于非馬爾科夫?qū)ο笄覍W(xué)習(xí)次數(shù)較多的情況。

        (2)由于馬爾科夫決策的收斂速度較快,因此在實(shí)際使用中,建議學(xué)習(xí)次數(shù)小于M2N2的情況下使用馬爾科夫決策;學(xué)習(xí)次數(shù)大于M2N2后,2種決策方法分別預(yù)測,根據(jù)預(yù)測正確率確定對象屬性,從而選擇預(yù)測方法。

        5 結(jié)束語

        本文研究海量實(shí)時數(shù)據(jù)條件下有效獲取多源信息的方法,在多智能體技術(shù)的基礎(chǔ)上,設(shè)計(jì)面向?qū)ο蟮亩嘀悄荏w協(xié)同多源信息搜索模型,并提出基于Q學(xué)習(xí)的多源信息搜索協(xié)同控制方法。與傳統(tǒng)搜索引擎相比,利用該模型能夠以對象為中心,在反饋循環(huán)搜索的過程中,完善對象描述模型并能從多源數(shù)據(jù)中關(guān)聯(lián)獲取對象信息,在信息搜索的全面性、有效性上有較大提高,模型的可擴(kuò)充性也較強(qiáng)。針對基于Q學(xué)習(xí)的多源信息搜索協(xié)同控制方法的實(shí)驗(yàn)證明,該方法設(shè)計(jì)的2種決策使得系統(tǒng)對馬爾科夫?qū)ο蠛头邱R爾科夫?qū)ο蟮男畔⑺阉餍视酗@著提高。基于多智能體的多源信息搜索模型,能夠提高信息搜索系統(tǒng)的智能性、全面性和靈活性,但由于采用在線采集要素、離線循環(huán)分析的方法,在時效性上有所欠缺;另外,該模型對智能體群處理能力的差異未進(jìn)行詳細(xì)分析,這些都有待進(jìn)一步研究。

        [1] Gantz J,Reinsel D.IDC IVIEW:Extracting Value from Chaos[J].IDC IVIEW,2011,(12):1-12.

        [2] Chu Yanjie,Wei Qiang.A Network Specific Information SearchSystemBasedonMobileAgent[C]// Proceedings of the 3rd Global Congress on Intelligent Systems.Wuhan,China:[s.n.],2012:302-304.

        [3] 蔣翠清,幸龍潮,丁 勇.基于Agent的知識管理系統(tǒng)模型研究[J].情報雜志,2007,(2):56-61.

        [4] 薛 紅,趙 川.基于多智能體的連鎖零售多級庫存集成與優(yōu)化[J].計(jì)算機(jī)工程,2012,38(14):167-170.

        [5] 陳 棟,關(guān)新平,龍承念,等.基于多智能體的區(qū)域監(jiān)控系統(tǒng)[J].計(jì)算機(jī)工程,2010,36(21):72-74.

        [6] 姚燦中,楊建梅.基于多智能體的大眾生產(chǎn)系統(tǒng)穩(wěn)定性研究[J].計(jì)算機(jī)工程,2011,37(3):13-15.

        [7] 熊立春,陳建宏,石東平,等.基于Multi-Agent協(xié)同模式的城市應(yīng)急聯(lián)動系統(tǒng)[J].科技導(dǎo)報,2012,(5): 33-38.

        [8] Ferreira E D,Khosla P K.Multi Agent Collaboration Using Distributed Value Functions[C]//Proceedings of IEEE Intelligent Vehicles Symposium.Dearborn,USA: IEEE Press,2000:404-409.

        [9] 徐 楊,張玉林,孫婷婷,等.基于多智能體交通濾波效應(yīng)分布式協(xié)同控制算法[J].軟件學(xué)報,2012, 23(11):2937-2945.

        [10] 徐 楊,李 響,常 洪,等.復(fù)雜網(wǎng)絡(luò)特性對大規(guī)模多智能體協(xié)同控制的影響[J].軟件學(xué)報,2012, 23(11):2971-2986.

        [11] 褚衍杰,徐正國.基于行為規(guī)律的搜索資源分配新算法[J].電訊技術(shù),2014,54(2):195-200.

        [12] 趙增榮,韓提文.基于Q-Learning的智能體訓(xùn)練[J].石家莊鐵道學(xué)院學(xué)報,2007,20(2):37-39.

        編輯 陸燕菲

        Multi-source Information Search Method Based on Multi-Agent Collaboration

        CHU Yanjie,XU Zhengguo
        (National Key Laboratory of Blind Signal Processing,Chengdu 610041,China)

        A new multi-source information search model based on multi-Agent collaboration is put forward to deal with the problem that under the real time,multi-source and huge information condition.Multi-Agent information search model centers around objects,builds the whole object model by cycling search,and gets the information that users care for.This model has higher intelligent and open-ended features,and it can make multi-source information searing more comprehensive and accurate.Q-learning-based collaborative control algorithm is proposed.The algorithm designs different decision-making methods for Markov objects and non-Markov objects.Experimental results show that the algorithm has better information search ability than probability transfer matrix and probability statistics algorithms.

        multi-Agent;information search;multi-source information;object-oriented;Q learning;collaborative mechanism

        褚衍杰,徐正國.基于多智能體協(xié)同的多源信息搜索方法[J].計(jì)算機(jī)工程,2015,41(2):193-198.

        英文引用格式:Chu Yanjie,Xu Zhengguo.Multi-source Information Search Method Based on Multi-Agent Collaboration[J].Computer Engineering,2015,41(2):193-198.

        1000-3428(2015)02-0193-06

        :A

        :TP393

        10.3969/j.issn.1000-3428.2015.02.037

        褚衍杰(1982-),男,博士研究生,主研方向:信息處理;徐正國,博士研究生。

        2014-02-28

        :2014-04-07E-mail:chuyanjie@tsinghua.org.cn

        猜你喜歡
        馬爾科夫數(shù)據(jù)源概率
        第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
        第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
        基于疊加馬爾科夫鏈的邊坡位移預(yù)測研究
        概率與統(tǒng)計(jì)(一)
        概率與統(tǒng)計(jì)(二)
        基于改進(jìn)的灰色-馬爾科夫模型在風(fēng)機(jī)沉降中的應(yīng)用
        Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
        基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評價研究
        馬爾科夫鏈在教學(xué)評價中的應(yīng)用
        基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評價算法
        男人扒开女人下面狂躁小视频| 久久国产热精品波多野结衣av| 红杏性无码免费专区| 亚洲国产精品久久性色av| 337p日本欧洲亚洲大胆色噜噜| 国产乱子伦农村叉叉叉| 一级片久久| 亚洲国产精品成人av| 91成人自拍国语对白| 亚洲爆乳精品无码一区二区| 免费成人福利视频| 国产精品又黄又爽又色| 天堂av在线美女免费| 图片区小说区激情区偷拍区| 岛国大片在线免费观看| 少妇呻吟一区二区三区| 亚洲色大成网站www永久| 国产三级在线观看播放视频| 亚洲国产欧美久久香综合| 亚洲国产最新免费av| 午夜精品久久久久久久99热| 亚洲精品无码久久毛片| 国产女主播免费在线观看| 丁香婷婷在线成人播放视频| 亚洲精品乱码久久久久久蜜桃不卡| 制服丝袜视频国产一区| 日本一区人妻蜜桃臀中文字幕| 欧美精品一区二区精品久久| 日韩精品无码一区二区三区视频| 99在线无码精品秘 入口九色 | 国产精品久久婷婷婷婷| h视频在线免费观看视频| 国产精品美女久久久久av福利 | 色男色女午夜福利影院| 特黄熟妇丰满人妻无码| 久久亚洲欧洲无码中文| 精品亚洲女同一区二区| 亚洲第一女优在线观看| 丰满少妇a级毛片| 欧美一级欧美一级在线播放| 亚洲黑寡妇黄色一级片|