亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一個具有隨機擾動項的動態(tài)學(xué)習(xí)模型的構(gòu)建

        2010-10-21 06:25:32敏,閆
        統(tǒng)計與決策 2010年8期
        關(guān)鍵詞:動態(tài)性納什概率分布

        周 敏,閆 磊

        (中國礦業(yè)大學(xué) 管理學(xué)院,江蘇 徐州 221116)

        0 前言

        由于在系統(tǒng)的演化發(fā)展過程中存在學(xué)習(xí)決策行為的復(fù)雜性和動態(tài)性,普通的博弈論的納什均衡不能很好的解決這些問題。但是在符合學(xué)習(xí)模型的各種基本假設(shè)的條件下,我們可以構(gòu)造一個具有隨機擾動項的動態(tài)學(xué)習(xí)模型,它可以把決策行為進行概率化來解決演化過程的復(fù)雜性和動態(tài)性特征。當(dāng)系統(tǒng)的演化結(jié)果出現(xiàn)穩(wěn)定解時,我們可以得到具有動態(tài)性和復(fù)雜性的學(xué)習(xí)模型的的穩(wěn)態(tài)決策概率分布,這種非確定性納什均衡解可以看做普通博弈論中的納什均衡解的擴展。

        1 動態(tài)學(xué)習(xí)模型的構(gòu)建

        由于企業(yè)的任何決策都是根據(jù)以前的決策行為和決策效果決定的,所以的企業(yè)的新的決策會隨著以前決策行為的結(jié)果做出調(diào)整,并且總是朝著更好的收益的方向轉(zhuǎn)移。所以說企業(yè)的連續(xù)決策是具有學(xué)習(xí)能力的,并且的動態(tài)復(fù)雜的。我們可以用一個帶有漂移的隨機分方程來表示這個決策過程。假設(shè)企業(yè)在原來的基礎(chǔ)上根據(jù)前一個決策的效果做出新的決策,這個新的決策行為由于受到噪音的影響會發(fā)生隨機游走產(chǎn)生某種變異。在任一時刻t,系統(tǒng)的狀態(tài)由t時刻決策的概率分布表示。這樣,如果決策狀態(tài)穩(wěn)定,決策行為經(jīng)過演化而得出的結(jié)果是一個在穩(wěn)態(tài)下的概率分布。

        企業(yè)的生產(chǎn)經(jīng)營行為就是不斷的做出決策的行為。在構(gòu)建的模型中,假設(shè)存在m個企業(yè),他們獨立的進行連續(xù)決策,同時又受到競爭對手以及自己的決策行為和結(jié)果的影響。企業(yè)的決策行為用ωj(t)∈[c,d]表示,其中t代表決策時間,j代表決策企業(yè)。由于隨機擾動的的存在,企業(yè)的決策行為以某種概率分布的形式來表示。設(shè)Gj(ω,t)為表示企業(yè)j決策行為的概率分布函數(shù),則其密度函數(shù)為:

        設(shè)m-1維向量ωm-1(t)為與決策行為j對應(yīng)的其它m-1個企業(yè)的決策,Gm-1(ωm-1,t)為相應(yīng)的為m-1個企業(yè)的決策行動的概率分布。由于在學(xué)習(xí)模型中決策行為的學(xué)習(xí)能力,企業(yè)j的收益是由其自身的決策行為和其它的m-1個企業(yè)共同決定的。我們用L(s)表示去在t時刻的收益,那么:

        由于任何企業(yè)都是以收益最大化為目的的,企業(yè)在決策過程中總是調(diào)整決策行為可以給自己帶來更高收益的決策方向靠攏。同時在決策過程中企業(yè)會受到各種噪音的干擾總會出現(xiàn)某些失誤,這可以用隨機擾動項來表示。

        我們將上述的兩個過程用如下方程表達出來:

        等式右邊的第一項為新決策行為對舊的決策行為的調(diào)整量。第二項為可能導(dǎo)致決策行為失誤的噪聲干擾,概率為ξj,wj(t),為標準維納過程,wj(t)服從均值為0方差為dt的正態(tài)分布。因此:

        考察到時間間隔,上式可化為:

        其中 0(δt)為 δt的高階無窮小。

        引入任意函數(shù)f(ωj),考察該函數(shù)在δt時間間隔后的期望值:我們令 x=ξjδwj(t)的密度函數(shù)為 φ(x),由于 E(x)≈0,E(x2)=ξj2δt,則:

        上式描述了具有動態(tài)學(xué)習(xí)行為的企業(yè)連續(xù)決策行為的系統(tǒng)演化過程。我們可以從中得出下面的結(jié)論:

        首先,右邊第一項-L[(sj(ωj),t)]'gj(ωj,t)表明,企業(yè)的決策行為總是向著可以帶來更高收益的方向調(diào)整,并且預(yù)期收益和現(xiàn)在收益的差距越大調(diào)整的速度越快;決策調(diào)整速度與企業(yè)在t時刻采取行動ωj的概率密度成正比。

        我們對上面的式子進一步研究。

        2 結(jié)論

        根據(jù)上面的模型構(gòu)建和演化分析,我們得出如下的結(jié)論:

        (1)(4)式是 Gi(ω,t)演化到穩(wěn)態(tài)時的均衡條件。 從該條件可以看出,采取決策行為ωj的概率不但受到與其他m-1個企業(yè)的決策行為相對應(yīng)的收益的影響,并且表現(xiàn)出遞增的態(tài)勢。

        (2)當(dāng)參數(shù) ξi趨于無窮大時,趨于零。 由于決策行為的的選取是完全隨機的不受期望收益的影響,這表明在演化過程中,企業(yè)決策行為會受到太大的隨機擾動的影響而呈現(xiàn)出隨機性特征。

        (3)當(dāng) ξj趨于零時,從(4)可知,由于受到的干擾較小,采取特定行動的概率中對行動的期望收益的依賴才會不斷增加。由于受到隨機因素的干擾較小,學(xué)習(xí)能力才能很快的增強。

        (4)在現(xiàn)實的企業(yè)決策過程中,決策的擾動既不是ξj趨于無窮大,也不是ξj趨于零,而是具有一定程度噪聲的決策行為的學(xué)習(xí)過程。當(dāng)整個演化達到穩(wěn)態(tài)時,得出的均衡解是具有某種概率密度的穩(wěn)態(tài)值,是非確定的,它可以看做確定解納什均衡的擴展值。同時在模型中可以看出降低決策行為的擾動是提高決策能力的有效方法。因此,企業(yè)在決策過程中應(yīng)該通過不斷學(xué)習(xí),來降低決策行為的的失誤和“噪音”的的擾動。

        [1]陸瑾.產(chǎn)業(yè)組織演化研究[D].復(fù)旦大學(xué),2005.

        [2]吳彤.自組織方法論研究[M].清華大學(xué)出版社,2001.

        [3]盛昭瀚,蔣德鵬.演化經(jīng)濟學(xué)[M].上海三聯(lián)書店,2002.

        [4]黃登仕,經(jīng)濟系統(tǒng)的密度周期性和復(fù)雜性[M].北京大學(xué)出版社,2003.

        [5]Kwasnicka H,Kwasnieki W,long-term diffusion factors of technological development:an evolutionary model and case study[J].Technologieal Foereasting and Social Change,1996,52.

        [6]Potts J,The New Evolutionary Microeconomics:Complexity,Competence,and Adaptive Behavior[M].Cheltenham,Edward Elgar,2000.

        [7]Silverberg G,Dosi G,Orsenigo L,Innovation,Diversity and Diffusion:a self-organization Model[J],EconomicJounral,1988,98.

        [8]程紅莉.學(xué)習(xí)型企業(yè)及其組織學(xué)習(xí)機制研究[D].華中師范大學(xué),2003.

        [9]陳國權(quán),馬萌.組織學(xué)習(xí)過程模型研究[J].管理科學(xué)學(xué)報,2000,3(3).

        猜你喜歡
        動態(tài)性納什概率分布
        離群動態(tài)性數(shù)據(jù)情報偵查方法研究
        THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
        THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
        離散型概率分布的ORB圖像特征點誤匹配剔除算法
        交際中模糊語言的動態(tài)性闡釋
        國土資源績效管理指標體系的動態(tài)性探討
        關(guān)于概率分布函數(shù)定義的辨析
        科技視界(2016年19期)2017-05-18 10:18:46
        基于概率分布的PPP項目風(fēng)險承擔(dān)支出測算
        基于CDM系統(tǒng)的航班動態(tài)性調(diào)度研究
        一種相依極小P值統(tǒng)計量概率分布的近似計算方法
        精品国产乱码久久免费看| av影片在线免费观看| 中国少妇×xxxx性裸交| 国产精品无码av天天爽| 欧美日韩国产专区| 大量老肥熟女老女人自拍| av手机在线观看不卡| 天天躁夜夜躁狠狠躁2021| 99久久综合狠狠综合久久| 69堂在线无码视频2020| 少妇人妻精品久久888| 男人扒开添女人下部免费视频| √天堂中文官网8在线| 91精品在线免费| 小池里奈第一部av在线观看 | 内射人妻视频国内| 久久精品日韩av无码| 伊人精品无码AV一区二区三区| 亚洲精品一区二区视频| 91九色成人蝌蚪首页| 国产免费av片在线观看| 日韩av在线毛片| 免费av在线 国产精品| 一区二区三区午夜视频在线 | 精品人妻久久一日二个| 无码精品人妻一区二区三区漫画| 日躁夜躁狠狠躁2001| 久久一日本道色综合久久大香| 自拍视频国产在线观看| 亚洲熟女一区二区三区250p| 边喂奶边中出的人妻| 成年女人免费v片| 一区二区三区精品婷婷| 蜜芽亚洲av无码精品色午夜| 国产乱人伦在线播放| 亚洲国产精品综合久久20| 精品久久一品二品三品| 摸进她的内裤里疯狂揉她动图视频| 福利在线国产| 青青草视频在线观看视频免费| 亚洲av一二三区成人影片|