亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一個具有隨機擾動項的動態(tài)學(xué)習(xí)模型的構(gòu)建

        2010-10-21 06:25:32敏,閆
        統(tǒng)計與決策 2010年8期
        關(guān)鍵詞:動態(tài)性納什概率分布

        周 敏,閆 磊

        (中國礦業(yè)大學(xué) 管理學(xué)院,江蘇 徐州 221116)

        0 前言

        由于在系統(tǒng)的演化發(fā)展過程中存在學(xué)習(xí)決策行為的復(fù)雜性和動態(tài)性,普通的博弈論的納什均衡不能很好的解決這些問題。但是在符合學(xué)習(xí)模型的各種基本假設(shè)的條件下,我們可以構(gòu)造一個具有隨機擾動項的動態(tài)學(xué)習(xí)模型,它可以把決策行為進行概率化來解決演化過程的復(fù)雜性和動態(tài)性特征。當(dāng)系統(tǒng)的演化結(jié)果出現(xiàn)穩(wěn)定解時,我們可以得到具有動態(tài)性和復(fù)雜性的學(xué)習(xí)模型的的穩(wěn)態(tài)決策概率分布,這種非確定性納什均衡解可以看做普通博弈論中的納什均衡解的擴展。

        1 動態(tài)學(xué)習(xí)模型的構(gòu)建

        由于企業(yè)的任何決策都是根據(jù)以前的決策行為和決策效果決定的,所以的企業(yè)的新的決策會隨著以前決策行為的結(jié)果做出調(diào)整,并且總是朝著更好的收益的方向轉(zhuǎn)移。所以說企業(yè)的連續(xù)決策是具有學(xué)習(xí)能力的,并且的動態(tài)復(fù)雜的。我們可以用一個帶有漂移的隨機分方程來表示這個決策過程。假設(shè)企業(yè)在原來的基礎(chǔ)上根據(jù)前一個決策的效果做出新的決策,這個新的決策行為由于受到噪音的影響會發(fā)生隨機游走產(chǎn)生某種變異。在任一時刻t,系統(tǒng)的狀態(tài)由t時刻決策的概率分布表示。這樣,如果決策狀態(tài)穩(wěn)定,決策行為經(jīng)過演化而得出的結(jié)果是一個在穩(wěn)態(tài)下的概率分布。

        企業(yè)的生產(chǎn)經(jīng)營行為就是不斷的做出決策的行為。在構(gòu)建的模型中,假設(shè)存在m個企業(yè),他們獨立的進行連續(xù)決策,同時又受到競爭對手以及自己的決策行為和結(jié)果的影響。企業(yè)的決策行為用ωj(t)∈[c,d]表示,其中t代表決策時間,j代表決策企業(yè)。由于隨機擾動的的存在,企業(yè)的決策行為以某種概率分布的形式來表示。設(shè)Gj(ω,t)為表示企業(yè)j決策行為的概率分布函數(shù),則其密度函數(shù)為:

        設(shè)m-1維向量ωm-1(t)為與決策行為j對應(yīng)的其它m-1個企業(yè)的決策,Gm-1(ωm-1,t)為相應(yīng)的為m-1個企業(yè)的決策行動的概率分布。由于在學(xué)習(xí)模型中決策行為的學(xué)習(xí)能力,企業(yè)j的收益是由其自身的決策行為和其它的m-1個企業(yè)共同決定的。我們用L(s)表示去在t時刻的收益,那么:

        由于任何企業(yè)都是以收益最大化為目的的,企業(yè)在決策過程中總是調(diào)整決策行為可以給自己帶來更高收益的決策方向靠攏。同時在決策過程中企業(yè)會受到各種噪音的干擾總會出現(xiàn)某些失誤,這可以用隨機擾動項來表示。

        我們將上述的兩個過程用如下方程表達出來:

        等式右邊的第一項為新決策行為對舊的決策行為的調(diào)整量。第二項為可能導(dǎo)致決策行為失誤的噪聲干擾,概率為ξj,wj(t),為標準維納過程,wj(t)服從均值為0方差為dt的正態(tài)分布。因此:

        考察到時間間隔,上式可化為:

        其中 0(δt)為 δt的高階無窮小。

        引入任意函數(shù)f(ωj),考察該函數(shù)在δt時間間隔后的期望值:我們令 x=ξjδwj(t)的密度函數(shù)為 φ(x),由于 E(x)≈0,E(x2)=ξj2δt,則:

        上式描述了具有動態(tài)學(xué)習(xí)行為的企業(yè)連續(xù)決策行為的系統(tǒng)演化過程。我們可以從中得出下面的結(jié)論:

        首先,右邊第一項-L[(sj(ωj),t)]'gj(ωj,t)表明,企業(yè)的決策行為總是向著可以帶來更高收益的方向調(diào)整,并且預(yù)期收益和現(xiàn)在收益的差距越大調(diào)整的速度越快;決策調(diào)整速度與企業(yè)在t時刻采取行動ωj的概率密度成正比。

        我們對上面的式子進一步研究。

        2 結(jié)論

        根據(jù)上面的模型構(gòu)建和演化分析,我們得出如下的結(jié)論:

        (1)(4)式是 Gi(ω,t)演化到穩(wěn)態(tài)時的均衡條件。 從該條件可以看出,采取決策行為ωj的概率不但受到與其他m-1個企業(yè)的決策行為相對應(yīng)的收益的影響,并且表現(xiàn)出遞增的態(tài)勢。

        (2)當(dāng)參數(shù) ξi趨于無窮大時,趨于零。 由于決策行為的的選取是完全隨機的不受期望收益的影響,這表明在演化過程中,企業(yè)決策行為會受到太大的隨機擾動的影響而呈現(xiàn)出隨機性特征。

        (3)當(dāng) ξj趨于零時,從(4)可知,由于受到的干擾較小,采取特定行動的概率中對行動的期望收益的依賴才會不斷增加。由于受到隨機因素的干擾較小,學(xué)習(xí)能力才能很快的增強。

        (4)在現(xiàn)實的企業(yè)決策過程中,決策的擾動既不是ξj趨于無窮大,也不是ξj趨于零,而是具有一定程度噪聲的決策行為的學(xué)習(xí)過程。當(dāng)整個演化達到穩(wěn)態(tài)時,得出的均衡解是具有某種概率密度的穩(wěn)態(tài)值,是非確定的,它可以看做確定解納什均衡的擴展值。同時在模型中可以看出降低決策行為的擾動是提高決策能力的有效方法。因此,企業(yè)在決策過程中應(yīng)該通過不斷學(xué)習(xí),來降低決策行為的的失誤和“噪音”的的擾動。

        [1]陸瑾.產(chǎn)業(yè)組織演化研究[D].復(fù)旦大學(xué),2005.

        [2]吳彤.自組織方法論研究[M].清華大學(xué)出版社,2001.

        [3]盛昭瀚,蔣德鵬.演化經(jīng)濟學(xué)[M].上海三聯(lián)書店,2002.

        [4]黃登仕,經(jīng)濟系統(tǒng)的密度周期性和復(fù)雜性[M].北京大學(xué)出版社,2003.

        [5]Kwasnicka H,Kwasnieki W,long-term diffusion factors of technological development:an evolutionary model and case study[J].Technologieal Foereasting and Social Change,1996,52.

        [6]Potts J,The New Evolutionary Microeconomics:Complexity,Competence,and Adaptive Behavior[M].Cheltenham,Edward Elgar,2000.

        [7]Silverberg G,Dosi G,Orsenigo L,Innovation,Diversity and Diffusion:a self-organization Model[J],EconomicJounral,1988,98.

        [8]程紅莉.學(xué)習(xí)型企業(yè)及其組織學(xué)習(xí)機制研究[D].華中師范大學(xué),2003.

        [9]陳國權(quán),馬萌.組織學(xué)習(xí)過程模型研究[J].管理科學(xué)學(xué)報,2000,3(3).

        猜你喜歡
        動態(tài)性納什概率分布
        離群動態(tài)性數(shù)據(jù)情報偵查方法研究
        THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
        THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
        離散型概率分布的ORB圖像特征點誤匹配剔除算法
        交際中模糊語言的動態(tài)性闡釋
        國土資源績效管理指標體系的動態(tài)性探討
        關(guān)于概率分布函數(shù)定義的辨析
        科技視界(2016年19期)2017-05-18 10:18:46
        基于概率分布的PPP項目風(fēng)險承擔(dān)支出測算
        基于CDM系統(tǒng)的航班動態(tài)性調(diào)度研究
        一種相依極小P值統(tǒng)計量概率分布的近似計算方法
        国产精品国产三级国av| 91久久综合精品久久久综合| 精品国产一区二区三区2021| 久久夜色精品国产欧美乱| 在线观看av手机网址| av在线网站一区二区| 久久免费看黄a级毛片| 亚洲乱码中文字幕综合| 亚洲欧美日韩精品中文乱码| 国产精品午夜福利亚洲综合网| 多毛小伙内射老太婆| 国内精品自在自线视频| 亚洲情a成黄在线观看动漫尤物| 国产色婷亚洲99精品av网站| 午夜人妻久久久久久久久| 亚洲小说区图片区另类春色| 国产高清精品自在线看| 亚洲一区二区三区免费的视频| 人妻av中文字幕久久| 亚洲欧洲无码av不卡在线| 97精品国产高清自在线看超| 黄片国产一区二区三区| 狠狠的干性视频| 男人天堂网在线视频| 一区二区三区岛国av毛片| 日韩中文字幕有码午夜美女| 性一交一乱一透一a级| 美女爽好多水快进来视频| 精品一区二区三区亚洲综合| 久久午夜无码鲁丝片午夜精品 | 国产最新一区二区三区| 曰韩少妇内射免费播放| 人妻影音先锋啪啪av资源| 四虎国产精品成人影院| 日本一区二区三区视频免费在线| 色偷偷偷久久伊人大杳蕉| 精品免费人伦一区二区三区蜜桃| 亚洲综合伊人久久综合| 欧洲熟妇色xxxx欧美老妇性| 欧美老妇人与禽交| 手机在线免费看av网站|