亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人工智能與因果語言

        2021-04-20 15:01:12吳小安
        關(guān)鍵詞:珀?duì)?/a>金字塔服藥

        吳小安 張 瑜

        一、“迷你”圖靈測(cè)試

        人工智能的先驅(qū)之一艾倫·圖靈曾提出這樣一個(gè)問題[1]:怎么才能說一個(gè)計(jì)算機(jī)像人一樣在思考?他給出了一個(gè)稱為“模仿游戲”的測(cè)試方法(后來人們稱之為“圖靈測(cè)試”):即向一個(gè)計(jì)算機(jī)提問,如果它對(duì)于問題的回答讓我們不能區(qū)別和我們交談的是計(jì)算機(jī)還是人,那么這一臺(tái)機(jī)器就可以算是一個(gè)思維機(jī)器。當(dāng)然要模仿一個(gè)成人的智能是困難的,隨著教育和閱歷的發(fā)展和推進(jìn),她的智能水平也一直在發(fā)展和推進(jìn)。很自然的想法是不妨從模仿孩子的智能開始(“迷你”圖靈測(cè)試),再循序漸進(jìn),最終實(shí)現(xiàn)成人的智能。

        在珀?duì)柡望溈淆R(Pearl and Mackenzie)[2]看來,對(duì)因果的理解是人類認(rèn)知最普遍也是最不可或缺的一環(huán)。只有所造的機(jī)器人理解因果,我們才能把對(duì)于這個(gè)世界的所知教給它們。具體而言,在制造出一個(gè)理解因果的機(jī)器人之前,至少有兩個(gè)疑難要面對(duì):只有解決了它們,一個(gè)思維機(jī)器才是可實(shí)現(xiàn)的。首先,人們是如何從環(huán)境中獲取因果知識(shí)的?其次,人們是如何處理因果信息的?第一個(gè)問題并不是珀?duì)栮P(guān)心的,他的主要貢獻(xiàn)和努力在于回答第二個(gè)問題,即給出如何表征因果知識(shí)的方式,也就是因果貝葉斯網(wǎng)絡(luò),并說明這種表征方式如何使得我們能夠快速地訪問必要的信息并正確地回答因果的問題。

        所以姑且把如何獲取因果知識(shí)的困難放在一邊,認(rèn)為已經(jīng)預(yù)存了如下的因果知識(shí)和模板(珀?duì)栒J(rèn)為孩子的大腦并不像有些人所理解的那樣是白板一塊,而是已經(jīng)有了豐富的機(jī)制和預(yù)存的模板)。圖1表示了我們對(duì)于世界的因果認(rèn)知和表征,季節(jié)的變化(SE取值{1,2,3,4},分別對(duì)應(yīng)春夏秋冬)會(huì)影響灑水器的開關(guān)(SP取值1 和0 對(duì)應(yīng)灑水車的開關(guān)),也決定雨水的豐沛與否(R取值1 和0,對(duì)應(yīng)雨水多與少),而不管是開灑水器還是雨水都會(huì)使得路面潮濕(W取值1 和0,對(duì)應(yīng)路面潮濕與否),從而使得路面變滑(S取值1和0,對(duì)應(yīng)路面滑與否)。

        讓我們從珀?duì)朠earl所謂的“迷你”圖靈測(cè)試開始,一個(gè)“理想的”思維機(jī)器應(yīng)該能圓滿地回答如下問題:

        圖1 表示五個(gè)變?cè)g依賴關(guān)系的因果圖

        問題1:如果此時(shí)正值秋季非常干燥的北京,但是有一處路面卻很滑,這說明了天下雨了嗎?

        回答:并不太可能,更可能是灑水器被打開了,還有一種很小的可能性,路滑并不是因?yàn)槁窛?。而是因?yàn)槠渌颉?/p>

        問題2:如果我看到灑水車是關(guān)著的,那能說明天下雨了嗎?

        回答:那就很有可能了。

        問題3:你的意思是如果在現(xiàn)實(shí)中我打開了灑水器,那么下雨就更不可能了嗎?

        回答:并不是這樣的,你打開灑水器與否都不會(huì)影響是否下雨。

        問題4:如果你看到灑水車是開著的且路面是濕的,那么設(shè)使灑水車關(guān)了,路面還會(huì)是濕的嗎?

        回答:路面將會(huì)是干的,因?yàn)楫?dāng)前是一個(gè)干燥的季節(jié),下雨的幾率很小。

        上述因果圖,以及以之為基礎(chǔ)對(duì)于上述問題的回答,為真正智能的實(shí)現(xiàn)提供了思路。我們棲居在這個(gè)世界之中,在“煩”與“畏”中與之砥礪,慢慢地,對(duì)于這個(gè)世界如何周轉(zhuǎn)運(yùn)行,對(duì)于事物如何發(fā)展的內(nèi)在理路和模式就有所掌握,對(duì)于上述問題的回答實(shí)質(zhì)上就是以上述預(yù)存模式為基礎(chǔ),以新情況為根據(jù)對(duì)模式做必要之修正而得出的。但是如何讓蠢笨的機(jī)器人能像人一樣思考,回答起因果問題時(shí)從容不迫,在因果交談中游刃有余,在珀?duì)柨磥砭捅仨毥o它們裝備因果推斷引擎[2]12,[3]57,[4]160,裝備了這個(gè)引擎的機(jī)器人,才能獲取存儲(chǔ)因果知識(shí),并以之為基礎(chǔ)做因果推斷,進(jìn)行有效因果交流,這個(gè)引擎中最關(guān)鍵的一環(huán)以及所有工作的初始就是:因果語言。

        二、因果語言的源起

        從一個(gè)頗具思維革命意味的、“測(cè)量金字塔”的例子來說明因果語言的意義和必要性是有幫助的。當(dāng)別人問你“金字塔有多高?”假定你沒有其他途徑能查到金字塔的高度,我相信你不會(huì)想著造一個(gè)金字塔高的巨大尺子來垂直度量它,因?yàn)檫@樣實(shí)在辱沒了我們的教育,任何一個(gè)受過小學(xué)教育的人都知道歐幾里德幾何,都知道五條公設(shè),并因而都證明過“相似三角形的對(duì)應(yīng)邊成比例”,如果你知道這個(gè)結(jié)論,那么測(cè)量金字塔的高度就不會(huì)那么耗時(shí)費(fèi)力了。

        你只要找到一個(gè)桿子,測(cè)量出桿子的影長(zhǎng)(a)、桿子高(c)和金字塔的影長(zhǎng)(b),再根據(jù)“相似三角形的對(duì)應(yīng)邊成比例”這個(gè)定理,就可以很輕易地計(jì)算出想要的結(jié)果。你會(huì)疑惑,這樣一個(gè)人類在數(shù)千年前就知道的方法有什么值得大書特書的呢?這種方法的意義在于它昭示了人類思維的巨大勝利,只要倚賴創(chuàng)造的數(shù)學(xué),就可以超越一些之前無法跨越的局限,只要在紙上計(jì)算一下,就可以得到在之前需要耗時(shí)費(fèi)力才會(huì)得到的結(jié)果。

        而今我們同樣也面臨這一類異常困難的問題:“吸煙是否導(dǎo)致肺癌”,或者“宏觀政策的實(shí)施是否會(huì)導(dǎo)致通貨膨脹”?對(duì)于這類問題的一個(gè)標(biāo)準(zhǔn)解決:良好設(shè)計(jì)的隨機(jī)對(duì)照實(shí)驗(yàn)(randomized controlled trials)。在一個(gè)恰當(dāng)?shù)碾S機(jī)化對(duì)照實(shí)驗(yàn)中,除了一個(gè)因素(比如這里的吸煙變量或者政策變量),那些影響結(jié)果變量的其他因素,要么被固定,要么隨機(jī)地變化,于是結(jié)果變量的改變必然是因?yàn)槟俏ㄒ灰蛩厮?,以此求出我們想要的因果關(guān)系。

        但是這個(gè)方法并不是包治百病的良方。首先,在很多時(shí)候,隨機(jī)對(duì)照實(shí)驗(yàn)是不可能實(shí)現(xiàn)的(法律上、實(shí)踐上、道德上、醫(yī)學(xué)上,甚至經(jīng)濟(jì)上不可能)。比如下面這個(gè)實(shí)驗(yàn)在倫理上就不可行:隨機(jī)抽樣一撥人,隨機(jī)指派為兩組,一組拼命吸煙,一組完全不吸煙,然后觀察個(gè)幾十年,看最后哪一組患肺癌的概率更大一些;或者如果想要知道增加稅收對(duì)于國(guó)家經(jīng)濟(jì)的影響,也不可能拿一個(gè)國(guó)家來作為實(shí)驗(yàn)對(duì)象,通過加稅或者減稅來觀察對(duì)于國(guó)家經(jīng)濟(jì)狀況的影響,代價(jià)太大,風(fēng)險(xiǎn)太高,也有太多的不確定。著名的1944 年的明尼蘇達(dá)饑餓實(shí)驗(yàn)(Minnesota Starvation Experiment)在今天的倫理標(biāo)準(zhǔn)之下是斷然不能進(jìn)行的。其次,在執(zhí)行隨機(jī)對(duì)照實(shí)驗(yàn)的過程中,現(xiàn)實(shí)的復(fù)雜也遠(yuǎn)超我們的想象。比如研究觀看暴力電視節(jié)目和學(xué)校霸凌之間的關(guān)系,很難有效地控制一個(gè)孩子看多少的電視節(jié)目,也近乎不可能知道是否有效地控制了看電視的時(shí)間。

        所以,很自然的問題,我們是否有其他的方法或者程序,可以從可觀測(cè)性研究(observational studies)中推導(dǎo)出想求的因果關(guān)系?在這種研究中,研究者只是記錄數(shù)據(jù),并不對(duì)研究本身進(jìn)行任何干預(yù)或者控制,即只有數(shù)據(jù)集P(X,Y,W,…)。上述的討論可以總結(jié)如下(表1):

        從表1中的比較知道,對(duì)金字塔高度的度量我們有兩個(gè)問題是需要解決的:

        1.需要一個(gè)相應(yīng)的語言來表達(dá)需要表達(dá)的問題,在金字塔的例子中,把金字塔高度用抽象的符號(hào)d來表示;

        2.還需要一個(gè)數(shù)學(xué)理論,能夠以在手的數(shù)據(jù)求出因果關(guān)系,正如在金字塔的例子中,通過歐式幾何,把金字塔高度的問題還原為通過一些相對(duì)容易可得的量(c,b,a)而計(jì)算出來。

        表1 金字塔高度度量的啟示

        與之對(duì)照的兩個(gè)問題珀?duì)朳5]都給出了回答。他給出了因果語言來表征相關(guān)的因果問題,發(fā)展出結(jié)構(gòu)因果模型來表征具體的情境,并通過干預(yù)概念把因果模型和刻畫因果的反事實(shí)聯(lián)系在一起(對(duì)于因果的反事實(shí)理論介紹與討論,可以參看裘江杰[6]10-17、何朝安[7]3-9等人的研究),進(jìn)而討論諸多因果概念。

        三、物理語言和概率語言

        當(dāng)然,因果從來不乏討論。我們熟知的“穆勒五法”就是前現(xiàn)代因果研究的主導(dǎo)方法論,韋伯在《新教倫理和資本主義精神》中對(duì)新教倫理和資本主義精神之間因果關(guān)系的探討(為什么資本主義在歐洲發(fā)生了,而沒有發(fā)生在世界的其他地方?),所使用的方法就是穆勒歸納法中的“差異法”。這種探討更多地依賴于作者本人的勤學(xué)苦讀、廣泛涉獵,形成的對(duì)于問題本身的直覺,然后再論證這種直覺的合理性。但是這種方法自有其學(xué)理上的弊端,更多是“一家之言”,受制于作者本人的視野和學(xué)識(shí),并不具有科學(xué)的客觀性。今天數(shù)據(jù)時(shí)代的到來,這種純直觀的學(xué)理研究必然是要揚(yáng)棄的,數(shù)據(jù)來源的多面性和廣泛性,使得我們有可能更加接近我們想要探尋的真實(shí),在珀?duì)柨磥怼皵?shù)目是盲目的”(Data are profoundly dumb),它需要指導(dǎo)和引領(lǐng),正如概率論源于賭博、運(yùn)籌學(xué)的發(fā)展部分也是戰(zhàn)爭(zhēng)的需要,在當(dāng)前新的形勢(shì)下,傳統(tǒng)的學(xué)科,比如社會(huì)學(xué)、政治科學(xué)、流行病學(xué)、公共健康也開始鳳凰涅槃,對(duì)一種新的因果語言和方法論的需求迫在眉睫又勢(shì)在必行。

        1.語言的重要性

        語言的重要性早就已經(jīng)被行為科學(xué)家和心理學(xué)家所洞悉,他們論證說語言塑造人的思維方式和行為模式[8]。比如,在澳大利亞北部約克角城西邊一個(gè)叫作波姆普勞(Pormpuraaw)的原住民小部落,這個(gè)部落里的人說庫塔語(Kuuk Thaayorre),這個(gè)語言中沒有描述相對(duì)空間位置的詞,比如左、右等,只有描述絕對(duì)方位的詞,比如東、西、南、北等。對(duì)比研究之后發(fā)現(xiàn),使用絕對(duì)方向語言的人更精確地把握自己所處的方向。“事實(shí)上,他們這種能力之強(qiáng),已經(jīng)超出了科學(xué)家過去設(shè)想的人類所能達(dá)到的極限。正是在語言的強(qiáng)化訓(xùn)練下,他們獲得了這種認(rèn)知能力?!碑?dāng)作者在公開演講時(shí)用同樣的問題測(cè)試那些擁有相對(duì)方位語言的聽眾,他們對(duì)于自己身處之東西南北卻異常暈圈。

        珀?duì)柡望溈淆R[2]10也特別強(qiáng)調(diào)語言的重要:“我對(duì)語言的強(qiáng)調(diào)也源于一個(gè)堅(jiān)定的信念,即語言會(huì)塑造我們的思想。你無法回答一個(gè)你提不出來的問題,你也不能提出一個(gè)你沒有詞語來描述的問題。”正如像“引力”“熵”“量子”這樣的概念,正是因?yàn)橛辛舜_切表達(dá)這些概念的語言,我們才能圍繞這些概念發(fā)展出相關(guān)的科學(xué)和理論。

        2.物理語言與概率語言

        一個(gè)很自然的困惑,因果語言的提出是在21 世紀(jì)末葉,而彼時(shí),科學(xué)的大樹早已經(jīng)根深蒂固,“絜之百圍”,為何要大費(fèi)周章,另辟蹊徑,再創(chuàng)造一個(gè)因果語言?為何不就地取材,因地制宜呢?

        遺憾的是,傳統(tǒng)的數(shù)學(xué)語言表達(dá)不了所希望表達(dá)的因果問題。比如在物理學(xué)中牛頓第二運(yùn)動(dòng)定律是:

        F=ma

        概率是許多特殊科學(xué)官方的語言,但是標(biāo)準(zhǔn)概率理論的詞匯表中并不包含“原因”這個(gè)詞。同樣我們也不能表達(dá)“氣壓是氣壓計(jì)讀數(shù)的原因”,“公雞打鳴不是太陽從東方升起的原因”,因?yàn)樗鼈兒汀皻鈮河?jì)的讀數(shù)依賴于氣壓”,以及“公雞打鳴依賴(或者獨(dú)立于)太陽從東方升起”是不一樣的,所以兩者的符號(hào)表征應(yīng)該是不一樣的。但是這個(gè)區(qū)分并沒有在標(biāo)準(zhǔn)的科學(xué)分析中被嚴(yán)肅對(duì)待。盡管我們?cè)⒕佑谶@個(gè)世界,用到太多太多因果的概念,但是迄今為止,還沒有一個(gè)語言來形式化我們關(guān)于世界的因果判斷。

        于是珀?duì)柼岢鲇谩癲o-算子”來表達(dá)因果關(guān)系,比如“吸煙是否導(dǎo)致肺癌”的問題可以形式化如下:

        其中:

        “do-算子”不只是舊的語言的擴(kuò)充,更是新的語言的開始。如果你剛剛接觸統(tǒng)計(jì)學(xué),會(huì)很難理解它對(duì)于因果概念的敵意,比如很多統(tǒng)計(jì)學(xué)教材開篇都會(huì)強(qiáng)調(diào)“我們這本書中不會(huì)使用‘因果的’或者‘因果’這樣的詞匯……我們這樣做是出于一種謹(jǐn)慎,因?yàn)閺难芯恐形覀兒苌倌軌虻玫疥P(guān)于因果的靠譜結(jié)論”[9]。在珀?duì)柨磥?,之所以有這樣一個(gè)對(duì)因果的排斥是因?yàn)闆]有與之對(duì)應(yīng)的語言來表達(dá)我們想要表達(dá)的因果關(guān)系,統(tǒng)計(jì)的語言是概率,但是概率卻不足以成為因果的語言。

        3.因果語言的特點(diǎn)

        我們需要對(duì)這個(gè)新的因果語言做一些澄清。首先,我們需要說明這個(gè)新的語言和概率之間的區(qū)別與聯(lián)系;其次,我們需要闡述清楚,這種新的語言實(shí)現(xiàn)什么樣的目的,即這個(gè)新語言的使命在哪里,以此,才能發(fā)展出與之相應(yīng)的數(shù)學(xué)來實(shí)現(xiàn)這個(gè)目的;再次,將說明這個(gè)新的語言對(duì)于人工智能和其他研究的意義。

        當(dāng)然,引入一個(gè)語言是一回事,正如表(1)所指出的,另一個(gè)困難的地方在于,要給出相配套的數(shù)學(xué)理論,讓它和數(shù)據(jù)結(jié)合在一起,把之所以引入這個(gè)語言的那些基本想法很好地體現(xiàn)和貫徹出來?!拔镉斜灸?,事有終始”,姑且把這個(gè)困難的問題先擱置在一邊,先把因果語言的問題講清楚。

        首先,需要看到這個(gè)新的因果表達(dá)式和條件概率的區(qū)別:

        P(Y=1|do(X=1))≠P(Y=1|X=1)

        “相關(guān)并不意味著因果”(Correlarion is not causation),早上公雞打鳴,太陽隨后就會(huì)升起來,這兩者之間有相關(guān)關(guān)系,但是公雞打鳴并不是太陽升起的原因,它們之間沒有因果關(guān)系。

        具體而言兩者的區(qū)別有:首先,是方向性。因果是單向的,只有原因會(huì)影響結(jié)果,結(jié)果是不會(huì)影響原因的。但是概率公式是對(duì)稱的,根據(jù)貝葉斯法則,可以從P(Y=1|X=1)得出P(X=1|Y=1),反之亦然。

        其次,是混雜(即共同原因)。我們求條件概率,比如P(康復(fù)|服藥),我們首先要知道服藥的人數(shù)是多少,然后再?gòu)闹姓页龇幥铱祻?fù)的人是多少,后者除以前者得出的結(jié)果就是我們所要求的條件概率。但是這種條件概率并不能滿足我們需要理解因果關(guān)系的目的,因?yàn)榭赡艽嬖诨祀s因素,它既影響病人服藥也影響病人的康復(fù)(比如性別),所以哪怕你得出P(康復(fù)|服藥)=1,也并不意味著服藥是康復(fù)的原因。而因果關(guān)系實(shí)際上表示的是服藥這個(gè)行為對(duì)于康復(fù)的影響,如何來刻畫這種行為對(duì)結(jié)果的影響?顯然它和上述條件概率的直觀不盡然相同。

        從現(xiàn)實(shí)的生活中,也很容易認(rèn)識(shí)到觀察與干預(yù)之間的區(qū)別,比如我們都能感覺到人的手掌的大小和他腳掌的大小之間有一種相關(guān)關(guān)系,腳大的人手一般也不會(huì)小,所以一般而言:P(Y=y|X=x)不等于P(Y=y)。P(Y=y|X=x),“∣”的右邊是通常的概率演算中的條件化,代表的是證據(jù)化條件“假如我們看到”,反映的是在X取值為x的那些個(gè)體中,Y的總體分布是什么。注意,當(dāng)條件化一個(gè)變量的時(shí)候,并沒有改變系統(tǒng),只是使變量取了我們感興趣的值,從而把關(guān)注點(diǎn)轉(zhuǎn)移到感興趣的那一類情形中去了(實(shí)際上就是一種篩選),如果要談改變的話,那改變的是我們對(duì)于這個(gè)世界的感知,而不是這個(gè)世界。

        但是如果你從小就裹腳,顯然你的腳可能就停留在某一個(gè)尺寸了,但是你的手掌還是會(huì)正常發(fā)育,大小不會(huì)受到太大的影響。裹腳就是一種干預(yù),但是裹腳對(duì)手掌的發(fā)育并沒有因果影響,所以P(Y=y|do(X=x))=P(Y=y),即不管裹腳與否,手掌大小的概率并不受影響。P(Y=y|do(X=x),“∣”的右邊是do算子,代表的是因果條件“假定我們干預(yù)了(doing)”,反映的是如果在總體中的每一個(gè)個(gè)體它們的X的取值為x,那么Y的總體的分布是什么。當(dāng)干預(yù)一個(gè)變量時(shí),我們固定它的值,改變了這個(gè)系統(tǒng)(即珀?duì)査^“手術(shù)式的”干預(yù)),其他變量的值也可能因?yàn)檫@個(gè)值的改變而改變。

        在因果模型的理論中,當(dāng)我們通過干預(yù)來確定某個(gè)變量的值的時(shí)候,與之對(duì)應(yīng)的圖表達(dá)的就是對(duì)圖的外科手術(shù)(surgery),刪除所有指向這個(gè)變量所對(duì)應(yīng)的節(jié)點(diǎn)的箭頭,并把這個(gè)節(jié)點(diǎn)所代表的變量的值固定為干預(yù)的值,由此我們得到了被修改的因果模型(perturbed causal model)。

        盡管引入do-算子只是一個(gè)開始,但那卻是打開新世界的鑰匙。珀?duì)朳5]422生動(dòng)地指出,如果你身處16 世紀(jì),你是一個(gè)加法(“+”)運(yùn)算的專家,迫切感覺需要引入一個(gè)新的算子來簡(jiǎn)化多個(gè)相同的數(shù)字相加的情況,因?yàn)榘堰@個(gè)相同的數(shù)字一個(gè)一個(gè)加起來實(shí)在是太繁瑣笨拙了。你所做的第一件事情就是用一個(gè)新的符號(hào)來表達(dá)這個(gè)過程:×,然后你要窮究這個(gè)算子的意義,正如你推導(dǎo)出的很多加法的法則一樣,你也希望推導(dǎo)出與乘法相關(guān)的法則,比如分配律、結(jié)合律、交換律等,并說明它與之前的加法運(yùn)算之間的關(guān)系。同樣,我們引入了一個(gè)新的do-算子,要說明這個(gè)新的算子和條件概率之間的關(guān)系,以及怎么來計(jì)算它,以得到想要的結(jié)果。為此需要一個(gè)與之相配的理論,在金字塔的例子中我們有歐式幾何,那么在這個(gè)新的因果語言之下,要給出什么樣的因果理論呢?那就是結(jié)構(gòu)因果模型。接下來我們將對(duì)do-算子的用處做進(jìn)一步的刻畫,而這需要通過把它與隨機(jī)對(duì)照實(shí)驗(yàn)中“隨機(jī)化”這個(gè)概念做一番比照。

        總之,觀測(cè)和干預(yù)對(duì)應(yīng)著兩種處理數(shù)據(jù)的方式。條件概率P(Y=y|X=x)對(duì)應(yīng)的前一種,一堆數(shù)據(jù)在我們面前,我們觀察那些X=x的數(shù)據(jù),看在這種條件下Y=y的概率是多少。但是概率的語言和因果的語言還是有很大不同,比如因果是單向的,而條件概率本身并不具有方向性;且當(dāng)一個(gè)共同因素(比如Z)決定另外兩個(gè)因素(比如X和Y)時(shí),我們知道X的改變并不會(huì)導(dǎo)致Y的改變,但是在概率中并不能體現(xiàn)這種特性,這也就是為什么要擴(kuò)充概率的語言,引入do-算子的原因(注意,這里我們對(duì)于因果持一種操控主義的理解[10],原因是某種產(chǎn)生差異的東西,改變?cè)蚓湍芨淖兘Y(jié)果)。

        四、因果語言與隨機(jī)對(duì)照實(shí)驗(yàn)

        正如在第二節(jié)所指出的,因果模型的提出是為了補(bǔ)隨機(jī)對(duì)照實(shí)驗(yàn)之憾,挽隨機(jī)對(duì)照試驗(yàn)之弊。但是因?yàn)槟P捅旧碛泻芏嗪軓?qiáng)的假設(shè),比如從數(shù)據(jù)中發(fā)現(xiàn)因果結(jié)構(gòu)的“橋接原則”(bridge principle)(對(duì)于它的介紹可以參考楊仁杰[11]18-25),討論的模型是馬爾可夫或者半馬爾可夫模型,以及用不多的變量及其決定論方程來模擬一個(gè)復(fù)雜的機(jī)制。它能否成為一個(gè)合格的“替代”,有待時(shí)間的檢驗(yàn),但是不妨先把這些疑慮放在一邊,從一個(gè)簡(jiǎn)單的例子來說明因果語言所要刻畫的隨機(jī)對(duì)照實(shí)驗(yàn)的原理為何。

        表2 是觀察數(shù)據(jù),從中我們發(fā)現(xiàn)一個(gè)奇怪的現(xiàn)象,如果分別考察男性和女性服藥之后的康復(fù)情況,我們發(fā)現(xiàn)不服藥更有利于康復(fù),但是如果考察總體的數(shù)據(jù),得出相反的結(jié)論,服藥有利于康復(fù)。當(dāng)然敏銳的讀者立刻就會(huì)發(fā)現(xiàn)其中的問題,觀測(cè)數(shù)據(jù)受性別的影響,女性更傾向于服藥,而男性更不傾向于服藥,而性別的差異又會(huì)影響康復(fù),所以可以把我們從表2中所讀到的這些因果假定用圖2表達(dá)如下:

        令X=1 代表的是服藥,Y=1 代表的是康復(fù),Z=1 表示的是女性(Z=0 表示的是男性)。顯然Z混雜了X對(duì)于Y的因果影響,如果要求出X對(duì)于Y的因果影響,我們要控制Z。

        表2 觀測(cè)數(shù)據(jù)(關(guān)于藥物的例子)

        圖2 與數(shù)據(jù)一致的因果圖

        在實(shí)際的隨機(jī)對(duì)照實(shí)驗(yàn)中,如果認(rèn)定混雜因子是性別(Z),就要把總體按性別劃分,再在男性總體中隨機(jī)指派他們進(jìn)入處理組(treatment group)和對(duì)照組(control group),在女性的總體中隨機(jī)指派他們進(jìn)入處理組和對(duì)照組。

        隨機(jī)對(duì)照實(shí)驗(yàn)所做的就是破壞Z到X的因果機(jī)制,讓X對(duì)于Y的直接因果效應(yīng)彰顯出來。為了實(shí)現(xiàn)這樣一種破壞,比如可以通過拋硬幣這樣一個(gè)隨機(jī)過程來決定被實(shí)驗(yàn)者是服藥還是服用安慰劑,由此把那些可能影響服藥的因素,比如本例子中性別的因素,還有在其他一些情形中的比如教育水平和健康保險(xiǎn)等等影響服藥的因素給排除掉,使之不再影響是否服藥。

        對(duì)應(yīng)到我們的因果圖3(這里可以把因果圖理解為數(shù)據(jù)的生成機(jī)制)中把Z指向X的箭頭刪除,這種把隨機(jī)化和因果圖中對(duì)應(yīng)箭頭的刪除聯(lián)系在一起的直觀并不是顯然的,正如珀?duì)朳5]244所說:“在聽了他斯波蒂斯(Peter Spirtes)在瑞典的烏普薩拉(Uppsala)發(fā)表的一個(gè)演講之后,我(珀?duì)枺┑谝淮我庾R(shí)到,執(zhí)行干預(yù)①對(duì)于“干預(yù)”有不同的理解,伍德沃德(Woodward)[12]認(rèn)為應(yīng)該把干預(yù)理解為一個(gè)因果過程,它獨(dú)立于模型中的其他變量而起作用。而劉易斯(Lewis)[13]則把這種設(shè)定變量值的干預(yù)理解為一個(gè)小“奇跡”(miracle)。可以被看作從因果圖中刪除箭頭。”

        圖3 隨機(jī)指派的作用

        正如前面金字塔的例子,我們不需要耗時(shí)費(fèi)力來測(cè)量金字塔的高度,只要用相對(duì)容易得到的數(shù)據(jù)在紙上算一算,就可以求出金字塔的高度。同樣地,當(dāng)面對(duì)因果問題,也希望不需要做隨機(jī)對(duì)照試驗(yàn),或者在因?yàn)楦鞣N阻力不能做隨機(jī)對(duì)照實(shí)驗(yàn)的時(shí)候,結(jié)構(gòu)方程模型能擁有歐式幾何那樣的效力,我們只要數(shù)據(jù)在手,算一算即可求出所要求的因果關(guān)系。根本上,我們是比照著隨機(jī)對(duì)照實(shí)驗(yàn)來設(shè)想因果語言的,它的主業(yè)是成為社會(huì)科學(xué)研究的方法論,它人工智能的蘊(yùn)含更多是上述工作的引申。

        五、總結(jié)

        有了我們前面所討論的因果語言,就可以把上述因果問題用它來表征如下:首先,問題1 和問題2 是經(jīng)典的概率問題。問題1 所說的是,如果季節(jié)是秋季且路面很滑的情況下,天下雨的概率有多大,可以形式化為:P(R=1|SE=3,S=1);問題2 所說的是,如果在秋季,路面很滑且灑水車又關(guān)著的情況下,天下雨的概率有多大,可以形式化為:P(R=1|SE=3,S=1,SP=1)。只要有上述圖1,以及與圖中節(jié)點(diǎn)相應(yīng)的變量的條件概率表(兩者組成了一個(gè)因果貝葉斯網(wǎng)絡(luò)),那么根據(jù)貝葉斯定理很容易就可以回答上述問題。需要注意的是,上述兩個(gè)問題都不是因果問題,只是一種回溯推理(Abduction),根據(jù)概率就可以得到想要的結(jié)果。

        問題3 和問題4 則是典型的因果推理問題。問題3 屬于“展望式”(prospective)反事實(shí),判斷的是一個(gè)行動(dòng)對(duì)于一個(gè)變量的因果影響,即打開灑水車(do(SP=1))是不是會(huì)對(duì)下雨有因果影響,問題可以形式化為:P(R=1|do(SP=1))。問題4屬于“反省式”(retrospective)反事實(shí),在給定路面是滑的且灑水車開著的證據(jù)之下,如果反事實(shí)設(shè)定灑水車是關(guān)著的,看對(duì)于里面的滑有無因果影響,問題可以形式化為:P(W_{SP=1}=1|SP=0,W=0)。根據(jù)珀?duì)柕慕Y(jié)構(gòu)因果理論,貝葉斯網(wǎng)絡(luò)加上do-演算就可以回答問題3。但是對(duì)于問題4的回答要困難很多,要對(duì)事物運(yùn)行的機(jī)制有深刻的理解才行,即需要知道對(duì)應(yīng)變量確切的結(jié)構(gòu)方程,以之為基礎(chǔ),根據(jù)珀?duì)朳5]206,給定確切的因果模型M,反事實(shí)P(W_{SP=1}=1|SP=0,W=0)的判定可以通過如下三步來實(shí)現(xiàn)。首先是溯因推理,根據(jù)證據(jù){SP=0,W=0}來確定變量SE的概率或者確定的值;其次由表示反事實(shí)前件的行動(dòng)do(SP=1)來修正模型M,得到子模型MSP=1;再次,通過得到的子模型和由證據(jù)所更新的SE的信息來計(jì)算反事實(shí)后件的值,并最終確定反事實(shí)的概率。顯然地,do-算子在上述問題上的形式化表述中扮演著重要作用。

        需要注意的是,首先,一旦給出數(shù)學(xué)機(jī)制,實(shí)現(xiàn)上述過程的算法就不再那么困難了。但是也并不意味著珀?duì)栆饬x上的智能就是唾手可及。人工智能是一個(gè)非常寬泛的領(lǐng)域,因果推斷只能算是其中認(rèn)知與推理工作,或者自然語言理解與交流工作的一部分(對(duì)于因果推斷在人工智能大圖景中的地位和作用可以參考:梅劍華[14]86-95),而本文所介紹的因果語言及其直覺、特點(diǎn)和作用更多是一種藍(lán)圖性的指南作用,它只是一個(gè)支點(diǎn),如何讓機(jī)器人真正具有智能?數(shù)學(xué)的設(shè)想在工程上如何可行,如何貫徹?還需要多領(lǐng)域跨學(xué)科的合作與努力才行,總之,前路茫茫,任重道遠(yuǎn)。

        其次,任何一個(gè)因果理論要配享“理論”之名,至少有四個(gè)方面的工作需要完成,首先,以數(shù)學(xué)的語言來表征因果問題;其次,提供精確的語言來傳達(dá)回答這些問題所依賴的假定;再次,提供一種系統(tǒng)的方式以回答至少其中一些問題,并把其他的問題標(biāo)記為“不可回答的”;最后,提供一種方法來決定,為了回答“不可回答的”問題,需要什么假定或者新的度量。限于篇幅,筆者只討論了第一個(gè)問題,并沒有具體闡述因果模型理論的成果(即后三個(gè)問題),觀念固然重要,但是圍繞著這個(gè)觀念發(fā)展出一種理論以處理方方面面的問題更是需要經(jīng)年累月的努力才行(當(dāng)然還有歷史的機(jī)運(yùn)),且更多時(shí)候,當(dāng)奔到終點(diǎn),初始的想法早已面目全非。

        再次,因果語言和概率語言的區(qū)分(即干預(yù)與觀測(cè)區(qū)分的區(qū)分)也給決策理論(decision theory)的研究很多啟發(fā),之前的決策理論研究并沒有清晰地區(qū)分行動(dòng)和行為(對(duì)應(yīng)著我們討論中的干預(yù)與觀測(cè)),比如,杰弗里(Jeffrey)[15]就把行動(dòng)看作是尋常的事件,于是純粹通過條件化來得到行動(dòng)的效應(yīng),而這將會(huì)得到很多顯然的悖謬性結(jié)論:“病人應(yīng)該盡可能避免去看醫(yī)生,‘以減少得重病的概率’;工人也不要急匆匆趕著去上班,以減少他們睡過了頭的概率;學(xué)生們也不要為考試做準(zhǔn)備,否則將證明他們之前沒有努力學(xué)習(xí),等等(珀?duì)枺盵5]108-109,[16]130。而這種區(qū)分能夠有力地廓清上述悖謬。

        另外,與通過概率來理解因果的思路相對(duì)應(yīng),在哲學(xué)里面也有一種概率的因果理論,即試圖通過概率來理解因果,即這是一種認(rèn)為概率是一種更為根本的語言,并在此基礎(chǔ)上來定義因果的理論。我們說X是Y的原因,是因?yàn)閄的發(fā)生提高了Y發(fā)生的概率。這在直覺上似乎是完全可以接受的,正如我們說吸煙是得肺癌的原因,并不是說吸煙一定會(huì)得肺癌,而是說吸煙提高了得肺癌的概率。珀?duì)栔赋龈怕什⒉蛔阋詣偃巫鳛橐蚬恼Z言,“因果關(guān)系不能簡(jiǎn)化為概率”,在珀?duì)朳5]249和珀?duì)柡望溈淆R[2]23-51中指出正是哲學(xué)家們不假思索地訴諸這種處理不確定性的概率語言,而導(dǎo)致了數(shù)十年失敗的探索。

        猜你喜歡
        珀?duì)?/a>金字塔服藥
        被這病賴上得終身服藥,變胖還沒勁兒?千萬別忽視
        祝您健康(2023年7期)2023-07-06 21:15:15
        “金字塔”
        服藥禁忌
        廣東第二課堂·小學(xué)(2021年10期)2021-12-03 20:45:38
        A Study of the Pit-Aided Construction of Egyptian Pyramids
        警惕服藥期間的飲食禁忌
        祝您健康(2020年10期)2020-10-12 14:04:48
        海上有座“金字塔”
        珀?duì)栃匏箶貧⑸甙l(fā)女妖美杜莎
        讀者欣賞(2019年5期)2019-05-13 01:56:34
        服藥先分陰陽
        眼鏡比薩餅
        日日碰狠狠添天天爽| 亚洲av本道一本二本三区 | 特级毛片a级毛片100免费播放 | 激情另类小说区图片区视频区| 欧美日本视频一区| 自拍偷拍韩国三级视频| 久久精品国产99久久无毒不卡| 中文字幕人妻丝袜乱一区三区| 久久中国国产Av秘 入口| 久久偷拍国内亚洲青青草| 国产内射爽爽大片| 亚洲av永久无码天堂网毛片| 99热成人精品国产免国语的| 国产三级精品三级在专区中文| 51国产偷自视频区视频| 香蕉视频在线精品视频| 女人体免费一区二区| 日本顶级片一区二区三区| 人妻少妇被粗大爽.9797pw| 少妇人妻200篇白洁| www.日本一区| 一级一片内射视频网址| 久久不见久久见免费影院国语| 国产精品嫩草影院AV| 国产一级一片内射在线| 人妻av有码中文字幕| 少妇被猛男粗大的猛进出| 国产免费播放一区二区| 国产一区二区亚洲一区| 无套中出丰满人妻无码| 中文字幕亚洲无线码| www插插插无码免费视频网站| 国产欧美日本亚洲精品一4区| 你懂的视频网站亚洲视频| 又爽又黄又无遮挡网站| 在线天堂中文字幕| 久久夜色精品国产亚洲av老牛 | 亚洲综合新区一区二区| 少妇久久久久久人妻无码| 一卡二卡三卡视频| 午夜精品一区二区久久做老熟女|