吳俊杰 曾子珉
天地不仁,以萬物為芻狗。萬物是什么,這里更傾向于沒有思考能力的自然物品,如一個杯子、一株小草。在計(jì)算機(jī)出現(xiàn)之后,計(jì)算機(jī)越來越傾向于形成被用來認(rèn)識和模仿人類或者自然的行為,甚至這種相似的程度就像“雙胞胎”一樣,被稱作“數(shù)字孿生”,但是,自然世界、數(shù)字世界和人造世界究竟有什么樣的區(qū)別呢?或者說通過研究這三個世界之間的聯(lián)系和區(qū)別,是否可以幫助我們更加深刻地理解事物和事物未來發(fā)展的趨勢和規(guī)律呢?圖靈原理試圖說明,計(jì)算機(jī)可以在一定的數(shù)據(jù)精度的層面仿真真實(shí)世界所產(chǎn)生的現(xiàn)象,并且讓“人”作為裁判,不可區(qū)分它們。下面,筆者通過一個“真實(shí)骰子”和“數(shù)字骰子”的對照實(shí)驗(yàn)來初步探究這一過程。
● 實(shí)驗(yàn)設(shè)計(jì)
實(shí)驗(yàn)需要準(zhǔn)備一個骰子,骰子有六個面,每個面分別有1~6六個點(diǎn),每一次在一個透明的盒子里面通過搖動盒子,生成一個自然世界的隨機(jī)數(shù)。通過編程,可以生成一個數(shù)字世界的隨機(jī)數(shù)。通過數(shù)據(jù)分析,可以對自然世界的隨機(jī)數(shù)和編程中的隨機(jī)數(shù)進(jìn)行差異化檢驗(yàn),實(shí)驗(yàn)假設(shè)為,自然界的隨機(jī)數(shù)和計(jì)算機(jī)生成的隨機(jī)數(shù)之間沒有顯著的差異。
● 研究工具
1.真實(shí)骰子
使用麻將中的一個骰子,骰子邊長為1.5厘米,放在一個邊長為10厘米的透明盒子當(dāng)中,實(shí)驗(yàn)過程與調(diào)制雞尾酒時混合冰塊的過程類似,需要上下猛烈地?fù)u動盒子2~3下,在這個過程中不能看盒子,當(dāng)骰子穩(wěn)定后,記錄骰子朝上的那個面的數(shù)字。
2.數(shù)字骰子
程序使用圖形化工具重復(fù)600次(如圖1),在鏈表當(dāng)中存儲下來,之后可以導(dǎo)出為txt文件進(jìn)行進(jìn)一步分析。
3.實(shí)驗(yàn)數(shù)據(jù)
真實(shí)骰子的數(shù)據(jù)和虛擬骰子的數(shù)據(jù)被保存為兩個記事本文件(如下頁圖2),兩組數(shù)據(jù)可以被復(fù)制在Excel表中進(jìn)行差異化檢驗(yàn)。
使用countif函數(shù)統(tǒng)計(jì)原始數(shù)據(jù)表當(dāng)中1~6出現(xiàn)的頻數(shù)和頻率,實(shí)驗(yàn)數(shù)據(jù)的頻數(shù)統(tǒng)計(jì)表如下頁表1所示。
● 實(shí)驗(yàn)分析
1.相對誤差分析
兩組數(shù)據(jù)的差異性檢驗(yàn)可以使用多種方法進(jìn)行判斷,如可以判斷真實(shí)骰子頻率和虛擬骰子頻率之間的相對誤差,一般自然科學(xué)研究認(rèn)為,如果相對誤差在5%以內(nèi),則可以視為差異不顯著。
相對誤差=(虛擬骰子頻率-真實(shí)骰子頻率)絕對值/((虛擬骰子頻率+真實(shí)骰子頻率)/2)
數(shù)據(jù)差異表如表2所示。
相對誤差的平均值為7.6%,大于5%,這說明不能用5%的水平證明,兩組數(shù)據(jù)差異性還是比較大的。在600組數(shù)據(jù)的數(shù)量上,兩組數(shù)據(jù)差異不夠顯著,虛擬骰子的表現(xiàn)令人失望。
真實(shí)骰子的概率分布與理論分布之間的相對誤差,可以用下面的公式來計(jì)算,且可以用下頁表3來統(tǒng)計(jì)真實(shí)骰子概率。
真實(shí)骰子相對誤差=(真實(shí)骰子頻率-1/6)絕對值/((真實(shí)骰子頻率+1/6)/2)
虛擬骰子相對誤差=(虛擬骰子頻率-1/6)絕對值/((虛擬骰子頻率+1/6)/2)
從相對誤差表來看,真實(shí)骰子比虛擬骰子更接近理論概率,虛擬骰子的表現(xiàn)并不好。這說明計(jì)算機(jī)生成的隨機(jī)數(shù)并不如真實(shí)骰子。真實(shí)骰子和虛擬骰子在5%的水平上不可接受,但是如果將可接受的相對誤差范圍擴(kuò)大到10%,仍可認(rèn)為虛擬骰子和真實(shí)骰子在10%的水平上不可區(qū)分。在后續(xù)實(shí)驗(yàn)中,將虛擬骰子的數(shù)據(jù)量增大到1200組,實(shí)驗(yàn)發(fā)現(xiàn)虛擬骰子和理論概率之間的差距下降到了5%以內(nèi),這說明計(jì)算機(jī)模仿的骰子若需要替代真實(shí)骰子的效果,還需要較大的數(shù)據(jù)量才能滿足5%的要求。
2.用圖靈測試的方式來進(jìn)行差異檢驗(yàn)
各種統(tǒng)計(jì)方法都可以對數(shù)字生成的隨機(jī)數(shù)和真實(shí)隨機(jī)數(shù)等價這個結(jié)論加以驗(yàn)證,但是對于更為復(fù)雜的實(shí)驗(yàn)環(huán)境,如“機(jī)器真的可以等價于人類嗎”這一類問題,當(dāng)缺乏測量來驗(yàn)證環(huán)境時,則可以引入第三方的驗(yàn)證工具。類似圖靈測試,筆者引入了一個第三方的檢測者,如讓一個人說一個1~6之間的隨機(jī)數(shù),然后分別跟真實(shí)骰子和虛擬骰子的數(shù)值比較,如果數(shù)值相同,則說明人獲勝,如果人與虛擬骰子之間的獲勝概率和人與真實(shí)骰子之間的獲勝概率一致,則說明在第三人看來,已經(jīng)在數(shù)據(jù)上無法對真實(shí)骰子和虛擬骰子進(jìn)行區(qū)別。
圖3為該實(shí)驗(yàn)的原始程序,該程序會自動判斷輸贏的情況。從100組數(shù)據(jù)的勝率來看,人與真實(shí)骰子的獲勝概率為14%,人與虛擬骰子之間的獲勝概率為16%。它們之間的相對誤差為13.3%,這意味著可以在15%以內(nèi)的水平上認(rèn)為虛擬骰子和真實(shí)骰子是等價的,基于之前真實(shí)骰子和虛擬骰子的比較試驗(yàn),可以預(yù)見,當(dāng)數(shù)據(jù)量增大以后,二者之間的相對誤差還會縮小。
● 結(jié)論
兩種方法都驗(yàn)證了真實(shí)骰子和虛擬骰子是有差異的,這種差異在600組數(shù)據(jù)時,大于5%,但小于10%,這意味著在10%以內(nèi)的誤差水平上虛擬骰子可以等價于真實(shí)骰子。這說明數(shù)字世界生成的隨機(jī)數(shù)和真實(shí)世界的隨機(jī)數(shù)在一定程度上可以等價看待。實(shí)際上,這個結(jié)論是比較容易預(yù)計(jì)的,因?yàn)楫吘褂糜?jì)算機(jī)生成隨機(jī)數(shù)來替代真實(shí)實(shí)驗(yàn)中的隨機(jī)數(shù)已經(jīng)是一種通行的做法。在圖靈原理的驗(yàn)證實(shí)驗(yàn)過程中,相對誤差為多少,認(rèn)定為“不可區(qū)分”這一概念尚沒有一個絕對的定論,這個認(rèn)定不可區(qū)分的標(biāo)準(zhǔn),稱為圖靈原理實(shí)驗(yàn)的“閾值”,閾值的設(shè)定也是研究假設(shè)的一部分,并且跟實(shí)驗(yàn)環(huán)境的具體條件相關(guān)。一般來說,越是定量的數(shù)據(jù)、好的計(jì)算條件和實(shí)驗(yàn)環(huán)境,這個閾值就可以設(shè)定得越低,畢竟閾值為零,也是圖靈原理的一種終極的追求,而對于語言這一類不好區(qū)分的情況,閾值則可以設(shè)定得比較高。
從信息科技學(xué)科發(fā)展的角度來看,仿真和科學(xué)計(jì)算已經(jīng)成為科學(xué)研究不可或缺的研究方法,而圖靈原理則是一系列仿真的基礎(chǔ)假設(shè)。從這個層面上來看,信息技術(shù)的核心概念(數(shù)據(jù)、算法、信息系統(tǒng)和信息社會)之間在圖靈原理的驗(yàn)證實(shí)驗(yàn)當(dāng)中呈現(xiàn)出一種自然而然的關(guān)聯(lián)性:通過編程來獲取虛擬數(shù)據(jù)并且與真實(shí)的實(shí)驗(yàn)對照,結(jié)合編程或者已有的軟件設(shè)定一定的規(guī)則和算法來驗(yàn)證圖靈原理。整個研究的過程可以編制成一個信息系統(tǒng),并且“人”在其中的裁判作用使得筆者不斷地思考虛實(shí)關(guān)系帶來的信息社會的發(fā)展和變革。因此,本文涉及的圖靈原理的驗(yàn)證性實(shí)驗(yàn)可能只是一個開始,類似的做法,可以形成一類有共性步驟和協(xié)同育人價值的信息技術(shù)實(shí)驗(yàn)項(xiàng)目群,為信息科技學(xué)科的發(fā)展,以及信息技術(shù)教學(xué)的專業(yè)性的提升貢獻(xiàn)力量。
3275500589233