亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人機(jī)協(xié)同下可信內(nèi)容合成

        2023-12-29 00:00:00鄧晃煌賀寶儀吳飛
        未來傳播 2023年4期

        摘 要:ChatGPT在工程上創(chuàng)新性地整合了大數(shù)據(jù)、大模型和大算力,按照“共生則關(guān)聯(lián)”的原理,挖掘出自然語言中單詞和單詞共生概率知識(shí),輔以人類反饋信息,以機(jī)器智能實(shí)現(xiàn)了統(tǒng)計(jì)關(guān)聯(lián)下的語言快速合成。ChatGPT推動(dòng)人工智能由識(shí)人辨物和預(yù)測(cè)決策等技術(shù)賦能向內(nèi)容合成這一新領(lǐng)域躍升,即人工智能內(nèi)容合成(Artificial intelligence generated content, AIGC)。AIGC會(huì)塑造內(nèi)容生產(chǎn)的新范式,成為智能數(shù)字交往的有力手段,并悄然引發(fā)一種文明范式的轉(zhuǎn)型。ChatGPT進(jìn)行內(nèi)容合成的計(jì)算機(jī)理及其所引發(fā)的倫理道德潛在風(fēng)險(xiǎn),將使人機(jī)協(xié)同下可信內(nèi)容合成更具有價(jià)值。

        關(guān)鍵詞:內(nèi)容合成;自注意力機(jī)制;潛在風(fēng)險(xiǎn);人機(jī)協(xié)同

        中圖分類號(hào):G206文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2096-8418(2023)04-0024-08

        一、 人造智能:清晰描述后計(jì)算模擬

        1955年8月,時(shí)任達(dá)特茅斯學(xué)院數(shù)學(xué)系助理教授、1971年度圖靈獎(jiǎng)獲得者麥卡錫(John McCarthy),時(shí)任哈佛大學(xué)數(shù)學(xué)系和神經(jīng)學(xué)系青年研究員、1969年度圖靈獎(jiǎng)獲得者明斯基(Marvin Lee Minsky),時(shí)任貝爾實(shí)驗(yàn)室數(shù)學(xué)家、信息論之父香農(nóng)(Claude Shannon),時(shí)任IBM信息研究主管、IBM第一代通用計(jì)算機(jī)701主設(shè)計(jì)師羅切斯特(Nathaniel Rochester)四位學(xué)者向美國洛克菲勒基金會(huì)遞交了一份題為“關(guān)于舉辦達(dá)特茅斯人工智能夏季研討會(huì)的提議(a proposal for the Dartmouth summer research project on artificial intelligence)”的建議書,希望洛克菲勒基金會(huì)資助擬于1956年夏天在達(dá)特茅斯學(xué)院舉辦的人工智能研討會(huì),研究“讓機(jī)器能像人那樣認(rèn)知、思考和學(xué)習(xí),即用計(jì)算機(jī)模擬人的智能”的研究。[1]

        在這份建議書中,“人工智能(artificial intelligence)”這一術(shù)語被首次使用。該建議書對(duì)能夠?qū)崿F(xiàn)“人工智能或人造智能”的原因進(jìn)行了如下描述:學(xué)習(xí)的每個(gè)方面或智能的大多數(shù)特性原則上都可以被精確描述,從而用機(jī)器來模擬。

        大多數(shù)學(xué)科都有必須遵守的最基本的命題或假設(shè),這些命題或假設(shè)不能被省略和被違反,即學(xué)科發(fā)展的第一性原理。比如,牛頓經(jīng)典力學(xué)中“引力和慣性”以及達(dá)爾文進(jìn)化論中“物競(jìng)天擇、適者生存”都是需要遵守的第一性原理。在人工智能研究中,對(duì)智能行為過程的精確描述或許可以作為類似于第一性原理需要遵守的原則,也就是說以機(jī)器為載體來展示人類智能或生物智能,需要對(duì)智能行為發(fā)生過程予以清晰描述,從而通過程序設(shè)計(jì)語言被機(jī)器按序執(zhí)行。

        這份建議書同時(shí)詳細(xì)列舉了7個(gè)在達(dá)特茅斯會(huì)議中需要重點(diǎn)討論的問題,它們分別如下:自動(dòng)計(jì)算機(jī)、計(jì)算機(jī)編程、神經(jīng)網(wǎng)絡(luò)、計(jì)算的復(fù)雜度、智能算法的自我學(xué)習(xí)與提高、智能算法抽象能力、智能算法隨機(jī)性與創(chuàng)造力。

        人工智能登上人類歷史舞臺(tái)后,研究者們圍繞智能行為的模擬進(jìn)行了諸多研究,形成了如下多種人工智能方法[2][3][4]:以符號(hào)主義為核心的邏輯推理、以問題求解為核心的探尋搜索、以數(shù)據(jù)驅(qū)動(dòng)為核心的機(jī)器學(xué)習(xí)、以行為主義為核心的強(qiáng)化學(xué)習(xí)、以博弈對(duì)抗為核心的群體智能(兩人及以上)。符號(hào)主義人工智能將概念(如命題等)符號(hào)化,從若干判斷(前提)出發(fā)得到新判斷(結(jié)論);問題求解的探尋搜索依據(jù)已有信息來尋找滿足約束條件的待求解問題的答案;數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法則是從數(shù)據(jù)出發(fā),從數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)所承載語義(如概念)的內(nèi)在模式,利用學(xué)習(xí)得到的內(nèi)在模式完成識(shí)別和分類等任務(wù);行為主義為核心的強(qiáng)化學(xué)習(xí)根據(jù)環(huán)境所提供的獎(jiǎng)罰反饋來學(xué)習(xí)所處狀態(tài)可施加的最佳行動(dòng),在“探索(未知空間)—利用(已有經(jīng)驗(yàn))(exploration vs. exploitation)”之間尋找平衡,完成某個(gè)序列化任務(wù),具備自我學(xué)習(xí)能力;博弈對(duì)抗則推動(dòng)機(jī)器學(xué)習(xí)從“數(shù)據(jù)擬合”優(yōu)化解的求取向“均衡解”的求取邁進(jìn)。

        1965年,諾貝爾物理學(xué)獎(jiǎng)獲得者費(fèi)曼(Richard Feynman)曾經(jīng)說過:“不可造者, 未能知也(What I cannot create, I do not understand)。”透過今天計(jì)算機(jī)外在之形了解其計(jì)算之內(nèi)稟,更能感嘆計(jì)算之偉大、計(jì)算之局限!

        二、內(nèi)容計(jì)算合成機(jī)理

        近年來,人工智能領(lǐng)域出現(xiàn)了若干科技創(chuàng)新現(xiàn)象級(jí)產(chǎn)品,如耳熟能詳?shù)腁lphaGo、AlphaFold和ChatGPT,這些現(xiàn)象級(jí)產(chǎn)品表現(xiàn)出較強(qiáng)的內(nèi)容合成能力(即“無中生有”)。AlphaGo根據(jù)當(dāng)前落子局勢(shì),從已有落子的學(xué)習(xí)中合成一個(gè)策略,以更好應(yīng)對(duì)當(dāng)前落子。AlphaFold從蛋白質(zhì)的基因序列和其三維空間結(jié)構(gòu)的配對(duì)數(shù)據(jù)中進(jìn)行學(xué)習(xí)后,按照給定的基因序列輸入,合成一個(gè)刻畫生命功能的蛋白質(zhì)三維結(jié)構(gòu)。ChatGPT這一復(fù)雜的神經(jīng)網(wǎng)絡(luò)大模型,按照“共生則關(guān)聯(lián)”挖掘所得單詞之間共生概率,實(shí)現(xiàn)統(tǒng)計(jì)意義下的語言合成。

        ChatGPT的成功并非一蹴而就,而是源自于以深度學(xué)習(xí)為代表的人工智能技術(shù)的長期積累。其核心在于谷歌公司于2017年將自注意力(self-attention)機(jī)制引入所構(gòu)造的Transformer神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),這一結(jié)構(gòu)可更高效挖掘句子或篇章中單詞與其上下文單詞之間因共生概率而形成的關(guān)聯(lián)關(guān)系。[5]

        為了訓(xùn)練Transformer,OpenAI主要采取了三種方法。首先,采取一種被稱為“完形填空”的訓(xùn)練方法。給定任意一個(gè)自然語言句子,從中“移除”一個(gè)單詞,然后讓模型根據(jù)剩下單詞所形成的上下文來預(yù)測(cè)最合適的“填空詞”,以便完成填空任務(wù)。這一“完形填空”過程在人工智能領(lǐng)域被稱為“自監(jiān)督學(xué)習(xí)(self-supervised learning)”。自監(jiān)督學(xué)習(xí)在人工智能中具有重要作用。圖靈獎(jiǎng)獲得者楊樂昆(Yann LeCun)曾表示,自監(jiān)督學(xué)習(xí)讓人工智能推理更像人類,因?yàn)槿祟惡蛣?dòng)物是通過自監(jiān)督模式獲得新知識(shí),具備學(xué)會(huì)了學(xué)習(xí)(learning to learn)的能力。

        其次,為了讓ChatGPT完成聊天問答任務(wù),在訓(xùn)練得到Transformer的基礎(chǔ)上,OpenAI研究者提出了一種“提示學(xué)習(xí)”(prompt)方法來讓Transformer具備“聊力”。在提示學(xué)習(xí)中,研究者設(shè)計(jì)“提示樣例”教人工智能模型學(xué)習(xí)更流暢合成語言。提示樣例可形象理解為“知識(shí)模板”,讓ChatGPT從中掌握各種“閑聊”固有套路。比較有意思的是,目前出現(xiàn)了一種編寫“提示案例”的工程師工作崗位(prompt engineer),被一些媒體稱為人工智能的私語者(AI whisperer),OpenAI 創(chuàng)始人之一山姆·阿爾特曼(Sam Altman)說:“這一職業(yè)需要強(qiáng)技能的水平?!?/p>

        最后,為了進(jìn)一步提高模型合成語言性能,ChatGPT還引入了人類反饋中強(qiáng)化學(xué)習(xí)(Reinforcement Learning from Human Feedback,RLHF)的技術(shù),將人類反饋?zhàn)鳛橐环N監(jiān)督信息輸入給模型,對(duì)模型參數(shù)微調(diào),提高語言模型回答的真實(shí)性和流暢性。

        還要說明的是,微軟公司將其收購的開源及私有軟件項(xiàng)目托管平臺(tái)GitHub中數(shù)十億行源代碼開放給OpenAI,用來訓(xùn)練ChatGPT的邏輯,使得ChatGPT從程序代碼中學(xué)習(xí)到思維鏈(chain of thought),因此ChatGPT所合成的語言中鮮見前后矛盾的語句。

        ChatGPT是大數(shù)據(jù)、大模型和大算力的工程性創(chuàng)新整合,體現(xiàn)了“數(shù)據(jù)是燃料、模型是引擎、算力是加速器”的深度學(xué)習(xí)特色:

        * 大數(shù)據(jù):ChatGPT的訓(xùn)練使用了45TB的數(shù)據(jù)、近1萬億個(gè)單詞(大概是1351萬本牛津詞典所包含的單詞數(shù)量),同時(shí)包括數(shù)十億行源代碼。

        * 大模型:ChatGPT的前身GPT-3模型參數(shù)高達(dá)1750億。如果將這些模型參數(shù)全部打印在A4紙張上,一張一張疊放后,其高度將超過上海中心大廈632米的高度。

        * 大算力:訓(xùn)練ChatGPT所耗費(fèi)的算力大概是3640 PetaFLOP/s-days,即用每秒能夠運(yùn)算1000萬億次的算力對(duì)模型進(jìn)行訓(xùn)練,需要3640天完成。

        在熱烈討論ChatGPT時(shí),不由讓人想起另外一個(gè)人工智能現(xiàn)象級(jí)產(chǎn)品AlphaGo在2016年以4∶1擊敗李世石的場(chǎng)景。雖然AlphaGo在迎戰(zhàn)李世石之前,已經(jīng)幾乎“閱覽完畢”人類選手所有圍棋比賽的棋局,且每天通過自我對(duì)弈來“華山論劍”(AlphaGo每天可完成200萬次的自我對(duì)弈),但李世石在其戰(zhàn)勝AlphaGo的唯一對(duì)局中落下了人類選手幾乎不可能落子的一招,這一落子是AlphaGo之前從未見過的,使AlphaGo無法從容應(yīng)對(duì)而落敗。

        可見,“數(shù)據(jù)有多大,智能就有多強(qiáng)”是計(jì)算獨(dú)大模式下人工智能算法不可避免的局限性。一旦數(shù)據(jù)無法覆蓋某些場(chǎng)景,則人工智能算法就會(huì)在這些場(chǎng)景中失效。這是因?yàn)樗惴o法理解數(shù)據(jù)背后所承載的機(jī)理、缺乏一種“靈氣”。

        三、計(jì)算優(yōu)勢(shì):試錯(cuò)與暴力

        博弈對(duì)抗是檢驗(yàn)人工智能能力大小的標(biāo)桿。1997年5月,國際象棋冠軍卡斯帕羅夫和IBM公司的“深藍(lán) (Deep Blue)”計(jì)算機(jī)程序展開了一輪令全球矚目的人機(jī)大戰(zhàn)。結(jié)果,深藍(lán)計(jì)算機(jī)發(fā)揮出色,以2勝3平1負(fù)的總比分戰(zhàn)勝了卡斯帕羅夫, 成為首個(gè)在標(biāo)準(zhǔn)比賽時(shí)限內(nèi)擊敗國際象棋世界冠軍的電腦系統(tǒng),這是人工智能領(lǐng)域一個(gè)里程碑事件。

        在象棋比賽中,深藍(lán)需要判斷某一時(shí)刻棋局落子會(huì)對(duì)整個(gè)棋局勝負(fù)帶來怎樣的影響。即基于已知規(guī)則,深藍(lán)要從當(dāng)前棋局出發(fā),盡可能向前搜索更多可能的未來棋局,以便掌握更多信息來對(duì)當(dāng)前落子的優(yōu)劣進(jìn)行判斷。由于可選棋局眾多,盡管深藍(lán)平均每秒能夠?qū)?億個(gè)棋局進(jìn)行判斷評(píng)估,還是無法在規(guī)定時(shí)間內(nèi)計(jì)算得到當(dāng)前棋局對(duì)勝負(fù)的潛在影響。1950年,香農(nóng)(Claud Shannon)發(fā)表了一篇有關(guān)國際象棋編程的論文。在這篇論文中,香農(nóng)估算國際象棋比賽中落子選擇從第一次移動(dòng)時(shí)的20種會(huì)增加到第二次移動(dòng)時(shí)的400種,在第六次移動(dòng)時(shí)可能的落子選擇達(dá)到1.19億種。香農(nóng)通過估算,認(rèn)為國際象棋的落子總數(shù)為10的120次方種,遠(yuǎn)遠(yuǎn)超出了10的82次方這一宇宙原子總數(shù)。這就是國際象棋中“組合爆炸”難題。

        為了從海量可能落子中選擇一種合適落子,以克服組合爆炸挑戰(zhàn),深藍(lán)采用了由1971年圖靈獎(jiǎng)獲得者約翰·麥卡錫 ( John McCarthy )發(fā)明的“阿爾法-貝塔(Alpha-Beta)”剪枝搜索算法。簡(jiǎn)單來說,該算法主動(dòng)“剪掉”對(duì)勝敗不產(chǎn)生任何影響的棋局,從而減少搜索空間以提高搜索效率,解決了組合爆炸難題??梢钥吹?,搜索是很重要的一種人工智能答案求解方法?!澳阋?,或者不見,我就在那里,不悲不喜”,解決某個(gè)問題的答案就在那里,需要運(yùn)用搜索之術(shù)來獲得。

        實(shí)際上,計(jì)算機(jī)在其誕生之初,就展示了其突破組合爆炸問題的優(yōu)勢(shì)。二戰(zhàn)期間,德國研制出了密碼機(jī),能將明文自動(dòng)轉(zhuǎn)換為密碼(密文),再通過無線電或電話線路傳送出去,這就是有名的恩尼格瑪機(jī)(enigma machine)。每一次U型潛艇深海的奔襲及每一次殘酷的進(jìn)攻都由恩尼格瑪機(jī)加密傳輸和解密閱讀。這些通信信號(hào)即使被截獲,也就是一堆毫無意義的亂碼。恩尼格瑪密碼機(jī)是一種電子系統(tǒng)和機(jī)械系統(tǒng)的組合,看上去像一臺(tái)很復(fù)雜的打字機(jī),由按鍵、轉(zhuǎn)子、插接板和導(dǎo)線連接。恩尼格瑪機(jī)將“每加密一個(gè)字母就更換一次密碼表并且永不重復(fù)”的信息加密追求發(fā)揮到了極致。據(jù)估計(jì),恩尼格碼的密鑰總數(shù)是1590萬萬億種。更為困難的是,德軍是每天更換1次密鑰,也就是說要在24小時(shí)內(nèi)驗(yàn)證1590萬萬億種密鑰的可能性,這幾乎是難以想象的困難。

        英國科學(xué)家、計(jì)算機(jī)理論模型之父圖靈(Alan Twring)在二戰(zhàn)期間深信“機(jī)器創(chuàng)造出來的密碼怪獸,只有用機(jī)器才能戰(zhàn)勝”,提出密碼破譯的過程可用機(jī)械方法自動(dòng)處理。1940年初,在波蘭數(shù)學(xué)家和密碼學(xué)家馬里安·雷耶夫斯基(Marian Adam Rejewski)通過暴力搜索方法機(jī)械式驗(yàn)證恩尼格瑪機(jī)所有轉(zhuǎn)子組合思路的基礎(chǔ)上,圖靈研究通過概率學(xué)原理來推斷不同密鑰組合的可能性,優(yōu)先運(yùn)算出可能性最高的組合,研制成功了被稱為“炸彈(Bombe)”或“圖靈炸彈(Turing Bombe)”的計(jì)算機(jī),極大加快了二戰(zhàn)結(jié)束的進(jìn)程。

        作為另外一種人工智能現(xiàn)象級(jí)產(chǎn)品AlphaGo,其在戰(zhàn)勝李世石之前已自我對(duì)弈了千萬次比賽。通過試錯(cuò)(trial amp; error)與暴力(brute force)窮盡遍覽圍棋落子布局,對(duì)模型參數(shù)不斷進(jìn)行調(diào)整。據(jù)估計(jì),李世石一生僅能參加數(shù)千場(chǎng)比賽。人類智能以“經(jīng)一蹶者長一智”模式,從有限嘗試中學(xué)習(xí)經(jīng)驗(yàn),人類智能和機(jī)器智能在智能優(yōu)化方面存在巨大差距。

        與上述人工智能模型類似,ChatGPT以完形填空預(yù)測(cè)、提示樣例調(diào)教和人類相關(guān)反饋對(duì)齊等機(jī)制來訓(xùn)練調(diào)優(yōu)參數(shù),是計(jì)算機(jī)在優(yōu)化人工智能模型時(shí)試錯(cuò)與暴力的一種體現(xiàn)。

        四、內(nèi)容計(jì)算合成的潛在風(fēng)險(xiǎn)

        產(chǎn)生式算法推動(dòng)人工智能由識(shí)人辨物和預(yù)測(cè)決策等向內(nèi)容合成躍升,使得人工智能能夠被普通用戶使用。但由于這一技術(shù)架構(gòu)在數(shù)據(jù)驅(qū)動(dòng)為模式下的深度學(xué)習(xí)基礎(chǔ)上,存在著解釋性差、失真而失信、難以由果溯因等不足,從而帶來潛在的應(yīng)用風(fēng)險(xiǎn)。筆者將分別介紹這些風(fēng)險(xiǎn)產(chǎn)生的技術(shù)原因以及人工智能的倫理風(fēng)險(xiǎn)。

        (一)模型解釋性差

        在物理學(xué)過去的發(fā)展歷史中,還原論(reductionism)的觀點(diǎn)一直是物理學(xué)工作者進(jìn)行研究的最基本的指導(dǎo)原則,其將一切復(fù)雜系統(tǒng)中出現(xiàn)的各種現(xiàn)象都?xì)w結(jié)為最基本組成單元以及單元之間相互作用的基本規(guī)律,或者說將復(fù)雜現(xiàn)象還原為簡(jiǎn)單構(gòu)成,然后再從簡(jiǎn)單重建復(fù)雜。譬如,氣體、液體和固體都被分解為分子或原子,原子又被分解為原子核和電子,原子核被分解為質(zhì)子和中子,質(zhì)子和中子又被分解為夸克。但是,以還原論為基礎(chǔ)來研究和討論復(fù)雜系統(tǒng)的合作現(xiàn)象時(shí),卻遇到了前所未有的挑戰(zhàn)。1977年諾貝爾物理學(xué)獎(jiǎng)獲得者安德森在美國《科學(xué)》雜志發(fā)表了 “More is different”文章中深刻討論了物理世界中所具有的涌現(xiàn)這一現(xiàn)象[6]:還原論假說從來都不意味著建構(gòu)論(constructionist)假說,將所有事物還原為簡(jiǎn)單的基本定律的能力并不意味著從那些基本定律出發(fā)重建整個(gè)宇宙的能力。事實(shí)上,粒子物理學(xué)家告訴我們?cè)蕉嚓P(guān)于基本定律的本質(zhì),這些基本定律和其他學(xué)科的問題的關(guān)聯(lián)就越少,和社會(huì)問題的關(guān)聯(lián)也越少。在面對(duì)尺度(scale)和復(fù)雜性(complexity)的雙重孿生難題時(shí),以還原論為基礎(chǔ)的建構(gòu)論的假定完全崩潰了。

        與之對(duì)應(yīng)的是,我們對(duì)深度學(xué)習(xí)研究中所提出的MCP神經(jīng)元、感知機(jī)模型、深度神經(jīng)網(wǎng)絡(luò)、自注意力機(jī)制等,均可通過相應(yīng)數(shù)學(xué)模型來刻畫。但一旦將這些基本單元或基本機(jī)制組合成龐大復(fù)雜的ChatGPT,其體現(xiàn)了難以解釋的涌現(xiàn)能力(emergence),即:模型參數(shù)較少時(shí)(如十億、百億等),ChatGPT無法表現(xiàn)其應(yīng)有能力;而一旦模型參數(shù)增加到千億級(jí)別時(shí),模型能力瞬間涌現(xiàn)和提升。機(jī)器學(xué)習(xí)模型具有涌現(xiàn)能力意味著重要的科學(xué)意義,因?yàn)槿绻楷F(xiàn)能力是永無盡頭的,那么只要模型足夠大,類人人工智能的出現(xiàn)就是必然。但是,研究表明,不存在明確表征可證明哪類任務(wù)最具涌現(xiàn),并且ChatGPT在邏輯推理和因果推斷任務(wù)中的涌現(xiàn)能力最低。微軟公司因此把其稱為現(xiàn)象級(jí)產(chǎn)品(phenomenological)。[7]

        (二)失真而失信

        ChatGPT以“共生則關(guān)聯(lián)”為標(biāo)準(zhǔn)對(duì)模型進(jìn)行訓(xùn)練,會(huì)通過單詞和單詞之間的概率關(guān)聯(lián)產(chǎn)生非事實(shí)的合成結(jié)果(也有學(xué)者將其稱為人工智能幻覺,hallucination)。例如,ChatGPT一本正經(jīng)地回答“林黛玉倒拔垂楊柳”這樣啼笑皆非的問題、捏造法學(xué)家性騷擾丑聞文章、發(fā)布澳洲某位官員因涉及澳大利亞儲(chǔ)備銀行子公司受賄案而入獄的虛假文章等,這些非事實(shí)結(jié)果產(chǎn)生的原因在于ChatGPT內(nèi)容合成機(jī)理是“機(jī)械式共生匹配”。

        1913年,法國科學(xué)家埃米爾·波雷爾(Emile Borel)發(fā)表了《靜態(tài)力學(xué)與不可逆性》( La mécanique statique et l’irréversibilité )論文,[8]闡釋了“無窮”概念:讓我們想象一下,假設(shè)猴子經(jīng)過訓(xùn)練學(xué)會(huì)了隨意按下打字機(jī)的按鈕,現(xiàn)在讓猴子們?cè)谝晃晃拿ゎI(lǐng)班監(jiān)督下工作。如果無限多猴子在無限多打字機(jī)上隨機(jī)亂敲,并持續(xù)無限久時(shí)間,那么在某個(gè)時(shí)候,將會(huì)有只猴子打出莎士比亞全部著作。這被稱為“無限猴子定理”?!盁o限猴子定理”試圖說明“隨機(jī)+無限=一切皆可能”。一旦在單詞之間建立了概率關(guān)聯(lián),很顯然從“無窮”角度而言,ChatGPT可以合成任意的內(nèi)容。但是,這一通過隨機(jī)概率將語言序列拼接在一起的合成模式也被若干學(xué)者稱為隨機(jī)鸚鵡(stochastic parrot)。

        據(jù)估計(jì),全球高質(zhì)量文本數(shù)據(jù)的總存量在5萬億token左右(一個(gè)token可理解為單詞或符號(hào)等基本單元),這包括了世界上所有的書籍、科學(xué)論文、新聞文章、百科、公開代碼以及網(wǎng)絡(luò)上經(jīng)過篩選的達(dá)標(biāo)數(shù)據(jù)(如網(wǎng)頁、博客和社交媒體)。按照目前ChatGPT消耗數(shù)據(jù)的速度,人工智能算法可能在一個(gè)數(shù)量級(jí)內(nèi),耗盡世界上所有有用的語言訓(xùn)練數(shù)據(jù)供應(yīng),而不得不使用ChatGPT合成的語言來訓(xùn)練ChatGPT。這將是一個(gè)多么令人魔幻的時(shí)刻!

        可見,“數(shù)據(jù)有多大、智能就有多強(qiáng)”是計(jì)算獨(dú)大模式下人工智能算法不可避免的局限性。一旦數(shù)據(jù)無法覆蓋某些場(chǎng)景,則人工智能算法就會(huì)在這些場(chǎng)景中失效。這是因?yàn)樗惴o法理解數(shù)據(jù)背后所承載的機(jī)理,“數(shù)據(jù)獨(dú)大、機(jī)理式微”這一計(jì)算模式缺乏“智慧之靈氣”。

        (三)由果溯因弱

        哲學(xué)上把現(xiàn)象與現(xiàn)象之間那種“引起和被引起”的關(guān)系,叫做因果關(guān)系,其中引起某種現(xiàn)象產(chǎn)生的現(xiàn)象叫做原因,被某種現(xiàn)象引起的現(xiàn)象叫做結(jié)果,如“力,形之所以奮也”。因果分析和推斷是一種重要的獲取知識(shí)的手段,是人類智能的關(guān)鍵組成。回答諸如“吸煙是否導(dǎo)致癌癥”和“某個(gè)廣告發(fā)布是否導(dǎo)致了某個(gè)商品銷量上漲”等問題時(shí),往往需要因果推理的能力。

        1973年,美國科學(xué)院院士、加州大學(xué)伯克利分校統(tǒng)計(jì)系教授彼得·畢克(Peter Bickel)在美國《科學(xué)》上雜志發(fā)表了一篇有趣論文來討論“伯克利分校錄取新生時(shí)性別歧視”的困惑。[9]在文章中,彼得教授對(duì)申請(qǐng)1973年秋季入學(xué)的12763名學(xué)生進(jìn)行了統(tǒng)計(jì),發(fā)現(xiàn)有8442個(gè)男生申請(qǐng)者和4321個(gè)女生申請(qǐng)者。在統(tǒng)計(jì)了當(dāng)年度所錄取學(xué)生中男生和女生人數(shù)后,發(fā)現(xiàn)當(dāng)年度男生錄取率為44%,遠(yuǎn)高于女生錄取率35%。因此,從這個(gè)數(shù)據(jù)可以得出“伯克利分校當(dāng)年在男生和女生錄取中性別歧視昭然若揭”這一結(jié)論,也就是女生更難被錄取。

        然而,如果單獨(dú)統(tǒng)計(jì)每個(gè)院系的錄取情況,就會(huì)發(fā)現(xiàn),對(duì)于每個(gè)院系而言,男生錄取率和女生錄取率相差無幾,甚至對(duì)伯克利六個(gè)最大院系分別統(tǒng)計(jì)男生和女生錄取率,竟然有四個(gè)院系女生錄取率大于男生錄取率。

        也就是說,將所有新生按照院系分組后,統(tǒng)計(jì)得到男生和女生的錄取率,與不按照院系分組統(tǒng)計(jì)男生和女生的錄取率結(jié)果正好相反。這就是著名的辛普森悖論(Simpson’s paradox)。辛普森悖論反映了總體數(shù)據(jù)集上成立的某種關(guān)系卻在分組數(shù)據(jù)集合中“反其道而行之”這一怪異現(xiàn)象。彼得教授認(rèn)為,在伯克利男生和女生錄取率這個(gè)案例中,產(chǎn)生悖論原因在于女生更愿意申請(qǐng)那些競(jìng)爭(zhēng)壓力更大的院系(比如英語系),而男生更愿意申請(qǐng)那些相對(duì)容易進(jìn)的院系(比如工程學(xué)系)。在分析伯克利分校錄取率時(shí),不應(yīng)該只看到男生和女生這個(gè)性別因素,還應(yīng)該知曉“專業(yè)選擇”這一因素會(huì)對(duì)新生錄取產(chǎn)生作用。

        辛普森悖論的重要性在于告訴如下道理:很多時(shí)候我們看到的數(shù)據(jù)并非反映現(xiàn)象全貌的數(shù)據(jù),如果忽略產(chǎn)生數(shù)據(jù)的“潛在變量”,可能會(huì)改變已有結(jié)論,而我們常常卻一無所知。比如伯克利招生錄取中專業(yè)選擇就是一個(gè)潛在變量。從觀測(cè)結(jié)果中尋找引發(fā)結(jié)果的原因,“知其然且知其所以然”,由果溯因,就是因果推理。

        “橫看成嶺側(cè)成峰”,通過機(jī)械匹配來挖掘單詞之間概率關(guān)聯(lián)的語言大模型,顯然會(huì)因?yàn)楹雎粤藛卧~所組成句子和篇章的內(nèi)部隱性規(guī)律(如主題等),將會(huì)帶來錯(cuò)誤之虞。

        (四)倫理風(fēng)險(xiǎn)

        “倫理”一詞來源于希臘語的“道德”(character,性格)一詞和拉丁語的“風(fēng)俗(customs)”一詞。這兩個(gè)單詞結(jié)合在一起,刻畫了個(gè)體之間如何互動(dòng),用來描述人和人之間言行的道德與準(zhǔn)則。“倫”表示人際各種關(guān)系,“理”則說明人際關(guān)系是有條有理。有原則有標(biāo)準(zhǔn)的倫理學(xué)就是對(duì)道德、道德問題及道德判斷所作的哲學(xué)思考。倫理學(xué)是哲學(xué)的一個(gè)課題,是對(duì)道德、道德問題和道德判斷所做的哲學(xué)思考。

        倫理一詞在中國最早見于《禮記·樂記》中“樂者,通倫理者也”。在中國語境中,對(duì)“倫”的詮釋主要有三重含義:其一,“倫”者從“人”從“侖”,許慎《說文解字》訓(xùn)“倫”為“輩也”,講“倫”起碼要兩人以上,“倫”即指人與人之間的輩分次第關(guān)系,單個(gè)人無所謂“倫”。其二,“倫”通“樂”,如《禮記·樂記》曰“樂者,通倫理者也”,強(qiáng)調(diào)音樂與倫理、美與善的相通性,或者說“樂”是通倫理的最佳方式,倫理以愉悅與和諧為要。其三,“倫”同“類”,如鄭玄注“倫理”曰:“倫,類也,理之分也”,強(qiáng)調(diào)“倫”的本質(zhì)是一種“類”的“分”。可見,“倫”在中國文明中就是一種關(guān)系,一種規(guī)則,一種秩序。

        科學(xué)技術(shù)作為人類理性實(shí)踐的結(jié)晶,對(duì)人類社會(huì)發(fā)展產(chǎn)生越來越深刻的影響,其產(chǎn)生和發(fā)展始終伴隨著倫理觀念、社會(huì)文化的演變。近代科學(xué)技術(shù)是伴隨著理性精神、人文精神的興起和傳播而崛起的,通過發(fā)現(xiàn)和應(yīng)用新知識(shí)為人類謀幸福是近代科學(xué)興起的原動(dòng)力之一??萍家郧八从械某潭葷B透進(jìn)人類社會(huì),甚至對(duì)政治、文化等產(chǎn)生深刻影響。當(dāng)科學(xué)技術(shù)的探索與應(yīng)用符合倫理規(guī)范,被引導(dǎo)至向善、負(fù)責(zé)任的方向,會(huì)更好地促進(jìn)社會(huì)發(fā)展和人類福祉提升。倘若科學(xué)技術(shù)探索和應(yīng)用打破了倫理底線,則可能給社會(huì)造成巨大危害。

        傳統(tǒng)的科技發(fā)展往往采取一種所謂的“技術(shù)先行或占先行動(dòng)徑路(proactionary approach )”模式,以發(fā)展技術(shù)為優(yōu)先原則,體現(xiàn)出一種強(qiáng)大的工具理性,即“通過縝密的邏輯思維和精細(xì)的科學(xué)計(jì)算來實(shí)現(xiàn)效率或效用的最大化”。這種對(duì)技術(shù)效用單一維度的追求導(dǎo)致了科技異化現(xiàn)象,技術(shù)發(fā)展逐漸時(shí)而偏離“善”的方向,進(jìn)而引發(fā)了一系列倫理風(fēng)險(xiǎn)。為確??萍及l(fā)展的正當(dāng)性與合理方向,在科學(xué)的社會(huì)建構(gòu)思潮影響下,科技倫理應(yīng)運(yùn)而生。

        科技倫理是科技活動(dòng)需要遵循的價(jià)值理念和行為規(guī)范。人類已進(jìn)入科技和信息時(shí)代,相較于傳統(tǒng)工業(yè)時(shí)期以安全性為表征的技術(shù)風(fēng)險(xiǎn),關(guān)涉人類福祉、公正等核心價(jià)值的倫理風(fēng)險(xiǎn)正成為當(dāng)代科技發(fā)展引發(fā)的主要消極后果。

        隨著物聯(lián)網(wǎng)、移動(dòng)終端、互聯(lián)網(wǎng)、傳感器網(wǎng)、車聯(lián)網(wǎng)、穿戴設(shè)備等的流行,計(jì)算與感知已經(jīng)遍布世界,與人類密切相伴。網(wǎng)絡(luò)不但遍布世界,更史無前例地連接著個(gè)體和群體,開始快速反映與聚集他們的意見、需求、創(chuàng)意、知識(shí)和能力。世界已從“物理世界—人類社會(huì)”二元空間結(jié)構(gòu)(Physics world-Human Society)演變?yōu)椤靶畔⒖臻g—物理世界—人類社會(huì)”三元空間結(jié)構(gòu)CPH(Cyber Space- Physics world- Human Society)。在CPH三元空間中,帶來的倫理學(xué)討論不再只是人與人之間的關(guān)系,也不是人與自然界既定事實(shí)之間的關(guān)系,而是人類與自己所發(fā)明一種產(chǎn)品在社會(huì)中所構(gòu)成的關(guān)聯(lián)。因此,對(duì)于科技本身,需要既考慮其技術(shù)屬性、又考慮其社會(huì)屬性,形成人機(jī)共融所形成社會(huì)形態(tài)應(yīng)遵守道德準(zhǔn)則和法律法規(guī)。

        一般而言,社會(huì)意識(shí)在很多時(shí)候落后于社會(huì)存在,如歷史上有名的“紅旗法案(Red flag traffic laws)”。19 世紀(jì),汽車剛被發(fā)明出來時(shí),被大眾認(rèn)為是一種怪物,不少人憂心忡忡地認(rèn)為汽車會(huì)給人類社會(huì)帶來重重危險(xiǎn)。為此,1865年,英國議會(huì)專門通過了一部被稱為“紅旗法案”的《機(jī)動(dòng)車法案》。這個(gè)法案規(guī)定:每一輛在道路上行駛的機(jī)動(dòng)車,必須由3 個(gè)人駕駛,其中一人必須在車前面50米以外做引導(dǎo),同時(shí)這個(gè)人還要用紅旗不斷搖動(dòng)為機(jī)動(dòng)車開道(提示人們危險(xiǎn)將近),并且汽車速度每小時(shí)不能超過6.4公里。紅旗法案的結(jié)果是把汽車當(dāng)馬車用,使得汽車工業(yè)發(fā)展幾乎處于停滯狀態(tài),在人類汽車發(fā)展史上留下了令人深思的一頁。

        這種對(duì)技術(shù)進(jìn)步所帶來的負(fù)面感覺被稱為“技術(shù)恐懼”(technophobia),好比19世紀(jì)末20世紀(jì)初,在擁有電力設(shè)施的家庭里工作的女傭十分擔(dān)心電力設(shè)施會(huì)如同蒸汽鍋爐或煤氣廠一樣在房屋內(nèi)突然爆炸。

        2023年3月底,美國生命未來研究所(Future of Life Institute)公布一封公開信,呼吁所有AI實(shí)驗(yàn)室立即暫停訓(xùn)練比GPT-4更強(qiáng)大的AI系統(tǒng)至少6個(gè)月。這一公開信提出了如下四個(gè)令人深刻思考的問題:是否應(yīng)該讓機(jī)器用宣傳和謊言充斥我們的信息渠道?是否應(yīng)該自動(dòng)化所有工作?是否應(yīng)該發(fā)展最終可能超過并取代我們的非人類思維?是否應(yīng)該冒險(xiǎn)失去對(duì)文明的控制?

        在這些問題中,機(jī)器通過機(jī)械匹配所合成的非事實(shí)內(nèi)容已經(jīng)出現(xiàn),另外三個(gè)問題離我們還很久遠(yuǎn)。從長遠(yuǎn)來看,應(yīng)該肯定這封公開信所作出的思考,但不應(yīng)對(duì)這封信斷章取義。

        如何看待一項(xiàng)新技術(shù)的發(fā)展,這是做技術(shù)預(yù)測(cè)時(shí)必須要有的一項(xiàng)認(rèn)知準(zhǔn)備。遺憾的是,我們?nèi)祟惪偸橇?xí)慣于線性思維(這符合人類自然的認(rèn)知模式:節(jié)省能量與快速計(jì)算),但這種認(rèn)知配置很容易出現(xiàn)認(rèn)知偏差。其中最常見的認(rèn)知偏差是對(duì)于技術(shù)近期與遠(yuǎn)期影響的判斷出現(xiàn)不對(duì)稱性,這個(gè)關(guān)系被美國科學(xué)家羅伊·阿瑪拉(Roy Amara)發(fā)現(xiàn),并形成了所謂的阿瑪拉法則(Amara’s Law)。所謂的阿瑪拉法則是指:短期內(nèi)我們傾向于高估技術(shù)的影響,長期內(nèi)我們低估技術(shù)的影響。

        五、人機(jī)協(xié)同創(chuàng)新

        人類進(jìn)入信息時(shí)代以來,先后通過鍵盤(文字輸入)和鼠標(biāo)(圖形界面)與信息交互,ChatGPT這一模型基座的出現(xiàn)使得人們可用自然語言與信息世界交互。人工智能這一能力第一次在聊天、虛擬助理、語言翻譯和內(nèi)容生成等方面助力每一個(gè)普通用戶,成為像水和電一樣的通用資源。

        隨著ChatGPT與不同領(lǐng)域App結(jié)合,整合不同領(lǐng)域的實(shí)時(shí)數(shù)據(jù),如旅行軟件、購物軟件、支付軟件、在線訂餐平臺(tái)等,這樣ChatGPT就演變?yōu)閤GPT。未來人們不必再自己去下載和使用各種App和網(wǎng)站,互聯(lián)網(wǎng)的統(tǒng)一入口將由不同xGPT開啟。每個(gè)人都可通過自然語言連接所需互聯(lián)網(wǎng)信息,極大改變了生活、生產(chǎn)和工作的生態(tài)。

        美國數(shù)學(xué)家、哲學(xué)家諾伯特·維納(Norbert Wiener)在1950年出版了一本極具洞察力和先見之明的著作《人有人的用處:控制論與社會(huì)》,目的就是希望人類在技術(shù)世界的環(huán)繞中更有尊嚴(yán)、更有人性,而不是相反。未來將是人和人工智能共同進(jìn)化的時(shí)代,人和人造物之間將如影隨形、協(xié)作共進(jìn)、相得益彰。機(jī)器是人類創(chuàng)造出來的,人類的作用就是在人和機(jī)器共處的社會(huì)中,不斷用知識(shí)強(qiáng)化優(yōu)化機(jī)器。我們需要用進(jìn)化的觀點(diǎn)去看待這個(gè)過程,最大限度發(fā)展種種可能性,而不是陷入“人機(jī)相斗”和“人機(jī)相害”的臆想中。

        不論怎樣,人類始終是人工智能高度、廣度和深度的總開關(guān)和決定者。因此,我們一方面要警惕將人工智能等同于人類大腦的不切實(shí)際之舉和“人工智能奴役人類”等杞人憂天之思,另一方面要善于利用人工智能這一幫手,在人機(jī)協(xié)同中進(jìn)行更好的內(nèi)容創(chuàng)造,創(chuàng)造更加美好的未來。

        當(dāng)前人工智能中知識(shí)引導(dǎo)方法長于推理(但其難以拓展)、數(shù)據(jù)驅(qū)動(dòng)模型善于預(yù)測(cè)識(shí)別(但其過程難以理解)、策略學(xué)習(xí)手段能對(duì)未知空間進(jìn)行探索(但其依賴于搜索策略),大模型提供了一種群智交互機(jī)制,可望建立人在回路的機(jī)器學(xué)習(xí)框架,最終充分協(xié)調(diào)數(shù)據(jù)驅(qū)動(dòng)下歸納知識(shí)指導(dǎo)中演繹及行為探索內(nèi)頓悟等不同學(xué)習(xí)手段和方法。

        以ChatGPT為代表的復(fù)雜神經(jīng)網(wǎng)絡(luò)大模型這類新型人造物的出現(xiàn),將給人類社會(huì)諸多生產(chǎn)、生活模式帶來一次大變革。但這也為另外更多的奇妙“多樣性”打開了一扇窗戶,因?yàn)椤叭擞腥说淖饔谩?[10]。

        參考文獻(xiàn):

        [1] McCarthy, J., Minsky, M. L., Rochester, N. amp; Shannon, C.E. A proposal for the dartmouth summer research project on artificial intelligence, Retrieved March 12, 2023, from https://doi.org/10.1609/aimag.v27i4.1904.

        [2] Jordan, M. amp; Mitchell, T. (2015). Machine learning: Trends, perspectives, and prospects.Science, 349(6245):255-260.

        [3] Yann, L., Yoshua, B. amp; Geoffrey, H. (2015). Deep learning. Nature, 521(7553):436–444.

        [4] Pan, Y. (2016). Heading toward artificial intelligence 2.0. Engineering, 2(4): 409- 413.

        [5] Ashish, V., Noam, S., Niki, P., Jakob, U., Llion, J., Aidan, N. G.,ukasz, K. amp; Illia, P. (2017). Attention is all you need. Proceedings of the 31st International Conference on Neural Information Processing Systems. Red Hook, NY, USA: Curran Associates Inc, 6000-6010.

        [6] Anderson, P.W. (1973). More is different. Science,177(4047):393-396.

        [7] Sébastien, B., Varun, C., Ronen, E., Johannes, G., Eric, H., Ece, K., Peter, L., Yin, T.L., Yuanzhi, L., Scott, L., Harsha, N., Hamid, P., Marco, T. R. amp; Yi, Z. (2023). Sparks of Artificial General Intelligence: Early experiments with GPT-4. Retrieved March 12, 2023, from https://doi.org/10.48550/arXiv.2303.12712.

        [8] mile, B. (1913). La mécanique statique et l'irréversibilité. Journal de Physique Théorique et Appliquée,3(1):189-196.

        [9 ]Peter, J., Bickel, E. A. H. amp; O’Connell, J. W. (1975). Sex bias in graduate admissions: Data from Berkeley. Science,187(4175):398-404.

        [10] 吳飛.走進(jìn)人工智能[M].北京:高等教育出版社,2022:167-175.

        [責(zé)任編輯:高辛凡]

        国产一区二区三区四区五区加勒比| 日本一区二区高清视频| 精品女厕偷拍视频一区二区 | 白白白色视频在线观看播放| 丝袜美腿在线观看一区| 精品亚洲成a人片在线观看| 欧美中文在线观看| 大屁股流白浆一区二区| 森中文字幕一区二区三区免费| 欧美黑人性暴力猛交喷水| 国产另类综合区| 亚洲国产综合性感三级自拍| 丁香婷婷激情视频在线播放| 精品日产卡一卡二卡国色天香 | 99在线无码精品秘 入口九色| 全亚洲最大的私人影剧院在线看| 无码av不卡一区二区三区| 毛茸茸性xxxx毛茸茸毛茸茸| 性色av无码久久一区二区三区| 制服丝袜天堂国产日韩| 国产高清一级毛片在线看| 精品人妻一区二区三区狼人 | 日本精品少妇一区二区| 成 人片 黄 色 大 片| 夜爽8888视频在线观看| 久久精品国产av大片| 青青草在线免费播放视频| 性色av闺蜜一区二区三区 | 欧美jizzhd精品欧美| 欧美v日韩v亚洲综合国产高清| 中文字幕日韩高清乱码| 国产欧美日韩一区二区三区| 老男人久久青草AV高清| 美女福利视频网址导航| 亚洲av成人无码久久精品老人| 国产午夜三级一区二区三| 国产V亚洲V天堂A无码| 在线精品首页中文字幕亚洲| 亚洲免费网站观看视频| 亚洲天堂av免费在线看| 日韩精品极品系列在线免费视频 |