亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        ChatGPT給科研工作者帶來(lái)的機(jī)遇與挑戰(zhàn)

        2023-03-12 09:14:22王樹(shù)義張慶薇
        圖書(shū)館論壇 2023年3期
        關(guān)鍵詞:分類器研究者文本

        王樹(shù)義,張慶薇

        0 引言

        2022年11月30日,OpenAI發(fā)布名為ChatGPT的模型研究預(yù)覽版,它可以用對(duì)話的方式與用戶進(jìn)行交互。ChatGPT模型使用人類反饋的強(qiáng)化學(xué)習(xí)(Reinforcement Learning from Human Feedback,RLHF)進(jìn)行訓(xùn)練[1]。訓(xùn)練方法與OpenAI早前發(fā)布的InstructGPT類似,但數(shù)據(jù)收集設(shè)置略有不同,OpenAI使用有監(jiān)督的微調(diào)方法,基于GPT-3.5系列的模型訓(xùn)練了一個(gè)初始模型,并且用人工AI訓(xùn)練師對(duì)話形式,混合InstructGPT數(shù)據(jù)集撰寫(xiě)對(duì)話格式的回應(yīng)。對(duì)于備選答案,由人工AI訓(xùn)練師排名提供增強(qiáng)學(xué)習(xí)的獎(jiǎng)勵(lì)[2]。ChatGPT自發(fā)布以來(lái),非常受歡迎,僅5天就吸引超過(guò)100萬(wàn)用戶[3],上市第一個(gè)月就擁有5,700萬(wàn)活躍用戶[4],估計(jì)發(fā)布后兩個(gè)月內(nèi)的月活躍用戶達(dá)到1億[5]。ChatGPT的廣泛普及使得OpenAI的價(jià)值增長(zhǎng)到了290億美元[6]。

        ChatGPT的火爆伴隨著一系列對(duì)它的討論。人們津津樂(lè)道于它通過(guò)圖靈測(cè)試[7],在明尼蘇達(dá)大學(xué)通過(guò)法律考試,并在加州大學(xué)伯克利分校的另一場(chǎng)考試中獲得優(yōu)異成績(jī)[8]。人們嘗試用它寫(xiě)簡(jiǎn)歷和求職信,解釋復(fù)雜的話題,提供戀愛(ài)建議[9]。在廣泛的使用中,用戶們逐漸發(fā)現(xiàn)ChatGPT的許多問(wèn)題,如對(duì)話容量限制、成為抄襲和作弊利器、存在偏見(jiàn)、歧視以及準(zhǔn)確性等問(wèn)題[10]。盡管大眾對(duì)ChatGPT的討論非常激烈和豐富多彩,但作為科研人員,更應(yīng)該嚴(yán)肅審視:ChatGPT以及相似模型和服務(wù)的出現(xiàn)會(huì)給學(xué)界帶來(lái)什么樣的變化?在變化出現(xiàn)的時(shí)候,該如何抓住機(jī)遇并避免負(fù)面影響,從而獲得科研競(jìng)爭(zhēng)優(yōu)勢(shì)?本文通過(guò)例證來(lái)嘗試初步回答上述問(wèn)題。

        1 文獻(xiàn)回顧

        NLG(Neural Language Generation,自然語(yǔ)言生成)是指從非語(yǔ)言表示生成人類可以理解的文本的技術(shù),應(yīng)用廣泛,包括機(jī)器翻譯、對(duì)話系統(tǒng)、文本摘要等[11]。目前主要的NLG模型包括Transformer、GPT-1/2/3、BERT、XLM、BART、Codex等。其中,Transformer模型基于Attention機(jī)制,在質(zhì)量和用時(shí)上都比之前的模型有所提升[12];GPT模型是使用大量數(shù)據(jù)訓(xùn)練好的基于Transformer結(jié)構(gòu)的生成型預(yù)訓(xùn)練變換器模型,能在常識(shí)推理、問(wèn)題回答、語(yǔ)義蘊(yùn)含的語(yǔ)言場(chǎng)景中取得改進(jìn)[13];BERT引入MLM和NSP訓(xùn)練方法,能融合上下文[14];XLM模型通過(guò)訓(xùn)練跨語(yǔ)言信息,可以用在訓(xùn)練語(yǔ)料少的語(yǔ)言上學(xué)習(xí)到的信息[15]。2020年OpenAI發(fā)布的GPT-3模型參數(shù)達(dá)到1,750億個(gè),通過(guò)與模型的文本互動(dòng)來(lái)指定任務(wù),性能強(qiáng)大[16]。2021年OpenAI發(fā)布基于GPT-3的Codex模型,能從自然語(yǔ)言文件串中產(chǎn)生功能正確的代碼[17]。2022年OpenAI發(fā)布基于GPT-3的InstructGPT模型,加入了人類評(píng)價(jià)及反饋數(shù)據(jù),能遵循人類指令,并可以泛化到?jīng)]有見(jiàn)過(guò)的任務(wù)[1]。ChatGPT是InstructGPT模型的兄弟模型,可以遵循提示中的指令并提供詳細(xì)的響應(yīng),回答遵循人類價(jià)值觀[2]。

        AIGC(AI Generated Content)是指利用人工智能技術(shù)來(lái)生成內(nèi)容的技術(shù),包括文本到文本的語(yǔ)言模型、文本到圖像的生成模型、從圖像生成文本等。其中,谷歌發(fā)布的LaMDA是基于Transformer的用于對(duì)話的語(yǔ)言模型,利用外部知識(shí)源進(jìn)行對(duì)話,達(dá)到接近人類水平的對(duì)話質(zhì)量[18];MetaAI推出的PEER是可以模擬人類寫(xiě)作過(guò)程的文本生成模型[19];OpenAI發(fā)布的Codex和Deep Mind的AlphaCode是用于從文本生成代碼的生成模型[17,20]。在圖像生成方面,GauGAN2和DALL·E 2分別是可以生成風(fēng)景圖像和從自然語(yǔ)言的描述生成現(xiàn)實(shí)圖像的生成模型,基于GAN和CLIP模型,使用對(duì)比學(xué)習(xí)訓(xùn)練[21-22];Midjourney和Stable Diffusion是從文本到圖像的AI生成模型,而谷歌的Muse則實(shí)現(xiàn)了最先進(jìn)的文本轉(zhuǎn)換為圖像的生成性能[23]。另外,F(xiàn)lamingo是一個(gè)視覺(jué)語(yǔ)言模型,能將圖像、視頻和文本作為提示輸出相關(guān)語(yǔ)言[24];VisualGPT是OpenAI推出的從圖像到文本的生成模型[25]。

        人工智能內(nèi)容產(chǎn)生過(guò)程,難以避免遇到各種問(wèn)題,如偏見(jiàn)和歧視。由于訓(xùn)練數(shù)據(jù)集可能存在偏見(jiàn)和歧視,ChatGPT可能會(huì)學(xué)習(xí)到這些偏見(jiàn)或歧視,因此需要采用多種方法對(duì)數(shù)據(jù)進(jìn)行篩選和清洗,或使用公平性算法來(lái)糾正模型偏差??傮w而言,ChatGPT的公平性取決于它的訓(xùn)練數(shù)據(jù)集以及使用它時(shí)的上下文和提問(wèn)方式[16]。另外,還有算力挑戰(zhàn),ChatGPT依賴大量算力來(lái)訓(xùn)練海量文本數(shù)據(jù),以此學(xué)習(xí)語(yǔ)言模式和知識(shí)。算力需求日益增長(zhǎng),致使這一領(lǐng)域存在著技術(shù)壟斷,會(huì)對(duì)算力持續(xù)提升、大數(shù)據(jù)的訓(xùn)練等進(jìn)一步行動(dòng)產(chǎn)生影響。OpenAI為了應(yīng)對(duì)ChatGPT的高需求,采取排隊(duì)系統(tǒng)和流量整形等措施[26]。

        筆者梳理相關(guān)成果,尚未發(fā)現(xiàn)詳細(xì)分析與論述ChatGPT對(duì)科研工作者影響的研究論文。因此,本文從ChatGPT給科研工作者帶來(lái)的機(jī)遇與挑戰(zhàn)兩個(gè)方面作為切入點(diǎn),展開(kāi)論述。

        2 機(jī)遇

        ChatGPT是一種AI工程化的成功實(shí)踐。AI工程化專注于開(kāi)發(fā)工具、系統(tǒng)和流程,使得人工智能能夠應(yīng)用于現(xiàn)實(shí)世界的領(lǐng)域[27]。它使得普通人可以應(yīng)用最新的自然語(yǔ)言生成與對(duì)話技術(shù),完成很多曾經(jīng)需要技術(shù)門(mén)檻才能完成的工作。

        2.1 輔助編程

        數(shù)據(jù)科學(xué)研究范式已經(jīng)深刻影響了許多學(xué)科。許多研究需要通過(guò)不同形式來(lái)掌握足夠的數(shù)據(jù)支持。通常研究數(shù)據(jù)獲取的途徑主要有3種:開(kāi)放數(shù)據(jù)集、API調(diào)用和爬蟲(chóng)(Web Scrapper)。Python語(yǔ)言是信息管理學(xué)科中進(jìn)行數(shù)據(jù)分析最常用的編程語(yǔ)言。以前用戶必須掌握Python語(yǔ)言的基礎(chǔ)語(yǔ)法,了解Python環(huán)境的使用,才能編寫(xiě)程序進(jìn)行API調(diào)用或利用爬蟲(chóng)搜集數(shù)據(jù)。而有了ChatGPT,用戶可以通過(guò)自然語(yǔ)言對(duì)話形式,給出要求,人工智能會(huì)直接給出源代碼,并復(fù)制到實(shí)驗(yàn)環(huán)境,從而獲取所需數(shù)據(jù)。圖1演示了研究者打算爬取某個(gè)網(wǎng)頁(yè)上的信息,于是可以通過(guò)瀏覽器的Inspector功能查找對(duì)應(yīng)的區(qū)域,此處找到的是類別sdyw_ul。

        圖1 通過(guò)瀏覽器定位爬取范圍

        有了對(duì)應(yīng)的爬取位置,用戶就可以在ChatGPT里直接提出要求:“我想獲得sdyw_ul類下的鏈接和標(biāo)題?!?I want to get the links and titles under the class“sdyw_ul”)。然后ChatGPT自動(dòng)編寫(xiě)程序,結(jié)果如圖2所示。

        圖2 ChatGPT自動(dòng)編程爬蟲(chóng)

        如果用戶對(duì)程序運(yùn)行結(jié)果不滿意,可以通過(guò)進(jìn)一步對(duì)話交流,讓ChatGPT對(duì)程序源代碼進(jìn)行修改。例如,可以通過(guò)對(duì)話讓ChatGPT把數(shù)據(jù)輸出的方式改成CSV文件。ChatGPT更新代碼,返回結(jié)果如圖3所示。

        圖3 ChatGPT爬蟲(chóng)編程修改輸出格式

        因?yàn)镃hatGPT擁有對(duì)多輪對(duì)話的記憶力,所以每次只需要提出進(jìn)一步的要求,就能不斷讓ChatGPT編寫(xiě)符合用戶目標(biāo)的程序,從而完成預(yù)期目標(biāo)。最終,用戶可以僅通過(guò)自然語(yǔ)言交互和拷貝ChatGPT生成結(jié)果代碼并運(yùn)行的方式,把該網(wǎng)站上全部感興趣的內(nèi)容,存入Excel文件,如圖4所示。

        圖4 ChatGPT生成爬蟲(chóng)的最終運(yùn)行結(jié)果

        ChatGPT輔助編程不只體現(xiàn)在數(shù)據(jù)采集環(huán)節(jié)。ChatGPT的基礎(chǔ)模型是“GPT-3.5”,底層基礎(chǔ)模型是在大量代碼上訓(xùn)練的結(jié)果,稱為“code-davinci-002”[28]。因此,ChatGPT見(jiàn)識(shí)過(guò)大量產(chǎn)生于2021年第四季度之前的代碼段,且對(duì)代碼上下文補(bǔ)全有較強(qiáng)的能力。在此之前的數(shù)據(jù)分析甚至是機(jī)器學(xué)習(xí)模型訓(xùn)練工作,都可以通過(guò)自然語(yǔ)言對(duì)話方式交給ChatGPT來(lái)進(jìn)行。例如,在下面的例子里,用戶嘗試讓ChatGPT采用LDA對(duì)一系列英文新聞文本做出主題挖掘,提出的自然語(yǔ)言指令和ChatGPT的應(yīng)答如圖5所示。用戶只需將ChatGPT給出的代碼復(fù)制運(yùn)行,對(duì)應(yīng)生成的LDA主題聚類可視化結(jié)果如圖6所示。如圖可見(jiàn),原本需要一定的編程基礎(chǔ)才能完成的機(jī)器學(xué)習(xí)乃至數(shù)據(jù)可視化任務(wù),都可以通過(guò)和ChatGPT自然語(yǔ)言對(duì)話方式來(lái)完成。如果用戶覺(jué)得結(jié)果有不滿意的地方,可以隨時(shí)跟ChatGPT交互,從而做出訂正。例如,原本的代碼中,ChatGPT默認(rèn)為筆者采用中文停用詞,并且還使用jieba軟件包進(jìn)行分詞,可以要求ChatGPT改用英語(yǔ)停用詞進(jìn)行處理,ChatGPT會(huì)立即根據(jù)新的要求變動(dòng),給出更新后的代碼,如圖7所示。

        圖5 ChatGPT編寫(xiě)LDA主題挖掘代碼

        圖6 ChatGPT輔助編程生成LDA主題聚類可視化結(jié)果

        圖7 要求ChatGPT改用英文停用詞表

        在這個(gè)例子中,ChatGPT改用nltk軟件包,使用內(nèi)置的英文停用詞表,可以做出更加符合要求的結(jié)果。不僅如此,在大部分ChatGPT生成的代碼中,不僅會(huì)有詳細(xì)的注釋,代碼完成后,ChatGPT還會(huì)給出相應(yīng)的解釋。例如,在這個(gè)更新的代碼中,筆者使用NLTK包中的“stopwords”語(yǔ)料庫(kù)來(lái)獲得“stopwords.w ords(‘english’)”方法,還使用‘word_tokenize’方法來(lái)對(duì)文本進(jìn)行標(biāo)記(原文為:in this updated code,we use the‘stopwords’corpus from the NLTK package to get the‘stopw ords.words(‘english’)’method.we also use the‘word_tokenize’method to tokenize the text.)。這對(duì)于了解代碼實(shí)際的功用,并且在其上進(jìn)行修改迭代甚至是查找錯(cuò)誤,都非常有幫助。對(duì)于想學(xué)習(xí)編程的入門(mén)級(jí)研究人員,也會(huì)起到顯著的幫助作用。

        2.2 輔助閱讀

        做研究需要閱讀文獻(xiàn)。在信息資源管理學(xué)科,期刊數(shù)量眾多,而且外文期刊所占比例很大,每年都涌現(xiàn)出很多新文章需要閱讀。及時(shí)對(duì)文章重點(diǎn)進(jìn)行把握,有利于在科研進(jìn)度上保持領(lǐng)先。但是,眾多的文獻(xiàn)閱讀、消化、理解,尤其是外文文獻(xiàn)閱讀,也對(duì)本領(lǐng)域的研究者構(gòu)成了較大的挑戰(zhàn)。有了ChatGPT,研究者可以將外文論文中的內(nèi)容直接輸入進(jìn)來(lái),然后利用提問(wèn)形式,要求ChatGPT自動(dòng)提煉重點(diǎn)內(nèi)容。以描述ChatGPT同類模型InstrctGPT的論文Training language models to follow instructions with human feedback[1]中的3.5節(jié)“Models”為例,輸入其中主體部分到ChatGPT,給出的提示詞是“請(qǐng)用中文從下面資料中提煉出至少三個(gè)重點(diǎn)”,輸入內(nèi)容如圖8所示,圖9是ChatGPT給出的答案??梢?jiàn)ChatGPT可以正確理解用戶的要求,并且對(duì)內(nèi)容進(jìn)行了正確的自動(dòng)總結(jié)。

        圖8 ChatGPT自動(dòng)提煉重點(diǎn)輸入部分

        圖9 ChatGPT自動(dòng)提煉重點(diǎn)輸出部分

        在模型學(xué)習(xí)訓(xùn)練集材料中,ChatGPT已經(jīng)接觸過(guò)不少專有名詞,所以甚至可以不進(jìn)行任何輸入,直接讓ChatGPT幫助解釋一些專有名詞。例如,圖10里答案中出現(xiàn)“深度強(qiáng)化學(xué)習(xí)”,可以讓ChatGPT嘗試講解其含義,輸入的提示詞為“什么是‘深度強(qiáng)化學(xué)習(xí)’,在上述文稿里面的作用是什么?”,圖10是ChatGPT給出的回答。

        可以對(duì)圖10中出現(xiàn)的新專有名詞繼續(xù)提問(wèn)。例如,“賭徒困境”是什么?ChatGPT的回答如圖11所示。如果對(duì)ChatGPT總結(jié)的內(nèi)容不放心,還可以讓ChatGPT找到與專有名詞對(duì)應(yīng)的原文文本。圖12為ChatGPT自動(dòng)找出的“賭徒困境”原始文本。通過(guò)ChatGPT展示原文的文本,研究者可以加以印證,證明ChatGPT總結(jié)沒(méi)有偏離原文的敘述。

        圖10 解釋深度強(qiáng)化學(xué)習(xí)

        圖11 ChatGPT解釋賭徒困境

        圖12 查找專有名詞對(duì)應(yīng)的原始文本

        另外,用戶還可以對(duì)文本提出問(wèn)題,ChatGPT會(huì)盡全力嘗試解答。例如,示例論文這樣的講述模型訓(xùn)練方法的作品,研究者可能更感興趣一種模型獲取反饋與提升改進(jìn)的流程,并且用它和其他同類模型進(jìn)行比對(duì),所以可以問(wèn)出一個(gè)非常綜合性的問(wèn)題:“模型是如何獲得反饋和改進(jìn),達(dá)到訓(xùn)練目標(biāo)的?”圖13是ChatGPT的回答??梢钥吹剑珻hatGPT對(duì)文本語(yǔ)義理解非常準(zhǔn)確,而且還用中文進(jìn)行了流暢自然的翻譯。特別地,對(duì)于文中出現(xiàn)的專有名詞,如“SFT”,都用英文全稱和縮寫(xiě)加以注明。

        圖13 ChatGPT對(duì)閱讀材料的綜合性問(wèn)題解答

        因?yàn)镃hatGPT具有多輪對(duì)話的記憶功能,用戶甚至可以將多篇論文的主體部分分別輸入,然后加以比對(duì)。這樣一來(lái),讀論文的工作就從“讀一篇”變成“讀一片”,ChatGPT的匯總可以快速提示研究者某一領(lǐng)域多篇重要文獻(xiàn)的特點(diǎn)與異同,有助于研究者快速了解領(lǐng)域的發(fā)展與演化過(guò)程。在從前,一個(gè)研究團(tuán)隊(duì)用若干天才能做出的文獻(xiàn)梳理工作,ChatGPT可以在很短時(shí)間內(nèi)高效率完成。

        2.3 輔助寫(xiě)作

        寫(xiě)作是溝通科研工作成果的過(guò)程,必不可少。但以往在寫(xiě)作環(huán)節(jié),科研工作者往往需要花費(fèi)很大的心力。因?yàn)椴粌H要詳細(xì)描述和展示科研成果,也要充分考量行文的風(fēng)格、措辭、舉例等。特別是多人合作寫(xiě)文章,往往還要第一作者最終統(tǒng)合稿件的不同部分,重新用統(tǒng)一的風(fēng)格撰寫(xiě)全文。ChatGPT的基礎(chǔ)就是大語(yǔ)言模型,最善于學(xué)習(xí)語(yǔ)言風(fēng)格。研究者可以在草稿里擺出主要的事實(shí)而不需要考慮語(yǔ)序、語(yǔ)法等因素,由ChatGPT來(lái)幫助寫(xiě)作、潤(rùn)色。用戶可以將自己之前寫(xiě)作的文章輸入ChatGPT中,然后如圖14要求ChatGPT提取文章的風(fēng)格,之后對(duì)新的文本,可以調(diào)用存儲(chǔ)的文章風(fēng)格(本例中為“paper style”)進(jìn)行風(fēng)格轉(zhuǎn)化與改寫(xiě)。例如,圖15中演示的例子是本文第一作者對(duì)第二作者提供材料的風(fēng)格改寫(xiě),ChatGPT對(duì)文本的語(yǔ)義加以保留,但是在表現(xiàn)形式上進(jìn)行了調(diào)整變化。統(tǒng)一的風(fēng)格樣式可以提升讀者閱讀的流暢性。

        圖14 ChatGPT學(xué)習(xí)文本風(fēng)格并存儲(chǔ)

        圖15 ChatGPT以存儲(chǔ)的風(fēng)格改寫(xiě)文本示例

        在寫(xiě)作過(guò)程中,ChatGPT也能幫助作者擴(kuò)展思路,聯(lián)想到合適的例子。例如,當(dāng)寫(xiě)作過(guò)程中發(fā)現(xiàn)當(dāng)前使用的例子作為證據(jù)并不足夠充分和貼切,需要找到更好的例證,在過(guò)去,如果用戶需要找到相關(guān)信息,那就必須進(jìn)入搜索引擎輸入關(guān)鍵詞,然后在海量的結(jié)果中篩選適合的內(nèi)容;然而現(xiàn)在用戶只需告訴ChatGPT“補(bǔ)充例子,論證上面的論斷”,就可以得到相關(guān)的信息,如圖16所示。雖然圖16 ChatGPT提供的例子可能無(wú)法直接原文使用,但它至少對(duì)作者會(huì)有啟發(fā)。例如,人臉識(shí)別已成為“日用品”,用戶幾乎每天都要使用這種方式驗(yàn)證付款,但作者或許沒(méi)有第一時(shí)間想到將其作為“AI工程化”的例子。如果用戶認(rèn)為圖16提供的例子不夠好,可以接著要求ChatGPT提供其他例子,ChatGPT返回的結(jié)果如圖17所示。這樣一來(lái),原本在寫(xiě)作中常見(jiàn)而瑣碎的技術(shù)性問(wèn)題就被ChatGPT的人工智能功能解決,顯著提升寫(xiě)作效率。

        圖16 ChatGPT補(bǔ)充例子證明論斷

        圖17 要求ChatGPT繼續(xù)補(bǔ)充例證

        3 挑戰(zhàn)

        上文討論了ChatGPT給研究者帶來(lái)的機(jī)遇。通過(guò)輔助編程、輔助閱讀與輔助寫(xiě)作,為研究者賦能,大幅提升研究工作效率,縮短研究產(chǎn)生成果的時(shí)間周期。但是,ChatGPT的出現(xiàn)也給研究者帶來(lái)挑戰(zhàn)和困擾,如果使用不當(dāng),甚至?xí)o研究過(guò)程帶來(lái)災(zāi)難性的后果。下文從回答的真實(shí)性、數(shù)據(jù)污染,以及隱私和數(shù)據(jù)安全角度分別論述。

        3.1 回答的真實(shí)性

        ChatGPT的基礎(chǔ)是一個(gè)生成式語(yǔ)言模型,它根據(jù)概率分布關(guān)系生成最符合要求的語(yǔ)言,但無(wú)法保證生成內(nèi)容的真實(shí)性和準(zhǔn)確性。

        一些研究者在使用ChatGPT時(shí)沒(méi)有意識(shí)到這一點(diǎn),他們驚訝于ChatGPT回答問(wèn)題的精準(zhǔn)性,并直接采納其答案。對(duì)于前文列舉的編程功能,這個(gè)問(wèn)題并不嚴(yán)重,因?yàn)槌绦蚓幋a是否準(zhǔn)確有客觀的評(píng)價(jià)標(biāo)準(zhǔn);但對(duì)于閱讀和寫(xiě)作輔助功能,則可能會(huì)因缺乏足夠的檢驗(yàn)依據(jù)而導(dǎo)致研究者采納錯(cuò)誤的答案。以前文展示過(guò)的ChatGPT舉例功能來(lái)說(shuō),作者曾要求ChatGPT對(duì)“人工智能工程化”舉出例證,結(jié)果收到的是圖18這樣的回答,回答中的疏漏非常明顯:DALLE究竟是由Facebook還是OpenAI推出?ChatGPT給出的兩個(gè)例子自相矛盾。不難發(fā)現(xiàn),即便對(duì)答案的真實(shí)性缺乏把握,ChatGPT回答時(shí)語(yǔ)氣卻非常自信。如果研究者在使用ChatGPT生成答案時(shí)不進(jìn)行取舍,將其作為內(nèi)容的組成部分,發(fā)表論文或者出版書(shū)籍后,難免遇到尷尬情況。因此在選用ChatGPT的答案時(shí),研究者應(yīng)該保持審慎的態(tài)度。

        圖18 ChatGPT的錯(cuò)誤回答

        3.2 數(shù)據(jù)污染

        ChatGPT的廣泛使用使得很多未經(jīng)思考或驗(yàn)證的內(nèi)容大量產(chǎn)生。據(jù)Intelligent.com報(bào)道,被調(diào)查的大學(xué)生中,至少有三分之一采用ChatGPT來(lái)撰寫(xiě)作業(yè)的答案[29]。ChatGPT更是被廣泛應(yīng)用于問(wèn)答網(wǎng)站的答案生產(chǎn),且大量充斥于社交媒體。虛假信息除直接影響受眾之外,這些海量產(chǎn)生的低質(zhì)量信息也會(huì)造成互聯(lián)網(wǎng)數(shù)據(jù)的污染。這就意味著未來(lái)的人工智能模型,在從互聯(lián)網(wǎng)獲取大規(guī)模公開(kāi)語(yǔ)料時(shí),會(huì)吸納大量ChatGPT生成內(nèi)容。如果不能加以甄別,這些數(shù)據(jù)將深刻影響未來(lái)模型訓(xùn)練數(shù)據(jù)的質(zhì)量。人工智能需要從人類產(chǎn)生的文本學(xué)習(xí)語(yǔ)言的規(guī)律。如此多的人工生成數(shù)據(jù)涌入訓(xùn)練集,不僅不會(huì)對(duì)模型能力帶來(lái)提升,還可能混入更多噪聲,導(dǎo)致回答問(wèn)題的準(zhǔn)確度降低。這會(huì)反過(guò)來(lái)影響人類的信息獲取與知識(shí)傳承。OpenAI指出,ChatGPT的不正當(dāng)使用會(huì)對(duì)教育者、家長(zhǎng)、記者、虛假信息研究人員和其他群體產(chǎn)生影響。為此,OpenAI官方在2023年1月推出ChatGPT生成文本的檢測(cè)分類器[30]。使用的演示效果(采用官網(wǎng)自帶的人工輸入文本)如圖19所示。

        圖19 OpenAI官方推出的ChatGPT檢測(cè)分類器

        然而這種分類器還存在著非常多的問(wèn)題。OpenAI官方建議不要將其作為主要決策工具,而應(yīng)作為確定文本來(lái)源的輔助手段。對(duì)短文本(少于1,000個(gè)字符),OpenAI提供的ChatGPT分類器不可靠。即使是較長(zhǎng)文本,有時(shí)也會(huì)被分類器錯(cuò)誤標(biāo)記。甚至人工編寫(xiě)的文本也時(shí)常會(huì)被分類器錯(cuò)誤地標(biāo)記為由AI編寫(xiě),而且檢測(cè)器對(duì)于錯(cuò)誤的檢測(cè)結(jié)果非常自信。OpenAI建議僅將分類器用于英文文本,在其他語(yǔ)言上分類器表現(xiàn)要差得多。對(duì)于代碼,該分類器也不可靠。另外,它無(wú)法可靠地識(shí)別有規(guī)律的可預(yù)測(cè)的文本。官方給出的例子是“包含前1000個(gè)質(zhì)數(shù)列表是由AI還是人類編寫(xiě)的,因?yàn)檎_答案總是相同的”。AI編寫(xiě)的文本通過(guò)編輯可以規(guī)避分類器識(shí)別。OpenAI提供的分類器能夠應(yīng)對(duì)一定程度的改寫(xiě),但對(duì)于改寫(xiě)較多的情況則不能準(zhǔn)確識(shí)別。

        3.3 隱私與數(shù)據(jù)安全

        ChatGPT帶來(lái)的另外一個(gè)挑戰(zhàn),就是隱私與數(shù)據(jù)安全問(wèn)題。

        當(dāng)用戶第一次注冊(cè)并開(kāi)啟ChatGPT時(shí),會(huì)看到有關(guān)數(shù)據(jù)收集和隱私保護(hù)的提示:“對(duì)話可能會(huì)被人工智能培訓(xùn)師審查,以改善系統(tǒng)。請(qǐng)不要在對(duì)話中分享任何敏感信息?!痹谟脩糇?cè)前提示用戶不要輸入隱私信息。

        許多人將ChatGPT視為成熟的產(chǎn)品來(lái)使用,并認(rèn)為它保護(hù)用戶隱私是理所當(dāng)然的事情。然而事實(shí)并非如此。ChatGPT模型建立在GPT3.5版本之上,使用了人工參與的增強(qiáng)學(xué)習(xí)。每個(gè)“研究預(yù)覽版”的ChatGPT用戶都是OpenAI的免費(fèi)測(cè)試員。

        如果用戶輸入的內(nèi)容包含敏感信息,如銀行卡號(hào),則可能會(huì)對(duì)用戶的財(cái)務(wù)和金融安全造成影響。而如果輸入手機(jī)號(hào)、住址等信息,則可能會(huì)帶來(lái)人身安全的隱患。

        對(duì)研究者來(lái)說(shuō),在輸入原創(chuàng)性想法時(shí)也要三思而行。盡管ChatGPT并沒(méi)有主動(dòng)剽竊用戶想法的意圖,但用戶輸入的內(nèi)容都會(huì)對(duì)模型造成影響。如果恰巧有其他用戶對(duì)同一研究方向感興趣,前面研究者輸入的想法可能會(huì)作為答案的一部分啟發(fā)后者。另外,根據(jù)OpenAI官方提示,ChatGPT人工訓(xùn)練員(AI trainers)也有可能查看對(duì)話信息,以改進(jìn)模型。

        從學(xué)術(shù)整體進(jìn)步的角度來(lái)看,這種信息加速傳播共享有利于研究進(jìn)展速度。但對(duì)研究者個(gè)體來(lái)說(shuō),其利益可能會(huì)受到潛在的威脅。

        綜上所述,ChatGPT的挑戰(zhàn)主要分為回答真實(shí)性、數(shù)據(jù)污染與隱私和安全等方面。面對(duì)ChatGPT帶來(lái)的挑戰(zhàn),研究者可以通過(guò)以下對(duì)策盡量避免潛在的損失。

        第一,針對(duì)回答的真實(shí)性問(wèn)題,建議研究者時(shí)刻警醒,不要輕易相信ChatGPT提供的答案。即便對(duì)看似合理的答案內(nèi)容,在正式采納和使用前,也需要找到源頭信息進(jìn)行驗(yàn)證。

        第二,針對(duì)數(shù)據(jù)污染問(wèn)題,建議研究者采用OpenAI官方提供的ChatGPT生成文本檢測(cè)工具對(duì)重要來(lái)源數(shù)據(jù)進(jìn)行抽樣檢測(cè)。在構(gòu)建大規(guī)模研究數(shù)據(jù)集時(shí),盡量避免采用開(kāi)放式問(wèn)答社區(qū)2022年12月之后的回答,以避免噪聲混入。

        第三,對(duì)于隱私和安全問(wèn)題,建議研究者與ChatGPT對(duì)話過(guò)程中,避免暴露個(gè)人隱私與所在機(jī)構(gòu)的敏感信息。對(duì)于研究意圖和想法,如果無(wú)法繞開(kāi),盡量分散在不同對(duì)話中進(jìn)行任務(wù)處理,避免被人工訓(xùn)練員在同一對(duì)話中大量獲取相關(guān)信息。

        4 結(jié)語(yǔ)

        OpenAI的對(duì)話機(jī)器人模型ChatGPT對(duì)科研工作者的外部環(huán)境造成了顯著變化,為提高編程、閱讀和寫(xiě)作效率帶來(lái)了機(jī)遇,但也帶來(lái)了回答真實(shí)性、數(shù)據(jù)污染和隱私安全等挑戰(zhàn)。為了敏感地抓住ChatGPT的特點(diǎn),創(chuàng)造競(jìng)爭(zhēng)優(yōu)勢(shì),科研工作者需要認(rèn)真思考并采取行動(dòng)。通過(guò)本文的討論,讀者可以看到ChatGPT對(duì)科研工作的賦能意義十分明顯,合理利用能夠大幅提升工作效率。而針對(duì)ChatGPT給科研工作者帶來(lái)的挑戰(zhàn),本文提出了對(duì)策,如在使用ChatGPT生成的答案時(shí)需要進(jìn)行謹(jǐn)慎評(píng)估,同時(shí)需要利用技術(shù)和方法來(lái)應(yīng)對(duì)數(shù)據(jù)污染和隱私安全問(wèn)題??傊?,科研工作者也需要不斷學(xué)習(xí)和更新自己的技能,以更好地適應(yīng)這個(gè)新的科研環(huán)境。

        ChatGPT出現(xiàn)時(shí)間不久且快速迭代,也有許多競(jìng)品宣布會(huì)相繼在近期推出。本文受到當(dāng)前寫(xiě)作時(shí)間點(diǎn)的客觀局限,無(wú)法對(duì)近期和遠(yuǎn)期即將出現(xiàn)的產(chǎn)品或服務(wù)趨勢(shì)做出準(zhǔn)確預(yù)測(cè)。本文寫(xiě)作時(shí),尚未發(fā)現(xiàn)與ChatGPT實(shí)力相當(dāng)?shù)恼嬲?jìng)品,因此研究對(duì)象比較單一,只涉及ChatGPT自身。團(tuán)隊(duì)后續(xù)會(huì)在新的同類產(chǎn)品出現(xiàn)后加以深入對(duì)比研究,為科研工作者提供更加符合本土化需求的分析結(jié)果與建議。

        猜你喜歡
        分類器研究者文本
        高等教育中的學(xué)生成為研究者及其啟示
        在808DA上文本顯示的改善
        研究者稱,經(jīng)CRISPR技術(shù)編輯過(guò)的雙胞胎已出生??茖W(xué)將如何回應(yīng)?
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        研究者調(diào)查數(shù)據(jù)統(tǒng)計(jì)
        中華手工(2018年6期)2018-07-17 10:37:42
        BP-GA光照分類器在車(chē)道線識(shí)別中的應(yīng)用
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        醫(yī)生注定是研究者
        亚洲精品一区二区三区国产| 午夜天堂av天堂久久久| 日韩精品真人荷官无码| 国产青榴视频在线观看| 亚洲综合色成在线播放| 91精品国产闺蜜国产在线| 永久免费在线观看蜜桃视频 | 欧美gv在线观看| 国产精品嫩草影院AV| 免费高清日本中文| 日韩av一区二区在线观看 | 91九色免费视频网站| 国产欧美精品一区二区三区四区| 男女做爰猛烈啪啪吃奶动| 亚洲 欧美 唯美 国产 伦 综合| 亚洲亚洲亚洲亚洲亚洲天堂| 一区二区二区三区亚洲| 国产乱人激情h在线观看| 国内精品大秀视频日韩精品| 日本看片一区二区三区| 懂色av一区二区三区尤物| 少妇性荡欲视频| 日韩爱爱视频| av在线一区二区三区不卡| 亚洲视频在线免费不卡| 精品www日韩熟女人妻| 无码熟熟妇丰满人妻啪啪| 中文字幕在线观看国产双飞高清| 国产精品日本中文在线| 国色天香社区视频在线| 亚洲人成人网站在线观看| 人伦片无码中文字幕| 美女扒开内裤露黑毛无遮挡| 女同在线网站免费观看| 国产欧美性成人精品午夜| 精品国产制服丝袜高跟| 在线观看视频日本一区二区三区 | 亚洲AV成人无码久久精品老人| 被驯服人妻中文字幕日本| 国产一区二区视频免费在| 亚洲aⅴ在线无码播放毛片一线天|