亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        訓練??智能語?模型的數(shù)據(jù)或在???六年耗盡?

        2022-04-20 16:04:11
        海外星云 2022年24期
        關(guān)鍵詞:低質(zhì)量高質(zhì)量人工智能

        大型語言模型是目前人工智能研究中最熱門的領(lǐng)域之一,各公司競相發(fā)布GPT-3一類的模型,他們可以寫出令人印象深刻的連貫文章,甚至是計算機代碼。

        但根據(jù)一個人工智能預測團隊的說法,一個嚴峻的問題即將出現(xiàn):我們未來可能沒有足夠的數(shù)據(jù)來訓練他們。

        大型語言模型是使用維基百科、新聞文章、科學論文和書籍等文本內(nèi)容進行訓練的。

        近年來,相關(guān)研究的趨勢是利用越來越多的數(shù)據(jù)來訓練這些模型,以期望它們更準確、更通用。

        問題是,最適合用于訓練語言模型的數(shù)據(jù)類型可能在不久的將來耗盡。人工智能研究和預測組織Epoch在一篇未經(jīng)同行評審的論文中指出,數(shù)據(jù)耗盡最早可能出現(xiàn)于2026年。

        這個問題源于這樣一個事實,即隨著研究人員建立更強大、能力更多樣的模型,他們必須找到更多的文本來訓練他們。

        “大型語言模型研究人員越來越擔心他們會耗盡這類數(shù)據(jù)”人工智能公司HuggingFace的研究員泰文·斯考表示。他沒有參與Epoch的工作。

        另一個可能導致問題的事實是,語言人工智能研究人員將他們用于訓練模型的數(shù)據(jù)分為兩類:高質(zhì)量和低質(zhì)量。

        但論文的第一作者,Epoch研究員巴勃羅·維拉洛博斯指出,這兩種類型之間的界限是十分模糊的。

        高質(zhì)量的文本內(nèi)容通常是由專業(yè)作家撰寫的,因此被認為寫得更好。而被歸為低質(zhì)量的數(shù)據(jù)包括社交媒體上的帖子或4chan等網(wǎng)站上的評論,這些低質(zhì)量文本的數(shù)量遠遠超過了那些被認為是高質(zhì)量的數(shù)據(jù)。

        研究人員通常只使用高質(zhì)量的數(shù)據(jù)來訓練模型,因為這是他們希望模型學習和效仿的語言類型。

        這種方法已經(jīng)在GPT-3之類的大型語言模型上實現(xiàn)了一些令人印象深刻的成果。

        據(jù)南加州大學專門研究數(shù)據(jù)集質(zhì)量的教授斯瓦巴·斯瓦揚迪普塔表示,克服這些數(shù)據(jù)限制的一種方法是重新評估何為“高質(zhì)量”文本,何為“低質(zhì)量”文本。

        斯瓦揚迪普塔認為,如果數(shù)據(jù)短缺迫使人工智能研究人員將更多樣化的數(shù)據(jù)集納入到訓練過程中,這對語言模型而言是一個“積極因素”。

        研究人員還可以努力找到延長語言模型訓練數(shù)據(jù)的使用壽命的方法。目前,由于性能和成本的限制,這些模型只在相同的數(shù)據(jù)上訓練一次。

        但斯瓦揚迪普塔表示,使用相同的數(shù)據(jù)多次訓練一個模型也可能是可行的。

        一些研究人員認為,對于語言模型來說,更大可能并不意味著更好。斯坦福大學的計算機科學教授珀西·梁說,有證據(jù)表明,提高模型的效率可以提高他們的能力,而不僅僅是增加他們的規(guī)模。

        他解釋說:“我們已經(jīng)看到,在高質(zhì)量數(shù)據(jù)上訓練的小模型,其性能足以超過在低質(zhì)量數(shù)據(jù)上訓練的大模型?!?/p>

        猜你喜歡
        低質(zhì)量高質(zhì)量人工智能
        雷人畫語
        美文(2023年5期)2023-03-26 03:15:00
        堅持以高質(zhì)量發(fā)展統(tǒng)攬全局
        當代陜西(2022年5期)2022-04-19 12:10:12
        高質(zhì)量項目 高質(zhì)量發(fā)展
        當代陜西(2021年1期)2021-02-01 07:18:02
        牢牢把握高質(zhì)量發(fā)展這個根本要求
        當代陜西(2020年20期)2020-11-27 01:43:10
        “三部曲”促數(shù)學復習課高質(zhì)量互動
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        低質(zhì)量的婚姻不如高質(zhì)量的單身,是真的嗎?(一)
        婦女生活(2017年5期)2017-05-16 21:04:56
        破解學前教育低質(zhì)量現(xiàn)象
        国产亚洲成性色av人片在线观| 国产人妻久久精品二区三区老狼| 一二三四在线观看韩国视频| 1234.com麻豆性爰爱影| 精品久久日产国产一区| 亚洲av手机在线一区| 日本在线观看不卡一区二区| 亚洲成av人片一区二区密柚| 日韩精品视频一区二区三区| 99久久综合精品五月天| 亚洲国产区男人本色| 国产精品美女久久久久久大全| 久久久久亚洲AV无码去区首| 69久久精品亚洲一区二区| 午夜免费观看国产视频| 国产精品国产亚洲精品看不卡| 国产欧美日韩综合精品一区二区| 日本又黄又爽gif动态图| 国产91精品成人不卡在线观看| 国产美女裸身网站免费观看视频| 国产精品不卡在线视频| 中文文精品字幕一区二区| 手机看片久久第一人妻| 国产乱码卡二卡三卡老狼| 熟女人妇交换俱乐部| 国产99r视频精品免费观看| 福利网在线| 最新日本女优中文字幕视频| 成年人观看视频在线播放| 午夜精品久久久久久久99热| 日韩欧美国产亚洲中文| 久久天天躁狠狠躁夜夜爽| 国产午夜精品美女裸身视频69| 一区二区三区免费自拍偷拍视频| 欧美又大又硬又粗bbbbb| 国产av无码专区亚洲av极速版| 国产欧美日韩综合在线一区二区| 日韩精品一二区在线视频| 亚洲色图在线免费观看视频| 另类老妇奶性生bbwbbw| 久久国产精品二区99|