亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        訓練??智能語?模型的數(shù)據(jù)或在???六年耗盡?

        2022-04-20 16:04:11
        海外星云 2022年24期
        關(guān)鍵詞:低質(zhì)量高質(zhì)量人工智能

        大型語言模型是目前人工智能研究中最熱門的領(lǐng)域之一,各公司競相發(fā)布GPT-3一類的模型,他們可以寫出令人印象深刻的連貫文章,甚至是計算機代碼。

        但根據(jù)一個人工智能預測團隊的說法,一個嚴峻的問題即將出現(xiàn):我們未來可能沒有足夠的數(shù)據(jù)來訓練他們。

        大型語言模型是使用維基百科、新聞文章、科學論文和書籍等文本內(nèi)容進行訓練的。

        近年來,相關(guān)研究的趨勢是利用越來越多的數(shù)據(jù)來訓練這些模型,以期望它們更準確、更通用。

        問題是,最適合用于訓練語言模型的數(shù)據(jù)類型可能在不久的將來耗盡。人工智能研究和預測組織Epoch在一篇未經(jīng)同行評審的論文中指出,數(shù)據(jù)耗盡最早可能出現(xiàn)于2026年。

        這個問題源于這樣一個事實,即隨著研究人員建立更強大、能力更多樣的模型,他們必須找到更多的文本來訓練他們。

        “大型語言模型研究人員越來越擔心他們會耗盡這類數(shù)據(jù)”人工智能公司HuggingFace的研究員泰文·斯考表示。他沒有參與Epoch的工作。

        另一個可能導致問題的事實是,語言人工智能研究人員將他們用于訓練模型的數(shù)據(jù)分為兩類:高質(zhì)量和低質(zhì)量。

        但論文的第一作者,Epoch研究員巴勃羅·維拉洛博斯指出,這兩種類型之間的界限是十分模糊的。

        高質(zhì)量的文本內(nèi)容通常是由專業(yè)作家撰寫的,因此被認為寫得更好。而被歸為低質(zhì)量的數(shù)據(jù)包括社交媒體上的帖子或4chan等網(wǎng)站上的評論,這些低質(zhì)量文本的數(shù)量遠遠超過了那些被認為是高質(zhì)量的數(shù)據(jù)。

        研究人員通常只使用高質(zhì)量的數(shù)據(jù)來訓練模型,因為這是他們希望模型學習和效仿的語言類型。

        這種方法已經(jīng)在GPT-3之類的大型語言模型上實現(xiàn)了一些令人印象深刻的成果。

        據(jù)南加州大學專門研究數(shù)據(jù)集質(zhì)量的教授斯瓦巴·斯瓦揚迪普塔表示,克服這些數(shù)據(jù)限制的一種方法是重新評估何為“高質(zhì)量”文本,何為“低質(zhì)量”文本。

        斯瓦揚迪普塔認為,如果數(shù)據(jù)短缺迫使人工智能研究人員將更多樣化的數(shù)據(jù)集納入到訓練過程中,這對語言模型而言是一個“積極因素”。

        研究人員還可以努力找到延長語言模型訓練數(shù)據(jù)的使用壽命的方法。目前,由于性能和成本的限制,這些模型只在相同的數(shù)據(jù)上訓練一次。

        但斯瓦揚迪普塔表示,使用相同的數(shù)據(jù)多次訓練一個模型也可能是可行的。

        一些研究人員認為,對于語言模型來說,更大可能并不意味著更好。斯坦福大學的計算機科學教授珀西·梁說,有證據(jù)表明,提高模型的效率可以提高他們的能力,而不僅僅是增加他們的規(guī)模。

        他解釋說:“我們已經(jīng)看到,在高質(zhì)量數(shù)據(jù)上訓練的小模型,其性能足以超過在低質(zhì)量數(shù)據(jù)上訓練的大模型?!?/p>

        猜你喜歡
        低質(zhì)量高質(zhì)量人工智能
        雷人畫語
        美文(2023年5期)2023-03-26 03:15:00
        堅持以高質(zhì)量發(fā)展統(tǒng)攬全局
        當代陜西(2022年5期)2022-04-19 12:10:12
        高質(zhì)量項目 高質(zhì)量發(fā)展
        當代陜西(2021年1期)2021-02-01 07:18:02
        牢牢把握高質(zhì)量發(fā)展這個根本要求
        當代陜西(2020年20期)2020-11-27 01:43:10
        “三部曲”促數(shù)學復習課高質(zhì)量互動
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        低質(zhì)量的婚姻不如高質(zhì)量的單身,是真的嗎?(一)
        婦女生活(2017年5期)2017-05-16 21:04:56
        破解學前教育低質(zhì)量現(xiàn)象
        国产国拍亚洲精品午夜不卡17| 亚洲欧美日韩另类精品一区| 六月婷婷久香在线视频| 免费超爽大片黄| 人妻一区二区三区免费看| 中文字幕一区在线直播| 女局长白白嫩嫩大屁股| 国产精品视频一区国模私拍| 亚洲综合国产成人丁香五月小说| 成人爽a毛片在线播放| 免费无码精品黄av电影| 国精产品一品二品国在线| 乱人伦人妻中文字幕不卡| 宅男视频一区二区三区在线观看| 国内精品视频一区二区三区八戒| 亚洲依依成人亚洲社区| 国产中文久久精品| 国产精品熟女少妇不卡| 国产特级毛片aaaaaa视频| 亚洲国产av一区二区三区四区| 91久久精品一二三区蜜桃| 两人前一后地插着她丰满| 亚洲精品午夜无码专区| 国产精品视频久久久久| 18禁成人免费av大片一区| 久久久久99精品成人片欧美| 18成人片黄网站www| 亚洲a人片在线观看网址| 久久伊人精品色婷婷国产| 欧美video性欧美熟妇| 99热成人精品免费久久| 加勒比久草免费在线观看| 狠狠色噜噜狠狠狠8888米奇| 18禁超污无遮挡无码免费游戏| 8090成人午夜精品无码| 丝袜美腿人妻第一版主| 国产男女猛烈无遮挡免费网站| 国产av成人精品播放| 视频一区二区三区国产| 国产精品videossex国产高清| а中文在线天堂|