亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        訓練??智能語?模型的數(shù)據(jù)或在???六年耗盡?

        2022-04-20 16:04:11
        海外星云 2022年24期
        關(guān)鍵詞:低質(zhì)量高質(zhì)量人工智能

        大型語言模型是目前人工智能研究中最熱門的領(lǐng)域之一,各公司競相發(fā)布GPT-3一類的模型,他們可以寫出令人印象深刻的連貫文章,甚至是計算機代碼。

        但根據(jù)一個人工智能預測團隊的說法,一個嚴峻的問題即將出現(xiàn):我們未來可能沒有足夠的數(shù)據(jù)來訓練他們。

        大型語言模型是使用維基百科、新聞文章、科學論文和書籍等文本內(nèi)容進行訓練的。

        近年來,相關(guān)研究的趨勢是利用越來越多的數(shù)據(jù)來訓練這些模型,以期望它們更準確、更通用。

        問題是,最適合用于訓練語言模型的數(shù)據(jù)類型可能在不久的將來耗盡。人工智能研究和預測組織Epoch在一篇未經(jīng)同行評審的論文中指出,數(shù)據(jù)耗盡最早可能出現(xiàn)于2026年。

        這個問題源于這樣一個事實,即隨著研究人員建立更強大、能力更多樣的模型,他們必須找到更多的文本來訓練他們。

        “大型語言模型研究人員越來越擔心他們會耗盡這類數(shù)據(jù)”人工智能公司HuggingFace的研究員泰文·斯考表示。他沒有參與Epoch的工作。

        另一個可能導致問題的事實是,語言人工智能研究人員將他們用于訓練模型的數(shù)據(jù)分為兩類:高質(zhì)量和低質(zhì)量。

        但論文的第一作者,Epoch研究員巴勃羅·維拉洛博斯指出,這兩種類型之間的界限是十分模糊的。

        高質(zhì)量的文本內(nèi)容通常是由專業(yè)作家撰寫的,因此被認為寫得更好。而被歸為低質(zhì)量的數(shù)據(jù)包括社交媒體上的帖子或4chan等網(wǎng)站上的評論,這些低質(zhì)量文本的數(shù)量遠遠超過了那些被認為是高質(zhì)量的數(shù)據(jù)。

        研究人員通常只使用高質(zhì)量的數(shù)據(jù)來訓練模型,因為這是他們希望模型學習和效仿的語言類型。

        這種方法已經(jīng)在GPT-3之類的大型語言模型上實現(xiàn)了一些令人印象深刻的成果。

        據(jù)南加州大學專門研究數(shù)據(jù)集質(zhì)量的教授斯瓦巴·斯瓦揚迪普塔表示,克服這些數(shù)據(jù)限制的一種方法是重新評估何為“高質(zhì)量”文本,何為“低質(zhì)量”文本。

        斯瓦揚迪普塔認為,如果數(shù)據(jù)短缺迫使人工智能研究人員將更多樣化的數(shù)據(jù)集納入到訓練過程中,這對語言模型而言是一個“積極因素”。

        研究人員還可以努力找到延長語言模型訓練數(shù)據(jù)的使用壽命的方法。目前,由于性能和成本的限制,這些模型只在相同的數(shù)據(jù)上訓練一次。

        但斯瓦揚迪普塔表示,使用相同的數(shù)據(jù)多次訓練一個模型也可能是可行的。

        一些研究人員認為,對于語言模型來說,更大可能并不意味著更好。斯坦福大學的計算機科學教授珀西·梁說,有證據(jù)表明,提高模型的效率可以提高他們的能力,而不僅僅是增加他們的規(guī)模。

        他解釋說:“我們已經(jīng)看到,在高質(zhì)量數(shù)據(jù)上訓練的小模型,其性能足以超過在低質(zhì)量數(shù)據(jù)上訓練的大模型?!?/p>

        猜你喜歡
        低質(zhì)量高質(zhì)量人工智能
        雷人畫語
        美文(2023年5期)2023-03-26 03:15:00
        堅持以高質(zhì)量發(fā)展統(tǒng)攬全局
        當代陜西(2022年5期)2022-04-19 12:10:12
        高質(zhì)量項目 高質(zhì)量發(fā)展
        當代陜西(2021年1期)2021-02-01 07:18:02
        牢牢把握高質(zhì)量發(fā)展這個根本要求
        當代陜西(2020年20期)2020-11-27 01:43:10
        “三部曲”促數(shù)學復習課高質(zhì)量互動
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        低質(zhì)量的婚姻不如高質(zhì)量的單身,是真的嗎?(一)
        婦女生活(2017年5期)2017-05-16 21:04:56
        破解學前教育低質(zhì)量現(xiàn)象
        国产精品三级在线专区1| 中文字幕日本人妻久久久免费| 国产无遮挡又黄又爽高潮| 免费国产裸体美女视频全黄| 小12箩利洗澡无码视频网站| 国产一区二区黑丝美女| 美女被男人插得高潮的网站| 日韩精品内射视频免费观看| 亚洲av无码专区亚洲av桃| 成人国产一区二区三区精品不卡| 谷原希美中文字幕在线| 无遮挡18禁啪啪羞羞漫画| 激情亚洲一区国产精品| 自慰高潮网站在线观看| 亚洲熟妇一区二区蜜桃在线观看 | 欧美粗大无套gay| 久久中文字幕亚洲精品最新| 日本女优五十路中文字幕| 在线中文字幕乱码英文字幕正常| 国产人妻精品一区二区三区不卡| AV无码免费不卡在线观看| 青青草在线免费观看视频| 丰满人妻一区二区三区免费视频| 国产一区二区三区av在线无码观看| 中文字幕高清无码不卡在线| 草逼视频免费观看网站| 久久久精品一区aaa片| 午夜成人理论无码电影在线播放| 五月停停开心中文字幕 | 天天影视色香欲综合久久 | 在线一区二区三区视频观看| 成人大片免费观看视频| 亚洲熟女乱色综合亚洲av| 亚洲AV永久天堂在线观看 | 午夜福利院电影| 久久无码高潮喷水免费看| 免费av一区男人的天堂| 成人一区二区免费中文字幕视频| 久久精品夜夜夜夜夜久久| 丰满少妇高潮在线观看| 少妇被黑人整得嗷嗷叫视频|