亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        AI被數(shù)據(jù)扯了后腿

        2020-08-09 08:40:31
        第一財經(jīng) 2020年8期
        關(guān)鍵詞:亞馬遜機器系統(tǒng)

        亞馬遜的“Go”商店令人眼前一亮。這些不設(shè)收銀員的店鋪2018年首次在西雅圖開業(yè),顧客只要亮出手機應(yīng)用,就可以拿了商品直接走人。該系統(tǒng)使用了大量傳感器,但其魔法主要是由連接到AI系統(tǒng)的攝像頭完成的。AI系統(tǒng)會追蹤商品從架子上被取走的過程。一旦顧客拿著商品離店,賬單就結(jié)算完畢,會自動向顧客收費。

        在一個擁擠的商店里做到這一點并不容易。系統(tǒng)要能夠應(yīng)付人員密集的環(huán)境:攝像頭可能被其他顧客阻擋而看不到某些人的動作。它必須能識別單個顧客,還有同行的朋友或是全家出動。如果一個孩子把一件商品放進自家購物籃,系統(tǒng)必須意識到應(yīng)該向Ta的父母收費。而且它必須實時又高度準確地完成這一切。

        為指導(dǎo)機器做這些,需要向它們展示大量“訓(xùn)練數(shù)據(jù)”:顧客瀏覽貨架上的商品、拿取商品、把商品放回貨架等各種行為的視頻。對于像圖像識別這樣的標準化任務(wù),AI開發(fā)人員可以使用公用訓(xùn)練數(shù)據(jù)集,每個都包含成千上萬張圖片。但記錄人們逛商店的公用訓(xùn)練集尚不存在。

        有些數(shù)據(jù)可由亞馬遜自己的員工生成,公司此前讓他們進入測試版店鋪中。但這么做有其局限。人們會用各種各樣的方式從架子上取走一件商品并決定買下它、立即把它放回架子,或稍后再放回去。要在現(xiàn)實世界中真正奏效,系統(tǒng)必須涵蓋盡可能多的可能性。

        從理論上講,世界充斥著數(shù)據(jù),這是現(xiàn)代AI的命脈。市場研究公司國際數(shù)據(jù)公司(IDC)估計,2018年全球生成了33ZB的數(shù)據(jù),足以填滿7萬億張DVD。但是,專注于AI領(lǐng)域的咨詢公司Cognilytica的凱瑟琳·沃爾克(Kathleen Walch)表示,盡管如此,數(shù)據(jù)問題仍是所有AI項目中最常見的癥結(jié)之一。和亞馬遜Go商店的例子一樣,某個項目需要的數(shù)據(jù)可能根本就不存在,或者數(shù)據(jù)可能被鎖在競爭對手的保險庫中。即便相關(guān)數(shù)據(jù)可以被挖出,可能也不適合輸送給計算機。

        Cognilytica表示,一個典型AI項目約80%的時間都花在了各種數(shù)據(jù)整理上。訓(xùn)練機器學(xué)習(xí)系統(tǒng)需要大量仔細標注的樣本,而這些標注通常需由人類添加。大型技術(shù)公司通常在內(nèi)部開展這項工作。那些缺少相關(guān)資源或技術(shù)知識的公司可以借力一個不斷發(fā)展的外包產(chǎn)業(yè)來完成這個部分。例如,中國公司莫比嗨客雇用了30多萬人來標注源源不斷的人臉照片、街道場景或醫(yī)療掃描影像以便后續(xù)的機器處理。亞馬遜的另一個部門土耳其機器人(Mechanical Turk)為企業(yè)與一個臨時工大軍牽線搭橋,向這些工人支付計件工資來執(zhí)行重復(fù)性任務(wù)。

        Cognilytica估計,第三方“數(shù)據(jù)準備”市場在2019年價值超過15億美元,到2024年可能增至35億美元。數(shù)據(jù)標注業(yè)務(wù)也差不多:2019年企業(yè)在這方面至少支出了17億美元,到2024年可能達到41億美元。Cognilytica的羅恩·施梅爾策(RonSchmelzer)說,掌握某個專業(yè)課題并非必要,例如在醫(yī)學(xué)診斷中,業(yè)余數(shù)據(jù)標注員經(jīng)訓(xùn)練后在識別骨折和腫瘤等方面幾乎可以和醫(yī)生媲美。但掌握一定的AI研究人員口中的“領(lǐng)域知識”至關(guān)重要。

        數(shù)據(jù)本身可能包含陷阱。機器學(xué)習(xí)系統(tǒng)將輸入與輸出相關(guān)聯(lián),但它們只是盲目地執(zhí)行,并不理解更廣泛的語境。1968年,編程大師高德納(Donald Knuth)警告說,計算機會“完全按你告訴它們的去做,不多也不少”。機器學(xué)習(xí)中充滿了這句話的例證——機器精確遵循規(guī)則的字眼,對其精神卻一無所知。

        人工智能部分事件

        數(shù)據(jù)來源:《經(jīng)濟學(xué)人》

        2018年,紐約西奈山醫(yī)療系統(tǒng)(Mount Sinai)的研究人員發(fā)現(xiàn),一個經(jīng)訓(xùn)練通過X光胸片識別肺炎的AI系統(tǒng),在它受訓(xùn)的醫(yī)院以外的其他醫(yī)院使用時能力明顯降低。研究人員發(fā)現(xiàn),機器能夠識別出胸片來自哪家醫(yī)院,方法之一是分析片子角上的小塊金屬標記—各家醫(yī)院的標記各不相同。

        由于訓(xùn)練集里的一家醫(yī)院的肺炎基準發(fā)生率遠高于其他醫(yī)院,胸片來自哪家醫(yī)院這個信息本身就足以大幅提高系統(tǒng)的準確性。研究人員把這種巧妙的伎倆稱為“作弊”,因為在向系統(tǒng)出示陌生醫(yī)院的數(shù)據(jù)時,它就失靈了。

        偏見導(dǎo)致了另一種問題。去年,美國國家標準技術(shù)研究院(National Institute of Standards andTechnology)測試了近200種人臉識別算法,發(fā)現(xiàn)許多算法在識別黑人面部時準確性明顯低于識別白人面部。這個問題可能反映出白人面部在機器的訓(xùn)練數(shù)據(jù)中占了多數(shù)。IBM去年發(fā)表的一項研究發(fā)現(xiàn),3種被廣泛使用的訓(xùn)練集中,超過80%的人臉都是較淺的膚色。

        至少從理論上講,這類缺陷很容易糾正(IBM提供了一個更具代表性的數(shù)據(jù)集供所有人使用)。其他的偏見來源可能更難消除。2017年,亞馬遜叫停了一個通過簡歷尋找合適人選的招聘項目,因為他們發(fā)現(xiàn)該系統(tǒng)對男性申請人有利。事后經(jīng)檢驗他們發(fā)現(xiàn)了一個循環(huán)的、自我增強的問題:公司用以前成功被錄取的申請人的簡歷訓(xùn)練該系統(tǒng),但技術(shù)人員的隊伍里大部分是男性,因此根據(jù)歷史數(shù)據(jù)來訓(xùn)練的系統(tǒng)會把男性這個特征作為適合度的強預(yù)測指標。

        普華永道機器學(xué)習(xí)英國團隊的負責(zé)人法布里斯·西亞斯(Fabrice Ciais)說,人類可以嘗試禁止機器做這類推導(dǎo)(亞馬遜正是這么做的)。在許多情況下他們必須這么做:在大多數(shù)富裕國家,雇主不能基于性別、年齡或種族等因素雇用人員。但算法可以比它的人類主人更聰明,西亞斯說,它們能用替代變量重構(gòu)出被禁用的信息。從業(yè)余愛好到工作經(jīng)歷,再到電話號碼中的區(qū)號,各種信息都可能暗示申請者很可能是女性、年輕人或少數(shù)族裔。

        在機器學(xué)習(xí)項目的各項任務(wù)上的平均耗時

        數(shù)據(jù)來源:《經(jīng)濟學(xué)人》

        如果現(xiàn)實世界中的數(shù)據(jù)難題太過艱巨,那么一種選擇是自己創(chuàng)造一些數(shù)據(jù)。這正是亞馬遜改進Go商店時所用的方法。該公司使用圖形軟件來生成虛擬購物者。這些“人造人”被拿來訓(xùn)練機器處理許多困難或異常的情景,它們在真實訓(xùn)練數(shù)據(jù)中未曾出現(xiàn),在實際環(huán)境中部署系統(tǒng)時卻可能發(fā)生。

        此舉并非亞馬遜獨樹一幟。無人車公司用高保真模擬現(xiàn)實來做大量訓(xùn)練,在這種模擬中如果出錯不會造成真正的破壞。芯片制造商英偉達2018年發(fā)表的一篇論文描述了一種為無人車快速創(chuàng)建綜合訓(xùn)練數(shù)據(jù)的方法,并得出結(jié)論稱由此生成的算法效果比僅用真實數(shù)據(jù)訓(xùn)練的算法更好。

        隱私關(guān)切是“合成數(shù)據(jù)”的另一個吸引力所在。希望在醫(yī)學(xué)或金融中使用AI的公司必須遵守美國的《健康保險可攜性和責(zé)任法案》(HIPAA)或歐盟的《通用數(shù)據(jù)保護條例》(GDPR)等法律。要對真實數(shù)據(jù)做恰當(dāng)?shù)哪涿幚砜赡軙茈y,而用虛擬人訓(xùn)練的系統(tǒng)根本不用擔(dān)心這個。

        西亞斯的同事尤安·卡梅倫(Euan Cameron)說,訣竅在于確保模擬足夠接近現(xiàn)實,使經(jīng)驗得以推廣。對于像欺詐識別或信用評分這樣能清晰界定的問題,這很簡單。還可以將統(tǒng)計噪聲添加到真實數(shù)據(jù)中來創(chuàng)建合成數(shù)據(jù)。這樣,盡管單個交易是虛擬的,但可以保證它們整體上具有與源數(shù)據(jù)相同的統(tǒng)計特征。但一個問題越復(fù)雜,就越難確保從虛擬數(shù)據(jù)中汲取的經(jīng)驗?zāi)鼙豁槙车赜糜诂F(xiàn)實世界。

        希望在于所有這些與數(shù)據(jù)相關(guān)的折騰都是一次性的,一旦訓(xùn)練好,機器學(xué)習(xí)模型將用數(shù)百萬次自動決策來回報這番努力。亞馬遜已經(jīng)開設(shè)了26家Go商店,并提出將相關(guān)技術(shù)授權(quán)給其他零售商。但即使到了這一步也仍需要謹慎。研究公司高德納(Gartner)的斯韋特蘭娜·??藸柪眨⊿vetlana Sicular)說,許多AI模型都受到“漂移”(drift)的影響,即隨著時間流逝,世界運轉(zhuǎn)方式的變化意味著它們的決策變得不那么準確。顧客的行為在變化,語言在演變,監(jiān)管機構(gòu)也會改變公司能做什么的規(guī)定。

        有時漂移會在一夜之間發(fā)生?!百徺I單程機票在自動檢測模型中曾是一個很好的預(yù)測欺詐的指標?!毕?藸柪照f,“但新冠肺炎導(dǎo)致封城后,突然有很多人都在買單程票,他們都是清白的。”如今戴口罩已成為常態(tài),一些習(xí)慣了識別裸露面部的人臉識別系統(tǒng)碰到了麻煩。自動化物流系統(tǒng)現(xiàn)在需要人員的幫助才能應(yīng)對卷筒紙、面粉及其他生活必需品的需求激增。世界的可變性意味著機器需要更多訓(xùn)練,也就是要為它們提供更多數(shù)據(jù)—這是一個無休止的再培訓(xùn)循環(huán)??穫惥嬲f:“人工智能不是個一勞永逸的系統(tǒng)?!?/p>

        猜你喜歡
        亞馬遜機器系統(tǒng)
        Smartflower POP 一體式光伏系統(tǒng)
        機器狗
        機器狗
        WJ-700無人機系統(tǒng)
        ZC系列無人機遙感系統(tǒng)
        北京測繪(2020年12期)2020-12-29 01:33:58
        亞馬遜雨林在燃燒
        亞馬遜賣的最好的100款玩具
        玩具世界(2019年5期)2019-11-25 07:40:12
        未來機器城
        電影(2018年8期)2018-09-21 08:00:06
        節(jié)儉又“浪費”的亞馬遜
        華人時刊(2017年21期)2018-01-31 02:24:10
        連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
        麻豆久久91精品国产| 亚洲影院天堂中文av色| 国产激情视频在线观看首页| av毛片一区二区少妇颜射| 久久精品国产熟女亚洲av麻豆| 亚洲综合激情另类小说区| 久久综合九色综合网站| 欧美性xxxx极品高清| 藏春阁福利视频| 国产高清在线91福利| 人妻丰满熟妇一二三区| 欧美拍拍视频免费大全| 亚洲人成未满十八禁网站| 精品一精品国产一级毛片| 一区二区亚洲精美视频| 日韩精品专区在线观看| 人妻丰满熟妇av无码区| 纯爱无遮挡h肉动漫在线播放| 在线观看无码一区二区台湾| 亚洲一区二区三区厕所偷拍| 人人妻人人澡人人爽国产| 久久露脸国产精品| 国产偷2018在线观看午夜| 精品久久精品久久精品| 深夜放纵内射少妇| 亚洲有码转帖| 中日无码精品一区二区三区| 国产精品一区二区三区播放| 无码成人一区二区| 国产自产精品露脸刺激91在线| 中文字幕精品亚洲一区二区三区| 国产精品一区二区三区卡 | 欧美日韩中文国产一区发布| 天堂av一区二区在线观看| 亚洲国产综合精品一区| 亚洲av毛片在线免费看| 欧美丰满熟妇xxxx性| 国产精品大屁股1区二区三区| 亚洲福利视频一区二区三区| 亚洲精品国偷拍自产在线| 精品一区二区三区在线观看|