亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        如何選擇云機(jī)器學(xué)習(xí)平臺(tái)

        2020-10-20 06:25:16MartinHeller陳琳華
        計(jì)算機(jī)世界 2020年37期
        關(guān)鍵詞:計(jì)算資源機(jī)器深度

        Martin Heller 陳琳華

        用戶需要大量的數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行清洗,并在合理的時(shí)間內(nèi)訓(xùn)練數(shù)據(jù)模型,這樣才能創(chuàng)建高效的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型。有了高效的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型之后,用戶需要部署和監(jiān)視這些模型。如果發(fā)生了變化,用戶還得根據(jù)需要重新對(duì)它們進(jìn)行訓(xùn)練。

        對(duì)于那些已在計(jì)算資源和GPU等加速器上投入了巨資的用戶,他們可以在本地執(zhí)行所有這些操作,不過(guò)這些用戶可能會(huì)發(fā)現(xiàn),在資源足夠的情況下,許多資源其實(shí)在很多時(shí)間都處于閑置狀態(tài)。與此同時(shí),用戶可能還會(huì)發(fā)現(xiàn),在云端運(yùn)行整個(gè)管道可能成本效益更為出色,因?yàn)樵品?wù)可以根據(jù)實(shí)際需求調(diào)用大量的計(jì)算資源和加速器,在不需要的時(shí)候再把這些資源釋放出來(lái)。

        目前,為了支持從項(xiàng)目規(guī)劃到維護(hù)生產(chǎn)模型一整套完整的機(jī)器學(xué)習(xí)生命周期,多家主要的云提供商和眾多小型云提供商都在構(gòu)建自己的機(jī)器學(xué)習(xí)平臺(tái),并投入了大量精力。那么用戶如何確定哪些云服務(wù)能夠滿足自己的需求呢?以下12種功能是所有云機(jī)器學(xué)習(xí)平臺(tái)都應(yīng)具備的功能。

        控制成本

        用戶需要控制模型的成本。通常情況下,在深度學(xué)習(xí)成本當(dāng)中,生產(chǎn)預(yù)測(cè)模型的部署成本占了90%,訓(xùn)練僅占10%。用戶的負(fù)載和模型的復(fù)雜性決定了預(yù)測(cè)成本的控制。

        如果負(fù)載很高,那么用戶可以使用加速器來(lái)避免增加虛擬機(jī)實(shí)例。如果負(fù)載是波動(dòng)的,那么用戶可以根據(jù)負(fù)載的變化動(dòng)態(tài)調(diào)整實(shí)例和容器的數(shù)量或規(guī)模。如果負(fù)載較低或者偶爾才有負(fù)載,那么用戶則可以選擇帶有局部加速器的微型實(shí)例來(lái)處理預(yù)測(cè)工作。

        支持在線建模環(huán)境

        以往的做法是用戶將數(shù)據(jù)導(dǎo)到桌面上進(jìn)行建模。如今,構(gòu)建機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型需要大量的數(shù)據(jù),這顛覆了用戶以往的經(jīng)驗(yàn)。對(duì)于探索性的數(shù)據(jù)分析和模型構(gòu)建,用戶只需將少量數(shù)據(jù)樣本下載到桌面上即可,但是想要構(gòu)建生產(chǎn)模型,用戶仍需訪問(wèn)完整的數(shù)據(jù)。目前,適于構(gòu)建模型的Web開(kāi)發(fā)環(huán)境主要有Jupyter Notebooks、JupyterLab和Apache Zeppelin。如果數(shù)據(jù)與開(kāi)發(fā)環(huán)境在相同的云服務(wù)上,那么用戶可最大程度地減少數(shù)據(jù)移動(dòng),從而節(jié)約時(shí)間。

        支持ETL或ELT管道

        數(shù)據(jù)庫(kù)中最常見(jiàn)的兩種數(shù)據(jù)管道配置是ETL(導(dǎo)出、轉(zhuǎn)換和加載)和ELT(導(dǎo)出、加載和轉(zhuǎn)換)。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)放大了對(duì)這些環(huán)節(jié)的需求,尤其是轉(zhuǎn)換環(huán)節(jié)。在用戶的轉(zhuǎn)型需要進(jìn)行調(diào)整時(shí),ELT可提供更高的靈活性,因?yàn)閷?duì)于大數(shù)據(jù)而言加載環(huán)節(jié)是最耗時(shí)的。

        因此對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō),用戶還必須將變量控制在標(biāo)準(zhǔn)化范圍之間,防止范圍波動(dòng)過(guò)大。至于用戶到底將標(biāo)準(zhǔn)范圍設(shè)置為多少,要取決于模型采用的算法。因?yàn)樵紨?shù)據(jù)通常都摻雜著大量的無(wú)用數(shù)據(jù),所以需要進(jìn)行過(guò)濾。另外,原始數(shù)據(jù)的變化范圍非常大,例如一個(gè)變量的最大值可能高達(dá)數(shù)百萬(wàn),而另一個(gè)變量的范圍可能是-0.1至-0.001之間。

        更靠近數(shù)據(jù)

        因?yàn)閿?shù)據(jù)傳輸速度不可能大于光速,距離過(guò)長(zhǎng)就意味著等待時(shí)間過(guò)長(zhǎng)。即使在具有無(wú)限帶寬的完美網(wǎng)絡(luò)上,情況也是如此。如果用戶擁有的大量數(shù)據(jù)足以建立起精確模型,那么理想的狀態(tài)是在存儲(chǔ)數(shù)據(jù)的地方就近建立模型,這樣可以避免傳輸大量數(shù)據(jù)。許多數(shù)據(jù)庫(kù)也支持這種做法。

        其次是將數(shù)據(jù)與模型構(gòu)建軟件放在同一個(gè)高速網(wǎng)絡(luò)上,這通常意味著數(shù)據(jù)和模型構(gòu)建軟件在同一數(shù)據(jù)中心內(nèi)。即便是在同一個(gè)云可用區(qū)域內(nèi)將數(shù)據(jù)從一個(gè)數(shù)據(jù)中心遷移到另一個(gè)數(shù)據(jù)中心,如果數(shù)據(jù)量過(guò)大也會(huì)出現(xiàn)嚴(yán)重的延遲。那么用戶可能通過(guò)增量更新的方法來(lái)緩解延遲。如果用戶不得不在帶寬受限且存在高延遲的網(wǎng)絡(luò)上長(zhǎng)距離移動(dòng)大數(shù)據(jù),那么這將是最糟糕的情況。

        支持AutoML和自動(dòng)提取特征

        通常情況下,AutoML系統(tǒng)會(huì)嘗試使用大量的模型,以查看哪些模型有最佳的目標(biāo)函數(shù)值。優(yōu)秀的AutoML系統(tǒng)還可以自動(dòng)提取特征,并有效地利用資源尋找含有優(yōu)秀特征集的最佳模型。因?yàn)椴⒎撬械挠脩舳忌瞄L(zhǎng)選擇機(jī)器學(xué)習(xí)模型和模型所使用的變量,以及從原始觀察中提取新的特征。即便用戶擅長(zhǎng),他們也需要花費(fèi)大量的時(shí)間,因此這些工作有必要實(shí)現(xiàn)自動(dòng)化。

        支持縱向和橫向訓(xùn)練

        除訓(xùn)練模型外,Notebooks需要的計(jì)算和內(nèi)存資源都不高。如果Notebooks能夠執(zhí)行在多個(gè)大型虛擬機(jī)或容器上運(yùn)行的訓(xùn)練任務(wù),并且如果訓(xùn)練可以使用GPU、TPU和FPGA等加速器,那將會(huì)帶來(lái)許多好處。其中,最大的好處就是訓(xùn)練時(shí)間可以由數(shù)天時(shí)間縮短為數(shù)小時(shí)。

        支持最佳的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)框架

        在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方面,大多數(shù)數(shù)據(jù)科學(xué)家都有自己偏愛(ài)的框架和編程語(yǔ)言。對(duì)于喜歡Python的人來(lái)說(shuō),他們?cè)跈C(jī)器學(xué)習(xí)方面更偏愛(ài)Scikit-learn,而TensorFlow、PyTorch、Keras和MXNet通常是深度學(xué)習(xí)的首選。云機(jī)器學(xué)習(xí)和深度學(xué)習(xí)平臺(tái)通常都有自己的算法集合,并且它們通常使用至少一種語(yǔ)言支持外部框架。部分云平臺(tái)還針對(duì)一些主要的深度學(xué)習(xí)框架進(jìn)行了修改。在某些情況下,用戶還可以將自己的算法和統(tǒng)計(jì)方法與平臺(tái)的AutoML設(shè)備集成在一起。

        提供預(yù)訓(xùn)練的模型并支持遷移學(xué)習(xí)

        以ImageNet為例,其數(shù)據(jù)集不僅非常龐大,而且訓(xùn)練能夠使用這些數(shù)據(jù)集的深度神經(jīng)網(wǎng)絡(luò)可能需要花上數(shù)周的時(shí)間。因此針對(duì)ImageNet數(shù)據(jù)集的預(yù)訓(xùn)練模型就變得意義重大。

        另外,并非所有人都愿意花費(fèi)大量的時(shí)間和計(jì)算資源來(lái)訓(xùn)練自己的模型。如果可以使用預(yù)訓(xùn)練模型,用戶就不必如此了。但預(yù)訓(xùn)練模型的不足之處在于其可能無(wú)法一直標(biāo)識(shí)出用戶關(guān)注的對(duì)象。在這種情況下,遷移學(xué)習(xí)可以幫助用戶針對(duì)特定數(shù)據(jù)集定制神經(jīng)網(wǎng)絡(luò)的最后幾層,不需要用戶再花時(shí)間和資金訓(xùn)練整個(gè)網(wǎng)絡(luò)。

        支持模型部署預(yù)測(cè)

        在找到了適合自己的最佳模型后,用戶還需要能夠快捷地部署這些模型。如果用戶出于相同目的部署了多個(gè)模型,那么用戶則還需要再?gòu)闹羞M(jìn)行挑選。

        監(jiān)控用于預(yù)測(cè)的數(shù)據(jù)

        整個(gè)世界是不斷變化的,數(shù)據(jù)也隨著世界的變化而變化。用戶不能部署完模型就甩手不管了。相反,用戶需要不斷監(jiān)控那些出于預(yù)測(cè)目的而提交的數(shù)據(jù)。如果數(shù)據(jù)的變化遠(yuǎn)遠(yuǎn)超過(guò)了訓(xùn)練數(shù)據(jù)集的最初設(shè)定范圍,那么用戶則需要重新訓(xùn)練自己的模型。

        提供經(jīng)過(guò)優(yōu)化的AI服務(wù)

        云平臺(tái)不僅提供了圖像識(shí)別功能,還為許多應(yīng)用程序提供了強(qiáng)大的且經(jīng)過(guò)優(yōu)化了的AI服務(wù),例如語(yǔ)言翻譯、語(yǔ)音轉(zhuǎn)文本、文本轉(zhuǎn)語(yǔ)音、預(yù)測(cè)和推薦。為了確保良好的響應(yīng)時(shí)間,目前這些經(jīng)過(guò)優(yōu)化的人工智能服務(wù)已經(jīng)部署在了計(jì)算資源充足的服務(wù)端點(diǎn)上。這些服務(wù)已使用了大量數(shù)據(jù)進(jìn)行了訓(xùn)練和測(cè)試,數(shù)據(jù)在數(shù)量上遠(yuǎn)遠(yuǎn)大于企業(yè)在正常情況下可用的數(shù)量。

        對(duì)試驗(yàn)進(jìn)行管理

        對(duì)所有的模式都嘗試一遍是為數(shù)據(jù)集找到最佳模型的唯一方法,無(wú)論是手動(dòng)的還是AutoML都要嘗試一下。這時(shí)緊隨而來(lái)的另外一個(gè)問(wèn)題就是如何管理這些試驗(yàn)。優(yōu)秀的云機(jī)器學(xué)習(xí)平臺(tái)可幫助用戶查看并比對(duì)訓(xùn)練集和測(cè)試數(shù)據(jù)試驗(yàn)的所有目標(biāo)函數(shù)值,以及模型和混淆矩陣的大小。

        本文作者M(jìn)artin Heller目前為InfoWorld網(wǎng)站的特約編輯兼評(píng)論員,此前曾擔(dān)任Web和Windows編程顧問(wèn)。從1986年至2010年,Heller一直從事數(shù)據(jù)庫(kù)、軟件和網(wǎng)站的開(kāi)發(fā)工作。近期,Heller還出任了Alpha Software的技術(shù)兼訓(xùn)練副總裁和Tubifi的董事長(zhǎng)兼首席執(zhí)行官。

        原文網(wǎng)址

        https://www.infoworld.com/article/3568889/how-to-choose-a-cloud-machine-learning-platform.html

        猜你喜歡
        計(jì)算資源機(jī)器深度
        機(jī)器狗
        機(jī)器狗
        基于模糊規(guī)劃理論的云計(jì)算資源調(diào)度研究
        深度理解一元一次方程
        改進(jìn)快速稀疏算法的云計(jì)算資源負(fù)載均衡
        深度觀察
        深度觀察
        未來(lái)機(jī)器城
        電影(2018年8期)2018-09-21 08:00:06
        深度觀察
        基于Wi-Fi與Web的云計(jì)算資源調(diào)度算法研究
        中文字幕精品人妻在线| 揄拍成人国产精品视频肥熟女| av亚洲在线一区二区| 阴唇两边有点白是怎么回事| 无码人妻精品一区二区三| 久久久久久久性潮| 亚洲国产字幕| 成人高清在线播放视频| 日韩av激情在线观看| 久久久精品人妻一区亚美研究所| 超清无码AV丝袜片在线观看| 免费看黄视频亚洲网站 | 欧美成人专区| 国产麻豆一区二区三区在线播放| 手机看片久久第一人妻| 国产精品亚洲一区二区三区在线| 产国语一级特黄aa大片| 国产一区二区杨幂在线观看性色| 高清午夜福利电影在线| 国产精自产拍久久久久久蜜| 2021久久精品国产99国产 | 欧美猛男军警gay自慰| 人妻av一区二区三区av免费| 久久精品国产亚洲av网站| 特黄aaaaaaaaa毛片免费视频 | 国产av一区二区网站| 国产免费无遮挡吸奶头视频| 久久久久99精品成人片试看 | 久久精品一品道久久精品9| 国产精品丝袜美女久久| 国产午夜精品av一区二区麻豆 | 玖玖资源站无码专区| 我和丰满老女人性销魂| 亚洲一区二区三区内裤视| 精品麻豆国产色欲色欲色欲www| 日韩在线精品在线观看 | 人妻中文字幕在线网站| 国产精品对白交换视频| 日本一极品久久99精品| 一本色道久久婷婷日韩| 大地资源在线播放观看mv|