AutoML是一項(xiàng)技術(shù),客戶可以攜帶數(shù)據(jù)并離開(kāi)模型而不必?fù)?dān)心訓(xùn)練機(jī)器學(xué)習(xí)模型所涉及的復(fù)雜工作流程。它大大簡(jiǎn)化了基于成熟算法的數(shù)據(jù)準(zhǔn)備,特征工程,模型選擇和超參數(shù)調(diào)整的方法。
基于公共云的ML平臺(tái)即服務(wù)(PaaS)產(chǎn)品(例如Azure ML,IBM Watson Studio和Google Cloud AI)具有AutoML組件。AWS遲遲未將AutoML功能引入其SageMaker平臺(tái)。自2019年發(fā)布SageMaker AutoPilot以來(lái),亞馬遜一直在不斷改善其托管ML平臺(tái)的AutoML功能。
通過(guò)最近添加的SageMaker JumpStart,AWS現(xiàn)在擁有完整的AutoML功能,涵蓋了回歸,分類(lèi),視覺(jué)和自然語(yǔ)言處理領(lǐng)域。
盡管AWS并未正式稱(chēng)呼Amazon SageMaker Autopilot和JumpStart服務(wù)AutoML,但它們是Azure AutoML和Google Cloud AutoML的替代產(chǎn)品。
Amazon SageMaker Autopilot針對(duì)諸如銷(xiāo)售預(yù)測(cè),推薦系統(tǒng),呼叫中心路由和廣告優(yōu)化之類(lèi)的方案,這些方案依賴(lài)于通常存儲(chǔ)在CSV文件,關(guān)系數(shù)據(jù)庫(kù)和NoSQL數(shù)據(jù)庫(kù)中的數(shù)據(jù)集。
基于XGBoost和Linear Learner算法,Autopilot非常適合處理線性回歸,邏輯回歸以及二元或多元分類(lèi)問(wèn)題。通過(guò)添加深度學(xué)習(xí)算法,Autopilot可以處理不可線性分離的復(fù)雜數(shù)據(jù)。
Amazon SageMaker Autopilot的主要與眾不同之處在于,自動(dòng)生成筆記本是AutoML工作流程的一部分。客戶只能創(chuàng)建一個(gè)Autopilot作業(yè)來(lái)生成筆記本,而不是運(yùn)行整個(gè)過(guò)程。這些筆記本基于在數(shù)據(jù)科學(xué)界流行的標(biāo)準(zhǔn)開(kāi)源Juypter筆記本。開(kāi)發(fā)人員和數(shù)據(jù)科學(xué)家可以下載筆記本,以了解數(shù)據(jù)準(zhǔn)備工作的完成方式以及為每個(gè)候選人構(gòu)建的單獨(dú)管道所使用的算法。
在re:Invent 2020上宣布的Amazon SageMaker JumpStart是Amazon SageMaker Studio的最新成員,后者是面向AWS客戶的集成ML開(kāi)發(fā)平臺(tái)。盡管Amazon SageMaker Autopilot處理通常以表格格式存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),但SageMaker JumpStart專(zhuān)注于視覺(jué)和NLP域。
Amazon SageMaker JumpStart包含三個(gè)組件-開(kāi)源模型部署,解決方案和基于較小的定制數(shù)據(jù)集的現(xiàn)有開(kāi)源模型構(gòu)建的定制模型。
亞馬遜利用TensorFlow和PyTorch提供的官方模型動(dòng)物園來(lái)提供開(kāi)源模型部署。只需單擊一下,即可在SageMaker Studio中提供150多個(gè)模型。AWS下載模型,在SageMaker中注冊(cè)它們,并公開(kāi)一個(gè)端點(diǎn)進(jìn)行推斷。
例如,您可以一鍵顯示ResNet或MobileNet SSD模型以進(jìn)行圖像分類(lèi)和對(duì)象檢測(cè)。部署模型后,SageMaker會(huì)將您指向帶有示例代碼的Jupyter Notebook,以調(diào)用推理端點(diǎn)。
部署使用公共數(shù)據(jù)集(例如ImageNet或CIFAR-100)訓(xùn)練的現(xiàn)有計(jì)算機(jī)視覺(jué)模型可能對(duì)企業(yè)不是很有用。他們需要使用與特定業(yè)務(wù)問(wèn)題保持一致的自定義數(shù)據(jù)集進(jìn)行訓(xùn)練的模型。例如,組織可能需要識(shí)別在接待區(qū)沒(méi)有面具的人。沒(méi)有公開(kāi)可用的模型可以可靠地檢測(cè)沒(méi)有面罩的面部。
責(zé)任編輯:lq
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
67文章
8567瀏覽量
137272 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1240瀏覽量
26264 -
自然語(yǔ)言處理
+關(guān)注
關(guān)注
1文章
630瀏覽量
14737
發(fā)布評(píng)論請(qǐng)先 登錄
ML610Q428/ML610Q429 8位微控制器:性能與應(yīng)用解析
ML610Q438/ML610Q439 8位微控制器深度剖析
RK3588的GMAC 時(shí)鐘怎么一直沒(méi)有?
上海海思助力智家統(tǒng)一互聯(lián)標(biāo)準(zhǔn)正式發(fā)布
LabView 程序內(nèi)存一直增長(zhǎng),內(nèi)存溢出問(wèn)題?
大數(shù)據(jù)商業(yè)應(yīng)用一直在變化:移動(dòng)BI的發(fā)展和廠商對(duì)比
亞馬遜云科技推出兩項(xiàng)Amazon Lambda新功能 進(jìn)一步應(yīng)對(duì)復(fù)雜應(yīng)用場(chǎng)景
信道活躍檢測(cè)(CAD)是一種無(wú)線喚醒技術(shù),這個(gè)功能一般是定時(shí)檢測(cè)么?還是一直檢測(cè)?
亞馬遜平臺(tái) API:解鎖電商潛能的技術(shù)鑰匙
亞馬遜平臺(tái)根據(jù)關(guān)鍵字搜索商品API接口
亞馬遜一直在不斷改善其托管ML平臺(tái)的AutoML功能
評(píng)論