(ChinaZ.com)12月11日 消息:在今年的re:Invent會議上,亞馬遜云AWS宣布了旗下基于云的機器學習平臺SageMaker九個主要更新。SageMaker旨在提供一種機器學習服務,該服務可用于構建,訓練和部署幾乎所有用例的ML模型。
在會議上,AWS亞馬遜機器學習副總裁Swami Sivasubramanian說:
“成千上萬的開發人員和數據科學家已經使用我們行業領先的機器學習服務Amazon SageMaker來構建,訓練和部署自定義機器學習模型。擁有像SageMaker這樣的被廣泛采用的服務的最好的部分之一就是,我們得到了很多客戶建議,這些建議推動了我們下一代新產品的開發。
今天,我們發布了一套適用于Amazon SageMaker的工具,使開發人員可以更輕松地構建端到端機器學習通道,以準備,構建,訓練,解釋,檢查,監視,調試和運行自定義機器學習模型,使其具有更強大,容易分析和大規模的自動化。”
SageMaker主要更新內容
第一個更新是Data Wrangler,該功能旨在自動為機器學習準備數據。Data Wrangler使客戶可以從各種數據存儲中選擇所需的數據,然后單擊即可導入。其中包括300多個內置數據轉換器,可幫助客戶在無需編寫任何代碼的情況下進行標準化,轉換和組合功能。
第二個更新是Feature Store。Amazon SageMaker Feature Store提供了一個新的存儲庫,可輕松存儲,更新,檢索和共享機器學習功能以進行培訓和推理。
Feature Store旨在克服存儲映射到多個模型要素的問題。專門的功能庫可幫助開發人員訪問和共享,從而使開發人員和數據科學家團隊之間更容易命名,組織,查找和共享功能集。由于它位于SageMaker Studio中,AWS聲稱它提供了毫秒級別的推理延遲。
SageMaker Pipelines,亞馬遜聲稱是針對機器學習的第一個專門構建的,易于使用的持續集成和持續交付(CI / CD)服務。
開發人員可以定義端到端機器學習工作流程的每個步驟,包括數據加載步驟,Amazon SageMaker Data Wrangler的轉換,Amazon SageMaker Feature Store中存儲的功能,培訓配置和算法設置,調試步驟以及優化步驟。 。
考慮到正在進行的事件, SageMaker Clarify可能是AWS本周最重要的功能之一。
Clarify旨在開發人員在機器學習工作流程中提供偏差檢測,能夠在其ML模型中建立更大的公平性和透明度。開發人員可以使用集成的解決方案來快速嘗試并應對模型中的任何偏差,而不必使用通常耗時的開源工具。
適用于Amazon SageMaker的Deep Profiling,可自動監視系統資源利用率,并在任何檢測到的培訓瓶頸需要的地方提供警報。該功能可跨框架(PyTorch,Apache MXNet和TensorFlow)使用,并自動收集系統和培訓指標,而無需在培訓腳本中進行任何代碼更改。
Data Parallelism引擎,通過自動在多個GPU之間分割數據,將培訓工作從單個GPU擴展到成百上千,從而將培訓時間縮短了40%。
Edge Manager幫助開發人員優化,保護,監視和維護部署在邊緣設備群上的ML模型。除了幫助優化ML模型和管理邊緣設備外,Edge Manager還提供以下功能:對模型進行加密簽名,將來自設備的預測數據上傳到SageMaker以進行監視和分析,以及查看儀表板,該儀表板跟蹤并提供有關操作的可視報告。
JumpStart為開發人員提供了一個易于使用的可搜索界面,以查找同類最佳的解決方案,算法和示例筆記本。開發人員可以從幾個端到端的機器學習模板中進行選擇,并將其直接部署到他們的SageMaker Studio環境中。
亞馬遜云不斷改進SageMaker,在過去的一年中已經提供了50多種新功能。