omniture

亞馬遜云科技推出五項Amazon SageMaker新功能

亞馬遜云科技
2023-12-06 11:01 2888

助力規(guī)?;_發(fā)應(yīng)用模型

  • Amazon SageMaker HyperPod通過為大規(guī)模分布式訓練提供專用基礎(chǔ)架構(gòu),將基礎(chǔ)模型的訓練時間縮短了高達40%;
  • Amazon SageMaker Inference通過優(yōu)化加速器的使用,平均降低50%基礎(chǔ)模型部署成本,并平均縮短了20%的延遲時間;
  • Amazon SageMaker Clarify能夠讓客戶更輕松地根據(jù)支持負責任AI參數(shù),迅速評估和選擇基礎(chǔ)模型;
  • Amazon SageMaker Canvas功能幫助客戶通過自然語言指令加速數(shù)據(jù)準備,并僅需幾次點擊即可使用基礎(chǔ)模型進行模型定制;
  • 寶馬集團BMW、繽客Booking.com、Hugging FacePerplexity、SalesforceStability AI先鋒領(lǐng)航集團(Vanguard等已開始使用新的Amazon SageMaker功能

北京2023年12月6日 /美通社/ -- 亞馬遜云科技在2023 re:Invent全球大會上,宣布推出五項Amazon SageMaker新功能,幫助客戶加速構(gòu)建、訓練和部署大語言模型和其他基礎(chǔ)模型。隨著模型不斷改變各行各業(yè)的客戶體驗,Amazon SageMaker讓企業(yè)更輕松快速地構(gòu)建、訓練和部署支持各種生成式AI使用場景的機器學習模型。為了成功使用模型,客戶需要先進的功能來高效管理模型的開發(fā)、使用和性能。這就是Falcon 40B和180B、IDEFICS、Jurassic-2、Stable Diffusion以及StarCoder等大多數(shù)業(yè)內(nèi)領(lǐng)先的模型都在Amazon SageMaker上訓練的原因。

今天的宣布包括了一項新功能,進一步增強了Amazon SageMaker的模型擴展能力并加速了模型的訓練。此外,Amazon SageMaker推出的另一項新功能,能夠通過降低模型部署成本和延遲時間,優(yōu)化了管理托管的機器學習基礎(chǔ)設(shè)施。亞馬遜云科技還推出了新的SageMaker Clarify功能,可以讓客戶在負責任地使用AI的基礎(chǔ)上,根據(jù)質(zhì)量參數(shù)更輕松地選擇正確模型。為了幫助客戶在企業(yè)范圍內(nèi)應(yīng)用這些模型,亞馬遜云科技還在Amazon SageMaker Canvas中引入了新的無代碼功能,讓客戶更快、更容易地使用自然語言指令準備數(shù)據(jù)。同時,Amazon SageMaker Canvas繼續(xù)推動模型構(gòu)建和定制的普及,讓客戶更輕松地使用模型提取洞察、進行預測和使用企業(yè)專有數(shù)據(jù)生成內(nèi)容。這些創(chuàng)新均基于Amazon SageMaker豐富的功能,幫助客戶實現(xiàn)規(guī)?;瘷C器學習創(chuàng)新。開始使用Amazon SageMaker,請訪問aws.amazon.com/sagemaker。

足夠的可伸縮算力的就位、海量數(shù)據(jù)的爆炸,以及機器學習技術(shù)的快速進步,正在促使包含數(shù)十億參數(shù)模型的興起,使它們能夠執(zhí)行各種任務(wù),如撰寫博客文章、生成圖像、解決數(shù)學問題、進行對話和根據(jù)文檔回答問題。如今,成千上萬的客戶,例如3M、阿斯利康(AstraZeneca)、法拉利(Ferrari)、LG AI Research、瑞安航空(RyanAir)、湯森路透(Thomson Reuters)和先鋒領(lǐng)航集團(Vanguard)等,每月在Amazon SageMaker進行超過1.5萬億次的推理請求。此外,像AI21 Labs、Stability AI和Technology Innovation Institute等客戶也正借助Amazon SageMaker訓練擁有數(shù)十億參數(shù)的模型。隨著客戶從構(gòu)建主要針對特定任務(wù)的模型轉(zhuǎn)向構(gòu)建支持生成式AI的大型通用模型,他們必須處理大量數(shù)據(jù)集并進行更復雜的基礎(chǔ)設(shè)施設(shè)置,同時在這個過程中還要不斷優(yōu)化成本和性能。客戶還希望能夠構(gòu)建和定制自己的模型,以創(chuàng)造獨特的客戶體驗,體現(xiàn)企業(yè)的聲音、風格和服務(wù)。自2017年推出以來,Amazon SageMaker已經(jīng)新增了380多個功能和特性,為客戶提供了規(guī)?;瘶?gòu)建、訓練和部署可投入生產(chǎn)的大規(guī)模模型所需的一切。

"機器學習是近年來影響深遠的技術(shù)變革之一,所有企業(yè)組織都對模型產(chǎn)生了濃厚的興趣。這也給那些希望快速構(gòu)建、訓練和部署模型的客戶帶來了新的挑戰(zhàn)。" 亞馬遜云科技人工智能和機器學習副總裁Bratin Saha表示,"從加速訓練、優(yōu)化托管成本、降低延遲到簡化基礎(chǔ)模型的評估,再到擴展無代碼模型的構(gòu)建能力,我們的使命是讓各種規(guī)模的企業(yè)平等地使用高質(zhì)量、高成本效益的機器學習模型。今天,我們再次增強Amazon SageMaker,通過全托管、專門構(gòu)建的新功能幫助客戶充分獲得他們在機器學習方面的投資回報。"

新功能讓客戶更輕松快速地訓練和操作模型,驅(qū)動生成式AI的應(yīng)用

隨著生成式AI的持續(xù)發(fā)展,許多新興應(yīng)用都將依賴于模型。然而,大多數(shù)企業(yè)在調(diào)整基礎(chǔ)設(shè)施以滿足新模型需求時存在困難,很難高效地實現(xiàn)規(guī)模化訓練和操作。今天,Amazon SageMaker增加了兩項全新功能,旨在幫助減輕規(guī)?;柧毢筒渴鹉P偷呢摀?/p>

  • Amazon SageMaker HyperPod加速基礎(chǔ)模型規(guī)?;柧殻?/b>許多企業(yè)希望以較低的成本使用基于GPU和Trainium的計算實例來訓練自己的模型。然而,數(shù)據(jù)激增、模型規(guī)模擴大以及較長的訓練時間使模型訓練復雜程度呈指數(shù)級增長,這要求客戶必須進一步調(diào)整他們的流程來應(yīng)對這些新需求。通??蛻粜枰獙⒛P陀柧毞峙涞綌?shù)百甚至數(shù)千個加速器上。之后,在幾周或者幾個月的時間內(nèi)并行運行數(shù)萬億次數(shù)據(jù)計算,這是一項耗時且需要專門機器學習知識的任務(wù)。與訓練特定任務(wù)的模型相比,加速器的數(shù)量和訓練時間會大大增加。因此,很容易出現(xiàn)如單個加速器故障這樣的小錯誤。這些錯誤可能會中斷整個訓練過程,并需要人工干預來識別、隔離、調(diào)試、修復和恢復,這將進一步延遲任務(wù)進度。在基礎(chǔ)模型的訓練過程中,客戶經(jīng)常需要暫停訓練,評估當前模型性能并優(yōu)化訓練代碼。為了不間斷地訓練模型,開發(fā)人員必須不斷保存訓練進度(通常稱為檢查點),以便在訓練中斷后不會丟失進度,并從停止的地方繼續(xù)訓練。這些挑戰(zhàn)明顯增加了訓練模型所需的時間和成本,延遲了新的生成式AI創(chuàng)新的部署。

Amazon SageMaker HyperPod消除了為訓練模型而構(gòu)建、優(yōu)化機器學習基礎(chǔ)設(shè)施的繁重工作,將訓練時間縮短了高達40%。Amazon SageMaker HyperPod預置了Amazon SageMaker的分布式訓練庫,使客戶能夠自動將訓練工作負載分布到數(shù)千個加速器上,以便并行處理工作負載,提高模型性能。此外,Amazon SageMaker HyperPod通過定期保存檢查點以確保用戶能夠不間斷地訓練模型。當訓練過程中發(fā)生硬件故障時,Amazon SageMaker HyperPod會自動檢測故障、修復或替換有故障的實例,并從最后保存的檢查點恢復訓練,無需客戶手動管理這一過程,協(xié)助客戶在分布式環(huán)境中進行數(shù)周或數(shù)月的訓練而無需中斷。

  • Amazon SageMaker Inference有助于降低模型部署成本并縮短延遲時間:企業(yè)在部署模型的過程中一直在尋找優(yōu)化性能的方法。為了降低部署成本和減少響應(yīng)延遲,客戶使用Amazon SageMaker在新的機器學習基礎(chǔ)設(shè)施加速器上部署模型,如Amazon Inferentia和GPU。然而,有些模型沒有充分利用這些實例提供的加速器,導致硬件資源使用效率低。有些企業(yè)還將多個模型部署到同一個實例上,以便更好地利用所有可用的加速器,但這需要復雜的基礎(chǔ)設(shè)施編排,既耗時又難以管理。當多個模型共享同一個實例時,每個模型都有自己的擴展需求和使用模式,因此很難預測客戶何時需要添加或刪除實例。例如,一個模型用于支持在特定時間內(nèi)使用量可能激增的應(yīng)用程序,而另一個模型可能具有更穩(wěn)定的使用模式。除了優(yōu)化成本,客戶還希望通過降低延遲來提供理想的用戶體驗。由于模型的輸出范圍從一句話到一整篇文章不等,因此完成推理請求所需的時間差異很大。如果請求在實例之間隨機路由,就會導致延遲出現(xiàn)不可預測的峰值。Amazon SageMaker現(xiàn)在支持新的推理功能,幫助客戶降低部署成本和延遲時間。通過這些新功能,客戶可以將多個模型部署到同一個實例上,更好地利用底層加速器,平均部署成本可降低50%??蛻暨€可以分別控制每個模型的擴展策略,使之更適應(yīng)模型的使用模式,同時優(yōu)化基礎(chǔ)設(shè)施成本。Amazon SageMaker能夠積極監(jiān)測正在處理推理請求的實例,并根據(jù)可用的實例智能發(fā)送請求,平均降低20%的推理延遲。

新功能能夠幫助客戶評估任意模型,并根據(jù)使用場景選擇更適合的模型

現(xiàn)在,客戶在為生成式AI應(yīng)用程序挑選模型時有很多選擇,他們希望能快速比較這些模型,并根據(jù)相關(guān)質(zhì)量和負責任的AI參數(shù)(如準確性、公平性和魯棒性)找到更適合的選擇。然而,當比較執(zhí)行相同功能(例如文本生成或摘要)或?qū)儆谕幌盗校ɡ鏔alcon 40B與Falcon 180B)的模型時,每個模型在各種負責任的AI參數(shù)上表現(xiàn)都不相同。即使是在兩個不同數(shù)據(jù)集上微調(diào)相同的模型,性能也存在差異,這將很難確定哪個版本效果更佳。如要開始比較模型,企業(yè)必須先花費數(shù)天時間識別相關(guān)標準,設(shè)置評估工具并對每個模型進行評估。盡管客戶可以訪問公開可用的模型標準,但他們通常無法根據(jù)代表特定使用場景的提示詞來評估模型的性能。此外,這些標準通常難以理解,也不適用于評估品牌聲音、相關(guān)性和風格。另外,企業(yè)還需經(jīng)過耗時的手動分析結(jié)果的過程,并對每個新使用場景或微調(diào)模型重復此過程。

Amazon SageMaker Clarify現(xiàn)在可以幫助客戶根據(jù)所選參數(shù)評估、比較和選擇適合特定使用場景的最佳模型,以支持企業(yè)負責任地使用AI。借助Amazon SageMaker Clarify的新功能,客戶可以輕松提交自己的模型進行評估,或通過Amazon SageMaker JumpStart選擇模型。在Amazon SageMaker Studio中,客戶可以選擇要針對給定任務(wù)進行比較的模型,例如問答或內(nèi)容摘要。然后,客戶選擇評估參數(shù)并上傳自己的提示詞數(shù)據(jù)集,或者從內(nèi)置的公開數(shù)據(jù)集中進行選擇。對于需要復雜人工判斷的敏感標準或精細內(nèi)容,客戶可以選擇使用自己的員工或由SageMaker Ground Truth提供的托管工作人員,使用反饋機制在幾分鐘內(nèi)審查回復。一旦客戶完成設(shè)置過程,Amazon SageMaker Clarify將會運行評估并生成報告,以便客戶可以根據(jù)性能標準快速評估、比較和選擇最佳模型。

新的Amazon SageMaker Canvas增強功能使客戶更輕松、更快速地將生成AI集成到工作流程中

Amazon SageMaker Canvas幫助客戶構(gòu)建機器學習模型并生成預測,而無需編寫代碼。此次發(fā)布擴展了Amazon SageMaker Canvas現(xiàn)有的即用功能,幫助客戶在無代碼環(huán)境中使用模型來支持各種使用場景。

  • 使用自然語言指令準備數(shù)據(jù):如今,Amazon SageMaker Canvas中的可視化界面使那些沒有機器學習專業(yè)知識的人可以輕松準備數(shù)據(jù),但有些客戶還希望以一種更快、更直觀的方式瀏覽數(shù)據(jù)集。客戶現(xiàn)在可以通過示例查詢快速入門,并在整個過程中隨時提問以簡化數(shù)據(jù)準備工作??蛻暨€可以使用自然語言指令進行復雜的轉(zhuǎn)換,解決常見的數(shù)據(jù)問題,例如填充列中的缺失值。通過這個新的無代碼界面,客戶可以大大簡化在Amazon SageMaker Canvas上處理數(shù)據(jù)的方式,將準備數(shù)據(jù)所需的時間從數(shù)小時縮短至數(shù)分鐘。
  • 利用模型進行大規(guī)模業(yè)務(wù)分析:客戶使用Amazon SageMaker Canvas構(gòu)建機器學習模型,并為各種任務(wù)生成預測,包括需求預測、客戶流失預測和金融投資組合分析等。今年早些時候,客戶即可通過Amazon SageMaker Canvas訪問Amazon Bedrock上的多個模型,包括來自AI21 Labs、Anthropic和亞馬遜的模型,以及來自MosaicML、TII和通過Amazon SageMaker Jumpstart獲取的模型。使用與今天相同的無代碼界面,客戶可以上傳數(shù)據(jù)集并選擇模型,Amazon SageMaker Canvas會自動幫助客戶構(gòu)建自定義模型,立即生成預測。Amazon SageMaker Canvas還可以顯示性能指標,讓客戶可以輕松協(xié)作,使用模型生成預測并了解基礎(chǔ)模型在特定任務(wù)上的表現(xiàn)。

Hugging Face是一家領(lǐng)先的機器學習公司和開放平臺,它為AI構(gòu)建提供了開放的基礎(chǔ)模型以及創(chuàng)建模型所需的工具。"Hugging Face一直在使用Amazon SageMaker HyperPod創(chuàng)建重要的最新開放基礎(chǔ)模型,如StarCoder、IDEFICS和Zephyr,這些模型已被下載了數(shù)百萬次。"Hugging Face產(chǎn)品負責人Jeff Boudier表示,"Amazon SageMaker HyperPod專為高可用和性能構(gòu)建的功能使我們的開放科學團隊能夠?qū)W⒂趧?chuàng)新,并改進基礎(chǔ)模型的構(gòu)建方式,而非管理基礎(chǔ)設(shè)施。Amazon SageMaker HyperPod能夠檢測到機器學習硬件故障,并快速替換有故障的硬件,且不會中斷正在進行的模型訓練。由于我們的團隊需要快速創(chuàng)新,該自動化作業(yè)恢復功能幫助我們在基礎(chǔ)模型訓練過程中減少中斷情況,讓我們在一年內(nèi)便節(jié)省了數(shù)百小時的訓練時間。" 

領(lǐng)先的人工智能客戶關(guān)系管理(CRM)平臺Salesforce,憑借數(shù)據(jù)、AI和CRM,提高了生產(chǎn)力,創(chuàng)造了可信的客戶體驗。 "我們對基礎(chǔ)模型采用了開放的方式,而Amazon SageMaker是一個至關(guān)重要的組成部分,幫助我們擴展架構(gòu)并加速市場推廣。"Salesforce工程副總裁Bhavesh Doshi表示,"利用新的Amazon SageMaker推理功能,我們能夠?qū)⑺心P头湃雴我坏腁mazon SageMaker端點,該端點可以自動處理所有資源分配和計算資源共享,在提高性能的同時降低了基礎(chǔ)模型的部署成本。" 

湯森路透(Thomson Reuters)是一家領(lǐng)先的信息領(lǐng)域提供商,也是全球值得信賴的新聞機構(gòu)之一。 "我們的工程師面臨的一個挑戰(zhàn)是在高峰季節(jié)有效管理客戶呼叫資源,以確保雇傭合適數(shù)量的客服人員來處理激增的咨詢。"Thomson Reuters人工智能、商業(yè)智能和數(shù)據(jù)平臺副總裁Maria Apazoglou表示,"對包含呼叫量、等待時間、日期等關(guān)鍵指標的呼叫中心數(shù)據(jù)進行歷史分析是一項耗時的任務(wù)。我們的團隊正在利用Amazon SageMaker Canvas中新的數(shù)據(jù)準備和定制功能,對公司數(shù)據(jù)進行模型訓練,從而識別影響高峰時段呼叫量的模式和趨勢,這讓我們使用自有數(shù)據(jù)構(gòu)建機器學習模型變得非常簡便。我們期待通過Amazon SageMaker Canvas增加對基礎(chǔ)模型的使用,而無需編寫任何代碼。" 

消息來源:亞馬遜云科技
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection