omniture

IBM 宣布在 watsonx 上提供開源的 Mistral AI 模型----擴大模型選擇范圍,幫助企業(yè)以可信和靈活的方式擴展 AI

IBM China
2024-03-11 11:59 3088
  • IBM 提供 Mixtral-8x7B 的優(yōu)化版本,該版本可將延遲時間最多縮短 75%
  • IBM、第三方和開源模型的目錄不斷增加,為客戶提供更多選擇和靈活性
  • 是watsonx 人工智能與數(shù)據(jù)平臺上最新的開源模型,watsonx提供企業(yè)就緒的人工智能開發(fā)平臺、數(shù)據(jù)存儲和治理功能

北京2024年3月11日 /美通社/ -- IBM(紐約證券交易所代碼:IBM)近日宣布,由Mistral AI公司開發(fā)的廣受歡迎的開源Mixtral-8x7B大型語言模型(LLM)已經(jīng)可在其watsonx人工智能與數(shù)據(jù)平臺上使用。

IBM_watson_x_social
IBM_watson_x_social

IBM 提供了 Mixtral-8x7B 的優(yōu)化版本,在內部測試中,與常規(guī)模型相比,該版本能夠將吞吐量(即在給定時間段內可處理的數(shù)據(jù)量)提高50%[i]。這可能可以將時間延遲減少 35-75%,從而加快獲得洞察的時間,具體取決于批處理量的大小。這是通過一個稱為量化的過程來實現(xiàn)的,該過程減少了 LLM 的模型大小和內存需求,進而可以加快處理速度,有助于降低成本和能耗。

Mixtral-8x7B 的加入擴展了 IBM 的開放、多模型戰(zhàn)略,隨時隨地滿足客戶的需求,并為他們提供選擇和靈活性,使其可以跨業(yè)務來擴展其企業(yè)級人工智能解決方案。通過數(shù)十年的人工智能研發(fā)、與 Meta 和 Hugging Face 開放式協(xié)作,以及與模型領導者的合作伙伴關系,IBM 正在擴展其 watsonx.ai 模型目錄,并引入新的功能、語言和模式。

IBM 的企業(yè)就緒基礎模型選擇及其 watsonx 人工智能和數(shù)據(jù)平臺可幫助客戶利用生成式人工智能獲得新的洞察力和效率,并基于信任原則創(chuàng)建新的業(yè)務模式。IBM 可幫助客戶根據(jù)所針對的業(yè)務領域(如金融)的合適用例及性價比目標來選擇合適的模型。

Mixtral-8x7B 結合了稀疏建模與專家混合技術來構建,"稀疏建模"是只查找和使用數(shù)據(jù)中最重要部分以創(chuàng)建更高效的模型的創(chuàng)新技術;而"專家混合技術"是把擅長并解決不同部分問題的不同模型("專家")結合在一起的技術。Mixtral-8x7B 模型因其能夠快速處理和分析海量數(shù)據(jù)以提供與上下文相關的見解而廣為人知。

IBM 軟件公司產品管理與增長高級副總裁 Kareem Yusuf 博士表示"客戶要求在部署最適合其獨特用例和業(yè)務要求的模型時擁有選擇權和靈活性。通過在watsonx上提供Mixtral-8x7B和其它模型,我們不僅為客戶提供了部署人工智能的可選性,還為人工智能構建者和業(yè)務領導者提供了一個強大的生態(tài)系統(tǒng),使他們能夠利用工具和技術推動不同行業(yè)和領域的創(chuàng)新。"

在同一周,IBM還宣布在watsonx上提供由ELYZA公司開源的日本LLM模型ELYZA-japanese-Llama-2-7b。IBM 還在 watsonx 上提供 Meta 的開源模型 Llama-2-13B-chat 和 Llama-2-70B-chat 以及其它第三方模型,未來幾個月還將推出更多模型。

有關 IBM 未來方向和意圖的聲明如有更改或撤回,恕不另行通知,僅代表目標和目的。

關于IBM

IBM 是全球領先的混合云、人工智能及企業(yè)服務提供商,幫助超過 175 個國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡化業(yè)務流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務、電信和醫(yī)療健康等關鍵基礎設施領域的超過 4000 家政府和企業(yè)實體依靠 IBM 混合云平臺和 Red Hat OpenShift 快速、高效、安全地實現(xiàn)數(shù)字化轉型。IBM 在人工智能、量子計算、行業(yè)云解決方案和企業(yè)服務方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業(yè)務發(fā)展的基石。了解更多信息,請訪問:https://www.ibm.com/cn-zh

媒體聯(lián)絡人:

郭韜 gguotao@cn.ibm.com


[i] 基于 IBM 在供 IBM 使用的 watsonx 實例上使用內部工作負載進行的為期兩天的測試。

消息來源:IBM China
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection