北京2024年3月11日 /美通社/ -- IBM(紐約證券交易所代碼:IBM)近日宣布,由Mistral AI公司開發(fā)的廣受歡迎的開源Mixtral-8x7B大型語言模型(LLM)已經(jīng)可在其watsonx人工智能與數(shù)據(jù)平臺上使用。
IBM 提供了 Mixtral-8x7B 的優(yōu)化版本,在內部測試中,與常規(guī)模型相比,該版本能夠將吞吐量(即在給定時間段內可處理的數(shù)據(jù)量)提高50%[i]。這可能可以將時間延遲減少 35-75%,從而加快獲得洞察的時間,具體取決于批處理量的大小。這是通過一個稱為量化的過程來實現(xiàn)的,該過程減少了 LLM 的模型大小和內存需求,進而可以加快處理速度,有助于降低成本和能耗。
Mixtral-8x7B 的加入擴展了 IBM 的開放、多模型戰(zhàn)略,隨時隨地滿足客戶的需求,并為他們提供選擇和靈活性,使其可以跨業(yè)務來擴展其企業(yè)級人工智能解決方案。通過數(shù)十年的人工智能研發(fā)、與 Meta 和 Hugging Face 開放式協(xié)作,以及與模型領導者的合作伙伴關系,IBM 正在擴展其 watsonx.ai 模型目錄,并引入新的功能、語言和模式。
IBM 的企業(yè)就緒基礎模型選擇及其 watsonx 人工智能和數(shù)據(jù)平臺可幫助客戶利用生成式人工智能獲得新的洞察力和效率,并基于信任原則創(chuàng)建新的業(yè)務模式。IBM 可幫助客戶根據(jù)所針對的業(yè)務領域(如金融)的合適用例及性價比目標來選擇合適的模型。
Mixtral-8x7B 結合了稀疏建模與專家混合技術來構建,"稀疏建模"是只查找和使用數(shù)據(jù)中最重要部分以創(chuàng)建更高效的模型的創(chuàng)新技術;而"專家混合技術"是把擅長并解決不同部分問題的不同模型("專家")結合在一起的技術。Mixtral-8x7B 模型因其能夠快速處理和分析海量數(shù)據(jù)以提供與上下文相關的見解而廣為人知。
IBM 軟件公司產品管理與增長高級副總裁 Kareem Yusuf 博士表示:"客戶要求在部署最適合其獨特用例和業(yè)務要求的模型時擁有選擇權和靈活性。通過在watsonx上提供Mixtral-8x7B和其它模型,我們不僅為客戶提供了部署人工智能的可選性,還為人工智能構建者和業(yè)務領導者提供了一個強大的生態(tài)系統(tǒng),使他們能夠利用工具和技術推動不同行業(yè)和領域的創(chuàng)新。"
在同一周,IBM還宣布在watsonx上提供由ELYZA公司開源的日本LLM模型ELYZA-japanese-Llama-2-7b。IBM 還在 watsonx 上提供 Meta 的開源模型 Llama-2-13B-chat 和 Llama-2-70B-chat 以及其它第三方模型,未來幾個月還將推出更多模型。
有關 IBM 未來方向和意圖的聲明如有更改或撤回,恕不另行通知,僅代表目標和目的。
關于IBM
IBM 是全球領先的混合云、人工智能及企業(yè)服務提供商,幫助超過 175 個國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡化業(yè)務流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務、電信和醫(yī)療健康等關鍵基礎設施領域的超過 4000 家政府和企業(yè)實體依靠 IBM 混合云平臺和 Red Hat OpenShift 快速、高效、安全地實現(xiàn)數(shù)字化轉型。IBM 在人工智能、量子計算、行業(yè)云解決方案和企業(yè)服務方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業(yè)務發(fā)展的基石。了解更多信息,請訪問:https://www.ibm.com/cn-zh
媒體聯(lián)絡人:
[i] 基于 IBM 在供 IBM 使用的 watsonx 實例上使用內部工作負載進行的為期兩天的測試。