作者: IBM watsonx.ai 產(chǎn)品主管Maryam Ashoori; IBM AI平臺(tái)(watsonx.ai 和 watsonx.governance)產(chǎn)品管理副總裁Armand Ruiz; IBM watsonx.ai 產(chǎn)品經(jīng)理Nisarg Patel
北京2025年2月11日 /美通社/ -- IBM日前宣布,DeepSeek-R1 的 Llama 3.1 8B 和 Llama 3.3 70b 蒸餾版本現(xiàn)已在 IBM 的企業(yè)級(jí) AI 開發(fā)平臺(tái) watsonx.ai 上提供。
DeepSeek-R1到底是啥?
DeepSeek-R1 是中國人工智能(AI)初創(chuàng)公司 DeepSeek 的推理大語言模型(LLM),是世界上最強(qiáng)大的開源模型之一,甚至可以與 OpenAI 的 o1 相媲美。DeepSeek-R1 在 MIT 許可證下發(fā)布,主要是通過在基礎(chǔ)模型 DeepSeek-V3 上直接使用強(qiáng)化學(xué)習(xí) (RL) 開發(fā)的,這是微調(diào) LLM 的一項(xiàng)重大創(chuàng)新。
DeepSeek 還使用了一種稱為知識(shí)蒸餾的技術(shù),使用較大的 R1 模型生成的數(shù)據(jù)來微調(diào)多個(gè) Llama 和 Qwen 模型。用戶可以通過兩種方式在 watsonx.ai 上訪問 DeepSeek 蒸餾模型:
DeepSeek-R1 支持哪些類型的用例?
DeepSeek-R1 是一種先進(jìn)的 AI 模型,以其卓越的推理能力而著稱,支持各行各業(yè)的廣泛應(yīng)用:
開發(fā)人員可在 IBM watsonx.ai 中使用 DeepSeek-R1 等已部署的模型和解決方案功能構(gòu)建人工智能解決方案:
為何要在 watsonx.ai 上使用DeepSeek蒸餾模型?
IBM watsonx.ai 使客戶能夠定制實(shí)施 DeepSeek-R1 等開源模型,從部署環(huán)境的完全靈活性到智能體(代理)開發(fā)、微調(diào)、RAG、提示工程和與企業(yè)應(yīng)用程序集成的直觀工作流,用戶可以利用watsonx.ai的內(nèi)置護(hù)欄來保護(hù)他們的應(yīng)用程序。
當(dāng)然,數(shù)據(jù)安全和AI治理是客戶最關(guān)心的問題。除防護(hù)欄外,在 watsonx.ai 上部署時(shí),這些模型將成為專用實(shí)例,這意味著除平臺(tái)外,不會(huì)在其他任何地方共享數(shù)據(jù)。此外,與 IBM watsonx.governance這一功能強(qiáng)大的治理、風(fēng)險(xiǎn)和合規(guī)性(GRC)工具包的無縫集成,可確??蛻舻腁I在整個(gè)AI生命周期內(nèi)都是負(fù)責(zé)任、透明和可解釋的。
開始在 IBM watsonx.ai 上使用 DeepSeek
支持 DeepSeek-R1 的蒸餾變體是 IBM 致力于AI開源創(chuàng)新的一部分。DeepSeek Llama 的兩個(gè)蒸餾模型都以納入 IBM watsonx.ai 上按需部署目錄,能夠在專用 GPU 上按小時(shí)部署。
如何從watsonx資源中心按需部署R1模型
從資源中心按需部署基礎(chǔ)模型,請完成以下步驟:
IBM watsonx.ai 在這里會(huì)用斜體顯示模型的思維過程,而最終輸出則用非斜體顯示。正如你所見,只需一個(gè)簡單的提示,模型就能推理并規(guī)劃出響應(yīng)中需要包含的各個(gè)部分。
如何通過 REST API 在 watsonx 上部署 R1 模型
或者, 您也可以使用 REST API 來部署模型
當(dāng)然,您必須將 bearer token 和 space-id 等信息替換為相應(yīng)的憑證。模型部署完成后,您可以從 Prompt Lab 或 watsonx.ai API 提示基礎(chǔ)模型。
通過讓用戶訪問 watsonx.ai 上同類最優(yōu)的開源模型(包括第三方模型和 IBM Granite),我們以期能夠塑造協(xié)作和知識(shí)共享的文化。
即刻試用watsonx.ai?中的DeepSeek-R1精餾模型 → 了解更多
關(guān)于IBM
IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商,幫助超過 175 個(gè)國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡化業(yè)務(wù)流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過 4000 家政府和企業(yè)實(shí)體依靠 IBM 混合云平臺(tái)和紅帽 OpenShift 快速、高效、安全地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計(jì)算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會(huì)責(zé)任、包容文化和服務(wù)精神的長期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。了解更多信息,請?jiān)L問:https://www.ibm.com/cn-zh
IBM 媒體聯(lián)系人:
郭韜 gguotao@cn.ibm.com