IBM 推出Granite 3.2：全新企業(yè)級多模態(tài)及推理的AI模型

IBM China

2025-03-04 21:31 3458

Granite 3.2是小型的 AI 模型，通過對開發(fā)人員友好的授權(quán)條款，提供推理、視覺和護(hù)欄功能
更新后的 Granite 時(shí)間序列模型可提供長期預(yù)測，參數(shù)少于10M；適用于金融與經(jīng)濟(jì)趨勢分析、供應(yīng)鏈需求預(yù)測，以及零售業(yè)的季節(jié)性庫存規(guī)劃等用例

北京, 2025年3月4日 /美通社/ -- IBM于2月底推出其 Granite 大型語言模型家族的最新一代產(chǎn)品 Granite 3.2，持續(xù)推動(dòng)小型、高效、企業(yè)專用的 AI，為實(shí)際應(yīng)用創(chuàng)造效益。

IBM 推出 Granite 3.2 大語言模型，體現(xiàn) IBM 發(fā)展企業(yè)專用、小型、高效與實(shí)用 AI 的策略。

所有 Granite 3.2 模型均采用寬松的 Apache 2.0 開源授權(quán)條款，可在 Hugging Face 下載。部分模型現(xiàn)已在 IBM watsonx.ai、Ollama、Replicate 和 LM Studio 上提供，預(yù)計(jì)不久將支援 RHEL AI 1.5，為企業(yè)與開源社區(qū)注入更強(qiáng)大的 AI 能力。

主要亮點(diǎn)

全新視覺語言模型：專為理解文件任務(wù)而設(shè)計(jì)，在關(guān)鍵企業(yè)基準(zhǔn)測試 DocVQA、ChartQA、AI2D 和 OCRBench^[1] 中，表現(xiàn)可媲美甚至超越更大規(guī)模的模型（如 Llama 3.2 11B 和 Pixtral 12B）。除了強(qiáng)大的訓(xùn)練數(shù)據(jù)外，IBM 也利用其開源 Docling 工具包處理8千5百萬份 PDF 文件，并生成2千6百萬個(gè)合成問答配對，提升視覺語言模型在處理大量文件工作流時(shí)的能力。
增強(qiáng)推理功能：Granite 3.2的2B與8B模型加入了「思維鏈」（Chain of Thought，CoT）推理機(jī)制，且使用者可以開啟或關(guān)閉推理功能以優(yōu)化效率。通過這項(xiàng)能力，8B 模型在 ArenaHard 和 Alpaca Eval 等指令遵循基準(zhǔn)測試中的表現(xiàn)^[2]，比前一代優(yōu)異比例達(dá)到兩位數(shù)，且不影響其他領(lǐng)域的安全性或性能。此外，通過創(chuàng)新的推理擴(kuò)展方法，Granite 3.2 8B 模型可以調(diào)整至接近 Claude 3.5 Sonnet 或 GPT-4o 在數(shù)學(xué)推理基準(zhǔn)（如 AIME2024 和 MATH500^[3]）上的表現(xiàn)。
Granite Guardian 安全模型更輕巧：在保持 Granite 3.1 Guardian 模型性能的同時(shí)，模型尺寸減少三成。此外，Granite 3.2 系列還引入了語言化信心評估（Verbalized Confidence）新功能，可提供更精細(xì)的風(fēng)險(xiǎn)評估，幫助安全監(jiān)測系統(tǒng)識別不確定性。

IBM 持續(xù)推動(dòng)企業(yè)專用的小型 AI 模型策略，并已在測試中展現(xiàn)高效能。例如，Granite 3.1 8B 模型在 Salesforce 大型語言模型CRM基準(zhǔn)測試中獲得高分，顯示其在實(shí)際應(yīng)用中的準(zhǔn)確度和可靠性。

IBM Granite 模型家族擁有廣大的合作伙伴生態(tài)體系，許多領(lǐng)先的軟件公司已將Granite模型嵌入其技術(shù)。Granite 3.2 是 IBM 在推動(dòng)企業(yè)專用小型 AI 方面的重要進(jìn)展，體現(xiàn)了 IBM 致力于提供小型、高效、實(shí)用 AI 的產(chǎn)品策略。

CrushBank 首席技術(shù)官 David Tan 表示："在 CrushBank，我們親眼目睹了 IBM 開放、高效的人工智能模型如何為企業(yè)人工智能帶來真正的價(jià)值--在性能、成本效益和可擴(kuò)展性之間實(shí)現(xiàn)適當(dāng)?shù)钠胶?。Granite 3.2 通過新的推理功能更進(jìn)一步，我們很高興能在構(gòu)建新的代理（智能體）解決方案時(shí)探索這些功能。"

Granite 3.2 是 IBM 產(chǎn)品組合和戰(zhàn)略發(fā)展的重要一步，旨在為企業(yè)提供小型實(shí)用的 AI。雖然思維鏈在推理任務(wù)中表現(xiàn)強(qiáng)大，但它需要大量計(jì)算資源，并非所有任務(wù)都必須啟用。因此，IBM 在 Granite 3.2 模型中加入了程式化開關(guān)功能，使用者可以根據(jù)需求開啟或關(guān)閉推理模式；模型可在不啟用推理的情況下運(yùn)行較簡單的任務(wù)，以降低不必要的計(jì)算成本。

此外，其他推理技術(shù)（例如推理擴(kuò)展 Inference Scaling）已顯示 Granite 3.2 8B 模型能夠在標(biāo)準(zhǔn)數(shù)學(xué)推理基準(zhǔn)測試中，媲美甚至超越更大模型的性能。持續(xù)發(fā)展這項(xiàng)推理技術(shù)也是 IBM 研究團(tuán)隊(duì)的重點(diǎn)方向^[4]，以進(jìn)一步提升 AI 的效能與應(yīng)用范圍。

除了 Granite 3.2 的指令、視覺和防護(hù)模型之外，IBM 也推出了新一代 TinyTimeMixers（TTM）時(shí)間序列模型，這些模型的參數(shù)少于1千萬，具備長期預(yù)測能力，可進(jìn)行長達(dá)兩年的長期預(yù)測。這些模型為長期趨勢分析提供強(qiáng)大工具，適用于金融與經(jīng)濟(jì)趨勢分析、供應(yīng)鏈需求預(yù)測，以及零售業(yè)的季節(jié)性庫存規(guī)劃。

IBM AI 研究副總裁 Sriram Raghavan 表示："AI 的下一個(gè)時(shí)代將聚焦效率、整合與實(shí)際應(yīng)用的影響力 — 企業(yè)應(yīng)該能夠在不過度消耗計(jì)算資源的情境下，取得強(qiáng)大的 AI 效益。IBM 最新的 Granite 模型發(fā)展專注于開放式解決方案，逐步推動(dòng) AI 的普及，使其更具成本效益，為現(xiàn)代企業(yè)創(chuàng)造更大價(jià)值。"

欲了解Granite 3.2 的技術(shù)細(xì)節(jié)，請參閱相關(guān)技術(shù)文章。

關(guān)于IBM

IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商，幫助超過 175 個(gè)國家和地區(qū)的客戶，從其擁有的數(shù)據(jù)中獲取商業(yè)洞察，簡化業(yè)務(wù)流程，降低成本，并獲得行業(yè)競爭優(yōu)勢。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過 4000 家政府和企業(yè)實(shí)體依靠 IBM 混合云平臺和 Red Hat OpenShift 快速、高效、安全地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計(jì)算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責(zé)任、包容文化和服務(wù)精神的長期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。了解更多信息，請?jiān)L問：https://www.ibm.com/cn-zh

媒體聯(lián)絡(luò)人：

郭韜 gguotao@cn.ibm.com

[1] 視覺模型（Vision Model）的基準(zhǔn)測試結(jié)果可在 IBM技術(shù)文章《IBM Granite 3.2：推理、視覺、預(yù)測與更多應(yīng)用》（2025 年 2 月 26 日發(fā)布）中查閱。

[2] 指令模型（Instruct Model）的基準(zhǔn)測試結(jié)果可在 IBM 技術(shù)文章《IBM Granite 3.2：推理、視覺、預(yù)測與更多應(yīng)用》（2025 年 2 月 26 日發(fā)布）中查閱。

[3] 推理擴(kuò)展（Inference Scaling）的基準(zhǔn)測試結(jié)果可在 IBM技術(shù)研究部落格《Granite 3.2 中的推理：利用推理擴(kuò)展技術(shù)》（2025 年 2 月 26 日發(fā)布）中查閱。

[4] 推理擴(kuò)展技術(shù)在 Granite 3.2 中的應(yīng)用，IBM 技術(shù)研究部落格，2025 年 2 月 26 日發(fā)布

IBM Corporation logo.

消息來源：IBM China