IBM發(fā)布新的Granite 3.2系列模型，實(shí)現(xiàn)按需推理能力

2025-02-28 11:32

來源：澎湃新聞·澎湃號(hào)·湃客

為了在企業(yè)人工智能市場(chǎng)中開拓自己的領(lǐng)地，IBM 公司今天推出了新一代 Granite AI 模型系列，包含實(shí)驗(yàn)性推理能力、視覺和預(yù)測(cè)功能。

與以往每次發(fā)布一樣，IBM 以開放源代碼 Apache 2.0 許可證發(fā)布這些模型。所有 Granite 模型現(xiàn)已在 Hugging Face 上線，部分模型也可在 IBM watson.ai 及其他平臺(tái)上使用。

這個(gè)新系列包含旗艦級(jí)純文本大語言模型 Granite 3.2 Instruct，有 8B 和 2B 兩個(gè)版本。它可以執(zhí)行總結(jié)、問題解決和代碼生成等任務(wù)，并且設(shè)計(jì)為可以遵循指令。這些類型的模型最適合構(gòu)建 AI 助手和代理。兩個(gè)版本都經(jīng)過訓(xùn)練，可以使用類似于其他行業(yè)標(biāo)準(zhǔn)模型的"思維鏈"推理，但 IBM 工程師特別設(shè)計(jì)了更小、性能更高的模型。

每個(gè)模型的推理能力都可以通過編程方式開啟或關(guān)閉。這意味著 IBM 不需要發(fā)布單獨(dú)的"推理模型"，而是創(chuàng)建了一個(gè)可以在對(duì)話模式和推理模式之間切換的模型。由于推理在部署時(shí)需要大量計(jì)算資源，在不需要時(shí)關(guān)閉這一功能可以節(jié)省大量能源。

IBM AI 研究副總裁 Sriram Raghavan 表示："AI 的下一個(gè)時(shí)代關(guān)注效率、集成和實(shí)際影響 - 企業(yè)無需過度投入計(jì)算資源就能實(shí)現(xiàn)強(qiáng)大的成果。"

推理模型通過"逐步"思考問題，業(yè)內(nèi)通常稱之為"思維鏈"。自 DeepSeek 的 R1 發(fā)布以來，這類模型越來越受歡迎。大多數(shù)推理模型會(huì)掃描整個(gè)推理空間以發(fā)現(xiàn)最佳邏輯"路徑"，然后生成最終答案。然而，一旦確定某條路徑不可行，就沒有必要繼續(xù)探索整個(gè)路徑。

IBM 工程師開發(fā)了一種新穎的推理擴(kuò)展技術(shù)，通過使用第二個(gè)過程獎(jiǎng)勵(lì)模型添加獎(jiǎng)勵(lì)系統(tǒng)，降低了推理任務(wù)的計(jì)算成本。這個(gè)獎(jiǎng)勵(lì)模型會(huì)監(jiān)控大語言模型，并在推理過程中將其引導(dǎo)至具有更高置信度結(jié)果的邏輯路徑。結(jié)合可以掃描整個(gè)邏輯空間的搜索技術(shù)，IBM 研究人員表示，與一體化的 R1 相比，他們能夠創(chuàng)建一個(gè)更小、更高效的推理模型方案。

SiliconANGLE 姐妹市場(chǎng)研究公司 theCUBE Research 的首席分析師 Dave Vellante 表示："DeepSeek 的 R1 發(fā)布在某種程度上承認(rèn)了 IBM 更小、高效率的模型策略。IBM 的簡報(bào)強(qiáng)化了這一觀點(diǎn)，指出 DeepSeek 早在 2024 年 12 月就使用了專家混合和其他效率方法，但直到最近 R1 受到關(guān)注才引起市場(chǎng)注意。我們認(rèn)為這呼應(yīng)了 IBM 在訓(xùn)練效率和專業(yè)架構(gòu)方面的方法。"

IBM 表示，Granite 3.2 8B 經(jīng)過調(diào)優(yōu)后，在 AIME2024 和 MATH500 等數(shù)學(xué)推理基準(zhǔn)測(cè)試中可以與 Claude 3.5 Sonnet 和 OpenAI GPT-4o 等更大的模型相媲美。

新的多模態(tài)視覺模型和更小的護(hù)欄模型

IBM 還發(fā)布了新的多模態(tài) Granite Vision 3.2 2B，具備計(jì)算機(jī)視覺能力，專門訓(xùn)練用于幫助企業(yè)處理視覺文檔理解。

Granite Vision 可以處理各種視覺理解任務(wù)，但最適合處理文檔。雖然大多數(shù)視覺語言模型都是為視覺任務(wù)設(shè)計(jì)的，但很少有模型在光學(xué)字符或文本識(shí)別方面表現(xiàn)出色。IBM 的工程團(tuán)隊(duì)花費(fèi)了大量時(shí)間訓(xùn)練 Vision 3.2，使其能夠識(shí)別布局、字體、圖表和信息圖表的獨(dú)特視覺特征。

Granite Guardian 3.2 是 IBM 最新的護(hù)欄 AI 模型，旨在檢測(cè)和突出顯示提示和響應(yīng)中的風(fēng)險(xiǎn)。公司表示，它提供了與 3.1 相當(dāng)?shù)男阅埽俣雀?，成本更低?/p>

Guardian 3.2 的一個(gè)優(yōu)點(diǎn)是在監(jiān)控輸入和輸出時(shí)提供"口頭置信度"指示。它不是簡單地表示二元的"是"或"否"，而是表達(dá)"高"或"低"的置信水平。這為開發(fā)人員提供了更好的指示，幫助他們判斷是否可以信任或拒絕輸出，給出了一個(gè)可以使用的閾值。

除了更新的 8B 版本外，IBM 還發(fā)布了兩個(gè)新的模型規(guī)模。第一個(gè)是精簡的 50 億參數(shù)版本，保持接近原始版本的性能。第二個(gè)是 Granite 3.2 3B-A800M，通過微調(diào)專家混合基礎(chǔ)模型創(chuàng)建。它通過一次只激活其 30 億參數(shù)中的 8 億參數(shù)來運(yùn)行，以實(shí)現(xiàn)低成本高性能。

IBM Granite 系列的最后一個(gè)模型包括緊湊型 Granite Timeseries 模型，也稱為 Tiny Time Mixers。最新添加的 Granite-Timeseries-TTM-R2.1 擴(kuò)展了模型功能，可以進(jìn)行長達(dá)兩年的日常和每周預(yù)測(cè)。時(shí)間序列模型適用于預(yù)測(cè)金融、經(jīng)濟(jì)、供應(yīng)鏈需求預(yù)測(cè)和零售季節(jié)性庫存規(guī)劃等行業(yè)的長期趨勢(shì)。

特別聲明

本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場(chǎng)，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。

我要舉報(bào)

#IBM