- +1
IBM發(fā)布新的Granite 3.2系列模型,實(shí)現(xiàn)按需推理能力
為了在企業(yè)人工智能市場(chǎng)中開拓自己的領(lǐng)地,IBM 公司今天推出了新一代 Granite AI 模型系列,包含實(shí)驗(yàn)性推理能力、視覺和預(yù)測(cè)功能。
與以往每次發(fā)布一樣,IBM 以開放源代碼 Apache 2.0 許可證發(fā)布這些模型。所有 Granite 模型現(xiàn)已在 Hugging Face 上線,部分模型也可在 IBM watson.ai 及其他平臺(tái)上使用。
這個(gè)新系列包含旗艦級(jí)純文本大語言模型 Granite 3.2 Instruct,有 8B 和 2B 兩個(gè)版本。它可以執(zhí)行總結(jié)、問題解決和代碼生成等任務(wù),并且設(shè)計(jì)為可以遵循指令。這些類型的模型最適合構(gòu)建 AI 助手和代理。兩個(gè)版本都經(jīng)過訓(xùn)練,可以使用類似于其他行業(yè)標(biāo)準(zhǔn)模型的"思維鏈"推理,但 IBM 工程師特別設(shè)計(jì)了更小、性能更高的模型。
每個(gè)模型的推理能力都可以通過編程方式開啟或關(guān)閉。這意味著 IBM 不需要發(fā)布單獨(dú)的"推理模型",而是創(chuàng)建了一個(gè)可以在對(duì)話模式和推理模式之間切換的模型。由于推理在部署時(shí)需要大量計(jì)算資源,在不需要時(shí)關(guān)閉這一功能可以節(jié)省大量能源。
IBM AI 研究副總裁 Sriram Raghavan 表示:"AI 的下一個(gè)時(shí)代關(guān)注效率、集成和實(shí)際影響 - 企業(yè)無需過度投入計(jì)算資源就能實(shí)現(xiàn)強(qiáng)大的成果。"
推理模型通過"逐步"思考問題,業(yè)內(nèi)通常稱之為"思維鏈"。自 DeepSeek 的 R1 發(fā)布以來,這類模型越來越受歡迎。大多數(shù)推理模型會(huì)掃描整個(gè)推理空間以發(fā)現(xiàn)最佳邏輯"路徑",然后生成最終答案。然而,一旦確定某條路徑不可行,就沒有必要繼續(xù)探索整個(gè)路徑。
IBM 工程師開發(fā)了一種新穎的推理擴(kuò)展技術(shù),通過使用第二個(gè)過程獎(jiǎng)勵(lì)模型添加獎(jiǎng)勵(lì)系統(tǒng),降低了推理任務(wù)的計(jì)算成本。這個(gè)獎(jiǎng)勵(lì)模型會(huì)監(jiān)控大語言模型,并在推理過程中將其引導(dǎo)至具有更高置信度結(jié)果的邏輯路徑。結(jié)合可以掃描整個(gè)邏輯空間的搜索技術(shù),IBM 研究人員表示,與一體化的 R1 相比,他們能夠創(chuàng)建一個(gè)更小、更高效的推理模型方案。
SiliconANGLE 姐妹市場(chǎng)研究公司 theCUBE Research 的首席分析師 Dave Vellante 表示:"DeepSeek 的 R1 發(fā)布在某種程度上承認(rèn)了 IBM 更小、高效率的模型策略。IBM 的簡報(bào)強(qiáng)化了這一觀點(diǎn),指出 DeepSeek 早在 2024 年 12 月就使用了專家混合和其他效率方法,但直到最近 R1 受到關(guān)注才引起市場(chǎng)注意。我們認(rèn)為這呼應(yīng)了 IBM 在訓(xùn)練效率和專業(yè)架構(gòu)方面的方法。"
IBM 表示,Granite 3.2 8B 經(jīng)過調(diào)優(yōu)后,在 AIME2024 和 MATH500 等數(shù)學(xué)推理基準(zhǔn)測(cè)試中可以與 Claude 3.5 Sonnet 和 OpenAI GPT-4o 等更大的模型相媲美。
新的多模態(tài)視覺模型和更小的護(hù)欄模型
IBM 還發(fā)布了新的多模態(tài) Granite Vision 3.2 2B,具備計(jì)算機(jī)視覺能力,專門訓(xùn)練用于幫助企業(yè)處理視覺文檔理解。
Granite Vision 可以處理各種視覺理解任務(wù),但最適合處理文檔。雖然大多數(shù)視覺語言模型都是為視覺任務(wù)設(shè)計(jì)的,但很少有模型在光學(xué)字符或文本識(shí)別方面表現(xiàn)出色。IBM 的工程團(tuán)隊(duì)花費(fèi)了大量時(shí)間訓(xùn)練 Vision 3.2,使其能夠識(shí)別布局、字體、圖表和信息圖表的獨(dú)特視覺特征。
Granite Guardian 3.2 是 IBM 最新的護(hù)欄 AI 模型,旨在檢測(cè)和突出顯示提示和響應(yīng)中的風(fēng)險(xiǎn)。公司表示,它提供了與 3.1 相當(dāng)?shù)男阅埽俣雀?,成本更低?/p>
Guardian 3.2 的一個(gè)優(yōu)點(diǎn)是在監(jiān)控輸入和輸出時(shí)提供"口頭置信度"指示。它不是簡單地表示二元的"是"或"否",而是表達(dá)"高"或"低"的置信水平。這為開發(fā)人員提供了更好的指示,幫助他們判斷是否可以信任或拒絕輸出,給出了一個(gè)可以使用的閾值。
除了更新的 8B 版本外,IBM 還發(fā)布了兩個(gè)新的模型規(guī)模。第一個(gè)是精簡的 50 億參數(shù)版本,保持接近原始版本的性能。第二個(gè)是 Granite 3.2 3B-A800M,通過微調(diào)專家混合基礎(chǔ)模型創(chuàng)建。它通過一次只激活其 30 億參數(shù)中的 8 億參數(shù)來運(yùn)行,以實(shí)現(xiàn)低成本高性能。
IBM Granite 系列的最后一個(gè)模型包括緊湊型 Granite Timeseries 模型,也稱為 Tiny Time Mixers。最新添加的 Granite-Timeseries-TTM-R2.1 擴(kuò)展了模型功能,可以進(jìn)行長達(dá)兩年的日常和每周預(yù)測(cè)。時(shí)間序列模型適用于預(yù)測(cè)金融、經(jīng)濟(jì)、供應(yīng)鏈需求預(yù)測(cè)和零售季節(jié)性庫存規(guī)劃等行業(yè)的長期趨勢(shì)。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司