下載客戶端

登錄

盤點AI黃金周：Sora 2引爆AI視頻、螞蟻沖進(jìn)萬億參數(shù)俱樂部

2025-10-03 16:21

來源：澎湃新聞·澎湃號·湃客

文｜白鴿

編｜王一粟

這個十一黃金周，AI圈真的很熱鬧。

10月1日凌晨，OpenAI深夜炸場，正式官宣新一代AI視頻模型Sora 2，并直接上線了一個AI版的“抖音”——一個完全由AI來生成視頻的短視頻平臺。

就在Sora 2發(fā)布之前，這一輪的大模型發(fā)布其實已經(jīng)卷起來了。

黃金周前夕，先是國內(nèi)大模型公司深度求索宣布推出DeepSeek-V3.2-Exp實驗版模型，緊隨其后智譜AI正式發(fā)布新一代大模型GLM-4.6。

中國大模型也引起了圖靈獎得主楊立昆的關(guān)注。就在9月30日，螞蟻集團(tuán)旗下百靈大模型宣布開源其思考模型Ring-1T的預(yù)覽版Ring-1T-preview，參數(shù)量達(dá)1000B（1萬億）。“令人印象深刻，祝賀你們的團(tuán)隊?！痹诎凫`最新思考大模型發(fā)布后，楊立昆在社交平臺上也給中國大模型點了贊。

而在大洋彼岸，Claude Sonnet 4.5同期發(fā)布。谷歌Gemini 3.0也預(yù)計將在10月迎戰(zhàn)。

顯然，全球大模型進(jìn)入了一個新的井噴期，各家在大模型產(chǎn)品和技術(shù)迭代上，都在明顯加速。據(jù)不完全統(tǒng)計，僅9月全球就有15家主流企業(yè)/機(jī)構(gòu)發(fā)布了開源大模型，數(shù)量較8月激增70%。

開源大模型的熱潮，也是開發(fā)者的盛宴。有開發(fā)者都在社交媒體上感慨：一天測了3個模型，還有一個沒測試，這還只是周一......

在這其中，中國大模型憑借場景化能力，正撕開半壁江山。

據(jù)光錐智能觀察來看，這一波AI大模型的更新，更聚焦在細(xì)分場景中，比如智譜最新大模型在編程方面的能力更加突出，螞蟻的百靈大模型則聚焦在自然語言推理領(lǐng)域。

更為重要的一點在于，當(dāng)OpenAI開始學(xué)字節(jié)跳動做產(chǎn)品時，大模型市場的游戲規(guī)則變了。如果說，2023年討論大模型參數(shù)天花板，那么，2025年，大模型真正的戰(zhàn)場則在場景適配與效率革命。

從OpenAI的Sora 2到螞蟻的萬億推理模型，新一輪的大模型“軍備競賽”已然打響，而行業(yè)共識則愈發(fā)清晰：大模型已從“通用能力比拼”邁入“細(xì)分技術(shù)突圍”的深水區(qū)。

那么，在這新一輪AI大模型競賽中，后來者又該如何在開源生態(tài)中突圍？

深度盤點9月大模型，AI大模型“百花齊放”

金九銀十的月份，各行各業(yè)都在持續(xù)加碼，大模型賽道也同樣“卷”的不行。

據(jù)不完全統(tǒng)計，在剛剛過去的9月，全球數(shù)十家企業(yè)共計發(fā)布了40多款大模型產(chǎn)品，涵蓋基礎(chǔ)通用大模型、深度思考推理大模型、編程、具身智能、翻譯、視頻生成等不同細(xì)分賽道。

（海外開發(fā)者統(tǒng)計的部分9月開源模型）

具體來看，這些模型有的側(cè)重高效推理，如帶“Flash”字樣的螞蟻集團(tuán)inclusionAI的Ring-flash-linear-2.0、美團(tuán)LongCat Flash Chat；有的則聚焦多模態(tài)能力，如阿里通義Qwen3-VL；也有的針對輕量化/移動端，如Meta AI發(fā)布的MobileLLM-R1-950M、螞蟻Ling-mini-2.0、Ring-mini-2.0等。

可以很明顯看到，9月份AI大模型“通用能力、專用場景、部署形態(tài)”等維度的全面發(fā)展，不同廠商、不同技術(shù)路線的大模型“百花齊放”，構(gòu)成了豐富的LLM生態(tài)。

在這其中，中國大模型產(chǎn)品占據(jù)半壁江山，并與海外市場的大模型產(chǎn)品形成了技術(shù)分化。

具體來看，相比較此前各家關(guān)注的參數(shù)規(guī)模競賽，現(xiàn)已經(jīng)讓位于效率革命，MoE（混合專家模型）架構(gòu)成為絕對主流。

如螞蟻百靈大模型最新開源的Ring-1T-preview，其底座Ring-1T是一個擁有萬億參數(shù)的深度思考模型，該開源模型延續(xù)Ling 2.0高效MoE架構(gòu)，在20T高質(zhì)量語料上完成預(yù)訓(xùn)練，結(jié)合此前公開的棒冰（icepop）方法，在自研高效強(qiáng)化學(xué)習(xí)系統(tǒng)ASystem（其中AReaL框架已開源）上進(jìn)行針對推理能力的RLVR訓(xùn)練。

有蘋果工程師在單個M3 Ultra芯片上運行Ring-1T-preview，量化的效果接近GPT-5，還能直接生成《太空侵略者》小游戲。

（蘋果工程師量化后部署Ring-1T-preview，游戲模擬效果）

這種“大參數(shù)儲備+小參數(shù)激活”的范式，解決了“性能與成本”的核心矛盾，使超大規(guī)模模型從實驗室走向具體行業(yè)場景。

從對開發(fā)者開放角度來看，海外陣營中，谷歌EmbeddingGemma主打端側(cè)隱私嵌入，Anthropic 開放 Claude Code API，仍停留在工具型開源。

但相比較來說，中國大模型產(chǎn)品更注重場景化能力，比如螞蟻專攻自然語言推理，騰訊突破小語種翻譯，形成“場景驅(qū)動型開源”。

這種差異在落地效果上立竿見影。如快手將Keye-VL 1.5嵌入審核系統(tǒng)，違規(guī)識別準(zhǔn)確率達(dá)98.7%；愛詩科技的AI插畫模型對接電商平臺，把詳情頁制作成本降低80%。

事實上，中國大模型產(chǎn)品已經(jīng)在各個細(xì)分領(lǐng)域全面開花，比如語音交互中，階躍星辰Step-Audio 2 mini支持語音直接調(diào)用工具，某智能音箱廠商反饋“喚醒準(zhǔn)確率提升至99.2%”；螞蟻健康管家AQ產(chǎn)品識別報告、藥盒、皮膚病等醫(yī)療圖像準(zhǔn)確率達(dá)90%以上，包括對100多種復(fù)雜多頁檢查報告的識別與解讀。

在翻譯領(lǐng)域，騰訊 Hunyuan-MT-7B 在 30 個語種翻譯中奪冠，跨境電商賣家實測“小語種轉(zhuǎn)化率提升27%”；同時，3D生成賽道中，騰訊混元Voyager可實現(xiàn)原生3D重建，游戲公司開發(fā)者稱 “場景制作周期從 1 周縮至 4 小時”。

另外，值得關(guān)注的一點是，相比于大模型創(chuàng)業(yè)公司的單點輸出，聚焦某一個細(xì)分行業(yè)，中國互聯(lián)網(wǎng)大廠們正逐漸形成體系化的產(chǎn)品更新，覆蓋基礎(chǔ)通用大模型、深度思考大模型、編程大模型、多模態(tài)大模型、視頻生成大模型等多品類大模型產(chǎn)品，典型的產(chǎn)品就是阿里巴巴旗下的通義千問、騰訊的混元大模型、字節(jié)跳動的豆包大模型等。

而這種生態(tài)優(yōu)勢，也正在轉(zhuǎn)化為全球影響力。據(jù)Hugging Face最新數(shù)據(jù)顯示，中文開源模型的fork量在9月增長180%。9月Hugging Face榜單顯示，阿里通義7款模型占據(jù)全球前十開源模型席位，Qwen3-Omni 登頂榜首，標(biāo)志著中國從“開源參與者”升級為“生態(tài)定義者”。

（9月28日， Hugging Face 模型榜單）

而中國大模型的“技術(shù)普惠+商業(yè)賦能”的開源模式，正在重塑全球AI產(chǎn)業(yè)格局。

“2023年我們追著OpenAI跑，2025年在金融推理、中文語音等領(lǐng)域，國外團(tuán)隊開始抄我們的作業(yè)?！币晃簧罡鸄I的連續(xù)創(chuàng)業(yè)者的調(diào)侃，道出了中國開源的新底氣。

模型開源競爭激烈，新來者蓄勢待發(fā)

為什么中國大模型能夠如此快速實現(xiàn)趕超？

這背后離不開開源戰(zhàn)略的選擇。據(jù)《全球大模型開源生態(tài)報告》顯示，中美開發(fā)者貢獻(xiàn)占比超四成，尤其是中國廠商非常注重以“開放策略”搶占生態(tài)主動權(quán)。而就在今年初，始終堅持閉源路線的OpenAI也開始走開源路線。

相比較來說，中國最早且始終堅持走開源路線的阿里通義千問，已經(jīng)在開源生態(tài)中占據(jù)了領(lǐng)導(dǎo)地位。那么，后來者還有機(jī)會嗎？

9月，螞蟻集團(tuán)旗下百靈大模型以平均每4天一款的速度，密集發(fā)布了7款大模型：

5日推出“端側(cè)雙雄”Ling-mini-2.0與Ring-mini-2.0；12日上線MoE架構(gòu)的Ling-flash-2.0，19日上線Ring-flash-2.0；26日推出2款混合架構(gòu)推理優(yōu)化模型Ring-flash-linear-2.0與Ring-mini-linear-2.0；30日以萬億參數(shù)的Ring-1T-preview壓軸。

模型剛發(fā)布完，Ring-1T-preview就登上了開源社區(qū)Hugging Face模型趨勢榜第三，第四名也是螞蟻inclusionAI社區(qū)的Ring-flash-linear-2.0。

放眼全球，這個月只有螞蟻的開源大模型數(shù)量，能比肩阿里通義千問?？梢哉f，螞蟻已經(jīng)成為了開源大模型的新晉“攪局者”。

從阿里、智譜、螞蟻等身上也能看到，中國的開源大模型尤其擅長“組合拳”——“全類型覆蓋、全尺寸適配、全鏈條開源”。

這種模型版圖早已突破語言模型的單一維度，構(gòu)建起“基礎(chǔ)通用+垂直專業(yè)”的完整矩陣：

以螞蟻為例，在語言和推理上，Ling系列作為基座模型，通MoE架構(gòu)優(yōu)化實現(xiàn)“思考效率躍升”。最新Ling-flash-2.0在AIME數(shù)學(xué)競賽、CodeForces編程任務(wù)中超越GPT-OSS-120B等大模型，尤其在前端研發(fā)場景，經(jīng)WeaveFox團(tuán)隊聯(lián)合優(yōu)化后，能同時滿足UI布局功能性與美學(xué)需求。而Ring-1T-preview更將推理精度推至新高度，92.6分的AIME成績僅比GPT-5低2分。

多模態(tài)深度融合能力上，Ming-lite-omni系列實現(xiàn)“能看、能聽、能說、能畫”的全感官交互，發(fā)布一周內(nèi)就被社區(qū)貢獻(xiàn)出消費級顯卡可運行的量化版本，其1.5版一度登頂Hugging Face趨勢榜榜首。其創(chuàng)新的視覺增強(qiáng)獎勵（VAR）機(jī)制，解決前端開發(fā)中“功能與美學(xué)脫節(jié)”的行業(yè)痛點。

而在垂直場景中，依托螞蟻在金融、醫(yī)療領(lǐng)域的場景積累，模型在專業(yè)數(shù)據(jù)上完成針對性訓(xùn)練。例如醫(yī)療模型通過結(jié)構(gòu)化病歷語料優(yōu)化，民生服務(wù)場景模型已支撐社保查詢、政務(wù)辦理等實際應(yīng)用。

顯然，這種布局跳出了“為技術(shù)而技術(shù)”的陷阱，每個模型都錨定明確的產(chǎn)業(yè)價值。

另外，在參數(shù)膨脹與落地難的矛盾中，螞蟻走出了一條“全尺寸彈性適配” 的差異化路徑，實現(xiàn)從消費級設(shè)備到云端算力的無縫覆蓋。

如Ling-mini-2.0以1B以下激活參數(shù)實現(xiàn)蘋果設(shè)備本地運行，響應(yīng)速度較同類模型提升2倍，可解決隱私敏感場景下的“云端依賴癥”。開發(fā)者可直接部署輕量化問答、本地翻譯等應(yīng)用。

其Ling-flash-2.0僅激活6.1B參數(shù)，卻能達(dá)到40B Dense模型的效果，在H20平臺實現(xiàn)200+tokens/s的生成速度，部署成本降低60%以上。這種 “以小博大”的能力，讓中小企業(yè)無需重金算力即可享受大模型紅利。

而Ming-lite-omni 1.5在保持文本、圖像、語音融合能力的同時，通過INT8量化技術(shù)適配消費級顯卡，成為短視頻創(chuàng)作、智能硬件交互等場景的首選開源方案。

更為重要的是，其Ring-1T-preview的開源打破了萬億參數(shù)模型的閉源現(xiàn)狀，其基于Ling-2.0 MoE架構(gòu)和20T語料訓(xùn)練的技術(shù)底座，讓全球開發(fā)者首次能接觸到頂尖推理能力的模型權(quán)重。

從“口袋里的AI” 到“云端超腦”，螞蟻用四級尺寸矩陣，覆蓋了從個人開發(fā)者到企業(yè)級用戶的全場景需求，這正是其開源生態(tài)快速起量的關(guān)鍵。

螞蟻在大模型賽道異軍突起并非偶然，一方面其能夠快速把握行業(yè)發(fā)展趨勢，讓大模型的迭代不再陷入?yún)?shù)競賽，而是敢于攻克“難而正確的事”。

深扒螞蟻發(fā)起的inclusionAI社區(qū)就會發(fā)現(xiàn)，他們毫不吝嗇的分享了很多在AI技術(shù)上的關(guān)鍵技術(shù)思考和進(jìn)展。比如，螞蟻發(fā)現(xiàn)了“編輯式圖像分割”這個技術(shù)，對于多模態(tài)模型的生成和理解的統(tǒng)一有著非常好的作用，堪比關(guān)鍵的“催化劑”，立馬就發(fā)文分享給所有開發(fā)者。

另一方面，當(dāng)前大模型開源已經(jīng)進(jìn)入全棧競爭時代，單純開放模型權(quán)重已無法形成壁壘，螞蟻通過ATorch框架、數(shù)據(jù)標(biāo)準(zhǔn)、強(qiáng)化學(xué)習(xí)工具的協(xié)同開源，構(gòu)建了“接入-訓(xùn)練-部署”的閉環(huán)生態(tài)，這有可能成為未來開源競爭的核心護(hù)城河。

中國廠商的全維度開源，正吸引全球開發(fā)者向中文生態(tài)聚集。開源模式將加速模型的迭代，中國大模型產(chǎn)業(yè)或?qū)⒆叱鲆粭l“生態(tài)換市場、開放換速度”的崛起之路。

場景里的AGI，中國走在前面

閉源模型更多承擔(dān)“技術(shù)標(biāo)桿”角色，但開源模型已成為產(chǎn)業(yè)落地的核心載體。

中國大模型生態(tài)正憑借對產(chǎn)業(yè)的深度理解和扎根具體場景化的能力，正走在全球AI產(chǎn)業(yè)的前列。

在這個AI黃金周，我們看到的不僅是技術(shù)突破，更是一種全新的發(fā)展邏輯：不追求“全能冠軍”，而是爭當(dāng)“單項尖兵”；不止步于模型開源，更聚焦于生態(tài)落地。

當(dāng)全球都在學(xué)習(xí)“場景化思維”，中國團(tuán)隊早已手握先發(fā)優(yōu)勢。

這或許就是國產(chǎn)大模型“不止半壁江山”的真正密碼：AGI從不是遙不可及的神話，而是在企業(yè)AI數(shù)字員工扎根業(yè)務(wù)場景，AI智能客服更具備個性化能力，借助AI人人都可以進(jìn)行編程等場景中，被無數(shù)個具體的技術(shù)突破匯聚而成的浪潮。

而這股浪潮，正從中國駛向全球。

特別聲明

本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#螞蟻集團(tuán)