- +1
盤點AI黃金周:Sora 2引爆AI視頻、螞蟻沖進(jìn)萬億參數(shù)俱樂部

文|白 鴿
編|王一粟
這個十一黃金周,AI圈真的很熱鬧。
10月1日凌晨,OpenAI深夜炸場,正式官宣新一代AI視頻模型Sora 2,并直接上線了一個AI版的“抖音”——一個完全由AI來生成視頻的短視頻平臺。
就在Sora 2發(fā)布之前,這一輪的大模型發(fā)布其實已經(jīng)卷起來了。
黃金周前夕,先是國內(nèi)大模型公司深度求索宣布推出DeepSeek-V3.2-Exp實驗版模型,緊隨其后智譜AI正式發(fā)布新一代大模型GLM-4.6。
中國大模型也引起了圖靈獎得主楊立昆的關(guān)注。就在9月30日,螞蟻集團(tuán)旗下百靈大模型宣布開源其思考模型Ring-1T的預(yù)覽版Ring-1T-preview,參數(shù)量達(dá)1000B(1萬億)。“令人印象深刻,祝賀你們的團(tuán)隊?!痹诎凫`最新思考大模型發(fā)布后,楊立昆在社交平臺上也給中國大模型點了贊。

而在大洋彼岸,Claude Sonnet 4.5同期發(fā)布。谷歌Gemini 3.0也預(yù)計將在10月迎戰(zhàn)。
顯然,全球大模型進(jìn)入了一個新的井噴期,各家在大模型產(chǎn)品和技術(shù)迭代上,都在明顯加速。據(jù)不完全統(tǒng)計,僅9月全球就有15家主流企業(yè)/機(jī)構(gòu)發(fā)布了開源大模型,數(shù)量較8月激增70%。
開源大模型的熱潮,也是開發(fā)者的盛宴。有開發(fā)者都在社交媒體上感慨:一天測了3個模型,還有一個沒測試,這還只是周一......

在這其中,中國大模型憑借場景化能力,正撕開半壁江山。
據(jù)光錐智能觀察來看,這一波AI大模型的更新,更聚焦在細(xì)分場景中,比如智譜最新大模型在編程方面的能力更加突出,螞蟻的百靈大模型則聚焦在自然語言推理領(lǐng)域。
更為重要的一點在于,當(dāng)OpenAI開始學(xué)字節(jié)跳動做產(chǎn)品時,大模型市場的游戲規(guī)則變了。如果說,2023年討論大模型參數(shù)天花板,那么,2025年,大模型真正的戰(zhàn)場則在場景適配與效率革命。
從OpenAI的Sora 2到螞蟻的萬億推理模型,新一輪的大模型“軍備競賽”已然打響,而行業(yè)共識則愈發(fā)清晰:大模型已從“通用能力比拼”邁入“細(xì)分技術(shù)突圍”的深水區(qū)。
那么,在這新一輪AI大模型競賽中,后來者又該如何在開源生態(tài)中突圍?
深度盤點9月大模型,AI大模型“百花齊放”
金九銀十的月份,各行各業(yè)都在持續(xù)加碼,大模型賽道也同樣“卷”的不行。
據(jù)不完全統(tǒng)計,在剛剛過去的9月,全球數(shù)十家企業(yè)共計發(fā)布了40多款大模型產(chǎn)品,涵蓋基礎(chǔ)通用大模型、深度思考推理大模型、編程、具身智能、翻譯、視頻生成等不同細(xì)分賽道。

(海外開發(fā)者統(tǒng)計的部分9月開源模型)
具體來看,這些模型有的側(cè)重高效推理,如帶“Flash”字樣的螞蟻集團(tuán)inclusionAI的Ring-flash-linear-2.0、美團(tuán)LongCat Flash Chat;有的則聚焦多模態(tài)能力,如阿里通義Qwen3-VL;也有的針對輕量化/移動端,如Meta AI發(fā)布的MobileLLM-R1-950M、螞蟻Ling-mini-2.0、Ring-mini-2.0等。
可以很明顯看到,9月份AI大模型“通用能力、專用場景、部署形態(tài)”等維度的全面發(fā)展,不同廠商、不同技術(shù)路線的大模型“百花齊放”,構(gòu)成了豐富的LLM生態(tài)。
在這其中,中國大模型產(chǎn)品占據(jù)半壁江山,并與海外市場的大模型產(chǎn)品形成了技術(shù)分化。
具體來看,相比較此前各家關(guān)注的參數(shù)規(guī)模競賽,現(xiàn)已經(jīng)讓位于效率革命,MoE(混合專家模型)架構(gòu)成為絕對主流。
如螞蟻百靈大模型最新開源的Ring-1T-preview,其底座Ring-1T是一個擁有萬億參數(shù)的深度思考模型,該開源模型延續(xù)Ling 2.0高效MoE架構(gòu),在20T高質(zhì)量語料上完成預(yù)訓(xùn)練,結(jié)合此前公開的棒冰(icepop)方法,在自研高效強(qiáng)化學(xué)習(xí)系統(tǒng)ASystem(其中AReaL框架已開源)上進(jìn)行針對推理能力的RLVR訓(xùn)練。
有蘋果工程師在單個M3 Ultra芯片上運行Ring-1T-preview,量化的效果接近GPT-5,還能直接生成《太空侵略者》小游戲。

(蘋果工程師量化后部署Ring-1T-preview,游戲模擬效果)
這種“大參數(shù)儲備+小參數(shù)激活”的范式,解決了“性能與成本”的核心矛盾,使超大規(guī)模模型從實驗室走向具體行業(yè)場景。
從對開發(fā)者開放角度來看,海外陣營中,谷歌EmbeddingGemma主打端側(cè)隱私嵌入,Anthropic 開放 Claude Code API,仍停留在工具型開源。
但相比較來說,中國大模型產(chǎn)品更注重場景化能力,比如螞蟻專攻自然語言推理,騰訊突破小語種翻譯,形成“場景驅(qū)動型開源”。
這種差異在落地效果上立竿見影。如快手將Keye-VL 1.5嵌入審核系統(tǒng),違規(guī)識別準(zhǔn)確率達(dá)98.7%;愛詩科技的AI插畫模型對接電商平臺,把詳情頁制作成本降低80%。
事實上,中國大模型產(chǎn)品已經(jīng)在各個細(xì)分領(lǐng)域全面開花,比如語音交互中,階躍星辰Step-Audio 2 mini支持語音直接調(diào)用工具,某智能音箱廠商反饋“喚醒準(zhǔn)確率提升至99.2%”;螞蟻健康管家AQ產(chǎn)品識別報告、藥盒、皮膚病等醫(yī)療圖像準(zhǔn)確率達(dá)90%以上,包括對100多種復(fù)雜多頁檢查報告的識別與解讀。
在翻譯領(lǐng)域,騰訊 Hunyuan-MT-7B 在 30 個語種翻譯中奪冠,跨境電商賣家實測“小語種轉(zhuǎn)化率提升27%”;同時,3D生成賽道中,騰訊混元Voyager可實現(xiàn)原生3D重建,游戲公司開發(fā)者稱 “場景制作周期從 1 周縮至 4 小時”。
另外,值得關(guān)注的一點是,相比于大模型創(chuàng)業(yè)公司的單點輸出,聚焦某一個細(xì)分行業(yè),中國互聯(lián)網(wǎng)大廠們正逐漸形成體系化的產(chǎn)品更新,覆蓋基礎(chǔ)通用大模型、深度思考大模型、編程大模型、多模態(tài)大模型、視頻生成大模型等多品類大模型產(chǎn)品,典型的產(chǎn)品就是阿里巴巴旗下的通義千問、騰訊的混元大模型、字節(jié)跳動的豆包大模型等。
而這種生態(tài)優(yōu)勢,也正在轉(zhuǎn)化為全球影響力。據(jù)Hugging Face最新數(shù)據(jù)顯示,中文開源模型的fork量在9月增長180%。9月Hugging Face榜單顯示,阿里通義7款模型占據(jù)全球前十開源模型席位,Qwen3-Omni 登頂榜首,標(biāo)志著中國從“開源參與者”升級為“生態(tài)定義者”。

(9月28日, Hugging Face 模型榜單)
而中國大模型的“技術(shù)普惠+商業(yè)賦能”的開源模式,正在重塑全球AI產(chǎn)業(yè)格局。
“2023年我們追著OpenAI跑,2025年在金融推理、中文語音等領(lǐng)域,國外團(tuán)隊開始抄我們的作業(yè)?!币晃簧罡鸄I的連續(xù)創(chuàng)業(yè)者的調(diào)侃,道出了中國開源的新底氣。
模型開源競爭激烈,新來者蓄勢待發(fā)
為什么中國大模型能夠如此快速實現(xiàn)趕超?
這背后離不開開源戰(zhàn)略的選擇。據(jù)《全球大模型開源生態(tài)報告》顯示,中美開發(fā)者貢獻(xiàn)占比超四成,尤其是中國廠商非常注重以“開放策略”搶占生態(tài)主動權(quán)。而就在今年初,始終堅持閉源路線的OpenAI也開始走開源路線。
相比較來說,中國最早且始終堅持走開源路線的阿里通義千問,已經(jīng)在開源生態(tài)中占據(jù)了領(lǐng)導(dǎo)地位。那么,后來者還有機(jī)會嗎?
9月,螞蟻集團(tuán)旗下百靈大模型以平均每4天一款的速度,密集發(fā)布了7款大模型:
5日推出“端側(cè)雙雄”Ling-mini-2.0與Ring-mini-2.0;12日上線MoE架構(gòu)的Ling-flash-2.0,19日上線Ring-flash-2.0;26日推出2款混合架構(gòu)推理優(yōu)化模型Ring-flash-linear-2.0與Ring-mini-linear-2.0;30日以萬億參數(shù)的Ring-1T-preview壓軸。
模型剛發(fā)布完,Ring-1T-preview就登上了開源社區(qū)Hugging Face模型趨勢榜第三,第四名也是螞蟻inclusionAI社區(qū)的Ring-flash-linear-2.0。

放眼全球,這個月只有螞蟻的開源大模型數(shù)量,能比肩阿里通義千問??梢哉f,螞蟻已經(jīng)成為了開源大模型的新晉“攪局者”。
從阿里、智譜、螞蟻等身上也能看到,中國的開源大模型尤其擅長“組合拳”——“全類型覆蓋、全尺寸適配、全鏈條開源”。
這種模型版圖早已突破語言模型的單一維度,構(gòu)建起“基礎(chǔ)通用+垂直專業(yè)”的完整矩陣:
以螞蟻為例,在語言和推理上,Ling系列作為基座模型,通MoE架構(gòu)優(yōu)化實現(xiàn)“思考效率躍升”。最新Ling-flash-2.0在AIME數(shù)學(xué)競賽、CodeForces編程任務(wù)中超越GPT-OSS-120B等大模型,尤其在前端研發(fā)場景,經(jīng)WeaveFox團(tuán)隊聯(lián)合優(yōu)化后,能同時滿足UI布局功能性與美學(xué)需求。而Ring-1T-preview更將推理精度推至新高度,92.6分的AIME成績僅比GPT-5低2分。
多模態(tài)深度融合能力上,Ming-lite-omni系列實現(xiàn)“能看、能聽、能說、能畫”的全感官交互,發(fā)布一周內(nèi)就被社區(qū)貢獻(xiàn)出消費級顯卡可運行的量化版本,其1.5版一度登頂Hugging Face趨勢榜榜首。其創(chuàng)新的視覺增強(qiáng)獎勵(VAR)機(jī)制,解決前端開發(fā)中“功能與美學(xué)脫節(jié)”的行業(yè)痛點。

而在垂直場景中,依托螞蟻在金融、醫(yī)療領(lǐng)域的場景積累,模型在專業(yè)數(shù)據(jù)上完成針對性訓(xùn)練。例如醫(yī)療模型通過結(jié)構(gòu)化病歷語料優(yōu)化,民生服務(wù)場景模型已支撐社保查詢、政務(wù)辦理等實際應(yīng)用。
顯然,這種布局跳出了“為技術(shù)而技術(shù)”的陷阱,每個模型都錨定明確的產(chǎn)業(yè)價值。
另外,在參數(shù)膨脹與落地難的矛盾中,螞蟻走出了一條“全尺寸彈性適配” 的差異化路徑,實現(xiàn)從消費級設(shè)備到云端算力的無縫覆蓋。
如Ling-mini-2.0以1B以下激活參數(shù)實現(xiàn)蘋果設(shè)備本地運行,響應(yīng)速度較同類模型提升2倍,可解決隱私敏感場景下的“云端依賴癥”。開發(fā)者可直接部署輕量化問答、本地翻譯等應(yīng)用。
其Ling-flash-2.0僅激活6.1B參數(shù),卻能達(dá)到40B Dense模型的效果,在H20平臺實現(xiàn)200+tokens/s的生成速度,部署成本降低60%以上。這種 “以小博大”的能力,讓中小企業(yè)無需重金算力即可享受大模型紅利。
而Ming-lite-omni 1.5在保持文本、圖像、語音融合能力的同時,通過INT8量化技術(shù)適配消費級顯卡,成為短視頻創(chuàng)作、智能硬件交互等場景的首選開源方案。
更為重要的是,其Ring-1T-preview的開源打破了萬億參數(shù)模型的閉源現(xiàn)狀,其基于Ling-2.0 MoE架構(gòu)和20T語料訓(xùn)練的技術(shù)底座,讓全球開發(fā)者首次能接觸到頂尖推理能力的模型權(quán)重。
從“口袋里的AI” 到“云端超腦”,螞蟻用四級尺寸矩陣,覆蓋了從個人開發(fā)者到企業(yè)級用戶的全場景需求,這正是其開源生態(tài)快速起量的關(guān)鍵。
螞蟻在大模型賽道異軍突起并非偶然,一方面其能夠快速把握行業(yè)發(fā)展趨勢,讓大模型的迭代不再陷入?yún)?shù)競賽,而是敢于攻克“難而正確的事”。
深扒螞蟻發(fā)起的inclusionAI社區(qū)就會發(fā)現(xiàn),他們毫不吝嗇的分享了很多在AI技術(shù)上的關(guān)鍵技術(shù)思考和進(jìn)展。比如,螞蟻發(fā)現(xiàn)了“編輯式圖像分割”這個技術(shù),對于多模態(tài)模型的生成和理解的統(tǒng)一有著非常好的作用,堪比關(guān)鍵的“催化劑”,立馬就發(fā)文分享給所有開發(fā)者。
另一方面,當(dāng)前大模型開源已經(jīng)進(jìn)入全棧競爭時代,單純開放模型權(quán)重已無法形成壁壘,螞蟻通過ATorch框架、數(shù)據(jù)標(biāo)準(zhǔn)、強(qiáng)化學(xué)習(xí)工具的協(xié)同開源,構(gòu)建了“接入-訓(xùn)練-部署”的閉環(huán)生態(tài),這有可能成為未來開源競爭的核心護(hù)城河。
中國廠商的全維度開源,正吸引全球開發(fā)者向中文生態(tài)聚集。開源模式將加速模型的迭代,中國大模型產(chǎn)業(yè)或?qū)⒆叱鲆粭l“生態(tài)換市場、開放換速度”的崛起之路。
場景里的AGI,中國走在前面
閉源模型更多承擔(dān)“技術(shù)標(biāo)桿”角色,但開源模型已成為產(chǎn)業(yè)落地的核心載體。
中國大模型生態(tài)正憑借對產(chǎn)業(yè)的深度理解和扎根具體場景化的能力,正走在全球AI產(chǎn)業(yè)的前列。
在這個AI黃金周,我們看到的不僅是技術(shù)突破,更是一種全新的發(fā)展邏輯:不追求“全能冠軍”,而是爭當(dāng)“單項尖兵”;不止步于模型開源,更聚焦于生態(tài)落地。
當(dāng)全球都在學(xué)習(xí)“場景化思維”,中國團(tuán)隊早已手握先發(fā)優(yōu)勢。
這或許就是國產(chǎn)大模型“不止半壁江山”的真正密碼:AGI從不是遙不可及的神話,而是在企業(yè)AI數(shù)字員工扎根業(yè)務(wù)場景,AI智能客服更具備個性化能力,借助AI人人都可以進(jìn)行編程等場景中,被無數(shù)個具體的技術(shù)突破匯聚而成的浪潮。
而這股浪潮,正從中國駛向全球。
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司