- +1
階躍星辰宣布開源圖生視頻模型,多模態(tài)領(lǐng)域的DeepSeek時刻何時來?
2月22日,2025全球開發(fā)者先鋒大會(GDC)正式開幕。

這是2月21日在上海徐匯西岸穹頂藝術(shù)中心拍攝的2025全球開發(fā)者先鋒大會“模速空間”專場活動現(xiàn)場。2月21日至23日,以“模塑全球 無限可能”為主題的2025全球開發(fā)者先鋒大會在上海舉辦。據(jù)悉,全球開發(fā)者先鋒大會源自世界人工智能大會,定位為開發(fā)者“社區(qū)的社區(qū)”,已舉辦兩屆。新華社 圖
本次大會以“模塑全球 無限可能”為主題,圍繞5個重點領(lǐng)域和6個重點行業(yè),加快實施“模塑申城”工程,展開開發(fā)者大講壇、開發(fā)者競賽、GDC Street互動體驗,工作坊、GDC開放麥、創(chuàng)業(yè)項目路演等,集中呈現(xiàn)人工智能對產(chǎn)業(yè)、工作、生活等方面帶來的積極變化。
大模型的落地應(yīng)用、社區(qū)生態(tài)以及開源成為本次大會的熱點話題。國內(nèi)大模型“六小虎”中最為低調(diào)的上海階躍星辰智能科技有限公司(以下簡稱“階躍星辰”)在大會期間也首次舉辦了生態(tài)開放日活動,集中展示大模型技術(shù)賦能下的豐富應(yīng)用場景與創(chuàng)新體驗。
落地與開源并重
隨著春節(jié)期間國產(chǎn)開源大模型DeepSeek走紅,AI社區(qū)開發(fā)者也開始探討,在多模態(tài)領(lǐng)域能否出現(xiàn)這樣強大的模型。
有著多模態(tài)領(lǐng)域深厚積累的階躍星辰選擇為開源貢獻自己的力量,首次進行了模型開源。
在大會期間,階躍星辰與吉利聯(lián)合宣布將雙方合作的階躍兩款Step系列多模態(tài)大模型向全球開發(fā)者開源。包括參數(shù)量300億,可直接生成204幀、540P分辨率高質(zhì)量視頻的視頻生成模型Step-Video-T2V,以及能根據(jù)不同場景生成情緒、方言、語種、歌聲和個性化風(fēng)格,和用戶自然地高質(zhì)量對話的語音交互大模型Step-Audio。
階躍星辰創(chuàng)始人、CEO姜大昕在開放日現(xiàn)場表示,兩款模型自開源以來得到了廣泛關(guān)注,產(chǎn)業(yè)側(cè)有更多伙伴加入了開源生態(tài),包括技術(shù)社區(qū)、創(chuàng)作社區(qū)、芯片、云廠商、產(chǎn)業(yè)方等。
姜大昕還透露了階躍星辰推理模型的最新研究進展——Open-Reasoner-Zero,采用了與OpenAI的o系列模型和DeepSeek-R1類似的強化學(xué)習(xí)算法,訓(xùn)練效率是DeepSeek-R1-Zero的25倍,這一探索的所有的實驗結(jié)果、代碼、數(shù)據(jù)以及論文也都計劃進行開源。
此外,他還表示階躍星辰3月將繼續(xù)開源圖生視頻模型。同時,公司內(nèi)部也正在研發(fā)推進能夠?qū)崿F(xiàn)視覺空間下慢思考的視覺推理模型。
多位開發(fā)者在現(xiàn)場向記者表示,不同于重投入的基礎(chǔ)大模型研發(fā),以階躍為代表的企業(yè)與開源社區(qū)深化合作,可以匯聚廣大開發(fā)者的力量,推動更加專業(yè)的垂類模型產(chǎn)品落地,能更好地觸達、更精準(zhǔn)地滿足使用者的需求。
“實現(xiàn)AGI的必經(jīng)之路”
階躍星辰于2023年4月在上海市徐匯區(qū)成立,由微軟前全球副總裁姜大昕創(chuàng)辦,ResNet作者之一的AI科學(xué)家張祥雨、擁有豐富大規(guī)模集群與系統(tǒng)建設(shè)經(jīng)驗的AI系統(tǒng)專家朱亦博等“大?!倍枷群蠹尤?,目前公司研發(fā)人員占比在80%以上。
階躍星辰因其Step系列基座模型研發(fā)速度快、多模態(tài)性能強,被業(yè)內(nèi)稱作多模態(tài)“卷王”。根據(jù)姜大昕的規(guī)劃,階躍星辰實現(xiàn)AGI的技術(shù)路線是:“單模態(tài)-多模態(tài)-多模理解和生成的統(tǒng)一-世界模型-AGI”。
在GDC開發(fā)者大會期間,姜大昕再次表示,多模態(tài)模型是實現(xiàn)AGI的必經(jīng)之路,但目前尚處于早期階段,AGI的實現(xiàn)離不開開發(fā)者的共同努力。
去年至今,階躍星辰一共發(fā)布了十余款自研基座模型,包括千億參數(shù)語言大模型Step-1、萬億參數(shù)語言大模型Step-2、圖像理解大模型Step-1V、圖像生成大模型Step-1X、多模態(tài)理解大模型Step-1.5V、視頻生成大模型Step-Video、語音復(fù)刻和生成大模型Step-tts-mini、語音識別大模型Step-Asr、國內(nèi)首個千億參數(shù)端到端語音大模型Step-1o Audio等。
其中,Step-2是國內(nèi)首個由大模型創(chuàng)業(yè)公司發(fā)布的萬億參數(shù)模型。Step系列模型也多次在國內(nèi)外權(quán)威大模型評測榜單上位列中國大模型第一。
今年以來,階躍星辰已經(jīng)接連發(fā)布了多款新模型,包括自研推理模型Step Reasoner mini、Step-2 mini、多模態(tài)理解大模型Step-1o Vision、Step-Video V2等。
階躍星辰還在去年年底剛剛完成了數(shù)億美元的B輪融資,核心投資方包括上海國有資本投資有限公司及其旗下基金,戰(zhàn)略和財務(wù)投資人包括騰訊投資、五源資本、啟明創(chuàng)投等。
彼時,一位持續(xù)跟進大模型融資的投資人表示,獲得多家不同屬性的知名專業(yè)投資機構(gòu)青睞,說明資本市場看好階躍星辰基座模型的技術(shù)領(lǐng)先性、產(chǎn)品差異化和商業(yè)化潛力,均衡的股東結(jié)構(gòu)也會讓階躍未來有更大發(fā)揮空間。
姜大昕在開放日上表示,隨著多模態(tài)和慢思考在2024年取得了顯著進展,Agent(智能體)將會是階躍未來發(fā)展的重要方向。
他表示:“現(xiàn)在機器的思考能力比較弱,只能思考幾十秒鐘,最多幾分鐘,隨著模型能力增強,思考時間越來越長,范圍越來越寬廣,意味著我們距離AGI的目標(biāo)也越來越近了。”
當(dāng)天,階躍星辰宣布了在汽車、手機、具身智能、IoT等關(guān)鍵應(yīng)用場景的智能終端和Agent布局,與吉利、千里科技深化技術(shù)合作,推動“AI+車”的深度融合,還與智元機器人達成戰(zhàn)略合作,探索AI+具身機器人應(yīng)用場景。
“上海擁有全國最好的大模型創(chuàng)新生態(tài)”
在記者探營階躍星辰時,該公司副總裁李璟表示,今年將是大模型應(yīng)用爆發(fā)的很重要一年。上海擁有全國最好的大模型創(chuàng)新生態(tài),不論是模型創(chuàng)新還是算力數(shù)據(jù),上海的生態(tài)布局是最全最深的;在應(yīng)用方面,依托模速空間以及上海市的各方面政策,也已有很多垂直領(lǐng)域的大模型率先落地。
上海近年來一直致力于打造人工智能發(fā)展全產(chǎn)業(yè)鏈生態(tài),經(jīng)過幾年的培育不斷夯實各種生態(tài)要素,強化產(chǎn)業(yè)生態(tài)打造,圍繞大模型、人形機器人,形成了西有徐匯模速空間、東有浦東模力社區(qū)一硬一軟的發(fā)展格局,此前還成立了225億元的人工智能先導(dǎo)母基金。
2024年上海人工智能的產(chǎn)業(yè)規(guī)模達到4500億元,同比增長7%,跨界融合開放融通的生態(tài)體系正加速形成。
在本屆GDC開發(fā)者大會上,模速空間以“全球最大的人工智能孵化器”為新定位全新亮相。截至去年年底,模速空間已有255家大模型企業(yè)、34個備案大模型、100余家投資機構(gòu)成功落地,建成涵蓋上游要素層、中游模型層、下游垂類應(yīng)用的全鏈條產(chǎn)業(yè)生態(tài)。
據(jù)了解,本屆GDC開發(fā)者大會將推出超百個應(yīng)用場景的招標(biāo)項目,在2025世界人工智能大會上將持續(xù)為開發(fā)者賦能。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司