中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

如何打通視頻模型商業(yè)化最后一公里??智象未來梅濤:技術(shù)之上還得構(gòu)建生態(tài)

澎湃新聞記者 喻琰
2025-06-09 08:09
來源:澎湃新聞
? 未來2% >
字號

過去一年,是視頻生成大模型領(lǐng)域眾聲喧嘩的一年,年初Sora引爆全場,隨后國內(nèi)眾多企業(yè)也都推出了自己的產(chǎn)品。行業(yè)競爭愈發(fā)激烈,能夠成功“跑通”的路徑也變得更加陡峭。探索如何實現(xiàn)商業(yè)化,成為眾多視頻生成創(chuàng)業(yè)者的困境。

在日前舉行的第7屆北京智源大會大模型產(chǎn)業(yè)CEO論壇上,智象未來創(chuàng)始人兼CEO 梅濤談及當(dāng)前視頻生成模型商業(yè)化過程中面臨的困境時坦言:“(目前)大模型商業(yè)化仍不明顯,離最后的商業(yè)應(yīng)用還是差‘最后一公里’”。

智源研究院院長王仲遠在論壇上指出,過去一年,大語言模型的推理能力和智能化水平有了明顯的提升,然而,原生多模態(tài)技術(shù)尤其在文生視頻、文生圖方面仍處于探索期,距離“多模態(tài)的ChatGPT時刻”尚有距離。  

澎湃科技(m.dbgt.com.cn)注意到,盡管近期國產(chǎn)大模型在多模態(tài)融合、生成質(zhì)量等方面取得顯著進展,也在訓(xùn)練效率、推理成本等關(guān)鍵指標(biāo)上不斷優(yōu)化,但當(dāng)前技術(shù)上仍存在一定瓶頸,而這一定程度上也影響了視頻生成模型商業(yè)化路徑。

Sand.AI(北京三代科技有限公司)的創(chuàng)始人兼CEO曹越認(rèn)為,雖然Sora已經(jīng)證明可以生成高質(zhì)量視頻,但從底層技術(shù)路徑上看,當(dāng)前主流的Diffusion模型和Transformer模型的訓(xùn)練方案有很大問題,核心問題在于不夠“Scalable”(可擴展性)。

這一情況類似2018年語言模型的發(fā)展階段,當(dāng)時BERT模型剛推出時,在10B參數(shù)量級內(nèi)表現(xiàn)良好,但一旦繼續(xù)擴大模型規(guī)模,其性能提升卻趨于停滯,難以獲得預(yù)期收益。這也是后來ChatGPT能夠后來居上的原因之一,它能夠有效地擴展到千億(1000B)級別,從而實現(xiàn)質(zhì)的飛躍。

然而,在視頻生成方向,Diffusion和Transformer目前雖然已能生成5秒左右的視頻并呈現(xiàn)出不錯的效果,但隨著模型參數(shù)規(guī)模的擴大,則快速達到瓶頸。在現(xiàn)有技術(shù)框架下,如何實現(xiàn)真正可擴展的視頻生成解決方案,仍是一個懸而未決的問題。

智象未來創(chuàng)始人兼CEO 梅濤指出,視頻生成大模型目前正處于ChatGPT2到ChatGPT3的階段。要解決視頻創(chuàng)作的問題,有三個關(guān)鍵點要達到,即敘事性、穩(wěn)定性和可控性,這是突破商業(yè)化瓶頸的關(guān)鍵所在。

梅濤稱,從2023年到2025年,這三年他對于商業(yè)化有不同階段的思考。2023年,他認(rèn)為模型就是產(chǎn)品,2024年覺得可以賣工具,但后來發(fā)現(xiàn),工具的門檻比較高,即便用了特效的方式,也很難滿足用戶所有需求。

2025年,他再將產(chǎn)品升級,即不用關(guān)心如何做,工具只是降本增效的方法,關(guān)鍵在于用低成本、極高效率,創(chuàng)造極高價值?!拔覀兿M苯影呀Y(jié)果交付給用戶,幫用戶做增長,跟用戶分傭,這種模式更貼近商業(yè)的本質(zhì)?!?/p>

梅濤表示,無論是做視頻生成還是大模型,最關(guān)鍵的挑戰(zhàn)在于如何從技術(shù)能力出發(fā),走到一個可持續(xù)、可閉環(huán)、有現(xiàn)金流的商業(yè)模型中去。如果無法實現(xiàn)這一點,終究只能停留在“技術(shù)提供者”的角色。在這一過程中,梅濤說他得出一個清晰的判斷,無論模型底座能力多強,離真正的商業(yè)應(yīng)用仍然差“最后一公里”。下一步,他的策略不僅是向用戶交付結(jié)果,還將進一步構(gòu)建完整生態(tài)。比如,簽約大量具備流量優(yōu)勢的內(nèi)容創(chuàng)作者(UP主)、MCN機構(gòu),搭建自有賬號體系,從而推動整個生態(tài)系統(tǒng)的運轉(zhuǎn)。

“最終我們可能進入電商領(lǐng)域,轉(zhuǎn)向賣貨,構(gòu)建起一個穩(wěn)定、有現(xiàn)金流支撐的業(yè)務(wù)閉環(huán)?!泵窛f。

曹越認(rèn)為,視頻生成模型在不同的發(fā)展階段,會展現(xiàn)出完全不同的產(chǎn)品契合度(PMF)。在早期階段,盡管生成效果還不完美,甚至需要頻繁“抽卡”才能生成一個可用片段,但與傳統(tǒng)拍攝相比,其成本優(yōu)勢依然顯著。他預(yù)測,視頻生成方向在未來三到五年內(nèi)會大有可為。

    責(zé)任編輯:宦艷紅
    圖片編輯:陳飛燕
    校對:施鋆
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋