中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

如何打通視頻模型商業(yè)化最后一公里??智象未來(lái)梅濤:技術(shù)之上還得構(gòu)建生態(tài)

澎湃新聞?dòng)浾?喻琰
2025-06-09 08:09
來(lái)源:澎湃新聞
? 未來(lái)2% >
字號(hào)

過(guò)去一年,是視頻生成大模型領(lǐng)域眾聲喧嘩的一年,年初Sora引爆全場(chǎng),隨后國(guó)內(nèi)眾多企業(yè)也都推出了自己的產(chǎn)品。行業(yè)競(jìng)爭(zhēng)愈發(fā)激烈,能夠成功“跑通”的路徑也變得更加陡峭。探索如何實(shí)現(xiàn)商業(yè)化,成為眾多視頻生成創(chuàng)業(yè)者的困境。

在日前舉行的第7屆北京智源大會(huì)大模型產(chǎn)業(yè)CEO論壇上,智象未來(lái)創(chuàng)始人兼CEO 梅濤談及當(dāng)前視頻生成模型商業(yè)化過(guò)程中面臨的困境時(shí)坦言:“(目前)大模型商業(yè)化仍不明顯,離最后的商業(yè)應(yīng)用還是差‘最后一公里’”。

智源研究院院長(zhǎng)王仲遠(yuǎn)在論壇上指出,過(guò)去一年,大語(yǔ)言模型的推理能力和智能化水平有了明顯的提升,然而,原生多模態(tài)技術(shù)尤其在文生視頻、文生圖方面仍處于探索期,距離“多模態(tài)的ChatGPT時(shí)刻”尚有距離。  

澎湃科技(m.dbgt.com.cn)注意到,盡管近期國(guó)產(chǎn)大模型在多模態(tài)融合、生成質(zhì)量等方面取得顯著進(jìn)展,也在訓(xùn)練效率、推理成本等關(guān)鍵指標(biāo)上不斷優(yōu)化,但當(dāng)前技術(shù)上仍存在一定瓶頸,而這一定程度上也影響了視頻生成模型商業(yè)化路徑。

Sand.AI(北京三代科技有限公司)的創(chuàng)始人兼CEO曹越認(rèn)為,雖然Sora已經(jīng)證明可以生成高質(zhì)量視頻,但從底層技術(shù)路徑上看,當(dāng)前主流的Diffusion模型和Transformer模型的訓(xùn)練方案有很大問(wèn)題,核心問(wèn)題在于不夠“Scalable”(可擴(kuò)展性)。

這一情況類似2018年語(yǔ)言模型的發(fā)展階段,當(dāng)時(shí)BERT模型剛推出時(shí),在10B參數(shù)量級(jí)內(nèi)表現(xiàn)良好,但一旦繼續(xù)擴(kuò)大模型規(guī)模,其性能提升卻趨于停滯,難以獲得預(yù)期收益。這也是后來(lái)ChatGPT能夠后來(lái)居上的原因之一,它能夠有效地?cái)U(kuò)展到千億(1000B)級(jí)別,從而實(shí)現(xiàn)質(zhì)的飛躍。

然而,在視頻生成方向,Diffusion和Transformer目前雖然已能生成5秒左右的視頻并呈現(xiàn)出不錯(cuò)的效果,但隨著模型參數(shù)規(guī)模的擴(kuò)大,則快速達(dá)到瓶頸。在現(xiàn)有技術(shù)框架下,如何實(shí)現(xiàn)真正可擴(kuò)展的視頻生成解決方案,仍是一個(gè)懸而未決的問(wèn)題。

智象未來(lái)創(chuàng)始人兼CEO 梅濤指出,視頻生成大模型目前正處于ChatGPT2到ChatGPT3的階段。要解決視頻創(chuàng)作的問(wèn)題,有三個(gè)關(guān)鍵點(diǎn)要達(dá)到,即敘事性、穩(wěn)定性和可控性,這是突破商業(yè)化瓶頸的關(guān)鍵所在。

梅濤稱,從2023年到2025年,這三年他對(duì)于商業(yè)化有不同階段的思考。2023年,他認(rèn)為模型就是產(chǎn)品,2024年覺(jué)得可以賣工具,但后來(lái)發(fā)現(xiàn),工具的門檻比較高,即便用了特效的方式,也很難滿足用戶所有需求。

2025年,他再將產(chǎn)品升級(jí),即不用關(guān)心如何做,工具只是降本增效的方法,關(guān)鍵在于用低成本、極高效率,創(chuàng)造極高價(jià)值?!拔覀兿M苯影呀Y(jié)果交付給用戶,幫用戶做增長(zhǎng),跟用戶分傭,這種模式更貼近商業(yè)的本質(zhì)?!?/p>

梅濤表示,無(wú)論是做視頻生成還是大模型,最關(guān)鍵的挑戰(zhàn)在于如何從技術(shù)能力出發(fā),走到一個(gè)可持續(xù)、可閉環(huán)、有現(xiàn)金流的商業(yè)模型中去。如果無(wú)法實(shí)現(xiàn)這一點(diǎn),終究只能停留在“技術(shù)提供者”的角色。在這一過(guò)程中,梅濤說(shuō)他得出一個(gè)清晰的判斷,無(wú)論模型底座能力多強(qiáng),離真正的商業(yè)應(yīng)用仍然差“最后一公里”。下一步,他的策略不僅是向用戶交付結(jié)果,還將進(jìn)一步構(gòu)建完整生態(tài)。比如,簽約大量具備流量?jī)?yōu)勢(shì)的內(nèi)容創(chuàng)作者(UP主)、MCN機(jī)構(gòu),搭建自有賬號(hào)體系,從而推動(dòng)整個(gè)生態(tài)系統(tǒng)的運(yùn)轉(zhuǎn)。

“最終我們可能進(jìn)入電商領(lǐng)域,轉(zhuǎn)向賣貨,構(gòu)建起一個(gè)穩(wěn)定、有現(xiàn)金流支撐的業(yè)務(wù)閉環(huán)?!泵窛f(shuō)。

曹越認(rèn)為,視頻生成模型在不同的發(fā)展階段,會(huì)展現(xiàn)出完全不同的產(chǎn)品契合度(PMF)。在早期階段,盡管生成效果還不完美,甚至需要頻繁“抽卡”才能生成一個(gè)可用片段,但與傳統(tǒng)拍攝相比,其成本優(yōu)勢(shì)依然顯著。他預(yù)測(cè),視頻生成方向在未來(lái)三到五年內(nèi)會(huì)大有可為。

    責(zé)任編輯:宦艷紅
    圖片編輯:陳飛燕
    校對(duì):施鋆
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋