中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

商湯發(fā)布新一代多模態(tài)大模型,徐立:要解決模型到客戶使用的最后一公里

澎湃新聞?dòng)浾?胡含嫣
2025-04-10 21:43
來(lái)源:澎湃新聞
? 10%公司 >
字號(hào)

商湯  視覺(jué)中國(guó) 資料圖

AI(人工智能)軟件公司商湯發(fā)布新一代大模型,持續(xù)押注多模態(tài)和日常場(chǎng)景落地。

4月10日,商湯集團(tuán)股份有限公司(商湯-W,0020.HK)在技術(shù)交流日上發(fā)布新一代多模態(tài)大模型系列“日日新SenseNova V6”,以及AI基礎(chǔ)設(shè)施“商湯大裝置SenseCore 2.0”。商湯科技集團(tuán)董事會(huì)執(zhí)行主席兼CEO徐立在演講中表示,從技術(shù)層面來(lái)看,多模態(tài)模型是走向通用人工智能(AGI)的必經(jīng)之路;在場(chǎng)景落地方面,“AI之道在于百姓之日用”,隨著通用性的增強(qiáng),AI將能夠走入更多人的日常生活。

徐立表示,多模態(tài)模型的發(fā)展和AGI的發(fā)展“畫(huà)上了約等號(hào)”。他解釋道,首先,純粹的語(yǔ)言模型難以真正地、完整地表達(dá)人類(lèi)的智能;其次,從數(shù)據(jù)角度看,多模態(tài)能夠補(bǔ)充互聯(lián)網(wǎng)上文本數(shù)據(jù)的不足,挖掘蘊(yùn)藏在圖像、視頻等非文本數(shù)據(jù)中的知識(shí):“從數(shù)據(jù)量來(lái)講,多模態(tài)是補(bǔ)充人類(lèi)智能的核心要素。而從學(xué)習(xí)方法上來(lái)講,(多模態(tài))也是效率更高的?!?/p>

據(jù)介紹,通過(guò)構(gòu)造多模態(tài)的強(qiáng)思維鏈數(shù)據(jù)和搭建多模態(tài)強(qiáng)化學(xué)習(xí)的語(yǔ)境,和去年發(fā)布的日日新大模型5.0及5.5相比,日日新6.0在多模態(tài)方面表現(xiàn)更加出眾,并針對(duì)推理能力進(jìn)行了強(qiáng)化。

為滿足不同場(chǎng)景的需要,日日新6.0包含若干版本。其中,原生多模態(tài)通用大模型SenseNova V6 Pro采用了6200億參數(shù)的混合專(zhuān)家(MoE)架構(gòu),SenseNova V6 Reasoner Pro在前者基礎(chǔ)上經(jīng)過(guò)了多模態(tài)長(zhǎng)思維鏈訓(xùn)練和多模態(tài)增強(qiáng)學(xué)習(xí),具有突出的多模態(tài)融合推理能力,在純文本和多模態(tài)推理任務(wù)上對(duì)標(biāo)OpenAI的o1模型和谷歌的Gemini 2.0 Flash-thinking。

此外,該系列中還包括視頻理解模型SenseNova V6 Video和輕量級(jí)的全模態(tài)交互模型SenseNova V6 Omni:V6 Video支持長(zhǎng)達(dá)10分鐘的視頻的完整輸入,能夠?qū)σ曨l進(jìn)行深入的理解、分析和推理;V6 Omni則支持實(shí)時(shí)交互但保持優(yōu)秀的綜合性能,對(duì)標(biāo)OpenAI的GPT 4o-mini。

近年來(lái),商湯在生成式AI和多模態(tài)AI領(lǐng)域投入巨大。對(duì)此,商湯聯(lián)合創(chuàng)始人、執(zhí)行董事及人工智能基礎(chǔ)設(shè)施和大模型首席科學(xué)家林達(dá)華在接受澎湃新聞?dòng)浾卟稍L時(shí)表示,這并不是單純的資源堆疊,而是基于商湯“三位一體(AI基礎(chǔ)設(shè)施-大模型-應(yīng)用)”戰(zhàn)略的系統(tǒng)性規(guī)劃:“我們會(huì)從多個(gè)業(yè)務(wù)場(chǎng)景進(jìn)行分析,針對(duì)如何打穿這些場(chǎng)景、形成高業(yè)務(wù)價(jià)值,凝練出最關(guān)鍵的技術(shù)能力,以此指導(dǎo)模型的迭代。”

林達(dá)華指出,Meta近期發(fā)布的Llama 4、乃至OpenAI的GPT-4.5其實(shí)都未能展現(xiàn)出讓人非常驚艷的性能,從這些案例中可以看出,傳統(tǒng)的縮放法則(scaling law)逐漸進(jìn)入了一個(gè)相對(duì)飽和的狀態(tài)。

但是,林達(dá)華認(rèn)為,模型能力其實(shí)還有很多其他的成長(zhǎng)方式,例如更長(zhǎng)思維鏈的注入、更高效的增強(qiáng)學(xué)習(xí)。因此,比起算力,商湯現(xiàn)在更關(guān)注通過(guò)技術(shù)優(yōu)化來(lái)提升模型效率:“對(duì)于我們的商業(yè)價(jià)值、對(duì)于模型的未來(lái)發(fā)展來(lái)說(shuō),商湯要找到投入產(chǎn)出的斜率最高的一條曲線,而不是去盲目地scale training(擴(kuò)大訓(xùn)練規(guī)模)?!?/p>

在主題演講中,徐立還在臺(tái)上展現(xiàn)了諸多使用日日新6.0的日常案例,包括電商比價(jià)、輔導(dǎo)作業(yè)、剪輯視頻、整理用戶評(píng)價(jià)等等,突出模型在日常生活中的實(shí)用性?;妹鞔┲輰W(xué)派代表人物王艮的名言“圣人之道,無(wú)異于百姓日用”,徐立表示,AI之“道”也是如此。

徐立進(jìn)一步指出,商湯發(fā)展AI的目標(biāo)便是“在真實(shí)的環(huán)境中解決那些日常煩瑣、但是重要的行業(yè)需求”:“當(dāng)AI聚集了人類(lèi)現(xiàn)有的大量平均水平的知識(shí)之后,它就能夠運(yùn)用觸類(lèi)旁通的能力,為開(kāi)放問(wèn)題形成一種真正意義上的確定性,完成從模型到客戶使用的最后一公里。”

在技術(shù)交流日上,商湯宣布了與多家軟硬件企業(yè)的戰(zhàn)略簽約,其中包括具身智能企業(yè)傅利葉。據(jù)介紹,基于商湯的SenseNova V6 Omni模型,傅利葉的機(jī)器人GRx系列可以通過(guò)融合圖像、視頻、語(yǔ)音和文本信息理解環(huán)境,實(shí)現(xiàn)更生動(dòng)、更智能的人機(jī)互動(dòng)體驗(yàn)。

10日當(dāng)天,商湯股價(jià)漲3.68%收于每股1.41港元,總市值522億港元。

    責(zé)任編輯:孫扶
    圖片編輯:蔣立冬
    校對(duì):施鋆
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋