- +1
觀察丨數(shù)據(jù)困境與模型挑戰(zhàn)并存,AI智能體與機(jī)器人如何破局

9月10日-13日,2025 Inclusion·外灘大會(huì)在上海舉行,AI無(wú)疑成為本屆大會(huì)最受關(guān)注的焦點(diǎn)。
在多個(gè)論壇中,行業(yè)專家、企業(yè)家與投資人展開(kāi)了熱烈討論,深入探討了當(dāng)前行業(yè)發(fā)展所面臨的挑戰(zhàn)。在算力爆發(fā)與模型創(chuàng)新的關(guān)鍵階段,無(wú)論是聚焦物理實(shí)體的機(jī)器人,還是專注于數(shù)字世界的智能體(Agent),都共同面對(duì)著數(shù)據(jù)質(zhì)量、模型能力與產(chǎn)業(yè)化落地的多重挑戰(zhàn)。
數(shù)據(jù)困境與模型挑戰(zhàn),機(jī)器人何時(shí)能進(jìn)入家庭
在大會(huì)主論壇的圓桌環(huán)節(jié),宇樹(shù)科技創(chuàng)始人、CEO王興興反復(fù)提及“數(shù)據(jù)”問(wèn)題:真正優(yōu)質(zhì)數(shù)據(jù)怎么采?數(shù)據(jù)質(zhì)量應(yīng)該達(dá)到什么標(biāo)準(zhǔn)?當(dāng)前應(yīng)該采集什么類型、多大規(guī)模的數(shù)據(jù)?哪些數(shù)據(jù)比較有價(jià)值應(yīng)該重點(diǎn)采集?
王興興指出,目前機(jī)器人的數(shù)據(jù),無(wú)論采集、噪聲、數(shù)據(jù)質(zhì)量問(wèn)題都非常大,“都還是比較模糊的階段”。
他表示,希望能通過(guò)提高數(shù)據(jù)的利用率、提升模型對(duì)數(shù)據(jù)的理解能力,實(shí)現(xiàn)用少量數(shù)據(jù)也能獲得良好的效果。而從模型的角度,很多情況下數(shù)據(jù)并非要單純從量的角度來(lái)衡量,有些特征性數(shù)據(jù)非常重要,比如機(jī)器人到底哪些動(dòng)作或場(chǎng)景怎么采集會(huì)比較有質(zhì)量。
在一場(chǎng)分論壇上,銀河通用聯(lián)合創(chuàng)始人張直政則強(qiáng)調(diào),具身大模型的發(fā)展可能需要上萬(wàn)億條數(shù)據(jù)。
張直政認(rèn)為,若全部用真實(shí)數(shù)據(jù)采集既不可行也不可持續(xù),即便同一個(gè)人重復(fù)相同動(dòng)作,每次的一致性都很差,導(dǎo)致真實(shí)數(shù)據(jù)的樣本效率極低。而仿真數(shù)據(jù)在可控性和規(guī)模化方面具有極大優(yōu)勢(shì),雖然其在物理和語(yǔ)義學(xué)習(xí)上不如真實(shí)數(shù)據(jù),但可以通過(guò)圖文大模型和數(shù)字大模型來(lái)彌補(bǔ)。
清華大學(xué)交叉信息研究院助理教授、具身智能實(shí)驗(yàn)室負(fù)責(zé)人、星海圖聯(lián)合創(chuàng)始人許華哲也在大會(huì)期間表示,真實(shí)數(shù)據(jù)雖然比較昂貴,但是質(zhì)量非常好,仿真和互聯(lián)網(wǎng)數(shù)據(jù)可能更便宜、更容易獲取,但與真實(shí)數(shù)據(jù)的質(zhì)量會(huì)仍存在差距。不過(guò),即便采用真實(shí)數(shù)據(jù),也存在“真實(shí)到真實(shí)的差距”(Real2real Gap),影響訓(xùn)練出的VLA(視覺(jué)-語(yǔ)言-動(dòng)作模型)最終質(zhì)量。
模型則是機(jī)器人的另一個(gè)瓶頸。王興興指出,對(duì)于機(jī)器人而言,最大的問(wèn)題還是AI模型沒(méi)辦法很好地把硬件用起來(lái),比如靈巧手。同時(shí),目前純語(yǔ)言模型或純視頻模型效果顯著,但一旦需要將語(yǔ)言與圖像深度融合,就面臨巨大挑戰(zhàn),特別是在機(jī)器人控制領(lǐng)域,如何讓生成視頻與機(jī)器人的控制模態(tài)精確對(duì)齊,至今仍面臨難題。
如何解決靈巧手的難題?靈心巧手聯(lián)合創(chuàng)始人兼首席AI架構(gòu)師蘇洋給出了他的答案。
蘇洋表示,就像預(yù)訓(xùn)練模型需要大量數(shù)據(jù)一樣,如果能有1萬(wàn)臺(tái)、10萬(wàn)臺(tái)、100萬(wàn)臺(tái)設(shè)備,真機(jī)數(shù)據(jù)采集會(huì)變得異常容易,真實(shí)數(shù)據(jù)采集的價(jià)格也會(huì)變得異常低。
同時(shí),蘇洋還指出,目前靈巧手占人形機(jī)器人成本的比例大約在21%-23%。他希望能夠造更多、更便宜的靈巧手,爭(zhēng)取三年內(nèi)將價(jià)格“打到”500元甚至100元,“這時(shí)候機(jī)器人就能進(jìn)家庭了,我們先做工業(yè)把它用得穩(wěn)定,在苛刻的環(huán)境下把穩(wěn)定性、可靠性、靈巧性都解決了,然后壓低成本,進(jìn)入千家萬(wàn)戶”。
國(guó)家地方共建人形機(jī)器人創(chuàng)新中心首席科學(xué)家江磊指出,當(dāng)前具身智能的路徑還遠(yuǎn)未收斂,“但好在目前具身智能的四條路徑——智駕、機(jī)械臂、腿足式機(jī)器人以及芯片,就像四條產(chǎn)業(yè)鏈的射線,當(dāng)有一天集中于一個(gè)點(diǎn)的時(shí)候,可能具身智能這個(gè)產(chǎn)業(yè)就能落地”。
留給智能體的窗口時(shí)間不多了,產(chǎn)業(yè)將趨分化
業(yè)界普遍認(rèn)為,今年將會(huì)是AI智能體的元年。在本次大會(huì)上,展區(qū)內(nèi)的各類智能體功能齊備,數(shù)不勝數(shù)。
BAI資本創(chuàng)始及管理合伙人龍宇則坦言,智能體的概念其實(shí)也還在被定義和落地過(guò)程當(dāng)中,處于大家不斷努力的過(guò)程當(dāng)中。
她認(rèn)為,當(dāng)前用戶端、消費(fèi)者、企業(yè)端給予所謂的智能體概念極大前所未有的寬容,愿意接受30%-60%的完成度,這在傳統(tǒng)企業(yè)級(jí)服務(wù)中是不可想象的。不過(guò),這種寬容并非沒(méi)有期限。龍宇強(qiáng)調(diào)“留給我們的窗口時(shí)間已經(jīng)不多了”,隨著token成本的大幅下降,一些重新設(shè)計(jì)和優(yōu)化構(gòu)架以及工作流的可能性已經(jīng)出現(xiàn),大家會(huì)對(duì)智能體交付的完成程度越來(lái)越較真,特別是在金融等高風(fēng)險(xiǎn)領(lǐng)域,容不得半點(diǎn)容錯(cuò)率,不是“做得還不錯(cuò)”就可以接受的。
RockFlow創(chuàng)始人、CEO Vakee也指出,目前大模型在垂直領(lǐng)域的數(shù)據(jù)是缺乏的,在金融領(lǐng)域的落地對(duì)于準(zhǔn)確性的要求非常高,同時(shí)強(qiáng)監(jiān)管的場(chǎng)景性質(zhì)也需要算法具備可解釋性。
對(duì)于行業(yè)未來(lái),龍宇表示,半年前還備受關(guān)注的Devin等垂直Agent,現(xiàn)在已經(jīng)較少被提及,“目前技術(shù)已經(jīng)夠用,關(guān)鍵是定義出新的交互范式,而非產(chǎn)品形態(tài)”。未來(lái),智能體將會(huì)是產(chǎn)業(yè)分化、模型產(chǎn)業(yè)化的趨勢(shì),大家都開(kāi)始進(jìn)行深層次的思考。
在如今這個(gè)AI發(fā)展的關(guān)鍵節(jié)點(diǎn),不論是機(jī)器人還是智能體,只有真正理解數(shù)據(jù)價(jià)值、提升數(shù)據(jù)利用率、突破模型的挑戰(zhàn),才能加快迎來(lái)真正的爆發(fā)式發(fā)展。當(dāng)機(jī)器人能夠進(jìn)入千家萬(wàn)戶,當(dāng)智能體能夠真正理解并完美執(zhí)行人們的指令,一切將會(huì)變得截然不同。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司