- +1
人形機(jī)器人“練級(jí)”:現(xiàn)在已是什么段位?如何突破“GPT時(shí)刻”
在2025世界機(jī)器人大會(huì)上,一幕幕生動(dòng)的場(chǎng)景正在上演:工作人員一聲指令“跟著前面這位穿白衣服背著包的人”,人形機(jī)器人便穩(wěn)健穿行于人群,精準(zhǔn)跟隨;輪式人形機(jī)器人絲滑“漂移”搬運(yùn)箱子,甚至“一心二用”同時(shí)取送兩瓶飲料;兼具迎賓講解、調(diào)酒、分裝爆米花、端盤(pán)子等多面手能力;工業(yè)人形機(jī)器人集群通過(guò)網(wǎng)絡(luò)協(xié)同,實(shí)現(xiàn)物料入庫(kù)搬運(yùn)到智能分揀的全流程作業(yè)……
伴隨著VLA(Vision Language Action,視覺(jué)語(yǔ)言動(dòng)作)模型與端到端技術(shù)的快速成熟?,人形機(jī)器人技能庫(kù)日益齊備。在這場(chǎng)工作技能的“練級(jí)”之旅中,人形機(jī)器人現(xiàn)在已經(jīng)達(dá)到了什么段位?未來(lái)又將達(dá)到什么水平?如何突破自己的“ChatGPT”時(shí)刻?
“干活”到了哪一層?
當(dāng)格斗或舞蹈機(jī)器人偶發(fā)倒地時(shí),觀眾不再嘲笑,轉(zhuǎn)而關(guān)注其迅速起身的類(lèi)人動(dòng)作。行業(yè)焦點(diǎn)已從去年的“能干活”躍升至今年的“干好活”——追求成功率與效率。
擎朗智能具身智能實(shí)驗(yàn)室負(fù)責(zé)人鄧強(qiáng)文對(duì)澎湃新聞?dòng)浾弑硎荆?strong>在相對(duì)少泛化的一些場(chǎng)景中,人形機(jī)器人目前完成簡(jiǎn)單的任務(wù)是沒(méi)問(wèn)題的,“比如預(yù)掃描出一個(gè)家庭的房間,標(biāo)好哪里是廚房,哪里是客廳,哪里是房間,我們和它說(shuō)渴了,它就知道要去廚房拿一瓶水”,但如果在一個(gè)相對(duì)開(kāi)放的環(huán)境中,讓機(jī)器人自己去看、去理解認(rèn)知,目前難度還是很高的。
鄧強(qiáng)文介紹稱(chēng),擎朗智能把每個(gè)機(jī)器人的“崗位”都進(jìn)行精準(zhǔn)細(xì)化,把每個(gè)崗位的SOP(標(biāo)準(zhǔn)作業(yè)程序)和驗(yàn)收標(biāo)準(zhǔn)都進(jìn)行規(guī)范,從基礎(chǔ)的抓、捏、按壓等技能開(kāi)始訓(xùn)練,再將其組合起來(lái),實(shí)現(xiàn)了在不同的機(jī)器人之間的相互轉(zhuǎn)化。
此次大會(huì)期間,擎朗智能的具身服務(wù)機(jī)器人XMAN入駐了全球首家具身智能機(jī)器人4S店Robot Mall及全球首家機(jī)器人餐廳“機(jī)器人焰究所”,可根據(jù)客戶(hù)的選擇,提供不同風(fēng)味的小零食服務(wù),以擬人化的動(dòng)作流暢完成零食鏟出、分裝等一系列操作。

擎朗智能的人形機(jī)器人在“機(jī)器人焰究所”服務(wù)。
銀河通用的具身大模型機(jī)器人Galbot也在本次大會(huì)迎來(lái)“升級(jí)”。銀河通用攜手英偉達(dá)聯(lián)合首發(fā)了搭載Jetson AGX THOR芯片的機(jī)器人應(yīng)用,Galbot也成為全球首臺(tái)體內(nèi)部署Thor芯片的機(jī)器人,并完成了工業(yè)場(chǎng)景的應(yīng)用。從序廳的端到端具身大模型技術(shù)實(shí)景演示,到自主展位覆蓋商業(yè)、工業(yè)及城市服務(wù)的全場(chǎng)景應(yīng)用,再到會(huì)客廳的真實(shí)商業(yè)售賣(mài),機(jī)器人全程無(wú)遙操、高效運(yùn)行。
從實(shí)際落地應(yīng)用情況來(lái)看,銀河通用已在數(shù)十家約40平方米的門(mén)店內(nèi)部署人形機(jī)器人并常態(tài)化運(yùn)營(yíng),單“人”管理超5000種藥品和6000個(gè)貨道。同時(shí),銀河通用也已與多家汽車(chē)制造商展開(kāi)合作,在多個(gè)生產(chǎn)線(xiàn)進(jìn)行分揀、搬運(yùn)等環(huán)節(jié)的人形機(jī)器人實(shí)際落地測(cè)試。
穹徹智能聯(lián)合創(chuàng)始人、上海交通大學(xué)人工智能學(xué)院副院長(zhǎng)盧策吾在接受澎湃新聞等媒體采訪(fǎng)時(shí)指出,大眾要感覺(jué)機(jī)器人“有用”,就是要有一批技能相對(duì)成熟,能夠解決實(shí)際場(chǎng)景的問(wèn)題。
盧策吾也透露:“可能大家今天能看到的主要還是抓取類(lèi)的,但其實(shí)像食材處理,比如串關(guān)東煮、做冰淇淋這類(lèi)技能,其實(shí)技術(shù)上是可以實(shí)現(xiàn),能夠馬上進(jìn)入生活的”。

銀河通用的人形機(jī)器人展示“漂移”搬箱。
硬件已經(jīng)基本達(dá)到人的水平
優(yōu)必選在此次大會(huì)把工廠流水線(xiàn)給搬了過(guò)來(lái),展示了多臺(tái)、多類(lèi)機(jī)器人,從物料入庫(kù)搬運(yùn)到智能分揀的全流程協(xié)同作業(yè),以及工業(yè)人形機(jī)器人集群的復(fù)雜動(dòng)態(tài)隨機(jī)分揀。
在人滿(mǎn)為患的展臺(tái)的二樓,優(yōu)必選首席品牌官譚旻向澎湃新聞?dòng)浾哧U述了對(duì)于公司工業(yè)人形機(jī)器人的發(fā)展規(guī)劃:兩年后能達(dá)到人類(lèi)80%的工作效率,加之自主換電能夠?qū)崿F(xiàn)24小時(shí)工作,帶來(lái)更大的生產(chǎn)力提升,“明年再來(lái)肯定不同”。

優(yōu)必選在此次WRC展示的機(jī)器人群體智能技術(shù)。
目前,優(yōu)必選已與多家車(chē)企、富士康、順豐等企業(yè)合作,在汽車(chē)制造、精密制造、智慧物流三大場(chǎng)景完成了工業(yè)人形機(jī)器人的部署。譚旻透露,優(yōu)必選今年還將在汽車(chē)制造領(lǐng)域交付500臺(tái)工業(yè)人形機(jī)器人,并將在教育科研領(lǐng)域交付超300臺(tái)天工行者人形機(jī)器人,今年將努力完成1000臺(tái)左右的交付,“隨著機(jī)器人能力的逐步實(shí)現(xiàn),會(huì)有更多的訂單”。
對(duì)于人形機(jī)器人的“工作”能力,星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇更為樂(lè)觀。陳建宇在接受澎湃新聞等媒體采訪(fǎng)時(shí)表示,人形機(jī)器人已在部分的真實(shí)工業(yè)場(chǎng)景達(dá)到了大約人類(lèi)70%的效率,2026年或?qū)⒛苓_(dá)到90%,“實(shí)際上硬件已經(jīng)能基本完全達(dá)到人的水平了,現(xiàn)在處在軟件和硬件的打磨階段。假以時(shí)日,我相信是能達(dá)到人類(lèi)的水平,甚至有可能超人類(lèi)的水平”。
長(zhǎng)遠(yuǎn)來(lái)看,譚旻認(rèn)為,未來(lái)進(jìn)入家庭的服務(wù)機(jī)器人,一定是“All in One”的,是個(gè)既能補(bǔ)習(xí)又會(huì)下廚,還能按摩打掃的通用機(jī)器人。
宇樹(shù)科技創(chuàng)始人、CEO王興興有更清晰的藍(lán)圖,他表示,“如果哪一天我們帶一個(gè)人形機(jī)器人到會(huì)場(chǎng),而且它沒(méi)有見(jiàn)過(guò)這個(gè)會(huì)場(chǎng)。我隨便和它說(shuō)一句話(huà)幫忙把這瓶水帶給某個(gè)觀眾,它可以比較順暢地自己走過(guò)去,流暢地把這個(gè)事情干了,就達(dá)到了機(jī)器人的ChatGPT時(shí)刻”。
他表示,這一時(shí)刻未來(lái)1-2年或2-3年很有可能實(shí)現(xiàn),慢的話(huà)估計(jì)3-5年能實(shí)現(xiàn)。

星動(dòng)紀(jì)元的人形機(jī)器人進(jìn)行抗干擾分揀。
瓶頸:軟硬件皆困于泛化
“泛化能力不足”是規(guī)?;瘧?yīng)用的核心瓶頸。??
王興興指出,目前機(jī)器人最大的問(wèn)題在于模型的泛化還不夠,硬件其實(shí)完全夠用。在大語(yǔ)言模型領(lǐng)域,有足夠多的數(shù)據(jù),尤其有足夠多好的數(shù)據(jù)時(shí),就能把模型訓(xùn)練得越來(lái)越好,但在具身智能和機(jī)器人領(lǐng)域,反而會(huì)發(fā)現(xiàn),哪怕采集了大量的數(shù)據(jù),把機(jī)器人的數(shù)據(jù)訓(xùn)練出來(lái)并部署到實(shí)物機(jī)器上,發(fā)現(xiàn)二者并沒(méi)有辦法很好的對(duì)齊。
陳建宇也指出,泛化能力更重要是在“大腦”上,但運(yùn)動(dòng)控制也需要更好的泛化,運(yùn)動(dòng)控制是保證所有的動(dòng)作都能精準(zhǔn)柔順達(dá)到的底層支撐。相對(duì)而言,“大腦”的泛化難度會(huì)更高一些。
譚旻也指出,在機(jī)器本體沒(méi)有收攏標(biāo)準(zhǔn)化的前提下,仿真數(shù)據(jù)訓(xùn)練也無(wú)法真正復(fù)用和泛化。
智平方創(chuàng)始人兼CEO郭彥東同樣認(rèn)為,過(guò)去買(mǎi)一個(gè)機(jī)器人可能需要幾百萬(wàn)元,現(xiàn)在只需要一萬(wàn)元就可以得到一個(gè)最基本的人形機(jī)器人型號(hào),硬件成本變得越來(lái)越低?!拔覀冃枰挚煽客瑫r(shí)又便宜的硬件,可以讓這些硬件放在真實(shí)世界里,越快部署越好,同時(shí),硬件必須要有一致性,比如生產(chǎn)100萬(wàn)臺(tái)機(jī)器人,邏輯就完全不一樣了”。
國(guó)家地方共建人形機(jī)器人創(chuàng)新中心首席科學(xué)家江磊一言道出,目前人形機(jī)器人的現(xiàn)狀是“大腦模型不夠大,小腦模型不夠小”,存在感知局限、決策斷層、泛化瓶頸三大問(wèn)題,“如果一個(gè)具身智能沒(méi)有思考跟進(jìn)化能力,它還是具身智能嗎?”

宇樹(shù)科技的格斗人形機(jī)器人在現(xiàn)場(chǎng)與觀眾互動(dòng)。
如何破局?
針對(duì)上述難題,行業(yè)正積極探索突破路徑。
王興興分享了幾條可能路徑,他認(rèn)為,VLA模型加上RL(強(qiáng)化學(xué)習(xí))訓(xùn)練是其中之一,但目前嘗試下來(lái)還是不夠,模型架構(gòu)還是得升級(jí)優(yōu)化;或是讓視頻生成模型先生成一個(gè)機(jī)器人動(dòng)作的視頻,再控制機(jī)器人去做,“這條路線(xiàn)可能比VLA模型更快收斂,概率更大”。
他認(rèn)為,未來(lái)2-5年,最大的方向會(huì)集中在端到端具身智能模型、更低成本更高壽命的硬件以及更低成本更大規(guī)模的算力三方面。
陳建宇也同樣認(rèn)為,強(qiáng)化學(xué)習(xí)是一條可行路徑。同時(shí),他對(duì)記者表示,不同的機(jī)器人,自由度、模型的輸出維度、傳感的類(lèi)型可能都不一樣,在預(yù)訓(xùn)練中盡量去使用與具體本體無(wú)關(guān)的數(shù)據(jù),比如說(shuō)人的通用數(shù)據(jù),再到真機(jī)上進(jìn)行調(diào)整,在形態(tài)相對(duì)比較接近的本體上可以達(dá)到較好的遷移水平。
陳建宇還表示,星動(dòng)紀(jì)元此前曾完成的全球首個(gè)世界模型和生成式模型的融合,接下來(lái)可能將會(huì)成為業(yè)內(nèi)的新共識(shí)。
盧策吾更為通俗地向記者進(jìn)行了解釋?zhuān)^泛化性,就是消除不確定性,“每消掉一個(gè)不確定性,它發(fā)展能力就會(huì)提高,整個(gè)‘大腦’就能像解方程一樣,把變量定住”。現(xiàn)在的VLA不確定性還特別大,有點(diǎn)像“大海撈針”,我們要一步一步加上各種技術(shù),使到它變成“甕中捉鱉”,“我們現(xiàn)在抓一個(gè)東西,范圍很大,我們不停地加上限制的話(huà),它的捕捉空間就會(huì)縮小,縮小到最后就能把東西抓住。其實(shí)都是逐漸去收窄VLA的不確定性,改到最后大家是不是叫VLA也不重要了”。

穹徹智能一直堅(jiān)持“以力為中心”。
江磊表示:“大家總感覺(jué)3D模型不‘解渴’,VLA似乎不能代表未來(lái),但是就是有了VLA,就像我們行業(yè)的貢獻(xiàn)者和引路者,促進(jìn)整個(gè)行業(yè)往前發(fā)展……軟硬一體化的AI是我們真正需要的,機(jī)器人本體一定是大腦、小腦與肢體一體的,要打造感知、認(rèn)知、決策、執(zhí)行的閉環(huán)?!?/strong>
他進(jìn)一步提出,具身智能不是現(xiàn)在“大腦+小腦”的方向,要打造未來(lái)的方向,比如通過(guò)生物仿生來(lái)提出具身智能的基礎(chǔ)模型。
人形機(jī)器人正從功能演示邁向高效執(zhí)行,潛力在工業(yè)與家庭場(chǎng)景中也日益顯現(xiàn)。軟硬件融合的閉環(huán)系統(tǒng),或?qū)⑹墙怄i機(jī)器人“通用”的鑰匙,讓機(jī)器人能從“干好活”進(jìn)化到“無(wú)處不在的助手”。





- 報(bào)料熱線(xiàn): 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司