中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

Figure AI發(fā)布人形機(jī)器人通用大模型:能識(shí)別陌生物品,兩臺(tái)機(jī)器人可共享運(yùn)行

澎湃新聞?dòng)浾?秦盛
2025-02-21 11:48
來源:澎湃新聞
? 10%公司 >
字號(hào)

離開OpenAI后,F(xiàn)igure AI正式發(fā)布“從未在人形機(jī)器人上看到過的東西”。

當(dāng)?shù)貢r(shí)間2月21日,AI機(jī)器人初創(chuàng)公司Figure AI公布了端到端人形機(jī)器人VLA(視覺-語(yǔ)言-動(dòng)作)通用大模型Helix。

Figure AI表示,如果機(jī)器人的能力沒有質(zhì)的飛躍,就無法進(jìn)入家庭領(lǐng)域,而Helix模型能像人類一樣推理。

據(jù)Figure AI介紹,Helix不僅實(shí)現(xiàn)了對(duì)整個(gè)機(jī)器人的上半身,包括手腕、軀干、頭部和單個(gè)手指輸出高速率連續(xù)控制,也可以在兩臺(tái)機(jī)器人上同時(shí)運(yùn)行,使它們能夠解決共享的長(zhǎng)距離操作任務(wù),操作它們從未見過的物品。

配備Helix的圖形機(jī)器人只需根據(jù)自然語(yǔ)言提示,就能拾取幾乎任何小型家用物品,包括它們從未見過的物品。

與之前的方法不同,Helix使用一組神經(jīng)網(wǎng)絡(luò)權(quán)重來學(xué)習(xí)所有行為——拾取和放置物品、使用抽屜和冰箱以及跨機(jī)器人交互——而無需針對(duì)具體任務(wù)進(jìn)行微調(diào)。

Figure AI Helix演示視頻。(02:33)

此外,Helix還能夠完全在嵌入式低功耗GPU上運(yùn)行,可立即投入商業(yè)部署。

Figure AI表示,家庭是機(jī)器人技術(shù)面臨的最大挑戰(zhàn)。與受控的工業(yè)環(huán)境不同,家庭中充斥著無數(shù)難以預(yù)測(cè)的物品。機(jī)器人要想在家庭中發(fā)揮作用,就必須能夠按需生成新的智能行為,尤其是針對(duì)它們從未見過的物體。而目前,即使是教機(jī)器人學(xué)會(huì)一種新行為,也需要大量的人力:要么是數(shù)小時(shí)的博士級(jí)專家手工編程,要么是數(shù)千次的演示。如果考慮到家庭問題的實(shí)際規(guī)模,這兩種方式的成本都高得令人望而卻步。而人工智能的其他領(lǐng)域已經(jīng)掌握了這種即時(shí)通用的方法。如果能簡(jiǎn)單地將視覺語(yǔ)言模型(VLM)中捕捉到的豐富語(yǔ)義知識(shí)直接轉(zhuǎn)化為機(jī)器人動(dòng)作,將從根本上改變機(jī)器人技術(shù)的發(fā)展軌跡。而關(guān)鍵問題是如何從VLM中提取所有的常識(shí)性知識(shí),并將其轉(zhuǎn)化為可通用的機(jī)器人控制。由此,F(xiàn)igure AI構(gòu)建了Helix來彌補(bǔ)這一差距。

對(duì)于人形機(jī)器人上半身的控制,Helix采用了“雙系統(tǒng)”方法。

Figure AI表示,之前的方法面臨著一個(gè)根本性的權(quán)衡:VLM架構(gòu)通用但不夠快,而機(jī)器人的視覺運(yùn)動(dòng)策略快但不通用。Helix通過兩個(gè)互補(bǔ)系統(tǒng)解決了這一問題,讓兩個(gè)系統(tǒng)經(jīng)過端對(duì)端訓(xùn)練,可以進(jìn)行通信。系統(tǒng)1(S1):快速反應(yīng)視覺運(yùn)動(dòng)策略,將系統(tǒng)2(S2)生成的潛在語(yǔ)義表征轉(zhuǎn)化為精確的連續(xù)機(jī)器人動(dòng)作。

這種架構(gòu)讓每個(gè)系統(tǒng)都能以其最佳時(shí)間尺度運(yùn)行。S2“慢思考”高層次目標(biāo),而S1則“快思考”實(shí)時(shí)執(zhí)行和調(diào)整動(dòng)作。

Helix的“雙系統(tǒng)”架構(gòu)。(00:07)

據(jù)介紹,S2是基于一個(gè)70億參數(shù)的開源、開放權(quán)重的視覺語(yǔ)言模型構(gòu)建,該模型在互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)上進(jìn)行了預(yù)訓(xùn)練。S1是一個(gè)8000萬參數(shù)的交叉注意力Transformer架構(gòu),依靠一個(gè)全卷積、多尺度的視覺骨干網(wǎng)絡(luò)進(jìn)行視覺處理,該網(wǎng)絡(luò)從全模擬環(huán)境中完成的預(yù)訓(xùn)練中構(gòu)建。同時(shí),對(duì)于分開的S1和S2,還可以分別進(jìn)行迭代,而不需要尋找統(tǒng)一的觀察空間或動(dòng)作表示。

Figure AI表示,他們收集了一個(gè)高質(zhì)量、多機(jī)器人、多操作員的多樣化遙操作行為數(shù)據(jù)集,總計(jì)約500小時(shí)。為了生成自然語(yǔ)言條件下的訓(xùn)練對(duì),還使用了一個(gè)自動(dòng)標(biāo)注的VLM來生成事后指令。該VLM處理來自機(jī)器人機(jī)載攝像頭的分段視頻片段,并以“為了得到這段視頻中看到的動(dòng)作,您會(huì)給機(jī)器人下達(dá)什么指令?”為提示。訓(xùn)練期間處理過的所有物品都會(huì)在評(píng)估中被排除,防止數(shù)據(jù)污染。

搭載Helix的人形機(jī)器人訓(xùn)練(00:13)

與其他方案相比,其速度可與專門用于單一任務(wù)的行為克隆策略媲美,同時(shí)還能對(duì)數(shù)千個(gè)新測(cè)試對(duì)象進(jìn)行零樣本泛化,也可直接輸出高維動(dòng)作空間的連續(xù)控制。

Figure AI成立于2022年,2023年3月正式發(fā)布首款通用人形機(jī)器人Figure 01,旨在通過在制造、物流、倉(cāng)儲(chǔ)和零售等行業(yè)執(zhí)行各種任務(wù)來解決全球勞動(dòng)力短缺問題,曾獲OpenAI、微軟、英偉達(dá)、英特爾以及亞馬遜創(chuàng)始人貝佐斯等投資,但在今年2月初,F(xiàn)igure AI在宣布即將公布此次的重大進(jìn)展時(shí)表示,將終止與OpenAI合作。

在此次Helix發(fā)布后,F(xiàn)igure AI創(chuàng)始人布雷特·阿德科克(Brett Adcock)表示想要將Helix的規(guī)模擴(kuò)大1000倍,并稱“2025年將是關(guān)鍵的一年,我們將開始生產(chǎn)、出貨更多的機(jī)器人,并解決家用機(jī)器人的問題”。

阿德科克也表示,還有很長(zhǎng)的路要走,“但這是可行的”。

值得一提的是,“人形機(jī)器人第一股”深圳市優(yōu)必選科技股份有限公司(優(yōu)必選,9880.HK)在Figure AI此次發(fā)布的前一天(2月20日)也剛剛宣布,針對(duì)最新的開源推理大模型 DeepSeek-R1,已在人形機(jī)器人應(yīng)用場(chǎng)景中進(jìn)行了驗(yàn)證,最新測(cè)試結(jié)果顯示,經(jīng)過多模態(tài)能力擴(kuò)展的DeepSeek-R1能夠讓人形機(jī)器人在執(zhí)行任務(wù)前結(jié)合看到的場(chǎng)景和接收到的指令進(jìn)行思考驗(yàn)證,零樣本推理水平與調(diào)優(yōu)后的同級(jí)別大模型推理水平相當(dāng)。公司將基于DeepSeek-R1研發(fā)適用于人形機(jī)器人的多模態(tài)具身推理大模型,預(yù)期在真實(shí)場(chǎng)景的數(shù)據(jù)調(diào)優(yōu)后,其表現(xiàn)將會(huì)進(jìn)一步提升。

另一方面,OpenAI投資的另一家機(jī)器人初創(chuàng)公司1X宣布將在明天有新發(fā)布。

同時(shí),OpenAI自2024年底開始也已在重組機(jī)器人部門,由Meta增強(qiáng)現(xiàn)實(shí)(AR)眼鏡團(tuán)隊(duì)前負(fù)責(zé)人凱特琳·卡利諾夫斯基(Caitlin Kalinowski)負(fù)責(zé)機(jī)器人和消費(fèi)硬件業(yè)務(wù)。今年1月末,OpenAI向美國(guó)專利商標(biāo)局提交新的商標(biāo)申請(qǐng),涉及人形機(jī)器人、XR、智能手表、可穿戴設(shè)備等硬件設(shè)備。

國(guó)內(nèi)的另一家機(jī)器人代表企業(yè)宇樹科技近期也頻繁公布人形機(jī)器人的算法升級(jí),宇樹科技創(chuàng)始人、CEO王興興也在最近的一次采訪中表示,現(xiàn)在AI驅(qū)動(dòng)機(jī)器人每天進(jìn)化得非???,AI人形機(jī)器人在今年年底前會(huì)達(dá)到一個(gè)新量級(jí)。

看來好戲才剛剛開始。

    責(zé)任編輯:孫扶
    圖片編輯:沈軻
    校對(duì):施鋆
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋