中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

特斯拉AI前成員卡帕西給Agent潑冷水:真正成熟還需十年

澎湃新聞記者 賈利略 實習(xí)生 趙蕊
2025-10-20 14:35
來源:澎湃新聞
? 未來2% >
字號

2025年被稱為智能體Agent之年,當(dāng)行業(yè)的熱潮席卷全球之際,OpenAI創(chuàng)始成員、特斯拉前AI總監(jiān)安德烈·卡帕西(Andrej Karpathy)近日在接受播客節(jié)目“Dwarkesh Patel Show”采訪時給這股熱潮潑下一盆冷水,他直言,當(dāng)前AI Agent技術(shù)尚處早期,還存在“無法持續(xù)學(xué)習(xí)、非真正的多模態(tài)、不能自如操作電腦”等核心缺陷,要實現(xiàn)真正的實用化還需要十年左右。

OpenAI創(chuàng)始成員、特斯拉前AI總監(jiān)安德烈·卡帕西(Andrej Karpathy)近日在接受播客節(jié)目采訪。

AGI為何還需要十年

卡帕西認(rèn)為,盡管當(dāng)前大語言模型展現(xiàn)出令人驚嘆的能力,但Agent真正能夠使用的標(biāo)志是它成為一個員工或?qū)嵙?xí)生,人類愿意雇傭它和自己一起干活、工作。顯然,Agent當(dāng)前還做不到這一步。

原因在于Agent還存在三大核心缺陷:無法持續(xù)學(xué)習(xí)、非真正的多模態(tài)、不能自如操作電腦。現(xiàn)在的AI無法記住和用戶的每一次互動,當(dāng)關(guān)掉對話窗口后,它就會忘掉。它無法像人類一樣,通過日常經(jīng)歷持續(xù)學(xué)習(xí)鞏固。

AI雖然能看圖寫字,但無法真正理解并完成復(fù)雜任務(wù)。卡帕西舉例,AI能寫代碼,但無法制作一張精美的PPT,因為超出了本質(zhì)是文本處理器的能力范圍。同時,AI操作電腦、點擊軟件的能力還非常初級和不可靠。

卡帕西借用其在特斯拉開發(fā)自動駕駛的經(jīng)驗提出,從“演示”到“產(chǎn)品”有著巨大的鴻溝,“這是一場向數(shù)字‘9’的進(jìn)軍,一個在90%的情況下能工作的演示達(dá)成了第一個9,但要達(dá)到99.99999%的可靠性,還有更多的‘9’需要走。這就是為什么這些事情要花這么長時間。”

強化學(xué)習(xí)很糟糕

談及強化學(xué)習(xí)(Reinforcement Learning),卡帕西直言,“強化學(xué)習(xí)很糟糕,只是碰巧之前的其他方法更糟糕。”

在強化學(xué)習(xí)中,試圖找到一個問題的解決方案,AI可能會進(jìn)行數(shù)百種不同的嘗試?!熬拖褡鲞x擇題,它蒙了100次,只有最后1次對了,但它會把整個蒙題過程都當(dāng)成‘正確經(jīng)驗’,這種學(xué)習(xí)方式存在嚴(yán)重的效率問題。而?類永遠(yuǎn)不會這樣做。”其中的原因是第一,現(xiàn)實世界?類不會進(jìn)行數(shù)百次試運行;第二,當(dāng)人類找到解決?案時,會有?個相當(dāng)復(fù)雜的反思復(fù)盤過程。

另一個深層問題是模型坍塌(model collapse)。模型生成的內(nèi)容多樣性會悄然減少,分布范圍變窄,即使單個輸出看起來仍然合理。卡帕西舉例,你可以讓 ChatGPT講個笑話,但它反復(fù)輸出的可能只是少數(shù)幾個模式化的笑話。這一特性阻礙了AI實現(xiàn)持續(xù)學(xué)習(xí),而如果讓AI使用自己產(chǎn)出的數(shù)據(jù),就會導(dǎo)致模型在自有數(shù)據(jù)上產(chǎn)生更加同質(zhì)化的內(nèi)容,陷入惡性循壞。

雖然人類也會存在類似的思維定式,但可以通過交流、閱讀等方式來對抗這一趨勢。兒童之所以是高效的學(xué)習(xí)者,正因為他們不擅長記憶,反而被迫去發(fā)現(xiàn)通用模式。當(dāng)前AI缺乏這種主動尋求并整合多樣性的內(nèi)在機(jī)制,必須依賴人類產(chǎn)生的真實數(shù)據(jù),這是個很大的瓶頸。

但卡帕西同時也深刻認(rèn)識到,強化學(xué)習(xí)仍是當(dāng)前AI發(fā)展道路上不可或缺的一環(huán)。原因在于,傳統(tǒng)的監(jiān)督學(xué)習(xí)(Supervised Learning)存在明顯的天花板。監(jiān)督學(xué)習(xí)嚴(yán)重依賴大量、高質(zhì)量的標(biāo)注數(shù)據(jù)。但對于“好代碼”、“好決策”這類無法明確定義、無法通過標(biāo)注數(shù)據(jù)學(xué)習(xí)的概念,只能通過設(shè)計一個獎勵函數(shù)來讓模型自己摸索什么是“好”。這正是強化學(xué)習(xí)的應(yīng)用場景。

AGI的漸進(jìn)式路徑

卡帕西堅持AGI的早期定義——能執(zhí)行任何具有經(jīng)濟(jì)價值任務(wù)的人類水平系統(tǒng)。但目前AI的實際影響仍有限,其應(yīng)用高度集中在編碼等高度結(jié)構(gòu)化、文本驅(qū)動的領(lǐng)域。“人們把物理的東西都拿走了,只是在討論數(shù)字知識工作,這是一個相當(dāng)重大的讓步。原始定義是人類可以做的任何任務(wù),包括舉起一件東西?!?/p>

與很多人對AGI“奇點”時刻的想象不同,卡帕西認(rèn)為,AGI不會在某一天突然降臨并引爆智能爆炸,而是會像蒸汽機(jī)、電力和互聯(lián)網(wǎng)等歷史上的通用技術(shù)一樣,緩慢地融入并延續(xù)過去2.5個世紀(jì)來約2%的年度GDP增長趨勢。

卡帕西一直試圖在GDP(Gross Domestic Product,國內(nèi)生產(chǎn)總值)的增長趨勢中找到AI對其產(chǎn)生的明顯影響,理論上GDP應(yīng)該顯著上升?!暗髞砦铱戳?些我認(rèn)為?常具有變?性的其他技術(shù),?如計算機(jī)或移動電話等。你在GDP中找不到它們,GDP是同樣的指數(shù)?!?他進(jìn)一步舉例,即使人們認(rèn)為2008年iPhone 推出是個重?的地震式變化,而實際上不是,一切都如此分散、如此緩慢地擴(kuò)散,以?于?切最終都被平均到同樣的指數(shù)中。

這種漸進(jìn)性源于技術(shù)革命的本質(zhì):新技術(shù)從演示到成熟產(chǎn)品的擴(kuò)散需要時間。就像自動駕駛關(guān)于一場向數(shù)字“‘9’的進(jìn)軍”,每一個“9”的可靠性提升都需要付出巨大努力。AGI的發(fā)展同樣會遵循這條路徑,先自動化一些封閉、結(jié)構(gòu)化的任務(wù),再逐步攻克更復(fù)雜的工作,其間社會需要時間來調(diào)整基礎(chǔ)設(shè)施、法律和技能體系。

卡帕西相信未來將會是多個AI實體逐漸增強自主性,與人類社會協(xié)同演進(jìn)。因此人們擁有寶貴的窗口期進(jìn)行準(zhǔn)備,可以系統(tǒng)地調(diào)整教育、社會保障和法律法規(guī),以確保人類在AGI時代能夠持續(xù)繁榮。

    責(zé)任編輯:喻琰
    圖片編輯:沈軻
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋