- +1
特斯拉AI前成員卡帕西給Agent潑冷水:真正成熟還需十年
2025年被稱為智能體Agent之年,當(dāng)行業(yè)的熱潮席卷全球之際,OpenAI創(chuàng)始成員、特斯拉前AI總監(jiān)安德烈·卡帕西(Andrej Karpathy)近日在接受播客節(jié)目“Dwarkesh Patel Show”采訪時(shí)給這股熱潮潑下一盆冷水,他直言,當(dāng)前AI Agent技術(shù)尚處早期,還存在“無(wú)法持續(xù)學(xué)習(xí)、非真正的多模態(tài)、不能自如操作電腦”等核心缺陷,要實(shí)現(xiàn)真正的實(shí)用化還需要十年左右。

OpenAI創(chuàng)始成員、特斯拉前AI總監(jiān)安德烈·卡帕西(Andrej Karpathy)近日在接受播客節(jié)目采訪。
AGI為何還需要十年
卡帕西認(rèn)為,盡管當(dāng)前大語(yǔ)言模型展現(xiàn)出令人驚嘆的能力,但Agent真正能夠使用的標(biāo)志是它成為一個(gè)員工或?qū)嵙?xí)生,人類愿意雇傭它和自己一起干活、工作。顯然,Agent當(dāng)前還做不到這一步。
原因在于Agent還存在三大核心缺陷:無(wú)法持續(xù)學(xué)習(xí)、非真正的多模態(tài)、不能自如操作電腦?,F(xiàn)在的AI無(wú)法記住和用戶的每一次互動(dòng),當(dāng)關(guān)掉對(duì)話窗口后,它就會(huì)忘掉。它無(wú)法像人類一樣,通過日常經(jīng)歷持續(xù)學(xué)習(xí)鞏固。
AI雖然能看圖寫字,但無(wú)法真正理解并完成復(fù)雜任務(wù)??ㄅ廖髋e例,AI能寫代碼,但無(wú)法制作一張精美的PPT,因?yàn)槌隽吮举|(zhì)是文本處理器的能力范圍。同時(shí),AI操作電腦、點(diǎn)擊軟件的能力還非常初級(jí)和不可靠。
卡帕西借用其在特斯拉開發(fā)自動(dòng)駕駛的經(jīng)驗(yàn)提出,從“演示”到“產(chǎn)品”有著巨大的鴻溝,“這是一場(chǎng)向數(shù)字‘9’的進(jìn)軍,一個(gè)在90%的情況下能工作的演示達(dá)成了第一個(gè)9,但要達(dá)到99.99999%的可靠性,還有更多的‘9’需要走。這就是為什么這些事情要花這么長(zhǎng)時(shí)間?!?/p>
強(qiáng)化學(xué)習(xí)很糟糕
談及強(qiáng)化學(xué)習(xí)(Reinforcement Learning),卡帕西直言,“強(qiáng)化學(xué)習(xí)很糟糕,只是碰巧之前的其他方法更糟糕。”
在強(qiáng)化學(xué)習(xí)中,試圖找到一個(gè)問題的解決方案,AI可能會(huì)進(jìn)行數(shù)百種不同的嘗試?!熬拖褡鲞x擇題,它蒙了100次,只有最后1次對(duì)了,但它會(huì)把整個(gè)蒙題過程都當(dāng)成‘正確經(jīng)驗(yàn)’,這種學(xué)習(xí)方式存在嚴(yán)重的效率問題。而?類永遠(yuǎn)不會(huì)這樣做?!逼渲械脑蚴堑谝?,現(xiàn)實(shí)世界?類不會(huì)進(jìn)行數(shù)百次試運(yùn)行;第二,當(dāng)人類找到解決?案時(shí),會(huì)有?個(gè)相當(dāng)復(fù)雜的反思復(fù)盤過程。
另一個(gè)深層問題是模型坍塌(model collapse)。模型生成的內(nèi)容多樣性會(huì)悄然減少,分布范圍變窄,即使單個(gè)輸出看起來(lái)仍然合理。卡帕西舉例,你可以讓 ChatGPT講個(gè)笑話,但它反復(fù)輸出的可能只是少數(shù)幾個(gè)模式化的笑話。這一特性阻礙了AI實(shí)現(xiàn)持續(xù)學(xué)習(xí),而如果讓AI使用自己產(chǎn)出的數(shù)據(jù),就會(huì)導(dǎo)致模型在自有數(shù)據(jù)上產(chǎn)生更加同質(zhì)化的內(nèi)容,陷入惡性循壞。
雖然人類也會(huì)存在類似的思維定式,但可以通過交流、閱讀等方式來(lái)對(duì)抗這一趨勢(shì)。兒童之所以是高效的學(xué)習(xí)者,正因?yàn)樗麄儾簧瞄L(zhǎng)記憶,反而被迫去發(fā)現(xiàn)通用模式。當(dāng)前AI缺乏這種主動(dòng)尋求并整合多樣性的內(nèi)在機(jī)制,必須依賴人類產(chǎn)生的真實(shí)數(shù)據(jù),這是個(gè)很大的瓶頸。
但卡帕西同時(shí)也深刻認(rèn)識(shí)到,強(qiáng)化學(xué)習(xí)仍是當(dāng)前AI發(fā)展道路上不可或缺的一環(huán)。原因在于,傳統(tǒng)的監(jiān)督學(xué)習(xí)(Supervised Learning)存在明顯的天花板。監(jiān)督學(xué)習(xí)嚴(yán)重依賴大量、高質(zhì)量的標(biāo)注數(shù)據(jù)。但對(duì)于“好代碼”、“好決策”這類無(wú)法明確定義、無(wú)法通過標(biāo)注數(shù)據(jù)學(xué)習(xí)的概念,只能通過設(shè)計(jì)一個(gè)獎(jiǎng)勵(lì)函數(shù)來(lái)讓模型自己摸索什么是“好”。這正是強(qiáng)化學(xué)習(xí)的應(yīng)用場(chǎng)景。
AGI的漸進(jìn)式路徑
卡帕西堅(jiān)持AGI的早期定義——能執(zhí)行任何具有經(jīng)濟(jì)價(jià)值任務(wù)的人類水平系統(tǒng)。但目前AI的實(shí)際影響仍有限,其應(yīng)用高度集中在編碼等高度結(jié)構(gòu)化、文本驅(qū)動(dòng)的領(lǐng)域?!叭藗儼盐锢淼臇|西都拿走了,只是在討論數(shù)字知識(shí)工作,這是一個(gè)相當(dāng)重大的讓步。原始定義是人類可以做的任何任務(wù),包括舉起一件東西。”
與很多人對(duì)AGI“奇點(diǎn)”時(shí)刻的想象不同,卡帕西認(rèn)為,AGI不會(huì)在某一天突然降臨并引爆智能爆炸,而是會(huì)像蒸汽機(jī)、電力和互聯(lián)網(wǎng)等歷史上的通用技術(shù)一樣,緩慢地融入并延續(xù)過去2.5個(gè)世紀(jì)來(lái)約2%的年度GDP增長(zhǎng)趨勢(shì)。
卡帕西一直試圖在GDP(Gross Domestic Product,國(guó)內(nèi)生產(chǎn)總值)的增長(zhǎng)趨勢(shì)中找到AI對(duì)其產(chǎn)生的明顯影響,理論上GDP應(yīng)該顯著上升?!暗髞?lái)我看了?些我認(rèn)為?常具有變?性的其他技術(shù),?如計(jì)算機(jī)或移動(dòng)電話等。你在GDP中找不到它們,GDP是同樣的指數(shù)。” 他進(jìn)一步舉例,即使人們認(rèn)為2008年iPhone 推出是個(gè)重?的地震式變化,而實(shí)際上不是,一切都如此分散、如此緩慢地?cái)U(kuò)散,以?于?切最終都被平均到同樣的指數(shù)中。
這種漸進(jìn)性源于技術(shù)革命的本質(zhì):新技術(shù)從演示到成熟產(chǎn)品的擴(kuò)散需要時(shí)間。就像自動(dòng)駕駛關(guān)于一場(chǎng)向數(shù)字“‘9’的進(jìn)軍”,每一個(gè)“9”的可靠性提升都需要付出巨大努力。AGI的發(fā)展同樣會(huì)遵循這條路徑,先自動(dòng)化一些封閉、結(jié)構(gòu)化的任務(wù),再逐步攻克更復(fù)雜的工作,其間社會(huì)需要時(shí)間來(lái)調(diào)整基礎(chǔ)設(shè)施、法律和技能體系。
卡帕西相信未來(lái)將會(huì)是多個(gè)AI實(shí)體逐漸增強(qiáng)自主性,與人類社會(huì)協(xié)同演進(jìn)。因此人們擁有寶貴的窗口期進(jìn)行準(zhǔn)備,可以系統(tǒng)地調(diào)整教育、社會(huì)保障和法律法規(guī),以確保人類在AGI時(shí)代能夠持續(xù)繁榮。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




