劉知遠(yuǎn)：大模型到專業(yè)Agent的躍遷必須解決的三大核心挑戰(zhàn)

澎湃新聞?dòng)浾?喻琰

2025-09-16 07:06

來(lái)源：澎湃新聞

在日前舉行的2025外灘大會(huì)“智能體時(shí)代進(jìn)化論”分論壇上，清華大學(xué)長(zhǎng)聘副教授、面壁智能首席科學(xué)家劉知遠(yuǎn)系統(tǒng)剖析了AI從大模型向Agent躍遷的必然趨勢(shì)，并深入探討了“專業(yè)智能體”與“多智能體系統(tǒng)”所面臨的核心技術(shù)挑戰(zhàn)與未來(lái)愿景。

劉知遠(yuǎn)認(rèn)為，AI發(fā)展的下一階段，必然是讓模型走出虛擬世界進(jìn)入到真實(shí)的環(huán)境中實(shí)現(xiàn)交互，即實(shí)現(xiàn)從大模型向智能體的躍遷。而這一過(guò)程躍遷的核心在于，AI不再僅僅是一個(gè)具備知識(shí)的“大腦”，而要成為一個(gè)能通過(guò)使用工具、自主學(xué)習(xí)來(lái)探索世界的行動(dòng)者。

劉知遠(yuǎn)的分享極具啟發(fā)性，以下是澎湃科技整理后的演講實(shí)錄：

人工智能的能力圖譜包括四方面的能力

劉知遠(yuǎn)演講的PPT

今天主題是智能體，這個(gè)智能體應(yīng)該說(shuō)在社會(huì)上獲得廣泛的關(guān)注，應(yīng)該是從去年開(kāi)始。我想從人工智能發(fā)展角度，這個(gè)智能體它都有什么樣的核心問(wèn)題，關(guān)鍵技術(shù)是什么，以及接下來(lái)它的發(fā)展過(guò)程中，我們需要解決的挑戰(zhàn)以及一旦這個(gè)挑戰(zhàn)如果被解決了，然后它可能產(chǎn)生一個(gè)怎樣的巨大應(yīng)用，我想通過(guò)這樣一個(gè)引導(dǎo)發(fā)言，然后來(lái)給各位進(jìn)行一個(gè)分享。

人工智能有一個(gè)我們可以定義出來(lái)的能力圖譜，我們認(rèn)為它大致包括這四個(gè)方面的能力。

第一，它要有基座大模型，像大腦一樣來(lái)高效思考這個(gè)世界。我們也需要有一個(gè)非常好的敏銳感官，也就是多模態(tài)智能，能夠敏銳感知這個(gè)世界。第二，從2018年隨著大模型的發(fā)展，應(yīng)該說(shuō)已經(jīng)形成包括文本基座模型和多模態(tài)模型一個(gè)非常前瞻式的應(yīng)用。我們認(rèn)為人工智能的能力圖譜除了這兩個(gè)部分，接下來(lái)還有兩個(gè)非常重要的組成部分。第三，探索能力，它能夠像一個(gè)專業(yè)的智能體一樣，專業(yè)探索這個(gè)世界、改造這個(gè)世界。第四，這些專業(yè)的智能體如何能夠互相進(jìn)行協(xié)作，形成群體智能，這是我們?nèi)斯ぶ悄艿谒膫€(gè)非常重要的板塊。

從圖譜的組成，其實(shí)我們就可以非常清晰地看到，人工智能發(fā)展非常顯著的脈絡(luò)。2018年一直到2025年，當(dāng)然隨著接下來(lái)的這幾年，我們肯定還會(huì)去見(jiàn)證模型隨著預(yù)訓(xùn)練的技術(shù)，從一個(gè)非常小的，只有幾千萬(wàn)的參數(shù)模型，現(xiàn)在增長(zhǎng)到上萬(wàn)億的規(guī)模，其實(shí)是一個(gè)類似于我們腦容量越來(lái)越大的一個(gè)過(guò)程，它具有更強(qiáng)對(duì)這個(gè)世界認(rèn)知方面的能力。

但是我們會(huì)認(rèn)為再進(jìn)一步，其實(shí)我們就不只是把這個(gè)模型本身能力進(jìn)行一個(gè)具備。我們其實(shí)還需要進(jìn)一步讓這個(gè)模型進(jìn)入到真實(shí)的環(huán)節(jié)、真實(shí)的世界，然后來(lái)進(jìn)行交互，這個(gè)過(guò)程其實(shí)就是一個(gè)智能體的過(guò)程。也就是通過(guò)工具的使用、自主學(xué)習(xí)，能讓這個(gè)智能體變成在相關(guān)專業(yè)領(lǐng)域自主探索的專業(yè)智能體。它們?cè)龠M(jìn)一步能夠形成群體智能，我們認(rèn)為人工智能應(yīng)該會(huì)在最近這幾年里面實(shí)現(xiàn)從大模型向智能體躍遷的這么一個(gè)過(guò)程。

這個(gè)過(guò)程的外在體現(xiàn)就能夠讓我們看到，從2022年開(kāi)始，國(guó)內(nèi)外陸續(xù)有非常多和智能體相關(guān)的探索工作。相當(dāng)于在這個(gè)浪潮里面，應(yīng)該說(shuō)我們國(guó)內(nèi)非常多學(xué)者和科技工作者所從事的工作站在世界的前沿。這些其實(shí)都是表象，我們要深入到人工智能未來(lái)發(fā)展的趨勢(shì)，然后來(lái)去看待智能體核心挑戰(zhàn)是什么。這個(gè)角度來(lái)講，我們認(rèn)為人類社會(huì)的發(fā)展，我們?nèi)祟惿鐣?huì)本身是人類智能一個(gè)非常高度發(fā)達(dá)的階段，我們可以想象，人工智能未來(lái)發(fā)展的這一態(tài)勢(shì)，應(yīng)該說(shuō)人類社會(huì)的發(fā)展會(huì)對(duì)它有一個(gè)非常重要的啟示。

AI發(fā)展兩大方向：個(gè)體專業(yè)化和協(xié)作專業(yè)化

過(guò)去的這幾百年，人類的社會(huì)發(fā)展有什么重要的特點(diǎn)？在社會(huì)學(xué)領(lǐng)域有兩個(gè)非常重要的觀點(diǎn)，我們會(huì)認(rèn)為這體現(xiàn)了人類社會(huì)從生產(chǎn)力、效能等方面的特點(diǎn)。第一，社會(huì)學(xué)的奠基人涂爾干曾經(jīng)提出，“個(gè)體的專業(yè)化是群體效能提升的基礎(chǔ)”。也就是說(shuō)，在過(guò)去的這幾百年的時(shí)間里面，我們會(huì)見(jiàn)證我們?nèi)祟惿鐣?huì)的每一個(gè)人都在呈現(xiàn)一個(gè)專業(yè)化的程度和規(guī)模，然后變得非常的壯大的過(guò)程，這個(gè)會(huì)成為我們?nèi)斯ぶ悄芤M(jìn)行發(fā)展的非常重要方向，也就是要去構(gòu)建相關(guān)各行各業(yè)、各個(gè)領(lǐng)域的專業(yè)智能體。

另外一個(gè)非常重要的特點(diǎn)，馬克思在社會(huì)學(xué)方面提出的一個(gè)觀點(diǎn)，協(xié)作社會(huì)化是生產(chǎn)力發(fā)展的必然結(jié)果，科技革命為這種擴(kuò)張?zhí)峁┝思夹g(shù)可能。我們會(huì)看到過(guò)去的這幾百年的時(shí)間，隨著技術(shù)的發(fā)展，隨著互聯(lián)網(wǎng)的出現(xiàn)，信息社會(huì)的出現(xiàn)，我們整個(gè)人類社會(huì)協(xié)作的社會(huì)化廣度和效率都大為地提升，而從這個(gè)角度來(lái)講，我們也可以預(yù)期未來(lái)人工智能的發(fā)展也一定會(huì)構(gòu)建一套更加高效、廣泛的多智能體系統(tǒng)，這將構(gòu)成接下來(lái)兩個(gè)非常重要的組成部分。

專業(yè)智能體的三大核心挑戰(zhàn)

首先我們來(lái)看一下專業(yè)智能體這個(gè)角度核心技術(shù)與主要挑戰(zhàn)是什么？我們認(rèn)為專業(yè)智能體將是下一代人工智能非常重要的發(fā)展方向。也就是說(shuō)，要讓這個(gè)模型進(jìn)入到一個(gè)多樣多變復(fù)雜的真實(shí)世界中進(jìn)行交互，來(lái)完成相關(guān)的復(fù)雜任務(wù)。從這個(gè)角度來(lái)講，我們就可以設(shè)想，當(dāng)大模型放到一個(gè)真實(shí)的環(huán)節(jié)，它所面臨的挑戰(zhàn)是什么，挑戰(zhàn)就是環(huán)境的多樣性、環(huán)境的多變性，以及任務(wù)的復(fù)雜性。

針對(duì)這些挑戰(zhàn)，我們認(rèn)為我們所需要解決的，其實(shí)就是智能體的三個(gè)性的問(wèn)題。

第一個(gè)是智能體的泛化性（Generalization）。在真實(shí)的世界里面，智能體其實(shí)需要能夠面對(duì)多樣化的環(huán)境，它就需要具備在那些訓(xùn)練過(guò)程中能夠接觸過(guò)的環(huán)境中，這個(gè)模型能不能做出合理的決策，完成這些復(fù)雜的任務(wù)。我們可以設(shè)想，當(dāng)我們把大模型放到不同的領(lǐng)域，它有可能是編程領(lǐng)域、數(shù)據(jù)庫(kù)領(lǐng)域、系統(tǒng)環(huán)境領(lǐng)域，也有可能是物理環(huán)境領(lǐng)域，或者是其他各種各樣專業(yè)。我們預(yù)期這個(gè)大模型、智能體就能夠成為軟件開(kāi)發(fā)、數(shù)據(jù)分析、系統(tǒng)觸控、機(jī)械控制的各個(gè)方面專業(yè)智能體，而這件事情體現(xiàn)的就是智能體背后的大模型泛化能力。

泛化性方面，最近國(guó)際上這兩年的時(shí)間，其實(shí)是能夠看到非常日新月異的發(fā)展。剛才我們的主持人，其實(shí)提到了其中一個(gè)非常重要的關(guān)鍵詞，就是要讓這個(gè)智能體能夠使用各種各樣專業(yè)工具，我們就可以設(shè)想各種各樣不同領(lǐng)域其實(shí)都有相應(yīng)專業(yè)工具的，所以這個(gè)是一個(gè)非常重要的方面。但是我們也會(huì)認(rèn)為，相關(guān)的專業(yè)領(lǐng)域也會(huì)有它各自的一些知識(shí)，也會(huì)有它自己的一些所謂SOP（標(biāo)準(zhǔn)化工作流程）。所有的這些專業(yè)領(lǐng)域，如何讓這個(gè)智能體能夠掌握使用會(huì)成為這個(gè)智能體泛化的一個(gè)非常重要體現(xiàn)。

在這方面有一個(gè)非常重要的特點(diǎn)，要讓智能體能夠從一個(gè)動(dòng)態(tài)環(huán)境中具備學(xué)習(xí)能力，所以我們現(xiàn)在會(huì)看到有非常多的科技工作者在提世界模型，其實(shí)就是要構(gòu)建多樣化的環(huán)境，來(lái)為這個(gè)智能體提供一個(gè)學(xué)習(xí)泛化能力的過(guò)程，這件事情其實(shí)是智能體泛化性的一個(gè)非常重要體現(xiàn)。

第二個(gè)挑戰(zhàn)，智能體的自主性（Autonomy）。我們認(rèn)為智能體要進(jìn)入到一個(gè)動(dòng)態(tài)的環(huán)境里面，它就要像人一樣在使用中適應(yīng)環(huán)境，主動(dòng)探索，不斷學(xué)習(xí)。它其實(shí)會(huì)需要能夠?qū)崿F(xiàn)一個(gè)感知自主、決策自主和學(xué)習(xí)自主，我們認(rèn)為這是非常重要的一個(gè)發(fā)展范式。

在過(guò)去的一年時(shí)間里面，包括DeepSeek的R1和OpenAI的o1，雖然表面上看是深度思考的能力，它更重要的技術(shù)，其實(shí)是背后的大規(guī)模強(qiáng)化學(xué)習(xí)，這其實(shí)體現(xiàn)了大模型或者人工智能學(xué)習(xí)。從過(guò)去大模型里面的模仿學(xué)習(xí)范式要推廣到或者說(shuō)躍遷到探索式的學(xué)習(xí)，甚至再進(jìn)一步它能夠進(jìn)入到完全開(kāi)放的環(huán)境進(jìn)行自主的探索和學(xué)習(xí)，我們認(rèn)為將會(huì)在未來(lái)2-3年內(nèi)實(shí)現(xiàn)這樣一種自主性構(gòu)建。

如何讓大模型或者智能體具備自主探索和自主演化的能力，其實(shí)是一個(gè)非常值得探索的話題。國(guó)內(nèi)外有非常多的學(xué)者在探索這個(gè)方面的工作，最近的半年時(shí)間有一個(gè)非常突飛猛進(jìn)的發(fā)展，如果大家去搜Reverse Learning（反向?qū)W習(xí)）會(huì)有一個(gè)非常清晰的感受。

第三個(gè)非常核心的挑戰(zhàn)，其實(shí)是智能體的長(zhǎng)程性(Long-Horizon-Capability）。它能不能去解一個(gè)越來(lái)越復(fù)雜的任務(wù)，而這個(gè)任務(wù)的復(fù)雜性體現(xiàn)的是完成步驟足夠長(zhǎng)，甚至可能是一個(gè)持續(xù)更長(zhǎng)，甚至終生的相關(guān)任務(wù)。剛才主持人也有提到，我們?nèi)绾伪３衷诃h(huán)路里（in the loop）。這個(gè)環(huán)路（loop）是什么？其實(shí)就是一個(gè)越來(lái)越長(zhǎng)的解決問(wèn)題的鏈條。在這個(gè)方面，過(guò)去的這兩年時(shí)間有非常多的探索，其實(shí)就是要讓這個(gè)模型具備更長(zhǎng)的上下文感知和經(jīng)驗(yàn)復(fù)用的能力。

而在這個(gè)方面核心的技術(shù)或者動(dòng)態(tài)，第一在模型內(nèi)部要能夠設(shè)計(jì)高效架構(gòu)，讓這個(gè)模型具備處理更長(zhǎng)上下文的能力；第二要在智能體層面設(shè)計(jì)能更好管理歷史信息的記憶架構(gòu)，突破當(dāng)前上下文的“窗口”局限，這個(gè)突破將會(huì)讓這個(gè)模型能夠在更多復(fù)雜場(chǎng)景里面具備更強(qiáng)的記憶能力和經(jīng)驗(yàn)復(fù)用的能力。

如何把上下文冗余消除掉？如何能夠讓計(jì)算成本極具下降？如何能讓推理效率極具提升？如何實(shí)現(xiàn)對(duì)歷史重要信息的主動(dòng)記憶，其實(shí)是非常重要的核心技術(shù)，這是構(gòu)成第三方面的關(guān)鍵技術(shù)。

我們總體來(lái)看，專業(yè)智能體它還有一個(gè)共同的技術(shù)基石，就是我們所謂的自主強(qiáng)化學(xué)習(xí)。剛才提到過(guò)去一年的時(shí)間，我們其實(shí)看到大模型學(xué)習(xí)范式從模仿學(xué)習(xí)到探索學(xué)習(xí)的躍遷，而我們會(huì)認(rèn)為智能體三大核心能力，包括泛化性、自主性和長(zhǎng)程性，其實(shí)都是高度依賴自主強(qiáng)化學(xué)習(xí)的提升。從人工智能科技發(fā)展來(lái)講，它的一個(gè)核心問(wèn)題。

以上是專業(yè)智能體方面，我們認(rèn)為核心技術(shù)與挑戰(zhàn)。

多智能體系統(tǒng)：邁向群體智能的“第二次涌現(xiàn)”

接下來(lái)就是多智能體系統(tǒng)，當(dāng)我們?cè)诟餍懈鳂I(yè)構(gòu)建足夠?qū)I(yè)的智能體之后，我們接下來(lái)就需要讓這些智能體互相之間能夠進(jìn)行通信和協(xié)作。如何實(shí)現(xiàn)智能體的自主協(xié)作和動(dòng)態(tài)演化，從而形成全球范圍內(nèi)的智能體互聯(lián)網(wǎng)，其實(shí)是實(shí)現(xiàn)人機(jī)協(xié)同群體智能第二次涌現(xiàn)的非常重要基礎(chǔ)。這個(gè)方面其實(shí)有大量的成果，我相信一會(huì)兒會(huì)有非常多的科技工作者來(lái)給大家進(jìn)行分享，我就不做詳細(xì)的介紹。

智能體系統(tǒng)面臨的非常關(guān)鍵挑戰(zhàn)在于，當(dāng)我們把多個(gè)智能體讓它有不同的專業(yè)背景，讓它們合作起來(lái)，顯然是可以去完成它們每個(gè)單個(gè)智能體所沒(méi)有辦法完成的更加復(fù)雜的任務(wù)，但是當(dāng)你讓多個(gè)智能體合作的過(guò)程，本身會(huì)引入非常大的額外計(jì)算，所以我們會(huì)看到一個(gè)非常重要的挑戰(zhàn)，這個(gè)挑戰(zhàn)就是多智能體系統(tǒng)能力提升與資源消耗之間其實(shí)是產(chǎn)生非常大的矛盾。我們需要做的事情，就是如何有效發(fā)揮群體智能的同時(shí)，能夠降低群體協(xié)作的資源開(kāi)銷，提升協(xié)作的效率。也就是我們剛才所提到的，協(xié)作的社會(huì)化效率問(wèn)題。

在這個(gè)方面非常核心需要解決的三大問(wèn)題，第一個(gè)方面，高效的交互。在國(guó)際上來(lái)講，非常重要的動(dòng)態(tài)，我們看到會(huì)看到包括Anthropic、Google在內(nèi)的非常多團(tuán)隊(duì)，其實(shí)都在嘗試著提出面向多智能體的標(biāo)準(zhǔn)化通信協(xié)議，不管是A2A（智能體對(duì)智能體），還是我們團(tuán)隊(duì)提出來(lái)的internet of agents（智能體互聯(lián)網(wǎng)），其實(shí)都在嘗試著構(gòu)建一個(gè)更加高效的交互協(xié)議。這個(gè)顯然會(huì)像歷史的互聯(lián)網(wǎng)協(xié)議標(biāo)準(zhǔn)化過(guò)程一樣，也是爭(zhēng)奪話語(yǔ)權(quán)非常重要的方面。而在這個(gè)方面，一個(gè)非常重要值得做的工作，如何研發(fā)一個(gè)標(biāo)準(zhǔn)化、最小化交流協(xié)議和互操作驗(yàn)證平臺(tái)，能夠降低通信開(kāi)銷，提升智能體高效協(xié)同。

第二個(gè)方面，從國(guó)際上來(lái)看，各大公司其實(shí)都在構(gòu)建多模態(tài)研究團(tuán)隊(duì)，并且推出自己的多智能體協(xié)作系統(tǒng)框架。這個(gè)事情其實(shí)就是要用于探索智能體組織化、自動(dòng)化編排和動(dòng)態(tài)協(xié)作，這也是我們國(guó)內(nèi)在這個(gè)方面比較有前景的一個(gè)地方。這個(gè)方面非常核心的一個(gè)問(wèn)題，其實(shí)就是如何能夠讓多智能體進(jìn)行分布式自主編排，能夠讓它路由的過(guò)程更加的高效，這件事情由于時(shí)間關(guān)系，我就不再特別多的介紹，應(yīng)該說(shuō)國(guó)內(nèi)外已經(jīng)有非常多的案例。

第三個(gè)方面，非常前沿的問(wèn)題，其實(shí)也是對(duì)應(yīng)前面所謂的自主強(qiáng)化學(xué)習(xí)。我們可以想象，面向?qū)I(yè)智能體，我們當(dāng)然需要它能夠具備自主的學(xué)習(xí)能力。面向一個(gè)團(tuán)隊(duì)，我們也可以設(shè)想，任何一個(gè)優(yōu)秀的團(tuán)隊(duì)都是善于向歷史去進(jìn)行學(xué)習(xí)的。所以我們可以想象，一個(gè)多智能體的群體團(tuán)隊(duì)，它也應(yīng)該具備從歷史工作經(jīng)驗(yàn)中總結(jié)經(jīng)驗(yàn)、總結(jié)教訓(xùn)，這件事情其實(shí)就涉及多智能體的群體演化與學(xué)習(xí)的能力。目前來(lái)講，這個(gè)方面多集中在學(xué)術(shù)界進(jìn)行前沿探索，其實(shí)我們也能夠看到，最近這兩年非常重要的特點(diǎn)，學(xué)術(shù)界與產(chǎn)業(yè)界邊界沒(méi)有那么清晰，我們?cè)诜浅？焖俚匕炎钋把丶夹g(shù)突破應(yīng)用到前沿相關(guān)應(yīng)用中去，這是我們特別值得關(guān)注的一個(gè)非常重要方面。如何實(shí)現(xiàn)智能體集群經(jīng)驗(yàn)共享與知識(shí)遷移，會(huì)是這個(gè)里面非常關(guān)鍵的問(wèn)題。

下一代群體智能的目標(biāo)：實(shí)現(xiàn)專業(yè)Agent的規(guī)?；蛯I(yè)化

我適當(dāng)d地總結(jié)一下，我們會(huì)認(rèn)為下一代群體智能非常重要的目標(biāo)，是要能夠?qū)崿F(xiàn)這種專業(yè)智能體的規(guī)?；蛯I(yè)化，實(shí)現(xiàn)群體智能的合作協(xié)作社會(huì)化的廣度和效率，從而能夠?qū)崿F(xiàn)面向人工智能的第二次涌現(xiàn)。

因?yàn)槲覀兛吹降氖沁^(guò)去這5年的時(shí)間，大模型越來(lái)越大、能力越來(lái)越強(qiáng)，它更像是個(gè)體智能的涌現(xiàn)，我們接下來(lái)想要迎來(lái)的就是由眾多專業(yè)智能體合作的群體智能涌現(xiàn)。面向未來(lái)一個(gè)非常重要值得探索的底層問(wèn)題，就是群體智能的涌現(xiàn)激勵(lì)到底是什么，我們?nèi)绾文軌蜃龅饺魏我粋€(gè)群體智能團(tuán)隊(duì)新加一個(gè)智能體，都能讓它合作效能比之前更高，我們能夠做到尋找到給定一個(gè)智能體的團(tuán)隊(duì)，我們能夠找到一個(gè)最優(yōu)讓它通信合作機(jī)制，這些都是我們未來(lái)值得探索的方面。

展望未來(lái)，我們整個(gè)人類社會(huì)都是由一個(gè)又一個(gè)人類專家所構(gòu)成的，我們未來(lái)一定會(huì)實(shí)現(xiàn)通過(guò)構(gòu)建崗位孿生的專業(yè)智能體和組織孿生的智能體群，從而形成群體智能的涌現(xiàn)，這就是我們對(duì)邁向下一代通用人工智能階段的關(guān)鍵問(wèn)題，以及相應(yīng)的愿景。

責(zé)任編輯：宦艷紅

圖片編輯：施佳慧

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#大模型 #Agent #人工智能 #群體智能