中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

劉知遠(yuǎn):大模型到專業(yè)Agent的躍遷必須解決的三大核心挑戰(zhàn)

澎湃新聞記者 喻琰
2025-09-16 07:06
來源:澎湃新聞
? 科學(xué)城邦 >
字號

在日前舉行的2025外灘大會“智能體時代進(jìn)化論”分論壇上,清華大學(xué)長聘副教授、面壁智能首席科學(xué)家劉知遠(yuǎn)系統(tǒng)剖析了AI從大模型向Agent躍遷的必然趨勢,并深入探討了“專業(yè)智能體”與“多智能體系統(tǒng)”所面臨的核心技術(shù)挑戰(zhàn)與未來愿景。

劉知遠(yuǎn)認(rèn)為,AI發(fā)展的下一階段,必然是讓模型走出虛擬世界進(jìn)入到真實的環(huán)境中實現(xiàn)交互,即實現(xiàn)從大模型向智能體的躍遷。而這一過程躍遷的核心在于,AI不再僅僅是一個具備知識的“大腦”,而要成為一個能通過使用工具、自主學(xué)習(xí)來探索世界的行動者。

劉知遠(yuǎn)的分享極具啟發(fā)性,以下是澎湃科技整理后的演講實錄: 

人工智能的能力圖譜包括四方面的能力

劉知遠(yuǎn)演講的PPT

今天主題是智能體,這個智能體應(yīng)該說在社會上獲得廣泛的關(guān)注,應(yīng)該是從去年開始。我想從人工智能發(fā)展角度,這個智能體它都有什么樣的核心問題,關(guān)鍵技術(shù)是什么,以及接下來它的發(fā)展過程中,我們需要解決的挑戰(zhàn)以及一旦這個挑戰(zhàn)如果被解決了,然后它可能產(chǎn)生一個怎樣的巨大應(yīng)用,我想通過這樣一個引導(dǎo)發(fā)言,然后來給各位進(jìn)行一個分享。

人工智能有一個我們可以定義出來的能力圖譜,我們認(rèn)為它大致包括這四個方面的能力。

第一,它要有基座大模型,像大腦一樣來高效思考這個世界。我們也需要有一個非常好的敏銳感官,也就是多模態(tài)智能,能夠敏銳感知這個世界。第二,從2018年隨著大模型的發(fā)展,應(yīng)該說已經(jīng)形成包括文本基座模型和多模態(tài)模型一個非常前瞻式的應(yīng)用。我們認(rèn)為人工智能的能力圖譜除了這兩個部分,接下來還有兩個非常重要的組成部分。第三,探索能力,它能夠像一個專業(yè)的智能體一樣,專業(yè)探索這個世界、改造這個世界。第四,這些專業(yè)的智能體如何能夠互相進(jìn)行協(xié)作,形成群體智能,這是我們?nèi)斯ぶ悄艿谒膫€非常重要的板塊。

從圖譜的組成,其實我們就可以非常清晰地看到,人工智能發(fā)展非常顯著的脈絡(luò)。2018年一直到2025年,當(dāng)然隨著接下來的這幾年,我們肯定還會去見證模型隨著預(yù)訓(xùn)練的技術(shù),從一個非常小的,只有幾千萬的參數(shù)模型,現(xiàn)在增長到上萬億的規(guī)模,其實是一個類似于我們腦容量越來越大的一個過程,它具有更強(qiáng)對這個世界認(rèn)知方面的能力。

但是我們會認(rèn)為再進(jìn)一步,其實我們就不只是把這個模型本身能力進(jìn)行一個具備。我們其實還需要進(jìn)一步讓這個模型進(jìn)入到真實的環(huán)節(jié)、真實的世界,然后來進(jìn)行交互,這個過程其實就是一個智能體的過程。也就是通過工具的使用、自主學(xué)習(xí),能讓這個智能體變成在相關(guān)專業(yè)領(lǐng)域自主探索的專業(yè)智能體。它們再進(jìn)一步能夠形成群體智能,我們認(rèn)為人工智能應(yīng)該會在最近這幾年里面實現(xiàn)從大模型向智能體躍遷的這么一個過程。

這個過程的外在體現(xiàn)就能夠讓我們看到,從2022年開始,國內(nèi)外陸續(xù)有非常多和智能體相關(guān)的探索工作。相當(dāng)于在這個浪潮里面,應(yīng)該說我們國內(nèi)非常多學(xué)者和科技工作者所從事的工作站在世界的前沿。這些其實都是表象,我們要深入到人工智能未來發(fā)展的趨勢,然后來去看待智能體核心挑戰(zhàn)是什么。這個角度來講,我們認(rèn)為人類社會的發(fā)展,我們?nèi)祟惿鐣旧硎侨祟愔悄芤粋€非常高度發(fā)達(dá)的階段,我們可以想象,人工智能未來發(fā)展的這一態(tài)勢,應(yīng)該說人類社會的發(fā)展會對它有一個非常重要的啟示。

AI發(fā)展兩大方向:個體專業(yè)化和協(xié)作專業(yè)化

過去的這幾百年,人類的社會發(fā)展有什么重要的特點?在社會學(xué)領(lǐng)域有兩個非常重要的觀點,我們會認(rèn)為這體現(xiàn)了人類社會從生產(chǎn)力、效能等方面的特點。第一,社會學(xué)的奠基人涂爾干曾經(jīng)提出,“個體的專業(yè)化是群體效能提升的基礎(chǔ)”。也就是說,在過去的這幾百年的時間里面,我們會見證我們?nèi)祟惿鐣拿恳粋€人都在呈現(xiàn)一個專業(yè)化的程度和規(guī)模,然后變得非常的壯大的過程,這個會成為我們?nèi)斯ぶ悄芤M(jìn)行發(fā)展的非常重要方向,也就是要去構(gòu)建相關(guān)各行各業(yè)、各個領(lǐng)域的專業(yè)智能體。

另外一個非常重要的特點,馬克思在社會學(xué)方面提出的一個觀點,協(xié)作社會化是生產(chǎn)力發(fā)展的必然結(jié)果,科技革命為這種擴(kuò)張?zhí)峁┝思夹g(shù)可能。我們會看到過去的這幾百年的時間,隨著技術(shù)的發(fā)展,隨著互聯(lián)網(wǎng)的出現(xiàn),信息社會的出現(xiàn),我們整個人類社會協(xié)作的社會化廣度和效率都大為地提升,而從這個角度來講,我們也可以預(yù)期未來人工智能的發(fā)展也一定會構(gòu)建一套更加高效、廣泛的多智能體系統(tǒng),這將構(gòu)成接下來兩個非常重要的組成部分。

專業(yè)智能體的三大核心挑戰(zhàn)

首先我們來看一下專業(yè)智能體這個角度核心技術(shù)與主要挑戰(zhàn)是什么?我們認(rèn)為專業(yè)智能體將是下一代人工智能非常重要的發(fā)展方向。也就是說,要讓這個模型進(jìn)入到一個多樣多變復(fù)雜的真實世界中進(jìn)行交互,來完成相關(guān)的復(fù)雜任務(wù)。從這個角度來講,我們就可以設(shè)想,當(dāng)大模型放到一個真實的環(huán)節(jié),它所面臨的挑戰(zhàn)是什么,挑戰(zhàn)就是環(huán)境的多樣性、環(huán)境的多變性,以及任務(wù)的復(fù)雜性。

針對這些挑戰(zhàn),我們認(rèn)為我們所需要解決的,其實就是智能體的三個性的問題。

第一個是智能體的泛化性(Generalization)。在真實的世界里面,智能體其實需要能夠面對多樣化的環(huán)境,它就需要具備在那些訓(xùn)練過程中能夠接觸過的環(huán)境中,這個模型能不能做出合理的決策,完成這些復(fù)雜的任務(wù)。我們可以設(shè)想,當(dāng)我們把大模型放到不同的領(lǐng)域,它有可能是編程領(lǐng)域、數(shù)據(jù)庫領(lǐng)域、系統(tǒng)環(huán)境領(lǐng)域,也有可能是物理環(huán)境領(lǐng)域,或者是其他各種各樣專業(yè)。我們預(yù)期這個大模型、智能體就能夠成為軟件開發(fā)、數(shù)據(jù)分析、系統(tǒng)觸控、機(jī)械控制的各個方面專業(yè)智能體,而這件事情體現(xiàn)的就是智能體背后的大模型泛化能力。

 泛化性方面,最近國際上這兩年的時間,其實是能夠看到非常日新月異的發(fā)展。剛才我們的主持人,其實提到了其中一個非常重要的關(guān)鍵詞,就是要讓這個智能體能夠使用各種各樣專業(yè)工具,我們就可以設(shè)想各種各樣不同領(lǐng)域其實都有相應(yīng)專業(yè)工具的,所以這個是一個非常重要的方面。但是我們也會認(rèn)為,相關(guān)的專業(yè)領(lǐng)域也會有它各自的一些知識,也會有它自己的一些所謂SOP(標(biāo)準(zhǔn)化工作流程)。所有的這些專業(yè)領(lǐng)域,如何讓這個智能體能夠掌握使用會成為這個智能體泛化的一個非常重要體現(xiàn)。

 在這方面有一個非常重要的特點,要讓智能體能夠從一個動態(tài)環(huán)境中具備學(xué)習(xí)能力,所以我們現(xiàn)在會看到有非常多的科技工作者在提世界模型,其實就是要構(gòu)建多樣化的環(huán)境,來為這個智能體提供一個學(xué)習(xí)泛化能力的過程,這件事情其實是智能體泛化性的一個非常重要體現(xiàn)。

 第二個挑戰(zhàn),智能體的自主性(Autonomy)。我們認(rèn)為智能體要進(jìn)入到一個動態(tài)的環(huán)境里面,它就要像人一樣在使用中適應(yīng)環(huán)境,主動探索,不斷學(xué)習(xí)。它其實會需要能夠?qū)崿F(xiàn)一個感知自主、決策自主和學(xué)習(xí)自主,我們認(rèn)為這是非常重要的一個發(fā)展范式。

在過去的一年時間里面,包括DeepSeek的R1和OpenAI的o1,雖然表面上看是深度思考的能力,它更重要的技術(shù),其實是背后的大規(guī)模強(qiáng)化學(xué)習(xí),這其實體現(xiàn)了大模型或者人工智能學(xué)習(xí)。從過去大模型里面的模仿學(xué)習(xí)范式要推廣到或者說躍遷到探索式的學(xué)習(xí),甚至再進(jìn)一步它能夠進(jìn)入到完全開放的環(huán)境進(jìn)行自主的探索和學(xué)習(xí),我們認(rèn)為將會在未來2-3年內(nèi)實現(xiàn)這樣一種自主性構(gòu)建。

如何讓大模型或者智能體具備自主探索和自主演化的能力,其實是一個非常值得探索的話題。國內(nèi)外有非常多的學(xué)者在探索這個方面的工作,最近的半年時間有一個非常突飛猛進(jìn)的發(fā)展,如果大家去搜Reverse Learning(反向?qū)W習(xí))會有一個非常清晰的感受。

第三個非常核心的挑戰(zhàn),其實是智能體的長程性(Long-Horizon-Capability)。它能不能去解一個越來越復(fù)雜的任務(wù),而這個任務(wù)的復(fù)雜性體現(xiàn)的是完成步驟足夠長,甚至可能是一個持續(xù)更長,甚至終生的相關(guān)任務(wù)。剛才主持人也有提到,我們?nèi)绾伪3衷诃h(huán)路里(in the loop)。這個環(huán)路(loop)是什么?其實就是一個越來越長的解決問題的鏈條。在這個方面,過去的這兩年時間有非常多的探索,其實就是要讓這個模型具備更長的上下文感知和經(jīng)驗復(fù)用的能力。

而在這個方面核心的技術(shù)或者動態(tài),第一在模型內(nèi)部要能夠設(shè)計高效架構(gòu),讓這個模型具備處理更長上下文的能力;第二要在智能體層面設(shè)計能更好管理歷史信息的記憶架構(gòu),突破當(dāng)前上下文的“窗口”局限,這個突破將會讓這個模型能夠在更多復(fù)雜場景里面具備更強(qiáng)的記憶能力和經(jīng)驗復(fù)用的能力。

如何把上下文冗余消除掉?如何能夠讓計算成本極具下降?如何能讓推理效率極具提升?如何實現(xiàn)對歷史重要信息的主動記憶,其實是非常重要的核心技術(shù),這是構(gòu)成第三方面的關(guān)鍵技術(shù)。

 我們總體來看,專業(yè)智能體它還有一個共同的技術(shù)基石,就是我們所謂的自主強(qiáng)化學(xué)習(xí)。剛才提到過去一年的時間,我們其實看到大模型學(xué)習(xí)范式從模仿學(xué)習(xí)到探索學(xué)習(xí)的躍遷,而我們會認(rèn)為智能體三大核心能力,包括泛化性、自主性和長程性,其實都是高度依賴自主強(qiáng)化學(xué)習(xí)的提升。從人工智能科技發(fā)展來講,它的一個核心問題。

以上是專業(yè)智能體方面,我們認(rèn)為核心技術(shù)與挑戰(zhàn)。

多智能體系統(tǒng):邁向群體智能的“第二次涌現(xiàn)”

接下來就是多智能體系統(tǒng),當(dāng)我們在各行各業(yè)構(gòu)建足夠?qū)I(yè)的智能體之后,我們接下來就需要讓這些智能體互相之間能夠進(jìn)行通信和協(xié)作。如何實現(xiàn)智能體的自主協(xié)作和動態(tài)演化,從而形成全球范圍內(nèi)的智能體互聯(lián)網(wǎng),其實是實現(xiàn)人機(jī)協(xié)同群體智能第二次涌現(xiàn)的非常重要基礎(chǔ)。這個方面其實有大量的成果,我相信一會兒會有非常多的科技工作者來給大家進(jìn)行分享,我就不做詳細(xì)的介紹。

智能體系統(tǒng)面臨的非常關(guān)鍵挑戰(zhàn)在于,當(dāng)我們把多個智能體讓它有不同的專業(yè)背景,讓它們合作起來,顯然是可以去完成它們每個單個智能體所沒有辦法完成的更加復(fù)雜的任務(wù),但是當(dāng)你讓多個智能體合作的過程,本身會引入非常大的額外計算,所以我們會看到一個非常重要的挑戰(zhàn),這個挑戰(zhàn)就是多智能體系統(tǒng)能力提升與資源消耗之間其實是產(chǎn)生非常大的矛盾。我們需要做的事情,就是如何有效發(fā)揮群體智能的同時,能夠降低群體協(xié)作的資源開銷,提升協(xié)作的效率。也就是我們剛才所提到的,協(xié)作的社會化效率問題。

在這個方面非常核心需要解決的三大問題,第一個方面,高效的交互。在國際上來講,非常重要的動態(tài),我們看到會看到包括Anthropic、Google在內(nèi)的非常多團(tuán)隊,其實都在嘗試著提出面向多智能體的標(biāo)準(zhǔn)化通信協(xié)議,不管是A2A(智能體對智能體),還是我們團(tuán)隊提出來的internet of agents(智能體互聯(lián)網(wǎng)),其實都在嘗試著構(gòu)建一個更加高效的交互協(xié)議。這個顯然會像歷史的互聯(lián)網(wǎng)協(xié)議標(biāo)準(zhǔn)化過程一樣,也是爭奪話語權(quán)非常重要的方面。而在這個方面,一個非常重要值得做的工作,如何研發(fā)一個標(biāo)準(zhǔn)化、最小化交流協(xié)議和互操作驗證平臺,能夠降低通信開銷,提升智能體高效協(xié)同。

第二個方面,從國際上來看,各大公司其實都在構(gòu)建多模態(tài)研究團(tuán)隊,并且推出自己的多智能體協(xié)作系統(tǒng)框架。這個事情其實就是要用于探索智能體組織化、自動化編排和動態(tài)協(xié)作,這也是我們國內(nèi)在這個方面比較有前景的一個地方。這個方面非常核心的一個問題,其實就是如何能夠讓多智能體進(jìn)行分布式自主編排,能夠讓它路由的過程更加的高效,這件事情由于時間關(guān)系,我就不再特別多的介紹,應(yīng)該說國內(nèi)外已經(jīng)有非常多的案例。

第三個方面,非常前沿的問題,其實也是對應(yīng)前面所謂的自主強(qiáng)化學(xué)習(xí)。我們可以想象,面向?qū)I(yè)智能體,我們當(dāng)然需要它能夠具備自主的學(xué)習(xí)能力。面向一個團(tuán)隊,我們也可以設(shè)想,任何一個優(yōu)秀的團(tuán)隊都是善于向歷史去進(jìn)行學(xué)習(xí)的。所以我們可以想象,一個多智能體的群體團(tuán)隊,它也應(yīng)該具備從歷史工作經(jīng)驗中總結(jié)經(jīng)驗、總結(jié)教訓(xùn),這件事情其實就涉及多智能體的群體演化與學(xué)習(xí)的能力。目前來講,這個方面多集中在學(xué)術(shù)界進(jìn)行前沿探索,其實我們也能夠看到,最近這兩年非常重要的特點,學(xué)術(shù)界與產(chǎn)業(yè)界邊界沒有那么清晰,我們在非??焖俚匕炎钋把丶夹g(shù)突破應(yīng)用到前沿相關(guān)應(yīng)用中去,這是我們特別值得關(guān)注的一個非常重要方面。如何實現(xiàn)智能體集群經(jīng)驗共享與知識遷移,會是這個里面非常關(guān)鍵的問題。

下一代群體智能的目標(biāo):實現(xiàn)專業(yè)Agent的規(guī)?;蛯I(yè)化

我適當(dāng)d地總結(jié)一下,我們會認(rèn)為下一代群體智能非常重要的目標(biāo),是要能夠?qū)崿F(xiàn)這種專業(yè)智能體的規(guī)模化和專業(yè)化,實現(xiàn)群體智能的合作協(xié)作社會化的廣度和效率,從而能夠?qū)崿F(xiàn)面向人工智能的第二次涌現(xiàn)。

因為我們看到的是過去這5年的時間,大模型越來越大、能力越來越強(qiáng),它更像是個體智能的涌現(xiàn),我們接下來想要迎來的就是由眾多專業(yè)智能體合作的群體智能涌現(xiàn)。面向未來一個非常重要值得探索的底層問題,就是群體智能的涌現(xiàn)激勵到底是什么,我們?nèi)绾文軌蜃龅饺魏我粋€群體智能團(tuán)隊新加一個智能體,都能讓它合作效能比之前更高,我們能夠做到尋找到給定一個智能體的團(tuán)隊,我們能夠找到一個最優(yōu)讓它通信合作機(jī)制,這些都是我們未來值得探索的方面。

展望未來,我們整個人類社會都是由一個又一個人類專家所構(gòu)成的,我們未來一定會實現(xiàn)通過構(gòu)建崗位孿生的專業(yè)智能體和組織孿生的智能體群,從而形成群體智能的涌現(xiàn),這就是我們對邁向下一代通用人工智能階段的關(guān)鍵問題,以及相應(yīng)的愿景。

    責(zé)任編輯:宦艷紅
    圖片編輯:施佳慧
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋