AI Agent概念火爆，但今年不可能實現(xiàn)

2025-03-11 13:06

來源：澎湃新聞·澎湃號·湃客

最近關于AI Agent的概念很火爆，也有公司宣布成功開發(fā)了AI Agent智能體，并且要有邀請碼才能試用。但是我想說的是，今年真正的AI Agent無法實現(xiàn)。為什么呢？

AI Agent 在英文里面的意思，就是AI代理或AI代理人，當然在國內(nèi)翻譯成人工智能體或人工智能代理。其實這種翻譯并不準確，當然有文學的宏大感與技術(shù)美感。而真正準確的，其實就是直接的翻譯，AI代理人，這個代理人的概念就類似于保險顧問，房產(chǎn)顧問，金融顧問之類的，是一種可以自主執(zhí)行任務的AI程式，它可以感知環(huán)境、做出決策并執(zhí)行行動，就像一個代替人類完成工作的代理人。

AI Agent 的核心是基于大語言模型 (LLM)，例如 GPT-4，它負責理解和處理人類的指令。但 AI Agent 不僅僅是大語言模型，它還包含其他組件，例如數(shù)據(jù)感知、外部工具調(diào)用、角色設定、任務規(guī)劃等等，這些組件讓 AI Agent 能夠處理更復雜的任務。

簡單的說，AI Agent就是一個具有更高智能，更高情商的大語言模型，就如同OpenAI最新宣布的GPT4.5一樣，在智商、情商方面都進行了更有效的升級。換句話說，就是讓人工智能更懂人，更能聽懂我們的文字表達，并且能夠?qū)崿F(xiàn)相應的思考與決策，從而給出更符合我們想要的結(jié)果。

那么為什么我說今年AI Agent還不能實現(xiàn)呢？原因就在于我們還無法有效的解決機器幻覺的問題。就以OpenAI的GPT4.5來看，毫無疑問，這是目前最強的大語言模型，或者說代表著嘴領先水平的大模型。但在SimpleQA基準測試中，GPT-4.5的準確率為62.5%，幻覺率為7.1%，盡管這一成績要遠優(yōu)于GPT-4o、OpenAI o1和o3-mini等模型，但是依然存在著相當高的幻覺率。

而其他的一些模型，那就更不談這個幻覺率的問題。在AI領域，如果拋開幻覺率來談大模型的先進性，就等于是耍流氓。因此，與其談AI Agent是否在今年實現(xiàn)這種沒有意義的炒作，不如關注我們是否能有效的找到方法解決機器幻覺的問題。

特別聲明

本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機構(gòu)觀點，不代表澎湃新聞的觀點或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報

#AI Agent #AI #Agent #大模型 #DeepSeek