- +1
AI Agent概念火爆,但今年不可能實現(xiàn)
最近關于AI Agent的概念很火爆,也有公司宣布成功開發(fā)了AI Agent智能體,并且要有邀請碼才能試用。但是我想說的是,今年真正的AI Agent無法實現(xiàn)。為什么呢?
AI Agent 在英文里面的意思,就是AI代理或AI代理人,當然在國內(nèi)翻譯成人工智能體或人工智能代理。其實這種翻譯并不準確,當然有文學的宏大感與技術(shù)美感。而真正準確的,其實就是直接的翻譯,AI代理人,這個代理人的概念就類似于保險顧問,房產(chǎn)顧問,金融顧問之類的,是一種可以自主執(zhí)行任務的AI程式,它可以感知環(huán)境、做出決策并執(zhí)行行動,就像一個代替人類完成工作的代理人。
AI Agent 的核心是基于大語言模型 (LLM),例如 GPT-4,它負責理解和處理人類的指令。但 AI Agent 不僅僅是大語言模型,它還包含其他組件,例如數(shù)據(jù)感知、外部工具調(diào)用、角色設定、任務規(guī)劃等等,這些組件讓 AI Agent 能夠處理更復雜的任務。
簡單的說,AI Agent就是一個具有更高智能,更高情商的大語言模型,就如同OpenAI最新宣布的GPT4.5一樣,在智商、情商方面都進行了更有效的升級。換句話說,就是讓人工智能更懂人,更能聽懂我們的文字表達,并且能夠?qū)崿F(xiàn)相應的思考與決策,從而給出更符合我們想要的結(jié)果。
那么為什么我說今年AI Agent還不能實現(xiàn)呢?原因就在于我們還無法有效的解決機器幻覺的問題。就以OpenAI的GPT4.5來看,毫無疑問,這是目前最強的大語言模型,或者說代表著嘴領先水平的大模型。但在SimpleQA基準測試中,GPT-4.5的準確率為62.5%,幻覺率為7.1%,盡管這一成績要遠優(yōu)于GPT-4o、OpenAI o1和o3-mini等模型,但是依然存在著相當高的幻覺率。
而其他的一些模型,那就更不談這個幻覺率的問題。在AI領域,如果拋開幻覺率來談大模型的先進性,就等于是耍流氓。因此,與其談AI Agent是否在今年實現(xiàn)這種沒有意義的炒作,不如關注我們是否能有效的找到方法解決機器幻覺的問題。
本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司