- +1
Grok 4發(fā)布,地表最強AI,所有學術領域達到博士水平
原創(chuàng) 文摘菌 大數(shù)據(jù)文摘

大數(shù)據(jù)文摘出品
7月9日晚間,Elon Musk正式發(fā)布他迄今為止最強的人工智能模型:Grok 4。
這款模型由他領導的xAI團隊打造,被Musk本人形容為“大爆炸級別的智能進化”。
在推特上,官方賬號稱:Grok 4是“地表最強”(世界上最強大)的AI模型。顯然,這不是簡單升級,而是一次全方位能力的躍遷。

據(jù)悉,Grok 4具備自然語音對話功能,能像人類一樣順暢表達,打破以往AI對話割裂感。
它不僅能處理文本,還可支持圖像輸入,未來甚至可能加入視頻識別功能,大步邁入真正的多模態(tài)AI時代。
開發(fā)者還將獲得“Grok 4 Code”專屬版本,用于寫代碼、調試和解釋邏輯,直逼GitHub Copilot與GPT-4的水平。
據(jù)說,Grok 4不只是聰明,它甚至“會唱歌”,聲音自然,還能理解互聯(lián)網(wǎng)語言、俚語和段子,成為最懂網(wǎng)絡文化的AI之一。

目前,對于Gork-4,在官網(wǎng)付費用戶已經可以使用。
Grok 4的發(fā)布并非“情緒宣傳”,而是有硬核數(shù)據(jù)為背書。根據(jù)Artificial Analysis的完整基準測試,Grok 4以AI指數(shù)73分,首次登頂全球第一。

這一分數(shù)直接擊敗了OpenAI的O3(70分)、Google的Gemini 2.5 Pro(70分)和Anthropic的Claude 4 Opus(64分)。
更關鍵的是,Grok 4在數(shù)學、編碼和綜合推理測試中全面碾壓,成為“人類最后的考試”上表現(xiàn)最強的AI。
在LiveCodeBench和SciCode測試中,Grok 4取得編碼準確率88%,創(chuàng)造歷史最高紀錄。

在GPQA Diamond測試中也拿下88%的高分,超過此前由Gemini 2.5 Pro保持的84%記錄。
“人類最后的考試”中,Grok 4 heavy版獲得50.7%的突破性成績,是目前唯一觸及這一高度的模型。
在AIME 2024和MMLU-Pro這兩項權威測試中,分別斬獲94%和87%的驚人得分。

據(jù)推特網(wǎng)友,對于這個模型的能力,Elon Musk說:“Grok 4可能在所有領域達到博士水平的模型?!?/p>
也有技術觀察者提醒:“那場考試的名字叫‘人類最后的考試’,但很可能不是AI的極限,而是人類理解力的終點?!?
此外,雖然它的輸出速度(75 tokens/s)低于O3(188 tokens/s)和Gemini 2.5 Pro(142 tokens/s),但依舊優(yōu)于Claude 4 Opus(66 tokens/s),性能穩(wěn)居一線。
同時,Grok 4支持長達256k token的上下文處理,允許進行復雜文檔分析與記憶性任務處理。
它還能調用函數(shù)、生成結構化結果,整體架構更適合應用于科研、商業(yè)、教育等高負載任務場景。
定價方面仍與Grok 3持平:每百萬輸入token收取3美元,輸出為15美元,緩存輸入更低至0.75美元。
原標題:《Grok 4 發(fā)布,地表最強 AI,所有學術領域達到博士水平》
本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司