DeepSeek R2沒等來，R1“小升級”發(fā)布：思考時間更長，效果如何？

澎湃新聞記者范佳來

2025-05-29 15:09

來源：澎湃新聞

? 10%公司 >

DeepSeek低調升級，引發(fā)科技圈熱議。

5月28日，DeepSeek 在官方微信群發(fā)布消息稱，DeepSeek R1模型已完成“小版本試升級”，歡迎前往官方網頁、APP、小程序測試（打開深度思考），API 接口和使用方式保持不變。

不過，澎湃新聞記者查詢官方網站等，發(fā)現(xiàn)沒有對此次更新的詳細信息。記者咨詢了一位DeepSeek內部人士，對方回復稱是“小升級”。

根據(jù)Hugging Face，DeepSeek-R1此次開源版本為0528。

從宣傳來看，此次升級十分低調，不過，根據(jù)網友測評，此次升級可不是簡單的“小升級”。

有科技媒體分析稱，時隔4個月，DeepSeek-R1完成了超進化，編碼能力強到離譜，而且思考時間更長了。據(jù)稱，新模型基于DeepSeek-V3-0324訓練（參數(shù)為660B）。在LiveCodeBench基準上，DeepSeek-R1-0528性能幾乎與o3-mini（High）和o4-mini（Medium)實力相當，一舉超越了Gemini 2.5 Flash。

科技類網站“AIGC開放社區(qū)”的評論稱，在著名代碼測試平臺Live CodeBench中顯示，其性能可以媲美OpenAI最新的o3模型高版本。也有網友對新版R1的風格進行了測試，幾乎和OpenAI的o3差不多。

從社交媒體的反饋來看，網友最為關注的是此次DeepSeek R1更新后的思考時間變長。據(jù)測評顯示，此次DeepSeek單任務處理時長可達30-60分鐘。

此外，有網友通過實驗對比了Claude-4-Sonnet與DeepSeek-R1-0528的實際表現(xiàn)?？梢钥吹?，DeepSeek-R1生成的代碼在模擬物理碰撞方面表現(xiàn)更好。

值得注意的是，此前有傳言稱，深度求索可能將在5月推出下一代AI大模型DeepSeek-R2。

有報道稱，DeepSeek-R2大模型將會采用一種更先進的混合專家模型(MoE)，其結合更加智能的門控網絡層(Gating Network)以優(yōu)化高負載推理任務的性能。

不過，當時有內部人士向記者坦言，該傳言真實度不高。從目前的情況分析，DeepSeek或許將用此次R1版本的升級，取代R2版本的推出。

盡管網友評測得出的結論十分驚喜，但是也有業(yè)內人士向記者表示，建議理性客觀看待，也期待更為權威的測評結果。

在DeepSeek R1發(fā)布更新后，遠在大洋彼岸的AI巨頭英偉達（Nasdaq：NVDA）發(fā)布截至4月27日的2026財年第一財季財報，期內實現(xiàn)營收440.62億美元，同比上漲69%，高于市場預期的432.8億美元；美國通用會計準則（GAAP）下凈利潤187.75億美元，同比上漲26%。在財報電話會上，英偉達CEO黃仁勛再次談到DeepSeek所引發(fā)的市場對于推理模型的關注，以及推理模型會需要更大的算力支持，這將驅動推理算力需求。

責任編輯：孫扶

圖片編輯：沈軻

澎湃新聞報料：021-962866

澎湃新聞，未經授權不得轉載

我要舉報

#DeepSeek-R1 #deepseek