中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

邁向智能體時(shí)代的第一步!DeepSeek V3.1發(fā)布,上下文擴(kuò)展至128K,影響有多大?

澎湃新聞?dòng)浾?范佳來(lái) 胡含嫣 實(shí)習(xí)生 劉天穎
2025-08-21 16:49
來(lái)源:澎湃新聞
? 10%公司 >
字號(hào)

國(guó)產(chǎn)大模型公司深度求索旗下DeepSeek低調(diào)上新,多領(lǐng)域能力提升。

8月21日下午,DeepSeek正式發(fā)布DeepSeek-V3.1,稱其為“邁向Agent(智能體)時(shí)代的第一步”。8月20日晚間,DeepSeek低調(diào)上線DeepSeek V3.1,此次升級(jí)推出的新功能引發(fā)廣泛關(guān)注,V3.1已在HuggingFace趨勢(shì)榜排名第三。

據(jù)介紹,V3.1包含三大主要變化。首先,V3.1采用混合推理架構(gòu),一個(gè)模型同時(shí)支持思考模式與非思考模式;其次,V3.1具有更高的思考效率,相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短時(shí)間內(nèi)給出答案;另外,V3.1具有更強(qiáng)的Agent能力,通過(guò)Post-Training優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。

在技術(shù)架構(gòu)層面,V3.1繼承了DeepSeekV3系列的關(guān)鍵技術(shù),包括MLA、MoE等,參數(shù)量與V3版本相同。

DeepSeekV3.1最引人注目的升級(jí)之一是將上下文窗口從原有的64k擴(kuò)展至128k,意味著其可以處理更長(zhǎng)篇幅的文檔和代碼,并在回答內(nèi)容上進(jìn)一步增加信息,提供更多細(xì)節(jié),語(yǔ)氣更為活潑。

從官方APP和網(wǎng)頁(yè)端的顯示來(lái)看,DeepSeek去掉了“深度思考(R1)”中的“R1”標(biāo)識(shí)。同時(shí),與V3-base相比,DeepSeekV3.1新增了四個(gè)特殊Token。雖然目前DeepSeek官方尚未發(fā)布任何關(guān)于這一改動(dòng)的消息,有推測(cè)認(rèn)為,這可能暗示著推理模型R系列與非推理模型V系列的融合,以此實(shí)現(xiàn)GPU資源復(fù)用。

同時(shí),V3.1在編程任務(wù)中表現(xiàn)突出。根據(jù)社區(qū)使用Aider測(cè)試數(shù)據(jù),V3.1在AiderPolyglot多語(yǔ)言編程測(cè)試中,拿下了71.6%的高分,超越了Claude4Opus和DeepSeekR1等模型。在SVGBench基準(zhǔn)測(cè)試中,其實(shí)力僅次于GPT-4.1-mini,遠(yuǎn)超DeepSeekR1。

DeepSeek方面表示,V3.1在多項(xiàng)搜索評(píng)測(cè)指標(biāo)上也取得了較大提升。在需要多步推理的復(fù)雜搜索測(cè)試(browsecomp)與多學(xué)科專(zhuān)家級(jí)難題測(cè)試(HLE)上,DeepSeek-V3.1 性能已大幅領(lǐng)先 R1-0528。

在多語(yǔ)言支持方面,V3.1也進(jìn)行了明顯的能力優(yōu)化,目前能處理超過(guò)100種語(yǔ)言,尤其優(yōu)化了亞洲語(yǔ)言和資源較少語(yǔ)種的運(yùn)用。

此外,V3.1在Token使用量方面較0324版本下降約13%,每次完整編程任務(wù)僅需1.01美元,成本僅為專(zhuān)有系統(tǒng)的六十分之一,具有節(jié)約成本的優(yōu)勢(shì)。

值得注意的是,DeepSeek也宣布,9月6日凌晨起,對(duì)DeepSeek開(kāi)放平臺(tái) API 接口調(diào)用價(jià)格進(jìn)行調(diào)整并取消夜間時(shí)段優(yōu)惠。輸入:0.5元/百萬(wàn)tokens(緩存命中),4元/百萬(wàn)tokens(緩存未命中);輸出:12元/百萬(wàn)tokens。今年2月,DeepSeek曾經(jīng)宣布,北京時(shí)間每日 00:30 至 08:30 的夜間空閑時(shí)段,DeepSeek開(kāi)放平臺(tái)推出錯(cuò)峰優(yōu)惠活動(dòng)。在此期間,API 調(diào)用價(jià)格大幅下調(diào):DeepSeek-V3 降至原價(jià)的 50%,DeepSeek-R1 更低至 25%。V3標(biāo)準(zhǔn)時(shí)間段收費(fèi)為:輸入:0.5元/百萬(wàn)tokens(緩存命中),2元/百萬(wàn)tokens(緩存未命中);輸出:8元/百萬(wàn)tokens。

此外,DeepSeek還表示,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的參數(shù)精度。UE8M0 FP8是針對(duì)即將發(fā)布的下一代國(guó)產(chǎn)芯片設(shè)計(jì)。

DeepSeek新模型一經(jīng)推出,便在技術(shù)社區(qū)擁有超高人氣和受關(guān)注度,一舉沖到HuggingFace趨勢(shì)榜第三。

不過(guò),雖然V3.1在多個(gè)方面有進(jìn)步,但部分功能體驗(yàn)也受到網(wǎng)友詬病。多名測(cè)試者反饋,V3.1在數(shù)學(xué)推理、邏輯分析等綜合推理任務(wù)中無(wú)明顯進(jìn)步,甚至在部分場(chǎng)景下表現(xiàn)不及舊版,也未看到“幻覺(jué)”問(wèn)題的改善跡象,還出現(xiàn)了“中英文混雜”的新問(wèn)題。在一些特定領(lǐng)域,如研究生級(jí)基準(zhǔn)問(wèn)答、軟件工程的某些復(fù)雜場(chǎng)景中,與頂尖模型如GPT-5相比仍有一定差距。

在其他大模型方面,市場(chǎng)競(jìng)爭(zhēng)依然激烈,動(dòng)作頻出。OpenAI籌劃萬(wàn)億級(jí)AI基建、Meta計(jì)劃再次重組其AI業(yè)務(wù)、智譜發(fā)布手機(jī)AgentAutoGLM2.0……根據(jù)ArtificialAnalysis最新大模型排名榜單,DeepSeek已從昔日“領(lǐng)跑”變?yōu)椤爸杏巍彼?,OpenAI、Google、阿里巴巴等競(jìng)爭(zhēng)對(duì)手躍至前位。

雖然自DeepSeek-R1推理大模型發(fā)布后,圈內(nèi)始終對(duì)DeepSeek保持高度關(guān)注,期待其繼續(xù)成為國(guó)產(chǎn)“黑馬”,但其長(zhǎng)期的“沉默”,也確實(shí)帶來(lái)了用戶的流失,QuestMobile在《2025年二季度AI應(yīng)用價(jià)值榜》中提到,DeepSeek月均下載量從第一季度的8111.3萬(wàn)猛降至2258.9萬(wàn),下滑超過(guò)70%?;钴S用戶規(guī)模方面,從2025年3月的1936.1萬(wàn)降至6月的1629.5萬(wàn),下滑趨勢(shì)明顯。

近日,有市場(chǎng)傳言稱,DeepSeek R2有望在8月15日至30日期間發(fā)布。8月13日,DeepSeek內(nèi)部人士向澎湃新聞?dòng)浾弑硎?,上述消息不屬?shí)。

盡管官方流量下滑,但DeepSeek仍有市場(chǎng)潛力,其開(kāi)源模型被騰訊、字節(jié)跳動(dòng)、阿里、百度等眾多第三方平臺(tái)廣泛接入,據(jù)估算有超過(guò)70%的DeepSeek模型調(diào)用量發(fā)生在這些第三方平臺(tái)。Token消耗量上,DeepSeek系列7月31日單日總Token用量達(dá)到70.5B,6月29日單日總Token用量達(dá)到54B,環(huán)比增長(zhǎng)接近31%。

第三方機(jī)構(gòu)onelittleweb分析顯示,就其全球市場(chǎng)表現(xiàn)而言,DeepSeek模型以3.96%的市場(chǎng)份額在全球AI聊天機(jī)器人中綜合評(píng)分排名第五,年度訪問(wèn)量達(dá)27.4億次。

    責(zé)任編輯:是冬冬
    圖片編輯:施佳慧
    校對(duì):張艷
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋