中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

“AI界的拼多多”DeepSeek發(fā)布新模型

澎湃新聞記者 喻琰
2024-12-27 15:21
來源:澎湃新聞
? 未來2% >
字號

12月26日晚間,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(以下簡稱“深度求索”)宣布,全新系列模型DeepSeek-V3首個版本上線并同步開源。

深度求索表示,DeepSeek-V3在知識類任務(wù)(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5顯著提升,接近當(dāng)前表現(xiàn)最好的模型Anthropic公司于10月發(fā)布的Claude-3.5-Sonnet-1022。在美國數(shù)學(xué)競賽(AIME 2024, MATH)和全國高中數(shù)學(xué)聯(lián)賽(CNMO 2024)上,DeepSeek-V3大幅超過了其他所有開源閉源模型。另外,在生成速度上,DeepSeek-V3的生成吐字速度從20TPS(Transactions Per Second每秒完成的事務(wù)數(shù)量)大幅提高至60TPS,相比V2.5模型實現(xiàn)了3倍的提升,能夠帶來更加流暢的使用體驗。

DeepSeek-V3和其他模型的比較。圖片來源:Deep Seek微信公眾號

Meta AI研究科學(xué)家田淵棟對DeepSeek-V3各個方向上的進展都表示贊賞,稱“這是一項了不起的工作”。

據(jù)官方技術(shù)論文披露,DeepSeek-V3模型的總訓(xùn)練成本為557.6萬美元,而GPT-4o等模型的訓(xùn)練成本約為1億美元。深度求索表示,“這是一個全新的開始?!?。

公開信息顯示,深度求索成立于2023年7月17日,由知名量化資管巨頭幻方量化創(chuàng)立,幻方量化創(chuàng)始人梁文峰在量化投資和高性能計算領(lǐng)域具有深厚的背景和豐富的經(jīng)驗。成立半年后,發(fā)布了第一代大模型DeepSeek Coder;2024年5月發(fā)布了其第二代開源Mixture-of-Experts(MoE)模型——DeepSeek-V2。DeepSeek V2模型因在中文綜合能力評測中的出色表現(xiàn),且以極低的推理成本引發(fā)行業(yè)關(guān)注,被稱為“AI界的拼多多”。DeepSeek-V3模型API服務(wù)定價為每百萬輸入tokens為0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens價格為8元,并享有45天的優(yōu)惠價格體驗期。

    責(zé)任編輯:宦艷紅
    圖片編輯:朱偉輝
    校對:張艷
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋