下載客戶端

登錄

DeepSeek-R1下載量破千萬：這不是AI的斯普特尼克時(shí)刻，而是開源的勝利

2025-02-18 10:41

來源：澎湃新聞·澎湃號·湃客

發(fā)布僅僅一個(gè)月左右，DeepSeek-R1成為Hugging Face平臺上有史以來最受歡迎的模型，其衍生出的數(shù)千個(gè)變體模型下載量突破了1000萬次！2月14日，Hugging Face聯(lián)合創(chuàng)始人Clément Delangue在推特上激動(dòng)宣布。

從Delangue分享的圖表中可以明顯看出，DeepSeek-R1（黃線）的下載量增長曲線幾乎呈現(xiàn)出“垂直起飛”的態(tài)勢，其他開源大模型，如Llama、Stable Diffusion、Mistral等增速相對緩慢。

這是繼DeepSeek AI智能助手登頂美區(qū)App Store免費(fèi)下載榜之后另一個(gè)振奮人心的消息。

我們來看看DeepSeek AI智能助手上架一個(gè)月后表現(xiàn)如何？

2月14日，它在生產(chǎn)工具類別下依然高居第三，排行榜的榜首被ChatGPT奪回，Google Gemini排在第四位。

在DeepSeek的評論區(qū)里，不少用戶給出了高度評價(jià)：

“取消GPT訂閱。我喜歡能夠閱讀它的‘推理’過程......更不用說我在我的MacBook 上運(yùn)行了14b和32b本地模型。比Apple Intelligence好多了......我認(rèn)為如果DeepSeek能夠用更少的錢把事情做好，蘋果應(yīng)該解雇負(fù)責(zé)蘋果智能研究的人?！?/p>

“五星好評！我最近有機(jī)會(huì)使用DeepSeek，我必須說，它徹底改變了我處理數(shù)據(jù)分析和決策的方式.....真正讓我印象深刻的是它提供的定制和靈活性......感謝DeepSeek創(chuàng)造了如此強(qiáng)大且用戶友好的解決方案！”

不過整體而言，DeepSeek的評分僅為4.1分，與兩大競爭對手ChatGPT（4.9 分）和Google Gemini（4.8 分）仍有差距。

考慮到ChatGPT和Gemini經(jīng)過多輪優(yōu)化，UI/UX設(shè)計(jì)更為成熟，用戶體驗(yàn)也更流暢；而DeepSeek雖然在AI模型壓縮和輕量化方面表現(xiàn)出色，但用戶在實(shí)際使用中仍可能遇到響應(yīng)延遲、服務(wù)器不穩(wěn)定、訪問受限等問題。此外，作為一款來自中國的產(chǎn)品，其在美國市場的信任度相對較低。在這樣的背景下，DeepSeek依然能取得當(dāng)前的口碑和下載量，已相當(dāng)可觀。

回顧過去一個(gè)月，DeepSeek頻頻登上各大媒體的頭版頭條，成為科技公司和風(fēng)投界熱議的焦點(diǎn)。

憑借推出“平價(jià)好用”的大語言模型，這家總部位于杭州的公司更是引發(fā)了市場對“燒錢”型AI模式的深刻反思，同時(shí)也在一定程度上攪動(dòng)了美股市場。

1月27日，隨著其AI智能助手登頂美區(qū)App Store免費(fèi)下載榜，納斯達(dá)克指數(shù)暴跌超3%，一度觸及19204.95點(diǎn)；標(biāo)普500指數(shù)則下跌1.46%，最低降至5962.92點(diǎn)。

隨著FOMO（Fear of Missing Out）情緒的消退，目前兩大指數(shù)均已有所修復(fù)，在上周五，納指重新站上20000點(diǎn)，標(biāo)普500指數(shù)則回升至6,114.63點(diǎn)。

DeepSeek 為什么“震撼”了美國？

先上結(jié)論，主要有四個(gè)點(diǎn)對美國產(chǎn)生了極大的“震撼”：

1.極低的訓(xùn)練成本：DeepSeek團(tuán)隊(duì)聲稱僅花費(fèi)了600萬美元就訓(xùn)練出了 R1，而GPT-4的訓(xùn)練成本預(yù)計(jì)高達(dá)數(shù)億美元。

2.中國AI研究實(shí)力的證明：美國一直在限制對中國的AI芯片出口（如 Nvidia GPU），但DeepSeek仍能取得突破，說明芯片封鎖并未阻止中國AI的發(fā)展。

3.開源且提供極其寬松的許可：DeepSeek-R1采用MIT許可證，比Meta的 Llama 還要開放，任何人都可以免費(fèi)使用、修改和二次開發(fā)，甚至商用化。

4.推理過程（reasoning traces）的公開：這點(diǎn)很重要。以往，OpenAI在發(fā)布A1時(shí)并沒有公開推理過程，而推理過程的公開可以幫助小模型快速進(jìn)行知識蒸餾（distillation），讓小模型的訓(xùn)練成本更低、速度更快。

其實(shí)，DeepSeek在“爆火”之前，英文技術(shù)社區(qū)已經(jīng)對它進(jìn)行了一段時(shí)間的關(guān)注了。

在HackerNews上，最早的討論可追溯至 2024 年 9 月，當(dāng)時(shí)一名用戶表示 DeepSeek的性能看起來不錯(cuò)，但對用戶條款、隱私政策等存疑，而其他用戶則回復(fù)道：“這是個(gè)開源模型，便宜又好用，不用太擔(dān)心?！?/p>

2024年10月發(fā)布的一篇名為“DeepSeek v2.5 – 一個(gè)和GPT-4相當(dāng)?shù)拈_源大語言模型，但價(jià)格便宜95%” 的帖子也引發(fā)了熱烈討論，足見許多開發(fā)者都在尋找更經(jīng)濟(jì)實(shí)用的大語言模型。但大部分評論者認(rèn)為，DeepSeek v2.5在功能完整度和性能上并不能完全替代GPT-4，更多是以極具優(yōu)勢的價(jià)格覆蓋了基本需求，幫助開發(fā)者大幅降低日常研發(fā)和調(diào)用成本。

10月到12月之間，我們可以看到依舊有不少討論DeepSeek的帖子。

接下來的劇情就是，1月20日，DeepSeek正式推出了R-1。這是一個(gè)在數(shù)學(xué)、代碼生成和自然語言推理等任務(wù)上，可與OpenAI的o1模型相媲美，但對計(jì)算資源消耗卻遠(yuǎn)低于市面主流大模型的全新大語言模型。隨著DeepSeek的AI智能助手沖上美區(qū)蘋果免費(fèi)應(yīng)用排行榜第一，美國科技公司的股價(jià)受到重創(chuàng)。

在匿名職場社交平臺Blind上，一位Meta員工爆料，DeepSeek對Meta GenAI業(yè)務(wù)部門造成了巨大沖擊：

“管理層擔(dān)心如何證明GenAI業(yè)務(wù)部門的巨額成本是合理的。當(dāng)GenAI業(yè)務(wù)部門的每一位領(lǐng)導(dǎo)的收入都超過完全培訓(xùn)DeepSeek v3的成本時(shí)，他們將如何面對更高的領(lǐng)導(dǎo)層？何況我們有幾十位這樣的領(lǐng)導(dǎo)。Deepseek-R1讓事情變得更加可怕。我不能透露機(jī)密信息，但它很快就會(huì)公開。GenAI本應(yīng)是一個(gè)專注于工程的小型組織，但由于一群人想加入影響力爭奪戰(zhàn)并人為地增加組織的招聘人數(shù)，每個(gè)人都輸了?！?/p>

一名谷歌員工在回復(fù)中也給出了最受支持的觀點(diǎn)：

“DeepSeek的做法的確瘋狂。但這對整個(gè)行業(yè)是好事，我們正在實(shí)時(shí)見證公開競爭如何有效地推動(dòng)創(chuàng)新?！?/p>

盡管不確定Meta GenAI部門是否真如帖子所言那樣焦灼，但可以肯定的是，OpenAI、谷歌、Anthropic等AI巨頭正在切實(shí)感受到來自DeepSeek的壓力，并紛紛加快更新產(chǎn)品以鞏固自身優(yōu)勢。

1月31日，OpenAI宣布推出全新推理模型o3-mini，并首次向免費(fèi)用戶開放。作為OpenAI推理系列中的最新產(chǎn)品，o3-mini相較o1價(jià)格便宜了93%，其中輸入價(jià)格為1.10美元/百萬Tokens，輸出價(jià)格為4.40美元/百萬Tokens。

2月5日，谷歌高調(diào)更新了Gemini 2.0全家桶，包括面向通用場景的Gemini 2.0 Flash、性能更強(qiáng)的Gemini 2.0 Pro，以及性價(jià)比最高的Gemini 2.0 Flash-Lite。官方信息顯示，Gemini 2.0 Flash-Lite與1.5 Flash在速度和成本上持平，最大的亮點(diǎn)是“高性價(jià)比”，其輸入價(jià)格為0.075美元/百萬Tokens，輸出價(jià)格為0.30美元/百萬Tokens。

與DeepSeek-R1的輸入/輸出價(jià)格（分別為0.14美元和2.19美元/百萬Tokens）相比，o3-mini依然偏貴；而Gemini 2.0 Flash-Lite雖然成本更低，但在需要更強(qiáng)算力或更復(fù)雜推理的場景中，表現(xiàn)相對遜色。

面對這樣“便宜大碗”的模型，開發(fā)者們怎么能不動(dòng)心？

Perplexity率先接入了DeepSeek，微軟CEO薩提亞·納德拉也在1月29日的財(cái)報(bào)電話會(huì)議上宣布：DeepSeek-R1可通過Azure AI Foundry和GitHub獲取。隨后，AWS、英偉達(dá)、AMD、Intel等云服務(wù)及芯片巨頭紛紛快速跟進(jìn)，爭相搭上DeepSeek的“快車”，希望借其更低成本、更高效的推理能力來增強(qiáng)各自的AI生態(tài)，以及更好地滿足開發(fā)者需求。

在錯(cuò)綜復(fù)雜的地緣政治環(huán)境下，中美在AI領(lǐng)域常因政策與監(jiān)管產(chǎn)生分歧。然而，DeepSeek采用開源和寬松許可模式發(fā)布其模型，讓更多研究者能夠跨越國別和制度鴻溝，進(jìn)行深度探索與驗(yàn)證。這種“社區(qū)共建”的機(jī)制，不僅推動(dòng)了技術(shù)的快速迭代與傳播，也在很大程度上弱化了地緣競爭中的不信任感，為AI創(chuàng)新建立了一個(gè)相對開放的公共平臺，給業(yè)界帶來了強(qiáng)烈的“震撼”。

這是AI的斯普特尼克時(shí)刻？還是一份禮物？

1957 年，蘇聯(lián)成功發(fā)射人類歷史上的第一顆人造衛(wèi)星——斯普特尼克（Sputnik），美國人頓覺領(lǐng)先地位被撼動(dòng)，不得不全力投入到一場空前的太空競賽中。

今天，美國主流媒體也將中國團(tuán)隊(duì)推出的DeepSeek-R1視作一種“AI的斯普特尼克時(shí)刻”，因?yàn)樗瑯佑|動(dòng)了科技界的神經(jīng)，引發(fā)了類似當(dāng)年的危機(jī)感與緊迫感。甚至美國總統(tǒng)唐納德·特朗普也宣稱這是“對我們AI行業(yè)的警鐘，我們需要全神貫注于競爭”。

在美國風(fēng)險(xiǎn)投資機(jī)構(gòu)Andreessen Horowitz（a16z）的合伙人Martin Casado看來，這場AI競賽和當(dāng)年的太空競賽沒什么兩樣，美國必須贏。

他在近期的播客中談到，DeepSeek之所以能在短時(shí)間內(nèi)獲得巨大關(guān)注，一是因?yàn)樗_源程度極高，采用了極其寬松的許可證；二是公開了推理過程，讓小模型能夠快速進(jìn)行知識蒸餾，進(jìn)一步降低訓(xùn)練成本與加快推理速度。與之形成鮮明對比的是，為了鞏固自己在行業(yè)里的領(lǐng)先地位，冠著“Open”名號的OpenAI在發(fā)布o(jì)1時(shí)并沒有公開任何推理細(xì)節(jié)。

(Martin Casado在播客里)

Casado是工程師出身，在a16z專注于企業(yè)軟件、網(wǎng)絡(luò)安全、云計(jì)算和人工智能等領(lǐng)域的投資。

他還坦言，美國近年來的AI政策是失敗的——高密度、高強(qiáng)度的出口管制，試圖在芯片和軟件層面封鎖中國的AI發(fā)展，這樣的措施沒有達(dá)到預(yù)期效果，DeepSeek的崛起就是最好的證明。

“我們需要從一個(gè)更廣闊的視角來看待這個(gè)問題——中國確實(shí)有頂尖的AI研究團(tuán)隊(duì)。DeepSeek其實(shí)已經(jīng)發(fā)布過多個(gè)業(yè)界領(lǐng)先（SOTA）的模型，比如V3，可能比R1更具技術(shù)含量。類似于GPT-4，它們也是基于鏈?zhǔn)剿季S（Chain of Thought, CoT）進(jìn)行推理的，而DeepSeek早就在這方面有所研究。”Casado說到。

當(dāng)年的斯普特尼克讓美國重新思考自身科技與教育體系，同時(shí)加速了對太空探索的投入。如今，面對DeepSeek的崛起，更值得反思的是，在打著自由市場旗號的美國，OpenAI、谷歌、Anthropic 等 AI 巨頭大多優(yōu)先考慮專有模型，而中國團(tuán)隊(duì)則通過開源方式實(shí)現(xiàn)了突破性進(jìn)展，進(jìn)一步降低最前沿 AI 的門檻和成本，構(gòu)建起蓬勃發(fā)展的AI生態(tài)系統(tǒng)。

對大公司而言，私有化模型有助于把控知識產(chǎn)權(quán)、強(qiáng)化自身在市場中的地位。然而，這種高度封閉的發(fā)展方式在高速演進(jìn)的AI領(lǐng)域里，越來越難以滿足公眾對技術(shù)開放和透明度的期待，也可能成為創(chuàng)新與合作的桎梏。

在政府層面，白宮對AI領(lǐng)域?qū)嵤┑乃懔ο拗坪痛a封鎖等舉措，不但沒有遏制中國的進(jìn)步，反而在某種程度上束縛了美國自身的領(lǐng)先優(yōu)勢。

a16z的另一位合伙人Alex Rampell更直截了當(dāng)?shù)刂赋觯鞍莸钦畵?dān)心如果美國的AI開源，中國會(huì)復(fù)制。但DeepSeek反其道而行之——現(xiàn)在是中國發(fā)布了開源AI，而美國的公司都想使用它或復(fù)刻它，因?yàn)樗男阅軐?shí)在太強(qiáng)了。”

開源曾是美國高科技領(lǐng)域里最引以為傲的“殺手锏”，早年的互聯(lián)網(wǎng)協(xié)議、操作系統(tǒng)、數(shù)據(jù)庫等關(guān)鍵技術(shù)，正是在廣泛開放的環(huán)境下得以快速迭代，助力美國牢牢把握信息革命的制高點(diǎn)。然而，近幾年由于對知識產(chǎn)權(quán)與商業(yè)收益的高度關(guān)注，再加上對國家安全和經(jīng)濟(jì)制裁層面的考量，一些科技巨頭選擇更加封閉的研發(fā)模式，縮減了行業(yè)合作與創(chuàng)新的空間。

Rampell并不認(rèn)為DeepSeek是“新的斯普特尼克時(shí)刻”，而是“給美國人民的禮物”：它讓“驕傲”的美國不得不正視全球AI競爭的現(xiàn)狀，加速在技術(shù)、人才和資金上的投入。

在這樣的大背景下，越來越多的科技人呼吁，美國的AI政策必須做出深層調(diào)整。繼續(xù)靠封鎖和管控來保持優(yōu)勢，只會(huì)失去推動(dòng)全行業(yè)整體躍升的機(jī)會(huì)。正如Meta首席人工智能科學(xué)家 Yann LeCun 在LinkedIn上所言：“對于那些看到DeepSeek表現(xiàn)、認(rèn)為這是中國在人工智能領(lǐng)域超越美國的人來說，你們理解錯(cuò)了。正確的解讀是開源模型正在超越專有模型?！?/p>

隨著AI競爭逐漸從單純追求更大規(guī)模、更多參數(shù)和更強(qiáng)算力，轉(zhuǎn)向注重應(yīng)用與生態(tài)的深度整合，誰能讓大模型在不同行業(yè)場景中快速落地，并構(gòu)建強(qiáng)大的協(xié)同網(wǎng)絡(luò)，誰就能在這場競賽中率先勝出。

英偉達(dá)CEO黃仁勛就曾強(qiáng)調(diào)，模型規(guī)模本身并不代表市場價(jià)值，真正能讓技術(shù)落地的，取決于能否與現(xiàn)實(shí)需求無縫對接；斯坦福大學(xué)教授吳恩達(dá)（Andrew Ng）也在演講中反復(fù)提到：解決實(shí)際問題、為用戶創(chuàng)造價(jià)值，才是所有大模型發(fā)展的根本目標(biāo)。從醫(yī)療、金融到零售，每個(gè)行業(yè)都有不同的業(yè)務(wù)痛點(diǎn)和法規(guī)要求，促使研發(fā)團(tuán)隊(duì)必須進(jìn)行針對性的模型裁剪與定制。

在這種趨勢下，像DeepSeek這樣依托開放、彈性生態(tài)系統(tǒng)的團(tuán)隊(duì)，不僅能為行業(yè)提供更低門檻的成長路線，還能不斷吸納開發(fā)者與合作伙伴，讓AI技術(shù)在更多應(yīng)用場景釋放潛力，保持可持續(xù)發(fā)展。

OpenAI CEO Sam Altman也開始反思他的策略。在o3-mini發(fā)布會(huì)后，這位硅谷天才創(chuàng)業(yè)者與幾位高管在Reddit上回答網(wǎng)友提問，在問及是否會(huì)公開部分大模型權(quán)重時(shí)，Altman坦言：“我個(gè)人認(rèn)為，我們在開源策略上可能走錯(cuò)了方向，需要探索一種全新的開放模式。不過，并非所有OpenAI成員都認(rèn)同這一觀點(diǎn)，而且目前這也并非我們的最高優(yōu)先級。”

或許DeepSeek不僅是開源大模型的一次重大勝利，更是一份“送給世界的禮物”，將為整個(gè)行業(yè)樹立了全新的標(biāo)桿。

特別聲明

本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場，澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報(bào)

#DeepSeek-R1