中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

DeepSeek-R1下載量破千萬:這不是AI的斯普特尼克時(shí)刻,而是開源的勝利

2025-02-18 10:41
來源:澎湃新聞·澎湃號·湃客
字號

發(fā)布僅僅一個(gè)月左右,DeepSeek-R1成為Hugging Face平臺上有史以來最受歡迎的模型,其衍生出的數(shù)千個(gè)變體模型下載量突破了1000萬次!2月14日,Hugging Face聯(lián)合創(chuàng)始人Clément Delangue在推特上激動(dòng)宣布。

從Delangue分享的圖表中可以明顯看出,DeepSeek-R1(黃線)的下載量增長曲線幾乎呈現(xiàn)出“垂直起飛”的態(tài)勢,其他開源大模型,如Llama、Stable Diffusion、Mistral等增速相對緩慢。

這是繼DeepSeek AI智能助手登頂美區(qū)App Store免費(fèi)下載榜之后另一個(gè)振奮人心的消息。

我們來看看DeepSeek AI智能助手上架一個(gè)月后表現(xiàn)如何?

2月14日,它在生產(chǎn)工具類別下依然高居第三,排行榜的榜首被ChatGPT奪回,Google Gemini排在第四位。

在DeepSeek的評論區(qū)里,不少用戶給出了高度評價(jià):

“取消GPT訂閱。我喜歡能夠閱讀它的‘推理’過程......更不用說我在我的MacBook 上運(yùn)行了14b和32b本地模型。比Apple Intelligence好多了......我認(rèn)為如果DeepSeek能夠用更少的錢把事情做好,蘋果應(yīng)該解雇負(fù)責(zé)蘋果智能研究的人?!?/p>

“五星好評!我最近有機(jī)會(huì)使用DeepSeek,我必須說,它徹底改變了我處理數(shù)據(jù)分析和決策的方式.....真正讓我印象深刻的是它提供的定制和靈活性......感謝DeepSeek創(chuàng)造了如此強(qiáng)大且用戶友好的解決方案!”

不過整體而言,DeepSeek的評分僅為4.1分,與兩大競爭對手ChatGPT(4.9 分)和Google Gemini(4.8 分)仍有差距。

考慮到ChatGPT和Gemini經(jīng)過多輪優(yōu)化,UI/UX設(shè)計(jì)更為成熟,用戶體驗(yàn)也更流暢;而DeepSeek雖然在AI模型壓縮和輕量化方面表現(xiàn)出色,但用戶在實(shí)際使用中仍可能遇到響應(yīng)延遲、服務(wù)器不穩(wěn)定、訪問受限等問題。此外,作為一款來自中國的產(chǎn)品,其在美國市場的信任度相對較低。在這樣的背景下,DeepSeek依然能取得當(dāng)前的口碑和下載量,已相當(dāng)可觀。

回顧過去一個(gè)月,DeepSeek頻頻登上各大媒體的頭版頭條,成為科技公司和風(fēng)投界熱議的焦點(diǎn)。

憑借推出“平價(jià)好用”的大語言模型,這家總部位于杭州的公司更是引發(fā)了市場對“燒錢”型AI模式的深刻反思,同時(shí)也在一定程度上攪動(dòng)了美股市場。

1月27日,隨著其AI智能助手登頂美區(qū)App Store免費(fèi)下載榜,納斯達(dá)克指數(shù)暴跌超3%,一度觸及19204.95點(diǎn);標(biāo)普500指數(shù)則下跌1.46%,最低降至5962.92點(diǎn)。

隨著FOMO(Fear of Missing Out)情緒的消退,目前兩大指數(shù)均已有所修復(fù),在上周五,納指重新站上20000點(diǎn),標(biāo)普500指數(shù)則回升至6,114.63點(diǎn)。

DeepSeek 為什么“震撼”了美國?

先上結(jié)論,主要有四個(gè)點(diǎn)對美國產(chǎn)生了極大的“震撼”:

1.極低的訓(xùn)練成本:DeepSeek團(tuán)隊(duì)聲稱僅花費(fèi)了600萬美元就訓(xùn)練出了 R1,而GPT-4的訓(xùn)練成本預(yù)計(jì)高達(dá)數(shù)億美元。

2.中國AI研究實(shí)力的證明:美國一直在限制對中國的AI芯片出口(如 Nvidia GPU),但DeepSeek仍能取得突破,說明芯片封鎖并未阻止中國AI的發(fā)展。

3.開源且提供極其寬松的許可:DeepSeek-R1采用MIT許可證,比Meta的 Llama 還要開放,任何人都可以免費(fèi)使用、修改和二次開發(fā),甚至商用化。

4.推理過程(reasoning traces)的公開:這點(diǎn)很重要。以往,OpenAI在發(fā)布A1時(shí)并沒有公開推理過程,而推理過程的公開可以幫助小模型快速進(jìn)行知識蒸餾(distillation),讓小模型的訓(xùn)練成本更低、速度更快。

其實(shí),DeepSeek在“爆火”之前,英文技術(shù)社區(qū)已經(jīng)對它進(jìn)行了一段時(shí)間的關(guān)注了。

在HackerNews上,最早的討論可追溯至 2024 年 9 月,當(dāng)時(shí)一名用戶表示 DeepSeek的性能看起來不錯(cuò),但對用戶條款、隱私政策等存疑,而其他用戶則回復(fù)道:“這是個(gè)開源模型,便宜又好用,不用太擔(dān)心?!?/p>

2024年10月發(fā)布的一篇名為“DeepSeek v2.5 – 一個(gè)和GPT-4相當(dāng)?shù)拈_源大語言模型,但價(jià)格便宜95%” 的帖子也引發(fā)了熱烈討論,足見許多開發(fā)者都在尋找更經(jīng)濟(jì)實(shí)用的大語言模型。但大部分評論者認(rèn)為,DeepSeek v2.5在功能完整度和性能上并不能完全替代GPT-4,更多是以極具優(yōu)勢的價(jià)格覆蓋了基本需求,幫助開發(fā)者大幅降低日常研發(fā)和調(diào)用成本。

10月到12月之間,我們可以看到依舊有不少討論DeepSeek的帖子。

接下來的劇情就是,1月20日,DeepSeek正式推出了R-1。這是一個(gè)在數(shù)學(xué)、代碼生成和自然語言推理等任務(wù)上,可與OpenAI的o1模型相媲美,但對計(jì)算資源消耗卻遠(yuǎn)低于市面主流大模型的全新大語言模型。隨著DeepSeek的AI智能助手沖上美區(qū)蘋果免費(fèi)應(yīng)用排行榜第一,美國科技公司的股價(jià)受到重創(chuàng)。

在匿名職場社交平臺Blind上,一位Meta員工爆料,DeepSeek對Meta GenAI業(yè)務(wù)部門造成了巨大沖擊:

“管理層擔(dān)心如何證明GenAI業(yè)務(wù)部門的巨額成本是合理的。當(dāng)GenAI業(yè)務(wù)部門的每一位領(lǐng)導(dǎo)的收入都超過完全培訓(xùn)DeepSeek v3的成本時(shí),他們將如何面對更高的領(lǐng)導(dǎo)層?何況我們有幾十位這樣的領(lǐng)導(dǎo)。Deepseek-R1讓事情變得更加可怕。我不能透露機(jī)密信息,但它很快就會(huì)公開。GenAI本應(yīng)是一個(gè)專注于工程的小型組織,但由于一群人想加入影響力爭奪戰(zhàn)并人為地增加組織的招聘人數(shù),每個(gè)人都輸了?!?/p>

一名谷歌員工在回復(fù)中也給出了最受支持的觀點(diǎn):

“DeepSeek的做法的確瘋狂。但這對整個(gè)行業(yè)是好事,我們正在實(shí)時(shí)見證公開競爭如何有效地推動(dòng)創(chuàng)新?!?/p>

盡管不確定Meta GenAI部門是否真如帖子所言那樣焦灼,但可以肯定的是,OpenAI、谷歌、Anthropic等AI巨頭正在切實(shí)感受到來自DeepSeek的壓力,并紛紛加快更新產(chǎn)品以鞏固自身優(yōu)勢。

1月31日,OpenAI宣布推出全新推理模型o3-mini,并首次向免費(fèi)用戶開放。作為OpenAI推理系列中的最新產(chǎn)品,o3-mini相較o1價(jià)格便宜了93%,其中輸入價(jià)格為1.10美元/百萬Tokens,輸出價(jià)格為4.40美元/百萬Tokens。

2月5日,谷歌高調(diào)更新了Gemini 2.0全家桶,包括面向通用場景的Gemini 2.0 Flash、性能更強(qiáng)的Gemini 2.0 Pro,以及性價(jià)比最高的Gemini 2.0 Flash-Lite。官方信息顯示,Gemini 2.0 Flash-Lite與1.5 Flash在速度和成本上持平,最大的亮點(diǎn)是“高性價(jià)比”,其輸入價(jià)格為0.075美元/百萬Tokens,輸出價(jià)格為0.30美元/百萬Tokens。

與DeepSeek-R1的輸入/輸出價(jià)格(分別為0.14美元和2.19美元/百萬Tokens)相比,o3-mini依然偏貴;而Gemini 2.0 Flash-Lite雖然成本更低,但在需要更強(qiáng)算力或更復(fù)雜推理的場景中,表現(xiàn)相對遜色。

面對這樣“便宜大碗”的模型,開發(fā)者們怎么能不動(dòng)心?

Perplexity率先接入了DeepSeek,微軟CEO薩提亞·納德拉也在1月29日的財(cái)報(bào)電話會(huì)議上宣布:DeepSeek-R1可通過Azure AI Foundry和GitHub獲取。隨后,AWS、英偉達(dá)、AMD、Intel等云服務(wù)及芯片巨頭紛紛快速跟進(jìn),爭相搭上DeepSeek的“快車”,希望借其更低成本、更高效的推理能力來增強(qiáng)各自的AI生態(tài),以及更好地滿足開發(fā)者需求。

在錯(cuò)綜復(fù)雜的地緣政治環(huán)境下,中美在AI領(lǐng)域常因政策與監(jiān)管產(chǎn)生分歧。然而,DeepSeek采用開源和寬松許可模式發(fā)布其模型,讓更多研究者能夠跨越國別和制度鴻溝,進(jìn)行深度探索與驗(yàn)證。這種“社區(qū)共建”的機(jī)制,不僅推動(dòng)了技術(shù)的快速迭代與傳播,也在很大程度上弱化了地緣競爭中的不信任感,為AI創(chuàng)新建立了一個(gè)相對開放的公共平臺,給業(yè)界帶來了強(qiáng)烈的“震撼”。

這是AI的斯普特尼克時(shí)刻?還是一份禮物?

1957 年,蘇聯(lián)成功發(fā)射人類歷史上的第一顆人造衛(wèi)星——斯普特尼克(Sputnik),美國人頓覺領(lǐng)先地位被撼動(dòng),不得不全力投入到一場空前的太空競賽中。

今天,美國主流媒體也將中國團(tuán)隊(duì)推出的DeepSeek-R1視作一種“AI的斯普特尼克時(shí)刻”,因?yàn)樗瑯佑|動(dòng)了科技界的神經(jīng),引發(fā)了類似當(dāng)年的危機(jī)感與緊迫感。甚至美國總統(tǒng)唐納德·特朗普也宣稱這是“對我們AI行業(yè)的警鐘,我們需要全神貫注于競爭”。

在美國風(fēng)險(xiǎn)投資機(jī)構(gòu)Andreessen Horowitz(a16z)的合伙人Martin Casado看來,這場AI競賽和當(dāng)年的太空競賽沒什么兩樣,美國必須贏。

他在近期的播客中談到,DeepSeek之所以能在短時(shí)間內(nèi)獲得巨大關(guān)注,一是因?yàn)樗_源程度極高,采用了極其寬松的許可證;二是公開了推理過程,讓小模型能夠快速進(jìn)行知識蒸餾,進(jìn)一步降低訓(xùn)練成本與加快推理速度。與之形成鮮明對比的是,為了鞏固自己在行業(yè)里的領(lǐng)先地位,冠著“Open”名號的OpenAI在發(fā)布o(jì)1時(shí)并沒有公開任何推理細(xì)節(jié)。

(Martin Casado在播客里)

Casado是工程師出身,在a16z專注于企業(yè)軟件、網(wǎng)絡(luò)安全、云計(jì)算和人工智能等領(lǐng)域的投資。

他還坦言,美國近年來的AI政策是失敗的——高密度、高強(qiáng)度的出口管制,試圖在芯片和軟件層面封鎖中國的AI發(fā)展,這樣的措施沒有達(dá)到預(yù)期效果,DeepSeek的崛起就是最好的證明。

“我們需要從一個(gè)更廣闊的視角來看待這個(gè)問題——中國確實(shí)有頂尖的AI研究團(tuán)隊(duì)。DeepSeek其實(shí)已經(jīng)發(fā)布過多個(gè)業(yè)界領(lǐng)先(SOTA)的模型,比如V3,可能比R1更具技術(shù)含量。類似于GPT-4,它們也是基于鏈?zhǔn)剿季S(Chain of Thought, CoT)進(jìn)行推理的,而DeepSeek早就在這方面有所研究。”Casado說到。

當(dāng)年的斯普特尼克讓美國重新思考自身科技與教育體系,同時(shí)加速了對太空探索的投入。如今,面對DeepSeek的崛起,更值得反思的是,在打著自由市場旗號的美國,OpenAI、谷歌、Anthropic 等 AI 巨頭大多優(yōu)先考慮專有模型,而中國團(tuán)隊(duì)則通過開源方式實(shí)現(xiàn)了突破性進(jìn)展,進(jìn)一步降低最前沿 AI 的門檻和成本,構(gòu)建起蓬勃發(fā)展的AI生態(tài)系統(tǒng)。

對大公司而言,私有化模型有助于把控知識產(chǎn)權(quán)、強(qiáng)化自身在市場中的地位。然而,這種高度封閉的發(fā)展方式在高速演進(jìn)的AI領(lǐng)域里,越來越難以滿足公眾對技術(shù)開放和透明度的期待,也可能成為創(chuàng)新與合作的桎梏。

在政府層面,白宮對AI領(lǐng)域?qū)嵤┑乃懔ο拗坪痛a封鎖等舉措,不但沒有遏制中國的進(jìn)步,反而在某種程度上束縛了美國自身的領(lǐng)先優(yōu)勢。

a16z的另一位合伙人Alex Rampell更直截了當(dāng)?shù)刂赋觯鞍莸钦畵?dān)心如果美國的AI開源,中國會(huì)復(fù)制。但DeepSeek反其道而行之——現(xiàn)在是中國發(fā)布了開源AI,而美國的公司都想使用它或復(fù)刻它,因?yàn)樗男阅軐?shí)在太強(qiáng)了。”

開源曾是美國高科技領(lǐng)域里最引以為傲的“殺手锏”,早年的互聯(lián)網(wǎng)協(xié)議、操作系統(tǒng)、數(shù)據(jù)庫等關(guān)鍵技術(shù),正是在廣泛開放的環(huán)境下得以快速迭代,助力美國牢牢把握信息革命的制高點(diǎn)。然而,近幾年由于對知識產(chǎn)權(quán)與商業(yè)收益的高度關(guān)注,再加上對國家安全和經(jīng)濟(jì)制裁層面的考量,一些科技巨頭選擇更加封閉的研發(fā)模式,縮減了行業(yè)合作與創(chuàng)新的空間。

Rampell并不認(rèn)為DeepSeek是“新的斯普特尼克時(shí)刻”,而是“給美國人民的禮物”:它讓“驕傲”的美國不得不正視全球AI競爭的現(xiàn)狀,加速在技術(shù)、人才和資金上的投入。

在這樣的大背景下,越來越多的科技人呼吁,美國的AI政策必須做出深層調(diào)整。繼續(xù)靠封鎖和管控來保持優(yōu)勢,只會(huì)失去推動(dòng)全行業(yè)整體躍升的機(jī)會(huì)。正如Meta首席人工智能科學(xué)家 Yann LeCun 在LinkedIn上所言:“對于那些看到DeepSeek表現(xiàn)、認(rèn)為這是中國在人工智能領(lǐng)域超越美國的人來說,你們理解錯(cuò)了。正確的解讀是開源模型正在超越專有模型?!?/p>

隨著AI競爭逐漸從單純追求更大規(guī)模、更多參數(shù)和更強(qiáng)算力,轉(zhuǎn)向注重應(yīng)用與生態(tài)的深度整合,誰能讓大模型在不同行業(yè)場景中快速落地,并構(gòu)建強(qiáng)大的協(xié)同網(wǎng)絡(luò),誰就能在這場競賽中率先勝出。

英偉達(dá)CEO黃仁勛就曾強(qiáng)調(diào),模型規(guī)模本身并不代表市場價(jià)值,真正能讓技術(shù)落地的,取決于能否與現(xiàn)實(shí)需求無縫對接;斯坦福大學(xué)教授吳恩達(dá)(Andrew Ng)也在演講中反復(fù)提到:解決實(shí)際問題、為用戶創(chuàng)造價(jià)值,才是所有大模型發(fā)展的根本目標(biāo)。從醫(yī)療、金融到零售,每個(gè)行業(yè)都有不同的業(yè)務(wù)痛點(diǎn)和法規(guī)要求,促使研發(fā)團(tuán)隊(duì)必須進(jìn)行針對性的模型裁剪與定制。

在這種趨勢下,像DeepSeek這樣依托開放、彈性生態(tài)系統(tǒng)的團(tuán)隊(duì),不僅能為行業(yè)提供更低門檻的成長路線,還能不斷吸納開發(fā)者與合作伙伴,讓AI技術(shù)在更多應(yīng)用場景釋放潛力,保持可持續(xù)發(fā)展。

OpenAI CEO Sam Altman也開始反思他的策略。在o3-mini發(fā)布會(huì)后,這位硅谷天才創(chuàng)業(yè)者與幾位高管在Reddit上回答網(wǎng)友提問,在問及是否會(huì)公開部分大模型權(quán)重時(shí),Altman坦言:“我個(gè)人認(rèn)為,我們在開源策略上可能走錯(cuò)了方向,需要探索一種全新的開放模式。不過,并非所有OpenAI成員都認(rèn)同這一觀點(diǎn),而且目前這也并非我們的最高優(yōu)先級。”

或許DeepSeek不僅是開源大模型的一次重大勝利,更是一份“送給世界的禮物”,將為整個(gè)行業(yè)樹立了全新的標(biāo)桿。

    本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋