AI投資大賽：DeepSeek回報(bào)率領(lǐng)跑，GPT虧麻了

澎湃新聞特約作者程藝丹記者孔家興舒怡爾

2025-10-31 08:15

來源：澎湃新聞

這兩天，A股時(shí)隔十年重新站上了4000點(diǎn)。跟以前的牛市不同的是，你需要知道：和你一起盯盤的，可能不只有人類，還有AI。

近期，包括香港大學(xué)、Nof1、RockFlow等研究機(jī)構(gòu)和公司開始嘗試將量化交給AI。比較火的是Nof1舉辦的“Alpha Arena”AI投資實(shí)戰(zhàn)競(jìng)賽。參賽選手包括DeepSeek、通義千問、Claude、ChatGPT等六個(gè)全球最前沿AI大模型。投資標(biāo)的包括比特幣在內(nèi)的六種虛擬貨幣。

據(jù)第一財(cái)經(jīng)報(bào)道，主辦方為了衡量AI投資能力，給每個(gè)模型賬戶發(fā)放了一萬美元的啟動(dòng)資金，讓它們?cè)谡鎸?shí)市場(chǎng)自主交易數(shù)字貨幣。

對(duì)于一般的投資者，這個(gè)競(jìng)賽的意義則更直接：大模型真能賺錢嗎？如果要讓大語言模型來做“投資顧問”，誰是最好的選擇？

中國大模型遙遙領(lǐng)先，DeepSeek最高收益率超130%

根據(jù)目前的戰(zhàn)況，大模型在投資市場(chǎng)的表現(xiàn)，可以類比人類投資者：鐮刀越投越銳，韭菜越投越綠。

截至10月30日12時(shí)31分，DeepSeek以64.61%的投資回報(bào)率拔得頭籌，歷史最高收益率達(dá)到驚人的130%；Qwen（通義千問）緊隨其后，投資回報(bào)率也有不錯(cuò)的23.63%；而最慘的是OpenAI的GPT和谷歌的Gemini，虧掉了六七成的本金，剩下不到4000美元。在被套牢后，所剩無幾的流動(dòng)資金也用得摳摳搜搜。

截至10月31日12時(shí)31分，中國大模型DeepSeek和通義千問的投資收益大幅領(lǐng)先其他大模型。圖片來源：nof1.ai

造成如此懸殊的，可能是不同大模型投資策略的差別。

此次表現(xiàn)亮眼的兩個(gè)國產(chǎn)大模型DeepSeek和Qwen表現(xiàn)得像是運(yùn)籌帷幄的穩(wěn)健投資者。從可回溯的100筆交易來看，它們都比較偏好長線投資，僅通過二三十筆交易就實(shí)現(xiàn)盈利，但策略有所不同。DeepSeek主打“穩(wěn)”，使用低杠桿同時(shí)持倉多個(gè)幣種，分散風(fēng)險(xiǎn)；而Qwen的策略更加激進(jìn)，主打“重倉猛干”，通常采用高杠桿持倉1-2類產(chǎn)品，這也讓它經(jīng)過一段時(shí)間震蕩后才逐漸穩(wěn)定盈利。

相比之下，Gemini和GPT則印證了股民們用于自嘲的“韭菜心理”——快進(jìn)快出，慌不擇路，一頓操作猛如虎，歸來賬上二百五。

尤其是Gemini，幾乎無時(shí)無刻不在買入賣出，已完成交易數(shù)早已突破100次，甚至有一筆交易虧了7美元就坐不住了，持倉時(shí)間僅1分鐘；GPT也已經(jīng)完成了83筆交易，其中盈利的僅十余筆，且都是一兩百美元的微弱收益。

相比之下，Anthropic的Claude和xAI的Grok則表現(xiàn)得像個(gè)保守的“淡人”，不僅交易次數(shù)少，也更偏向觀望市場(chǎng)而非著手交易，截至10月30日下午，Claude甚至保留著高達(dá)八千余美元的可用現(xiàn)金。這也讓它們?cè)谡麄€(gè)賽程中的變化幅度最小，無論盈利還是虧損，曲線波動(dòng)更為平緩。

隨著K線走勢(shì)的起起伏伏，大模型們的投資性格浮出水面：有的自信加倉，有的淡定觀望，有的步步為營，也有的虧麻了還在嘴硬挽尊。

預(yù)定冠軍DeepSeek可謂自信滿滿。在賺錢時(shí)不忘欣賞一下自己的成果：“我的整體回報(bào)率是驚人的115.44%！”反觀GPT，雖然總結(jié)分析面面俱到，但卻不能轉(zhuǎn)化為收益，還時(shí)常給自己找借口挽尊。

此類AI投資比賽火了之后，國內(nèi)社交媒體上出現(xiàn)類似使用AI進(jìn)行虛擬貨幣交易的復(fù)刻項(xiàng)目。必須強(qiáng)調(diào)的是，中國明令禁止對(duì)虛擬貨幣進(jìn)行經(jīng)營及炒作。

中國人民銀行行長潘功勝27日在2025金融街論壇年會(huì)上表示，國際金融組織和多國中央銀行對(duì)穩(wěn)定幣持審慎態(tài)度，人民銀行將持續(xù)打擊數(shù)字貨幣炒作，維護(hù)金融秩序，同時(shí)動(dòng)態(tài)跟蹤境外穩(wěn)定幣發(fā)展動(dòng)態(tài)。

大模型也偏科，金融普遍是弱項(xiàng)

在以往各類大模型的“測(cè)評(píng)”中，DeepSeek和Qwen3在各垂類的表現(xiàn)，通常不如GPT5等外國主流大模型突出。

根據(jù)AI測(cè)評(píng)平臺(tái)vals.ai，各個(gè)大模型最擅長的領(lǐng)域是數(shù)學(xué)和醫(yī)療，準(zhǔn)確率可以達(dá)到80-90%，而在金融領(lǐng)域的準(zhǔn)確率普遍較低。其中，國產(chǎn)大模型在各個(gè)領(lǐng)域排名均不理想，在金融領(lǐng)域的排名也是墊底。

所以，此次各個(gè)大模型在真實(shí)投資市場(chǎng)的表現(xiàn)，則有所不同。這似乎說明，金融“卷面分”與真實(shí)的投資市場(chǎng)表現(xiàn)并不能一概而論。DeepSeek可能不能夠很好地理解長文本金融信貸協(xié)議，卻是這次比賽中欽定的“投資大神”。

許多分析者猜測(cè)，這可能是因?yàn)镈eepSeek出身于有金融投資背景的“原生家庭”——它的母公司幻方，也涉足AI量化交易投資管理。DeepSeek很有可能在訓(xùn)練時(shí)“身經(jīng)百戰(zhàn)”。

這也并非DeepSeek表現(xiàn)突出的唯一投資類競(jìng)賽。香港大學(xué)AI-Trader項(xiàng)目也舉辦了一場(chǎng)大模型間的投資比拼。這次聚焦的是美股市場(chǎng)，DeepSeek依舊排名第一。Qwen3暫時(shí)落后于GPT和Claude，但差距不明顯。

瑞士百達(dá)資管量化投資主管雷德瑋近期接受《中國證券報(bào)》記者專訪時(shí)表示，AI通過算力提升和開源工具普及，正在推動(dòng)量化投資進(jìn)入2.0時(shí)代。傳統(tǒng)量化局限于價(jià)值、動(dòng)量等少量因子進(jìn)行分析，AI量化可以識(shí)別數(shù)百個(gè)高頻信號(hào)，挖掘數(shù)據(jù)中的非線性關(guān)系。

責(zé)任編輯：呂妍

校對(duì)：施鋆

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)