- +1
AI投資大賽:DeepSeek回報(bào)率領(lǐng)跑,GPT虧麻了
這兩天,A股時(shí)隔十年重新站上了4000點(diǎn)。跟以前的牛市不同的是,你需要知道:和你一起盯盤的,可能不只有人類,還有AI。
近期,包括香港大學(xué)、Nof1、RockFlow等研究機(jī)構(gòu)和公司開始嘗試將量化交給AI。比較火的是Nof1舉辦的“Alpha Arena”AI投資實(shí)戰(zhàn)競(jìng)賽。參賽選手包括DeepSeek、通義千問、Claude、ChatGPT等六個(gè)全球最前沿AI大模型。投資標(biāo)的包括比特幣在內(nèi)的六種虛擬貨幣。
據(jù)第一財(cái)經(jīng)報(bào)道,主辦方為了衡量AI投資能力,給每個(gè)模型賬戶發(fā)放了一萬美元的啟動(dòng)資金,讓它們?cè)谡鎸?shí)市場(chǎng)自主交易數(shù)字貨幣。
對(duì)于一般的投資者,這個(gè)競(jìng)賽的意義則更直接:大模型真能賺錢嗎?如果要讓大語言模型來做“投資顧問”,誰是最好的選擇?
中國大模型遙遙領(lǐng)先,DeepSeek最高收益率超130%
根據(jù)目前的戰(zhàn)況,大模型在投資市場(chǎng)的表現(xiàn),可以類比人類投資者:鐮刀越投越銳,韭菜越投越綠。
截至10月30日12時(shí)31分,DeepSeek以64.61%的投資回報(bào)率拔得頭籌,歷史最高收益率達(dá)到驚人的130%;Qwen(通義千問)緊隨其后,投資回報(bào)率也有不錯(cuò)的23.63%;而最慘的是OpenAI的GPT和谷歌的Gemini,虧掉了六七成的本金,剩下不到4000美元。在被套牢后,所剩無幾的流動(dòng)資金也用得摳摳搜搜。

截至10月31日12時(shí)31分,中國大模型DeepSeek和通義千問的投資收益大幅領(lǐng)先其他大模型。圖片來源:nof1.ai
造成如此懸殊的,可能是不同大模型投資策略的差別。
此次表現(xiàn)亮眼的兩個(gè)國產(chǎn)大模型DeepSeek和Qwen表現(xiàn)得像是運(yùn)籌帷幄的穩(wěn)健投資者。從可回溯的100筆交易來看,它們都比較偏好長線投資,僅通過二三十筆交易就實(shí)現(xiàn)盈利,但策略有所不同。DeepSeek主打“穩(wěn)”,使用低杠桿同時(shí)持倉多個(gè)幣種,分散風(fēng)險(xiǎn);而Qwen的策略更加激進(jìn),主打“重倉猛干”,通常采用高杠桿持倉1-2類產(chǎn)品,這也讓它經(jīng)過一段時(shí)間震蕩后才逐漸穩(wěn)定盈利。

相比之下,Gemini和GPT則印證了股民們用于自嘲的“韭菜心理”——快進(jìn)快出,慌不擇路,一頓操作猛如虎,歸來賬上二百五。
尤其是Gemini,幾乎無時(shí)無刻不在買入賣出,已完成交易數(shù)早已突破100次,甚至有一筆交易虧了7美元就坐不住了,持倉時(shí)間僅1分鐘;GPT也已經(jīng)完成了83筆交易,其中盈利的僅十余筆,且都是一兩百美元的微弱收益。
相比之下,Anthropic的Claude和xAI的Grok則表現(xiàn)得像個(gè)保守的“淡人”,不僅交易次數(shù)少,也更偏向觀望市場(chǎng)而非著手交易,截至10月30日下午,Claude甚至保留著高達(dá)八千余美元的可用現(xiàn)金。這也讓它們?cè)谡麄€(gè)賽程中的變化幅度最小,無論盈利還是虧損,曲線波動(dòng)更為平緩。
隨著K線走勢(shì)的起起伏伏,大模型們的投資性格浮出水面:有的自信加倉,有的淡定觀望,有的步步為營,也有的虧麻了還在嘴硬挽尊。

預(yù)定冠軍DeepSeek可謂自信滿滿。在賺錢時(shí)不忘欣賞一下自己的成果:“我的整體回報(bào)率是驚人的115.44%!”反觀GPT,雖然總結(jié)分析面面俱到,但卻不能轉(zhuǎn)化為收益,還時(shí)常給自己找借口挽尊。
此類AI投資比賽火了之后,國內(nèi)社交媒體上出現(xiàn)類似使用AI進(jìn)行虛擬貨幣交易的復(fù)刻項(xiàng)目。必須強(qiáng)調(diào)的是,中國明令禁止對(duì)虛擬貨幣進(jìn)行經(jīng)營及炒作。
中國人民銀行行長潘功勝27日在2025金融街論壇年會(huì)上表示,國際金融組織和多國中央銀行對(duì)穩(wěn)定幣持審慎態(tài)度,人民銀行將持續(xù)打擊數(shù)字貨幣炒作,維護(hù)金融秩序,同時(shí)動(dòng)態(tài)跟蹤境外穩(wěn)定幣發(fā)展動(dòng)態(tài)。
大模型也偏科,金融普遍是弱項(xiàng)
在以往各類大模型的“測(cè)評(píng)”中,DeepSeek和Qwen3在各垂類的表現(xiàn),通常不如GPT5等外國主流大模型突出。

根據(jù)AI測(cè)評(píng)平臺(tái)vals.ai,各個(gè)大模型最擅長的領(lǐng)域是數(shù)學(xué)和醫(yī)療,準(zhǔn)確率可以達(dá)到80-90%,而在金融領(lǐng)域的準(zhǔn)確率普遍較低。其中,國產(chǎn)大模型在各個(gè)領(lǐng)域排名均不理想,在金融領(lǐng)域的排名也是墊底。
所以,此次各個(gè)大模型在真實(shí)投資市場(chǎng)的表現(xiàn),則有所不同。這似乎說明,金融“卷面分”與真實(shí)的投資市場(chǎng)表現(xiàn)并不能一概而論。DeepSeek可能不能夠很好地理解長文本金融信貸協(xié)議,卻是這次比賽中欽定的“投資大神”。
許多分析者猜測(cè),這可能是因?yàn)镈eepSeek出身于有金融投資背景的“原生家庭”——它的母公司幻方,也涉足AI量化交易投資管理。DeepSeek很有可能在訓(xùn)練時(shí)“身經(jīng)百戰(zhàn)”。
這也并非DeepSeek表現(xiàn)突出的唯一投資類競(jìng)賽。香港大學(xué)AI-Trader項(xiàng)目也舉辦了一場(chǎng)大模型間的投資比拼。這次聚焦的是美股市場(chǎng),DeepSeek依舊排名第一。Qwen3暫時(shí)落后于GPT和Claude,但差距不明顯。
瑞士百達(dá)資管量化投資主管雷德瑋近期接受《中國證券報(bào)》記者專訪時(shí)表示,AI通過算力提升和開源工具普及,正在推動(dòng)量化投資進(jìn)入2.0時(shí)代。傳統(tǒng)量化局限于價(jià)值、動(dòng)量等少量因子進(jìn)行分析,AI量化可以識(shí)別數(shù)百個(gè)高頻信號(hào),挖掘數(shù)據(jù)中的非線性關(guān)系。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




