中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

量化巨頭幻方創(chuàng)始人梁文鋒參加總理座談會并發(fā)言,他還創(chuàng)辦了“AI界拼多多”

澎湃新聞記者 孫銘蔚
2025-01-22 07:54
來源:澎湃新聞
? 牛市點線面 >
字號

國產(chǎn)大模型公司深度求索(DeepSeek)創(chuàng)始人梁文鋒參加了總理座談會。

據(jù)新華社報道,中共中央政治局常委、國務(wù)院總理李強1月20日下午主持召開專家、企業(yè)家和教科文衛(wèi)體等領(lǐng)域代表座談會,聽取對《政府工作報告(征求意見稿)》的意見建議。座談會上,張輝、任少波、劉珺、梁文鋒、魏洪興、陳學(xué)東、陳紅彥、杜斌、鄒敬園等先后發(fā)言。

其中,梁文鋒正是頭部量化私募幻方量化創(chuàng)始人、DeepSeek的創(chuàng)始人。

低調(diào)的“量化天王”

梁文鋒“發(fā)跡”于量化投資。

作為一名“80后”,梁文鋒本科、研究生都就讀于浙江大學(xué),擁有信息與電子工程學(xué)系本科和碩士學(xué)位。

2008年起,梁文鋒就開始帶領(lǐng)團隊使用機器學(xué)習(xí)等技術(shù)探索全自動量化交易。2015年,幻方量化正式成立,2019年,其資金管理規(guī)模就突破百億元。

2019年,梁文鋒在當年的金牛獎頒獎儀式上,發(fā)表主題演講《一名程序員眼里中國量化投資的未來》,這是他罕有的公開發(fā)言。

在演講中,梁文鋒指出,量化與非量化的判定標準就是在投資決策的過程中,是用數(shù)量化方法進行決策的,還是用人進行決策的。量化公司是沒有基金經(jīng)理的,基金經(jīng)理就一堆服務(wù)器。

 “作為私募,投資人對我們的期望是很高的,如果一年跑贏指數(shù)低于25%,投資人是不滿意的?!绷何匿h指出,量化投資已經(jīng)賺了技術(shù)面流派原來賺的錢,未來也要搶奪基本面流派原來賺的錢。

演講最后,梁文鋒說,幻方量化的使命就是提高中國二級市場的有效性。

2021年,幻方量化成為國內(nèi)首家突破千億規(guī)模的的量化私募大廠,被稱為國內(nèi)量化私募“四大天王”之一。不過,就在這一年,由于業(yè)績波動,幻方量化關(guān)閉了全部募集通道,并在12月底發(fā)布致投資者公開信,致歉稱“幻方業(yè)績的回撤達到歷史最大值,我們對此深感愧疚”,究其原因,主要是AI的投資決策在買賣時點上沒有做好,市場風(fēng)格劇烈切換的時候,AI會傾向于冒更大的風(fēng)險來博取更多收益,進一步加大了回撤。

此后,幻方量化逐漸降低其資金管理規(guī)模。2024年10月,幻方量化還向投資者發(fā)布公告稱,計劃逐步對沖產(chǎn)品投資倉位降低至零。

“短期內(nèi)沒有融資計劃”

梁文鋒對于AI的興趣早就有跡可循。

2016年10月21日,幻方量化推出第一個AI模型,第一份由深度學(xué)習(xí)生成的交易倉位上線執(zhí)行,使用GPU進行計算。2017年,幻方量化宣稱實現(xiàn)投資策略全面AI化。

幻方量化官網(wǎng)顯示,其在2018年就確立以AI為公司的主要發(fā)展方向。

2020年開始,幻方累計投資超億元、占地面積相當于一個籃球場的AI超級計算機“螢火一號”正式投入運作,號稱可以匹敵4萬臺個人電腦的超級算力。2021年,幻方投入十億建設(shè)“螢火二號”,以“任務(wù)級分時共享”為核心理念,調(diào)度系統(tǒng)秒級響應(yīng),平臺配備強大的軟件層支持:高性能算子庫(hfai.nn)、分布式訓(xùn)練通訊框架(hfreduce)、專為AI開發(fā)而生的大容量高帶寬文件系統(tǒng)(3FS),讓AI模型能自如拓展到多節(jié)點之上,進行大規(guī)模并行訓(xùn)練,算力擴容翻倍,集群連續(xù)滿載運行,平均占用率達到96%以上。

2021年,在梁文鋒參與的論文中提到,他們正在部署的螢火二號系統(tǒng),“配備了1萬張A100GPU芯片”,在性能上接近DGX-A100(英偉達推出的人工智能專用超級計算機),但成本降低了一半,同時能耗減少了40%。

當時國內(nèi)超過1萬枚GPU的企業(yè)不超過5家,而且除了幻方量化之外,其他4家公司都是互聯(lián)網(wǎng)大廠。

這背后需要極其雄厚的財力支持。

2023年初,幻方量化表示,過去的幾年,幻方量化及員工每年拿出收入的一部分投入公益,回饋社會,累計捐贈超過5.8億元。其中,2022年,員工“一只平凡的小豬”個人就向慈善機構(gòu)捐贈1.38億元,當時的消息指出,這個人就是梁文鋒。這從一個側(cè)面反映出了幻方量化和梁文鋒本人的“不差錢”。

幻方量化曾表示,多年以來,該公司堅持把營收的大部分投入人工智能領(lǐng)域,建設(shè)領(lǐng)先的AI硬件基礎(chǔ)設(shè)施,進行大規(guī)模的研究,探索人類未知的奧秘,“我們相信幾乎所有的創(chuàng)新都是從大膽嘗試和點滴積累中孕育而來?!?/p>

梁文鋒在為數(shù)不多的對外發(fā)聲中同樣也提到“短期內(nèi)沒有融資計劃”,并認為當下面臨的問題“從來不是錢,而是高端芯片(短缺)”。

“AI界拼多多”

2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式進軍通用人工智能領(lǐng)域。據(jù)報道,DeepSeek包括創(chuàng)始人梁文鋒在內(nèi),僅有139名工程師和研究人員。與之對比,OpenAI有1200名研究人員,Anthropic則有500多名研究人員。

僅僅不到一年的2024年5月,DeepSeek就發(fā)布了DeepSeekV2,因為創(chuàng)新的模型架構(gòu)和史無前例的性價比,火爆出圈。DeepSeek-V2的API定價為每百萬tokens輸入1元、輸出2元,價格僅為GPT-4 Turbo的百分之一。

對于為何能做到如此高的性價比,DeepSeek官方解釋稱,DeepSeek-V2采用了創(chuàng)新的架構(gòu),例如注意力機制方面的MLA(多頭潛在注意力)和前饋網(wǎng)絡(luò)方面的DeepSeekMoE架構(gòu)等,以實現(xiàn)具有更高經(jīng)濟性的訓(xùn)練效果和更高效的推理。

因此, DeepSeek被稱為“AI界的拼多多”,引發(fā)了字節(jié)、阿里、百度等大廠的大模型價格戰(zhàn),紛紛宣布大模型產(chǎn)品降價。彼時,梁文鋒在接受媒體采訪時稱,DeepSeek無意成為行業(yè)鲇魚,低價背后是希望算力普惠。

2024年12月27日,DeepSeek-V3更是橫空出世,火爆全球。據(jù)DeepSeek官網(wǎng)顯示,其評測成績不僅超越了Qwen2.5-72B(阿里自研大模型)和Llama 3.1-405B(Meta自研大模型)等頂級開源模型,甚至能和GPT-4o、Claude 3.5-Sonnet(Anthropic自研大模型)等頂級閉源模型一較高下。

DeepSeek宣布上線并同步開源DeepSeek-V3模型之外,還公布了長達53頁的訓(xùn)練和技術(shù)細節(jié)。得到大幅升級的V3模型是在一個“難以想象”的預(yù)算下訓(xùn)練完成的:整個訓(xùn)練僅花費了557.6萬美元,在2048塊英偉達H800 GPU(針對中國市場的低配版 GPU)集群上運行55天完成,僅是OpenAI GPT-4o模型訓(xùn)練成本的不到十分之一。

“中國也要逐步成為貢獻者,而不是一直搭便車?!绷何匿h在接受媒體采訪時說,“我們已經(jīng)習(xí)慣摩爾定律從天而降,躺在家里18個月就會出來更好的硬件和軟件,Scaling Law(規(guī)模定律)也在被如此對待。但其實,這是西方主導(dǎo)的技術(shù)社區(qū)一代代孜孜不倦創(chuàng)造出來的,只因為之前我們沒有參與這個過程,以至于忽視了它的存在。很多國產(chǎn)芯片發(fā)展不起來,也是因為缺乏配套的技術(shù)社區(qū),只有第二手消息,中國必然需要有人站到技術(shù)的前沿。”

梁文鋒和他的DeepSeek還在繼續(xù)求索。

就在1月20日, DeepSeek正式發(fā)布DeepSeek-R1模型。該模型在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI o1正式版。DeepSeek稱,R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù),在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力。DeepSeek不僅將R1訓(xùn)練技術(shù)全部公開,還蒸餾了6個小模型開源給社區(qū),允許用戶借此訓(xùn)練其他模型。

“投身于探索AGI的本質(zhì),不做中庸的事,帶著好奇心,用最長期的眼光去回答最大的問題。”DeepSeek的公眾號這樣寫道。

    責(zé)任編輯:葛佳
    圖片編輯:沈軻
    校對:丁曉
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋