- +1
百度文心4.5將至,大模型應(yīng)用賽按下提速鍵

2月28日百度官方宣布將在3月16日發(fā)布文心大模型4.5。
在百度官宣前一天,媒體爆料了百度文心4.5將在3月中旬發(fā)布的消息,28日凌晨,OpenAI發(fā)布了GPT-4.5模型,OpenAI發(fā)布GPT-4.5的時(shí)間節(jié)點(diǎn)恰巧是媒體的爆料第二天。于是業(yè)內(nèi)人士分析OpenAI倉(cāng)促發(fā)布GPT-4.5重要原因可能是來(lái)自中國(guó)的競(jìng)爭(zhēng)加劇。

但略顯倉(cāng)促發(fā)布的GPT-4.5性能被業(yè)內(nèi)評(píng)價(jià)差強(qiáng)人意。而據(jù)百度方面介紹,文心大模型4.5不僅在基礎(chǔ)模型能力上有大幅提升,且具備原生多模態(tài)、深度思考等能力。此前在DeepSeek大火時(shí),百度也在2月中旬宣布,文心一言將于4月1日0時(shí)起,全面免費(fèi),所有PC端和APP端用戶均可體驗(yàn)文心系列最新模型,并在6月30日起開(kāi)源文心大模型4.5系列。
百度即將在4月和6月對(duì)文心一言“免費(fèi)”和“開(kāi)源”等一系列大動(dòng)作,體現(xiàn)了百度的自信,也引發(fā)市場(chǎng)對(duì)文心大模型4.5的關(guān)注和期待。
文心大模型4.5定檔,百度史上最強(qiáng)模型將至
從2019年3月百度率先開(kāi)始訓(xùn)練大模型,并在2023年3月16日正式推出文心一言大模型,目前百度擁有超過(guò)5500億條知識(shí)的自研知識(shí)圖譜融入到文心大模型的預(yù)訓(xùn)練中,結(jié)合深度學(xué)習(xí)和海量的行業(yè)數(shù)據(jù),如今已應(yīng)用于百度搜索、信息流、智能駕駛、百度地圖等多款產(chǎn)品。
百度此后每年都會(huì)進(jìn)行模型迭代。百度文心大模型矩陣再添“力作”,全家桶更加豐富。在時(shí)隔兩年后,百度再度發(fā)布新款大模型。據(jù)了解,3月16日發(fā)布的文心大模型4.5將具備多模態(tài)和深度思考能力,尤其是深度思考能力成為市場(chǎng)期待的焦點(diǎn)。
文心大模型4.5到底有哪些能力值得期待?
百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏在2月18日的財(cái)報(bào)電話會(huì)上透露,文心大模型4.5將是百度有史以來(lái)最強(qiáng)大的大模型,“希望客戶和用戶能比之前更方便地體驗(yàn)這款模型”。

近期文心一言上線了“深度搜索”功能,具備專家級(jí)問(wèn)答能力,RAG能力突出,尤其是專業(yè)領(lǐng)域問(wèn)答幻覺(jué)率低已經(jīng)降至最新水平,以及去年百度發(fā)布自研iRAG技術(shù),這或是李彥宏對(duì)“史上最強(qiáng)大模型”的信心源泉。
而OpenAI最新推出的GPT-4.5不具備多模態(tài)推理能力,還是主打?qū)懽鞯任谋旧伞O噍^于OpenAI 的 ChatGPT、谷歌的 Bard ,作為扎根在中國(guó)市場(chǎng)下的本土大語(yǔ)言模型是目前市面上最適合中國(guó)人使用的語(yǔ)言模型。
研發(fā)投入1700億
大模型火爆至今已有三年,為什么頭部玩家依然只有那些實(shí)力雄厚的大公司?根本原因在于大模型非常燒錢,不是一般企業(yè)能夠玩得轉(zhuǎn)。其主要成本包括硬件、電力、數(shù)據(jù)、研發(fā)團(tuán)隊(duì)等多個(gè)方面。
大模型的算力需求巨大,訓(xùn)練大模型需要高性能計(jì)算集群,單卡成本可達(dá)數(shù)萬(wàn)美元。以GPT-3為例,訓(xùn)練需約1萬(wàn)塊GPU,訓(xùn)練耗時(shí)數(shù)周,僅訓(xùn)練成本就高達(dá)數(shù)千萬(wàn)美元甚至上億美元。這還不包括高負(fù)載運(yùn)行導(dǎo)致硬件壽命縮短,維護(hù)和更新成本。
公開(kāi)數(shù)據(jù)顯示,GPT-4單次訓(xùn)練成本約6300萬(wàn)美元,年運(yùn)營(yíng)成本超10億美元。Google PaLM(5400億參數(shù)):訓(xùn)練成本約2000萬(wàn)-3000萬(wàn)美元。即便百億參數(shù)級(jí)模型訓(xùn)練成本通常在數(shù)百萬(wàn)美元級(jí)別。
百度能在大模型上取得讓OpenAI不得不倉(cāng)促發(fā)布新品的成績(jī)根源在于舍得“砸錢”搞研發(fā)。財(cái)報(bào)顯示,2019年至2024年,百度的研發(fā)費(fèi)用分別為183.5億元、195.1億元、249.4億元、233.2億元、241.9億元和221.3億元,近4年的研發(fā)費(fèi)用均超過(guò)220億元,研發(fā)費(fèi)用占總營(yíng)收的比例一度在全球互聯(lián)網(wǎng)巨頭中坐二望一。2021年,在全球互聯(lián)網(wǎng)巨頭中,百度的研發(fā)占比高于谷歌和亞馬遜,位居全球第二位。

目前百度的研發(fā)占比始終保持在20%左右,而全球互聯(lián)網(wǎng)行業(yè)研發(fā)占比的平均值為3%-6%之間,比如小米研發(fā)占比4%左右,聯(lián)想研發(fā)占比2.5%左右,京東研發(fā)占比1.6%左右,百度和華為成為目前國(guó)內(nèi)互聯(lián)網(wǎng)企業(yè)中研發(fā)占比超過(guò)10%的唯二兩家。
財(cái)報(bào)數(shù)據(jù)顯示,百度投入AI十年來(lái)累計(jì)研發(fā)投入1700億元。在大模型領(lǐng)域的巨大投入,才讓百度成為全球大模型的領(lǐng)跑者。
AI行業(yè)大震動(dòng)——接連開(kāi)源、免費(fèi),百度更加開(kāi)放
大模型現(xiàn)在進(jìn)入到了一個(gè)新的階段。通過(guò)開(kāi)源路線普及模型的基礎(chǔ),進(jìn)而帶動(dòng)模型應(yīng)用的爆發(fā)。
李彥宏在財(cái)報(bào)電話會(huì)上專門對(duì)百度即將開(kāi)源進(jìn)行了解讀,李彥宏表示,開(kāi)源4.5系列的決策源自于對(duì)技術(shù)領(lǐng)先地位的堅(jiān)定信心,開(kāi)源將進(jìn)一步促進(jìn)文心大模型的廣泛應(yīng)用,并在更多場(chǎng)景中擴(kuò)大其影響力,“但我想強(qiáng)調(diào)的是,無(wú)論開(kāi)源閉源,基礎(chǔ)模型只有在大規(guī)模解決現(xiàn)實(shí)問(wèn)題時(shí),才具備真實(shí)價(jià)值”。未來(lái),百度將加速推動(dòng)文心大模型的性能升級(jí)與成本降低。
開(kāi)源作為技術(shù)領(lǐng)域的核心協(xié)作模式,其價(jià)值體現(xiàn)在技術(shù)、經(jīng)濟(jì)、社會(huì)等多個(gè)維度,技術(shù)驅(qū)動(dòng)層面,?提升軟件質(zhì)量與安全性,?開(kāi)源代碼的透明性允許全球開(kāi)發(fā)者共同審查和修復(fù)漏洞,形成持續(xù)優(yōu)化的技術(shù)迭代機(jī)制。開(kāi)源打破了技術(shù)壟斷,開(kāi)發(fā)者可基于現(xiàn)有成果快速迭代,?加速了技術(shù)創(chuàng)新。最為重要的一點(diǎn)是開(kāi)源可以降低行業(yè)整體成本,李彥宏在談DeepSeek時(shí)表示“歷史上的創(chuàng)新都來(lái)自于成本降低,大模型成本每年降低90%以上”,這其中開(kāi)源占據(jù)絕大部分作用。

互聯(lián)網(wǎng)投資人史保剛對(duì)百度開(kāi)源表示了贊賞,“百度在技術(shù)提速的情況下,為推動(dòng)行業(yè)整體的發(fā)展,推出了免費(fèi)和開(kāi)源,從接入DeepSeek也體現(xiàn)了百度兼容和開(kāi)放,這樣能讓百度占據(jù)大模型競(jìng)爭(zhēng)的主動(dòng)權(quán),根源還是源于百度對(duì)自身技術(shù)的自信?!?/p>
史保剛認(rèn)為百度直接將行業(yè)拉入“免費(fèi)+開(kāi)源”的新階段,將大模型的使用門檻拉到極致,無(wú)疑將助推大模型應(yīng)用爆發(fā)。在推動(dòng)行業(yè)發(fā)展的同時(shí)也帶動(dòng)百度自身大模型的發(fā)展,對(duì)百度和對(duì)行業(yè)都有極大的推動(dòng)作用。
使用場(chǎng)景和產(chǎn)品體驗(yàn)為王的時(shí)代
無(wú)論是百度文心一言還是ChatGPT-4,大模型的使用場(chǎng)景和產(chǎn)品體驗(yàn)設(shè)計(jì)都是決定其技術(shù)價(jià)值能否轉(zhuǎn)化為實(shí)際商業(yè)或社會(huì)價(jià)值的關(guān)鍵。大模型的技術(shù)能力是基礎(chǔ),但產(chǎn)品體驗(yàn)決定了用戶是否愿意持續(xù)使用,也是決定該大模型能否通過(guò)市場(chǎng)檢驗(yàn)的基礎(chǔ)。現(xiàn)在第一輪百模大戰(zhàn)接近尾聲,接下來(lái)是應(yīng)用大戰(zhàn),如何讓大家都有機(jī)會(huì)接入最先進(jìn)的技術(shù),落地使用場(chǎng)景是各大頭部玩家的追求目標(biāo)。
目前,百度文心大模型技術(shù)正經(jīng)歷從?“能力展示”到“價(jià)值交付”?的關(guān)鍵躍遷。未來(lái)三年,具備?場(chǎng)景理解深度?、?交互友好度?、?價(jià)值可量化?特征的產(chǎn)品,將在醫(yī)療、金融、制造等領(lǐng)域持續(xù)釋放變革能量?。這一進(jìn)程中,技術(shù)普惠與倫理規(guī)范的雙軌并行,將定義智能時(shí)代的新型生產(chǎn)關(guān)系。

在使用場(chǎng)景和產(chǎn)品體驗(yàn)為王的時(shí)代,百度文心大模型的眾多場(chǎng)景體驗(yàn)已經(jīng)通過(guò)市場(chǎng)檢驗(yàn),實(shí)現(xiàn)了“應(yīng)用落地”,代表著中國(guó)大模型領(lǐng)域的最新技術(shù)和發(fā)展路線。這次李彥宏攜“百度史上最強(qiáng)大模型”自信而來(lái),在使用場(chǎng)景不斷豐滿以及應(yīng)用場(chǎng)景真正做到落地的情況下,也讓市場(chǎng)對(duì)百度最新力作擁有更多期待。
前有DeepSeek春節(jié)出圈,后有百度接連開(kāi)源、免費(fèi),中國(guó)大模型趕超美國(guó)提速。中國(guó)在以百度為代表的企業(yè)在算法方面的巨大投入產(chǎn)生的強(qiáng)大的基礎(chǔ)大模型是護(hù)城河,目前來(lái)看,OpenAI被“逼出”GPT-4.5的背后,是中國(guó)大模型在不斷提升能力趕超美國(guó)的印證。
該文為BT財(cái)經(jīng)原創(chuàng)文章,未經(jīng)許可不得擅自使用、復(fù)制、傳播或改編該文章,如構(gòu)成侵權(quán)行為將追究法律責(zé)任。
作 者 | 夢(mèng)蕭
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




