百度文心4.5將至，大模型應(yīng)用賽按下提速鍵

2025-03-03 07:50

來(lái)源：澎湃新聞·澎湃號(hào)·湃客

2月28日百度官方宣布將在3月16日發(fā)布文心大模型4.5。

在百度官宣前一天，媒體爆料了百度文心4.5將在3月中旬發(fā)布的消息，28日凌晨，OpenAI發(fā)布了GPT-4.5模型，OpenAI發(fā)布GPT-4.5的時(shí)間節(jié)點(diǎn)恰巧是媒體的爆料第二天。于是業(yè)內(nèi)人士分析OpenAI倉(cāng)促發(fā)布GPT-4.5重要原因可能是來(lái)自中國(guó)的競(jìng)爭(zhēng)加劇。

但略顯倉(cāng)促發(fā)布的GPT-4.5性能被業(yè)內(nèi)評(píng)價(jià)差強(qiáng)人意。而據(jù)百度方面介紹，文心大模型4.5不僅在基礎(chǔ)模型能力上有大幅提升，且具備原生多模態(tài)、深度思考等能力。此前在DeepSeek大火時(shí)，百度也在2月中旬宣布，文心一言將于4月1日0時(shí)起，全面免費(fèi)，所有PC端和APP端用戶均可體驗(yàn)文心系列最新模型，并在6月30日起開(kāi)源文心大模型4.5系列。

百度即將在4月和6月對(duì)文心一言“免費(fèi)”和“開(kāi)源”等一系列大動(dòng)作，體現(xiàn)了百度的自信，也引發(fā)市場(chǎng)對(duì)文心大模型4.5的關(guān)注和期待。

文心大模型4.5定檔，百度史上最強(qiáng)模型將至

從2019年3月百度率先開(kāi)始訓(xùn)練大模型，并在2023年3月16日正式推出文心一言大模型，目前百度擁有超過(guò)5500億條知識(shí)的自研知識(shí)圖譜融入到文心大模型的預(yù)訓(xùn)練中，結(jié)合深度學(xué)習(xí)和海量的行業(yè)數(shù)據(jù)，如今已應(yīng)用于百度搜索、信息流、智能駕駛、百度地圖等多款產(chǎn)品。

百度此后每年都會(huì)進(jìn)行模型迭代。百度文心大模型矩陣再添“力作”，全家桶更加豐富。在時(shí)隔兩年后，百度再度發(fā)布新款大模型。據(jù)了解，3月16日發(fā)布的文心大模型4.5將具備多模態(tài)和深度思考能力，尤其是深度思考能力成為市場(chǎng)期待的焦點(diǎn)。

文心大模型4.5到底有哪些能力值得期待？

百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏在2月18日的財(cái)報(bào)電話會(huì)上透露，文心大模型4.5將是百度有史以來(lái)最強(qiáng)大的大模型，“希望客戶和用戶能比之前更方便地體驗(yàn)這款模型”。

近期文心一言上線了“深度搜索”功能，具備專家級(jí)問(wèn)答能力，RAG能力突出，尤其是專業(yè)領(lǐng)域問(wèn)答幻覺(jué)率低已經(jīng)降至最新水平，以及去年百度發(fā)布自研iRAG技術(shù)，這或是李彥宏對(duì)“史上最強(qiáng)大模型”的信心源泉。

而OpenAI最新推出的GPT-4.5不具備多模態(tài)推理能力，還是主打?qū)懽鞯任谋旧伞Ｏ噍^于OpenAI 的 ChatGPT、谷歌的 Bard ，作為扎根在中國(guó)市場(chǎng)下的本土大語(yǔ)言模型是目前市面上最適合中國(guó)人使用的語(yǔ)言模型。

研發(fā)投入1700億

大模型火爆至今已有三年，為什么頭部玩家依然只有那些實(shí)力雄厚的大公司？根本原因在于大模型非常燒錢，不是一般企業(yè)能夠玩得轉(zhuǎn)。其主要成本包括硬件、電力、數(shù)據(jù)、研發(fā)團(tuán)隊(duì)等多個(gè)方面。

大模型的算力需求巨大，訓(xùn)練大模型需要高性能計(jì)算集群，單卡成本可達(dá)數(shù)萬(wàn)美元。以GPT-3為例，訓(xùn)練需約1萬(wàn)塊GPU，訓(xùn)練耗時(shí)數(shù)周，僅訓(xùn)練成本就高達(dá)數(shù)千萬(wàn)美元甚至上億美元。這還不包括高負(fù)載運(yùn)行導(dǎo)致硬件壽命縮短，維護(hù)和更新成本。

公開(kāi)數(shù)據(jù)顯示，GPT-4單次訓(xùn)練成本約6300萬(wàn)美元，年運(yùn)營(yíng)成本超10億美元。Google PaLM（5400億參數(shù)）：訓(xùn)練成本約2000萬(wàn)-3000萬(wàn)美元。即便百億參數(shù)級(jí)模型訓(xùn)練成本通常在數(shù)百萬(wàn)美元級(jí)別。

百度能在大模型上取得讓OpenAI不得不倉(cāng)促發(fā)布新品的成績(jī)根源在于舍得“砸錢”搞研發(fā)。財(cái)報(bào)顯示，2019年至2024年，百度的研發(fā)費(fèi)用分別為183.5億元、195.1億元、249.4億元、233.2億元、241.9億元和221.3億元，近4年的研發(fā)費(fèi)用均超過(guò)220億元，研發(fā)費(fèi)用占總營(yíng)收的比例一度在全球互聯(lián)網(wǎng)巨頭中坐二望一。2021年，在全球互聯(lián)網(wǎng)巨頭中，百度的研發(fā)占比高于谷歌和亞馬遜，位居全球第二位。

目前百度的研發(fā)占比始終保持在20%左右，而全球互聯(lián)網(wǎng)行業(yè)研發(fā)占比的平均值為3%-6%之間，比如小米研發(fā)占比4%左右，聯(lián)想研發(fā)占比2.5%左右，京東研發(fā)占比1.6%左右，百度和華為成為目前國(guó)內(nèi)互聯(lián)網(wǎng)企業(yè)中研發(fā)占比超過(guò)10%的唯二兩家。

財(cái)報(bào)數(shù)據(jù)顯示，百度投入AI十年來(lái)累計(jì)研發(fā)投入1700億元。在大模型領(lǐng)域的巨大投入，才讓百度成為全球大模型的領(lǐng)跑者。

AI行業(yè)大震動(dòng)——接連開(kāi)源、免費(fèi)，百度更加開(kāi)放

大模型現(xiàn)在進(jìn)入到了一個(gè)新的階段。通過(guò)開(kāi)源路線普及模型的基礎(chǔ)，進(jìn)而帶動(dòng)模型應(yīng)用的爆發(fā)。

李彥宏在財(cái)報(bào)電話會(huì)上專門對(duì)百度即將開(kāi)源進(jìn)行了解讀，李彥宏表示，開(kāi)源4.5系列的決策源自于對(duì)技術(shù)領(lǐng)先地位的堅(jiān)定信心，開(kāi)源將進(jìn)一步促進(jìn)文心大模型的廣泛應(yīng)用，并在更多場(chǎng)景中擴(kuò)大其影響力，“但我想強(qiáng)調(diào)的是，無(wú)論開(kāi)源閉源，基礎(chǔ)模型只有在大規(guī)模解決現(xiàn)實(shí)問(wèn)題時(shí)，才具備真實(shí)價(jià)值”。未來(lái)，百度將加速推動(dòng)文心大模型的性能升級(jí)與成本降低。

開(kāi)源作為技術(shù)領(lǐng)域的核心協(xié)作模式，其價(jià)值體現(xiàn)在技術(shù)、經(jīng)濟(jì)、社會(huì)等多個(gè)維度，技術(shù)驅(qū)動(dòng)層面，?提升軟件質(zhì)量與安全性，?開(kāi)源代碼的透明性允許全球開(kāi)發(fā)者共同審查和修復(fù)漏洞，形成持續(xù)優(yōu)化的技術(shù)迭代機(jī)制。開(kāi)源打破了技術(shù)壟斷，開(kāi)發(fā)者可基于現(xiàn)有成果快速迭代，?加速了技術(shù)創(chuàng)新。最為重要的一點(diǎn)是開(kāi)源可以降低行業(yè)整體成本，李彥宏在談DeepSeek時(shí)表示“歷史上的創(chuàng)新都來(lái)自于成本降低，大模型成本每年降低90%以上”，這其中開(kāi)源占據(jù)絕大部分作用。

互聯(lián)網(wǎng)投資人史保剛對(duì)百度開(kāi)源表示了贊賞，“百度在技術(shù)提速的情況下，為推動(dòng)行業(yè)整體的發(fā)展，推出了免費(fèi)和開(kāi)源，從接入DeepSeek也體現(xiàn)了百度兼容和開(kāi)放，這樣能讓百度占據(jù)大模型競(jìng)爭(zhēng)的主動(dòng)權(quán)，根源還是源于百度對(duì)自身技術(shù)的自信?！?/p>

史保剛認(rèn)為百度直接將行業(yè)拉入“免費(fèi)+開(kāi)源”的新階段，將大模型的使用門檻拉到極致，無(wú)疑將助推大模型應(yīng)用爆發(fā)。在推動(dòng)行業(yè)發(fā)展的同時(shí)也帶動(dòng)百度自身大模型的發(fā)展，對(duì)百度和對(duì)行業(yè)都有極大的推動(dòng)作用。

使用場(chǎng)景和產(chǎn)品體驗(yàn)為王的時(shí)代

無(wú)論是百度文心一言還是ChatGPT-4，大模型的使用場(chǎng)景和產(chǎn)品體驗(yàn)設(shè)計(jì)都是決定其技術(shù)價(jià)值能否轉(zhuǎn)化為實(shí)際商業(yè)或社會(huì)價(jià)值的關(guān)鍵。大模型的技術(shù)能力是基礎(chǔ)，但產(chǎn)品體驗(yàn)決定了用戶是否愿意持續(xù)使用，也是決定該大模型能否通過(guò)市場(chǎng)檢驗(yàn)的基礎(chǔ)。現(xiàn)在第一輪百模大戰(zhàn)接近尾聲，接下來(lái)是應(yīng)用大戰(zhàn)，如何讓大家都有機(jī)會(huì)接入最先進(jìn)的技術(shù)，落地使用場(chǎng)景是各大頭部玩家的追求目標(biāo)。

目前，百度文心大模型技術(shù)正經(jīng)歷從?“能力展示”到“價(jià)值交付”?的關(guān)鍵躍遷。未來(lái)三年，具備?場(chǎng)景理解深度?、?交互友好度?、?價(jià)值可量化?特征的產(chǎn)品，將在醫(yī)療、金融、制造等領(lǐng)域持續(xù)釋放變革能量?。這一進(jìn)程中，技術(shù)普惠與倫理規(guī)范的雙軌并行，將定義智能時(shí)代的新型生產(chǎn)關(guān)系。

在使用場(chǎng)景和產(chǎn)品體驗(yàn)為王的時(shí)代，百度文心大模型的眾多場(chǎng)景體驗(yàn)已經(jīng)通過(guò)市場(chǎng)檢驗(yàn)，實(shí)現(xiàn)了“應(yīng)用落地”，代表著中國(guó)大模型領(lǐng)域的最新技術(shù)和發(fā)展路線。這次李彥宏攜“百度史上最強(qiáng)大模型”自信而來(lái)，在使用場(chǎng)景不斷豐滿以及應(yīng)用場(chǎng)景真正做到落地的情況下，也讓市場(chǎng)對(duì)百度最新力作擁有更多期待。

前有DeepSeek春節(jié)出圈，后有百度接連開(kāi)源、免費(fèi)，中國(guó)大模型趕超美國(guó)提速。中國(guó)在以百度為代表的企業(yè)在算法方面的巨大投入產(chǎn)生的強(qiáng)大的基礎(chǔ)大模型是護(hù)城河，目前來(lái)看，OpenAI被“逼出”GPT-4.5的背后，是中國(guó)大模型在不斷提升能力趕超美國(guó)的印證。

該文為BT財(cái)經(jīng)原創(chuàng)文章，未經(jīng)許可不得擅自使用、復(fù)制、傳播或改編該文章，如構(gòu)成侵權(quán)行為將追究法律責(zé)任。

作者 | 夢(mèng)蕭

特別聲明

本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場(chǎng)，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。

我要舉報(bào)

#百度AI