- +1
AI狂歡的背后:算力的能耗,我們該擔(dān)憂嗎?
原創(chuàng) Sophia Chen 集智俱樂部

導(dǎo)語
ChatGPT等AI模型爆發(fā)式增長引發(fā)關(guān)鍵問題:這場AI革命需要消耗多少能源?本文探究數(shù)據(jù)中心在鄉(xiāng)村地區(qū)的快速擴張,以弗吉尼亞州為例,揭示研究者如何通過供應(yīng)鏈分析和直接測量兩種方法估算AI能耗。雖然AI目前僅占全球能源消耗的小部分,但在數(shù)據(jù)中心集中區(qū)域影響顯著。技術(shù)效率的提升能否跑贏使用量的增長?這場能源與創(chuàng)新的博弈將如何影響我們的未來?
研究領(lǐng)域:生成式人工智能、能源透明度、供應(yīng)鏈分析、杰文斯悖論
Sophia Chen | 作者
Nature | 作者
在弗吉尼亞州的庫爾佩珀縣,空氣中彌漫著干草和糞便的氣息,這里的牛數(shù)量是人類的三分之一。“我們有大片農(nóng)場,大多數(shù)仍然是家族經(jīng)營,并且有很多森林,”Sarah Parmelee說道,她是該縣55,000名居民之一?!斑@里是迷人的美國小鎮(zhèn)風(fēng)情,”她補充道。
但是這個田園般的世外桃源正經(jīng)歷21世紀(jì)的重大轉(zhuǎn)變。過去幾年里,該縣已經(jīng)批準(zhǔn)了七個大型數(shù)據(jù)中心項目的建設(shè),這些項目將支持技術(shù)公司在生成式人工智能(AI)方面的擴張計劃。在這些巨大的建筑內(nèi)部,成排的計算機服務(wù)器將用于訓(xùn)練像ChatGPT這樣的對話式AI模型,并向全世界每天約數(shù)十億的請求提供答案。這種建設(shè)將會給弗吉尼亞帶來長遠的影響,每個設(shè)施可能會消耗與數(shù)萬住宅相同的電量,這可能會推高居民的用電成本,并使該地區(qū)的電力基礎(chǔ)設(shè)施使用超出其容量限制。帕梅利和其他社區(qū)成員對數(shù)據(jù)中心的用電需求持謹(jǐn)慎態(tài)度,尤其弗吉尼亞已經(jīng)是全球的數(shù)據(jù)中心之都。2024年12月發(fā)布的一項審查指出,盡管數(shù)據(jù)中心帶來了經(jīng)濟效益,但持續(xù)增長可能會在未來十年內(nèi)使弗吉尼亞的電力需求翻倍。
“電將從哪里來?”帕梅利問道,她正在繪制該州數(shù)據(jù)中心的增長地圖,并為位于弗吉尼亞州沃倫頓的非營利組織皮埃蒙特環(huán)境委員會(Piedmont Environmental Council)工作。他們都說,“我們會從其他地區(qū)購買電力。”但可能那個區(qū)正計劃從你這里購買電力?!?
類似關(guān)于AI和能源的沖突正在全球許多地方上演,這些地方的數(shù)據(jù)中心都在以創(chuàng)紀(jì)錄的速度涌現(xiàn)。大型科技公司正大力押注生成式AI,這比舊的AI模型需要更多的能量來運行,因為舊模型只是提取數(shù)據(jù)中的模式,而不生成新的文本和圖像。這使得企業(yè)集體花費數(shù)百億美元用于新建數(shù)據(jù)中心和服務(wù)器,以擴大其算力容量。
從全球視角來看,AI對未來電力需求的影響相對較小,但是對數(shù)據(jù)中心密集的地方的影響較為深遠。與其他能源密集型設(shè)施相比,如鋼鐵廠和煤礦,數(shù)據(jù)中心的空間密集度要高得多。公司傾向?qū)?shù)據(jù)中心的建筑建設(shè)地彼此靠近,以便共享電網(wǎng)和冷卻系統(tǒng),并高效地傳輸信息,既包括內(nèi)部傳輸,也包括傳輸?shù)接脩?。特別地,由于弗吉尼亞州提供稅收優(yōu)惠,越來越多的數(shù)據(jù)中心公司在此聚集。

圖片來源:go.nature.com/439becc
“如果有了一個,很可能就會有更多,”帕梅利說。弗吉尼亞已經(jīng)擁有340個這樣的設(shè)施,而帕梅利繪制的地圖顯示弗吉尼亞還有159個計劃中的數(shù)據(jù)中心或現(xiàn)有中心的擴建項目,據(jù)位于加利福尼亞州帕洛阿爾托的研究機構(gòu)EPRI的一份報告稱,這些數(shù)據(jù)中心占該州電力使用的四分之一以上[2]。在愛爾蘭,數(shù)據(jù)中心消耗的電力超過了全國用電量的20%,其中大部分位于都柏林邊緣地區(qū)。在美國,至少有五個州的數(shù)據(jù)中心耗電量已超過10%。
更棘手的情況是,企業(yè)對其AI系統(tǒng)電力需求的數(shù)據(jù)缺乏透明度?!罢嬲膯栴}是,我們在操作時幾乎無法獲取詳細(xì)數(shù)據(jù)和信息,”獨立研究員喬納森·庫米說,他研究計算機能源使用三十多年時間,并在加州伯靈格姆運營一家分析公司。
“我認(rèn)為這個領(lǐng)域的研究人員都在抓狂,因為我們得不到我們需要的數(shù)據(jù),”阿姆斯特丹自由大學(xué)研究員、荷蘭公司Digiconomist的創(chuàng)始人亞歷克斯·德弗里斯說,這家公司研究數(shù)字趨勢帶來的意外后果?!拔覀冎荒鼙M力而為,嘗試各種方法來得出一些數(shù)字。”
估算AI能源需求
由于缺乏公司的詳細(xì)數(shù)據(jù),研究人員以兩種方式探討了AI的能源需求。2023年,德弗里斯使用了一種供應(yīng)鏈(或基于市場的)方法。他查看了NVIDIA服務(wù)器的功耗,該服務(wù)器在生成式AI市場占據(jù)主導(dǎo)地位,并據(jù)此推算一年所需的電力。然后,他根據(jù)特定任務(wù)所需此類服務(wù)器總數(shù)的估計值乘以這一數(shù)字。
德弗里斯用這種方法估計了如果谷歌搜索使用生成式AI所需的能量。兩家能源分析公司估計,谷歌搜索使用類似ChatGPT的AI需要40到50萬臺NVIDIA A100服務(wù)器,基于這些服務(wù)器的功率需求,這將相當(dāng)于每年23至29太瓦時 (TWh) 的電力。然后,根據(jù)分析師提供的每日高達90億次搜索的估算(不同來源的估計數(shù)字),德弗里斯計算出每次通過AI服務(wù)器的請求大約需要7至9瓦時(Wh)的電力。按照谷歌在2009年博客文章中報道的數(shù)字,這是普通搜索使用電力的23至30倍(參見 go.nature.com/3d8sd4t)。對此,谷歌方?jīng)]有回應(yīng)。
德弗里斯說,這種計算方式感覺像是“抓住救命稻草”(grasping at straws),因為他不得不依靠來自第三方的估算。而他的數(shù)字很快過時了,因為現(xiàn)在的AI模型在計算成本僅為2023年模型一小部分的情況下,也可以達到相同的準(zhǔn)確度,所以現(xiàn)在用于集成AI的谷歌搜索所需的服務(wù)器數(shù)量可能更低,正如美國能源分析公司SemiAnalysis(德弗里斯估算的來源數(shù)據(jù))在給《自然》雜志的電子郵件中所寫道。
即便如此,該公司表示,評估生成式AI能耗的最佳方式仍然是監(jiān)控服務(wù)器發(fā)貨量及其功率需求,這是許多分析師廣泛采用的方法。然而,要分離出僅由生成式AI使用的能量是很困難的,因為數(shù)據(jù)中心通常也需要執(zhí)行非AI任務(wù)。
自下而上的估算
另一種評估AI能耗需求的方法是“自下而上”的:研究人員測量一個與AI相關(guān)的請求在一個具體數(shù)據(jù)中心中的電力需求。然而,獨立研究人員只能使用開源的AI模型進行測量,這些模型的能耗預(yù)計和私有模型(非開源)類似。
這些測試背后的概念是用戶提交一個提示,例如生成圖像或文本聊天的請求,然后Python軟件包CodeCarbon可允許用戶電腦訪問數(shù)據(jù)中心,獲取模型執(zhí)行芯片的技術(shù)細(xì)節(jié)?!霸谶\行結(jié)束時,它會提供所使用的硬件消耗了多少電力的估計值,”薩莎·盧西奧尼說,他是幫助開發(fā)CodeCarbon的AI研究員,并且在紐約市的Hugging Face工作,該公司托管了一個開放源代碼平臺,用于AI模型和數(shù)據(jù)集。
盧西奧尼和其他人發(fā)現(xiàn)不同的任務(wù)需要不同的能量。根據(jù)他們最新的結(jié)果,平均而言,根據(jù)文本提示生成圖像大約消耗0.5 Wh的電力,而生成文本則略少。作為比較,現(xiàn)代智能手機充滿電大約需要22 Wh。但存在很大的差異:較大的模型需要更多的能量(參見‘AI使用多少能量?’)。德弗里斯說,這些數(shù)字低于他論文中的數(shù)字,但這可能是因為盧西奧尼等人測試用的模型至少比支持ChatGPT的模型小一個數(shù)量級,以及AI變得越來越高效。
這些數(shù)字是一個下限,根據(jù)卡內(nèi)基梅隆大學(xué)的計算機科學(xué)家艾瑪·斯特魯貝爾(Emma Strubell)的說法,他是盧西奧尼的合作研究者。他們說,“否則,公司會出來糾正我們,但他們并沒有?!贝送?,公司通常不會提供估算數(shù)據(jù)中心冷卻(data-centre cooling)所需電力相關(guān)的信息。據(jù)法國的數(shù)據(jù)科學(xué)家本諾瓦·科爾蒂(Beno?t Courty)所說,CodeCarbon也無法訪問某些類型的芯片的能量消耗數(shù)據(jù),這包括谷歌的專有TPU芯片,他是CodeCarbon的維護者。

AI在不同任務(wù)上的能耗
盧西奧尼還研究了一個模型從大量數(shù)據(jù)中提取統(tǒng)計模式,也就是訓(xùn)練生成式AI模型需要多少能量。訓(xùn)練像GPT-3這樣的模型,即ChatGPT的第一個版本背后的模型,需要的能量約為千兆瓦時。但按照模型每天接收數(shù)十億次請求的計算,那么回答這些查詢所消耗的電力,能耗在太瓦時量級,依然主導(dǎo)AI每年的能耗需求。
上個月,盧西奧尼和其他研究人員發(fā)起了AI Energy Score項目,這是一個公共倡議,旨在比較不同任務(wù)上的AI模型的能效,并給每個模型評級。封閉源代碼模型的開發(fā)者也可以上傳測試結(jié)果,然而目前只有美國軟件公司Salesforce參與了進來,盧西奧尼說。
隨著競爭的加劇,公司對于其最新行業(yè)模型的能源需求越來越閉口不談,‘公司間共享信息的現(xiàn)象有所減少’,斯特魯貝爾說。如谷歌和微軟等公司的報告所稱,歸因于支持AI的數(shù)據(jù)中心建設(shè),他們的碳排放量正在增加。(當(dāng)被《自然》雜志提及缺乏透明度的批評時,包括谷歌、微軟和亞馬遜在內(nèi)的公司沒有回應(yīng);相反,它們強調(diào)正在與地方當(dāng)局合作,確保新建的數(shù)據(jù)中心不會影響當(dāng)?shù)氐墓迷O(shè)施供應(yīng)。)
一些政府現(xiàn)在要求公司提高透明度。2023年,歐盟通過了一項能源效率指令,要求能耗500千瓦功率以上的數(shù)據(jù)中心運營商每年報告其能源消耗。
全球性的預(yù)測
基于供應(yīng)鏈估算方法,分析師表示數(shù)據(jù)中心目前僅占世界電力需求的一小部分。國際能源署(IEA)估計,在2022年,此類設(shè)施使用的電量為240至340太瓦時,或占世界需求的1%到1.3%,如果包括加密貨幣挖掘和數(shù)據(jù)傳輸基礎(chǔ)設(shè)施,這一比例將升至2% [4]。
AI的爆發(fā)將會增加這一比例,但由于許多行業(yè)的電氣化、電動汽車的增長以及空調(diào)需求的增加,預(yù)計到2050年全球電力消耗將增長超過80%,因此數(shù)據(jù)中心“在全球電力需求增長中所占的比例相對較小”,IEA報道[4]。
即使有對AI當(dāng)前能源需求的估算值,也很難預(yù)測未來趨勢,庫米警告說?!皼]有人知道即使是幾年后,數(shù)據(jù)中心(無論是AI還是傳統(tǒng)型)將使用多少電力”,他說。主要原因是未來所需的服務(wù)器和數(shù)據(jù)中心數(shù)量存在問題,在財政的激勵下,公用事業(yè)公司和技術(shù)公司通??浯髷?shù)字。并且,許多預(yù)測是基于“簡單化的假設(shè)”,他們將最近的趨勢外推到未來十年或十五年。
去年晚些時候,庫米與他人合著了一份由美國能源部資助的報告[5],該報告估計美國的數(shù)據(jù)中心目前使用國家電力的176太瓦時(4.4%),并且到2028年可能會翻倍或三倍,達到總用電量的7%到12%。
與此同時,SemiAnalysis在其2024年3月的報告中指出(參見 go.nature.com/439becc),到2028年,數(shù)據(jù)中心將消耗美國15%的電力,到2030年將消耗全球能源生產(chǎn)的4.5%(大約是IEA數(shù)據(jù)的兩倍)。IEA計劃下個月更新其數(shù)據(jù),但無論其預(yù)測如何,顯然,AI對能源的影響在地方和區(qū)域?qū)用嫔献顬槊黠@。
弗吉尼亞的壓力
就在世界各地的研究人員盡力評估AI對能源的影響時,弗吉尼亞州的居民也缺少有關(guān)該地區(qū)數(shù)據(jù)中心用電情況的信息。帕梅利通過查閱新聞報道、行業(yè)出版物、稅務(wù)申報和眾包提示,追蹤了一些數(shù)據(jù)中心的電力需求,然而,要找到相關(guān)的信息非常具有挑戰(zhàn)性。
里士滿弗吉尼亞州立法審計審查委員會的首席立法政策分析師馬克·格里賓(Mark Gribbin)表示,當(dāng)?shù)仉娏敬_實知道建造數(shù)據(jù)中心的公司承諾需要多少電力。作為監(jiān)督州級項目和機構(gòu)的政府機構(gòu)成員,他共同撰寫了那份數(shù)據(jù)中心將在十年內(nèi)使弗吉尼亞的電力需求翻倍的報告[1]。但是,公司通常不會公開單個數(shù)據(jù)中心的具體電力需求。
上個月,弗吉尼亞州議員通過了一項數(shù)據(jù)中心透明度法案,該法案在《自然》雜志付印時正等待州長簽署。它不要求公司披露其電力需求,而是呼吁報告對環(huán)境的影響,涉及用水、土地使用等方面。
與此同時,弗吉尼亞州的電力基礎(chǔ)設(shè)施已顯示出緊張跡象。位于華盛頓特區(qū)以西的威廉王子縣的一些批準(zhǔn)的數(shù)據(jù)中心面臨長達三年的延遲,因為電力公司無法按承諾的時間向它們供電。
JLARC的報告稱,弗吉尼亞州的公用事業(yè)公司將“非常困難”地建立足夠的基礎(chǔ)設(shè)施以滿足預(yù)期的數(shù)據(jù)中心需求。太陽能設(shè)施需要以2024年年度兩倍的速度增加,風(fēng)力發(fā)電能力則必須超過迄今為止所有為未來發(fā)展預(yù)留的海上風(fēng)電場。
在某些情況下,建造數(shù)據(jù)中心的公司正試圖自己采購電力供應(yīng)。例如,去年微軟達成了一項重啟賓夕法尼亞州三里島核電站反應(yīng)堆的協(xié)議,以幫助為其AI運營供電。雖然其中一些項目使用低碳或可再生能源,但一些公用事業(yè)公司和立法者正在推動發(fā)展更多的化石燃料電廠,比如燃燒天然氣的電廠,然而這將增加碳排放。
AI的需求是否會下降?
建造數(shù)據(jù)中心的熱潮基于更多人想要更頻繁地使用AI的預(yù)期。但是,“AI使用的速度和方式仍然根本不確定”,IEA分析員在去年的一篇評論文章中寫道(參見 go.nature.com/4hu2hos)。人們擔(dān)心AI表現(xiàn)的不一致性以及版權(quán)侵權(quán)訴訟;也不清楚將來為生成式AI提供計算能力究竟需要多少資源。

2014年1月至2024年8月美國數(shù)據(jù)中心投資情況,圖片來源:go.nature.com/4hu2hos
中國今年早些時候發(fā)布的DeepSeek-R1模型能夠以明顯的成本優(yōu)勢與美國模型相匹敵。這讓一些研究人員認(rèn)為現(xiàn)在可以創(chuàng)建更好的模型而不必使其變得更“大”,這可能降低數(shù)據(jù)中心的計算需求。
集智百科團隊對DeepSeek-R1模型原理的拆解:相比之下,如果生成式AI變得更加高效,人們很可能會更加頻繁地使用它——這就是所謂的杰文斯悖論(Jevons paradox),得名于十九世紀(jì)英國經(jīng)濟學(xué)家威廉·斯坦利·杰文斯。他觀察到煤炭技術(shù)效率的提高也加速了開采,從而抵消了節(jié)省下的能源。
十年后,按照計劃,生成式AI的使用量可能會增長,庫爾佩珀縣目前提議的所有數(shù)據(jù)中心都將以滿負(fù)荷運行;也有可能生成式AI將成為一種相對小眾的技術(shù),由于需求不足,一些數(shù)據(jù)中心將關(guān)閉。
“如果做出有把握的預(yù)測,但這件事本身又存在巨大的不確定性,有人就會遭受損失”,庫米說。
參考文獻:
1. Joint Legislative Audit and Review Commission. Data Centers in Virginia 2024. JLARC Report 598 (JLARC, 2024).
2. Electric Power Research Institute. Powering Intelligence: Analyzing Artificial Intelligence and Data Center Energy Consumption (EPRI, 2024).
3. De Vries, A. Joule 7, 2191–2194 (2023).
4. International Energy Agency. World Energy Outlook 2024 (IEA, 2024).
5. Shehabi, A. et al. United States Data Center Energy Usage Report (Lawrence Berkeley National Laboratory, 2024).
原標(biāo)題:《AI狂歡的背后:算力的能耗,我們該擔(dān)憂嗎? | Nature報道》
本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




