- +1
 
AI編程真的厲害,OpenAI、DeepMind模型奪得國際大學(xué)生程序設(shè)計(jì)決賽金牌
在本月初于阿塞拜疆舉行的國際大學(xué)生程序設(shè)計(jì)競賽(ICPC)世界決賽中,OpenAI、谷歌DeepMind兩家公司的人工智能模型獲得了金牌級別的成績,順利解出人類參賽者無法完成的問題。DeepMind稱之為“朝著通用人工智能(AGI)邁進(jìn)的歷史性時(shí)刻”。
ICPC世界總決賽匯集了來自全球103個(gè)國家、近3000所大學(xué)的139支頂尖隊(duì)伍。在一共12道題目中,排名第一的是OpenAI,成功解決全部12道題目。Gemini 2.5 Deep Think模型最終解決10道題目,達(dá)到金牌水準(zhǔn),位列第二。
OpenAI參賽系統(tǒng)由多個(gè)通用模型組成,包括GPT-5和一個(gè)實(shí)驗(yàn)性推理模型。其中,GPT-5解決了11題,實(shí)驗(yàn)性推理模型解決了最難的第12題,并負(fù)責(zé)最終提交決策。所有模型均未針對ICPC進(jìn)行專門訓(xùn)練。OpenAI技術(shù)團(tuán)隊(duì)在賽后表示,“我記得剛加入OpenAI時(shí),我們最好的AI模型甚至連Codeforces的簡單問題都解決不了??吹竭^去兩年的進(jìn)步速度,真是令人難以置信?!?/p>
谷歌方面介紹,參賽的Gemini2.5并非專門為ICPC訓(xùn)練,而是用戶在Gemini應(yīng)用中可直接使用的版本。模型在比賽開始10分鐘后啟動(dòng),前45分鐘便解出8題,三小時(shí)內(nèi)又完成兩題。DeepMind稱,這一表現(xiàn)是人工智能在“解決抽象問題能力上的飛躍”。例如,Gemini在不到半小時(shí)內(nèi)解出了“問題C”——一項(xiàng)關(guān)于管道網(wǎng)絡(luò)向儲(chǔ)液器分配液體的復(fù)雜優(yōu)化問題,而這一題目無人類隊(duì)伍成功解答。
“對我來說,這是一個(gè)相當(dāng)于國際象棋的‘深藍(lán)’和圍棋的AlphaGo的時(shí)刻?!盌eepMind副總裁Quoc Le進(jìn)一步解釋說,“更重要的是,它更接近現(xiàn)實(shí)世界,而不僅僅是像國際象棋和圍棋這樣受限的環(huán)境。正因如此,我認(rèn)為這一進(jìn)步有可能改變許多科學(xué)和工程學(xué)科,”比如設(shè)計(jì)新藥或芯片。
谷歌表示,Gemini 2.5 Deep Think是一款經(jīng)過專門訓(xùn)練的通用人工智能模型,可以解決非常困難的編碼、數(shù)學(xué)和推理問題,其表現(xiàn)“與世界前20名的程序員一樣好”。在這些競賽中解決復(fù)雜的任務(wù)需要深度抽象推理、創(chuàng)造力、綜合新解決方案的能力,以及真正的創(chuàng)造力火花。
不少網(wǎng)友在社交平臺(tái)慶祝這一歷史性時(shí)刻。AI在ICPC上斬獲金牌可能意味著人工智能可以成為程序員真正的問題解決伙伴。但同時(shí)也引發(fā)了未來人類的編程能力可能會(huì)永遠(yuǎn)落后于AI的擔(dān)憂。
加州大學(xué)伯克利分校的計(jì)算機(jī)科學(xué)教授斯圖爾特·拉塞爾(Stuart Russell)在細(xì)節(jié)公布之前表示,“具有劃時(shí)代意義的說法似乎有些夸大其詞?!彼J(rèn)為,人工智能系統(tǒng)在編程任務(wù)上表現(xiàn)優(yōu)秀已經(jīng)有一段時(shí)間了,而“人工智能公司一直聲稱取得突破要面臨巨大的壓力。”
同時(shí)他也承認(rèn),“要正確回答ICPC的問題,代碼實(shí)際上必須能夠正常工作(至少在有限數(shù)量的測試用例上),所以這種性能可能表明,人工智能編碼系統(tǒng)在足夠準(zhǔn)確地生成高質(zhì)量代碼方面取得了進(jìn)步。”





- 報(bào)料熱線: 021-962866
 - 報(bào)料郵箱: news@thepaper.cn
 
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




