- +1
Jim Keller :做與英偉達完全相反的事情

本文由半導體產(chǎn)業(yè)縱橫(ID:ICVIEWS)編譯自eetimes
RISC-V正在發(fā)揮更大的價值。
Tenstorrent 已開始發(fā)售其用于 AI 工作負載的 Blackhole 處理器。首席執(zhí)行官 Jim Keller 表示,這是四年來最好的一天。
在Keller位于加州圣克拉拉的辦公室門外,有一塊白板,上面用粗體字寫著“我們一定會贏!”。旁邊列出了一些在黑洞一代硬件上達到“實用”性能和可靠性水平的模型,其中包括目前公司TT-NN編譯器堆棧中列出的五個模型?!拔覀冞€有15個模型正在開發(fā)中,”他說。
負責構建基于 Tenstorrent MLIR(多級中間表示)編譯器的團隊 TT-Forge 稍微落后了一點,但 Keller 表示“目前有數(shù)百名工程師正在致力于此”。

“MLIR 真的是一個重大勝利,”Keller說?!斑@是一個不錯的選擇,真的很棒?!?/p>
Keller 對為開源項目 MLIR 做出貢獻感到特別興奮。Tenstorrent 的整個軟件棧都是開源的?!斑@個決定在公司內(nèi)部和外部都得到了好評,而且它幫助我們招募人才,因為開源精神對工程師很有吸引力,”他說。
“我們在很多方面都獲得了關注,因為人們能夠基于我們的技術構建軟件,而且他們?yōu)槲覀儦g呼,因為它有效,而且我們可以對其進行調(diào)整。他們對真正的開源軟件棧的存在感到興奮,”Keller 說。
RISC-V投資
Tenstorrent 的芯片和 IP 也基于開源指令集 RISC-V 構建。Keller 表示:“RISC-V 行業(yè)的決策速度曾讓我們感到畏懼,但現(xiàn)在我們在某些領域已經(jīng)處于領先地位?!?/p>
“我們正在投資 RISC-V 編譯器技術。我們已經(jīng)將 LLVM 的性能提高了 10%,并且為開源做出了貢獻。操作系統(tǒng)、驅動程序、工具鏈,一切都在改進。RISC-V 真的很棒,我很高興我們做出了正確的決策,并且能夠從中受益,”Keller 說道。
“AI 代碼生成將會改變代碼。它將更加傾向于并行化,CPU 架構也在發(fā)生變化。其他 ISA 無法控制這一點,但 RISC-V 可以,所以我們正在積極地致力于此,”Keller 說。
NVIDIA 近期宣布,將把其用于 GPU 之間通信的互連技術“NVIDIA NVLink”的 IP 授權給部分定制 CPU 和加速器制造商。該公司以自主研發(fā)而聞名,但一些人認為此舉旨在圍繞部分 NVIDIA 技術構建多供應商生態(tài)系統(tǒng)。當被問及是否對更開放的 NVLink 版本有任何擔憂時,Keller 回答說:“我一點也不擔心。”
Keller說:“Tenstorrent 芯片通過經(jīng)過驗證的開放標準以太網(wǎng)連接,這已經(jīng)足夠了?!?/p>
他開玩笑說:“我們把NVIDIA做的事情列個清單,然后反其道而行之。以太網(wǎng)真的很棒。小型低成本芯片是個好主意。更簡單的服務器很棒,開源軟件也很棒?!?/p>
他還強調(diào)了 Tenstorrent 對更便宜的芯片封裝的關注,放棄高帶寬內(nèi)存 (HBM) 而選擇 GDDR6。
Keller說:“如果你完全照搬領先者的做法,你將獲得 20% 的市場份額,但你會降低價格,而且你不會創(chuàng)造出新的市場?!?/p>
“至少有一家公司正在自己的AI硬件中使用Tenstorrent的開源堆棧。這家中國公司提交了一份錯誤報告,Tenstorrent團隊順利修復了該錯誤。這就是開源軟件的本質,即使它可能幫助了中國的競爭對手制造商,”他說。
勝利是靠創(chuàng)新贏得的
“Tenstorrent 將繼續(xù)服務中國市場。根據(jù)目前的美國出口限制,我們上一代硬件 Wormhole 可以運往中國,但 Blackhole 必須進行精簡,我們正在將這種精簡融入到每一塊硅片中。Ascalon CPU IP 也必須針對中國客戶進行精簡,”Keller 說道。
“限制人工智能技術的出口對美國沒有好處,”Keller說?!跋拗瓢雽w設備的出口意味著中國將加大國內(nèi)人工智能技術的研發(fā)力度。”
“據(jù)我所知,過去五年中國對半導體設備的限制,反而加速了中國的發(fā)展速度大約五年,”Keller說道?!皠倮强縿?chuàng)新贏得的,而不是靠限制。這一點早已顯而易見?!?/p>
Tenstorrent 目前在塞爾維亞、德國和波蘭設有歐洲辦事處,并應塞浦路斯政府的邀請在塞浦路斯開設辦事處,將使用 Tenstorrent 計算機與塞浦路斯大學開展合作項目。
“各國都希望掌控自己的人工智能技術,而不是依賴美國的超級巨頭,”Keller說,“他們喜歡我們的開源軟件,這樣他們就可以自己做事?!?/p>
Keller表示:“我們未來可能設立辦事處的國家之一是西班牙,因為那里有大量與 RISC-V 相關的人才和政府支持。”
在日本,Tenstorrent 也正在與 Rapidus 合作,后者的 2nm 中試線正在啟動中,并且剛剛提前發(fā)布了 PDK(工藝設計套件)。
“我們一直在對一些 CPU 進行綜合測試,并向它們發(fā)送反饋,”Keller 說,“測試結果基本符合我們的預期?!?/p>
構建更大的訓練集群
隨著 Blackhole 芯片的推出,Tenstorrent 正在繼續(xù)構建更大規(guī)模的訓練集群。目前,他們已經(jīng)構建了一個由 6 個“Backhole Galaxies ”(192 個芯片)組成的訓練集群,并計劃在未來六個月內(nèi)實現(xiàn)更大的集群。他們的最終目標是打造一個包含 16 臺 Galaxy 服務器的數(shù)據(jù)平面引擎。其中 16 臺 Galaxy 服務器用于交換(Tenstorrent 使用自有芯片作為交換機),另外 16 臺 Galaxy 服務器用作優(yōu)化器,并保留一定的冗余度。
“在演示中,我們將運行一個集群,并展示即使拔掉任何線纜,它也不會停止運行,”Keller說?!霸瓌t上,你可以關閉任何服務器的電源,它都會繼續(xù)運行?!?/p>
他進一步指出,“四臺 Galaxies(128 塊芯片)即可實現(xiàn)快速推理。推理所需的令牌數(shù)量將是現(xiàn)有大規(guī)模語言 (LLM) 工作負載的百萬倍以上(推理計算量的實際上限取決于人類能夠提出的獨特問題的數(shù)量)。”
“我的使命是大幅降低訓練成本,”Keller強調(diào)?!拔覀?nèi)绾翁峁┖线m的平臺來做新的事情?這是一個巨大的挑戰(zhàn),因為如果你不能訓練,你就無法做新的事情。”
*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯(lián)系后臺。
本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




