- +1
IDC發(fā)布AI就緒數(shù)據(jù)存儲基礎(chǔ)設(shè)施研究報告
IDC發(fā)布了一份關(guān)于AI就緒數(shù)據(jù)存儲基礎(chǔ)設(shè)施(AI-RDSI)的研究報告,該報告由Hammerspace公司進行分發(fā)。
這份報告是四部分系列研究的第一部分,其他部分將涵蓋客戶之聲、競爭格局以及市場規(guī)模和預(yù)測。
AI-RDSI文檔的IDC觀點部分指出,"不到一半的AI試點項目能夠推進到生產(chǎn)階段"。報告強調(diào)"組織必須從以數(shù)據(jù)為中心的角度來處理AI項目"。作者還表示"供應(yīng)商必須準備好在合作伙伴和競爭對手的生態(tài)系統(tǒng)中運營,以提供全棧AI基礎(chǔ)設(shè)施產(chǎn)品"。
AI-RDSI的定義為:一個能夠支持AI工作負載數(shù)據(jù)需求的數(shù)據(jù)存儲基礎(chǔ)設(shè)施,包括數(shù)據(jù)攝取、處理、分析和部署的全生命周期。
IDC作者談到了數(shù)據(jù)物流的概念,即數(shù)據(jù)從創(chuàng)建或攝取開始在組織數(shù)據(jù)處理環(huán)境中的整個流程,并用圖表說明了這一概念。
AI系統(tǒng)需要單一的數(shù)據(jù)真實來源,要么"具備復(fù)制數(shù)據(jù)管理能力,要么在所有存儲中建立單一統(tǒng)一的元數(shù)據(jù)環(huán)境"。
這種數(shù)據(jù)基礎(chǔ)設(shè)施有五個主要屬性:
性能 - 數(shù)據(jù)吞吐量、IOPS、延遲、網(wǎng)絡(luò)帶寬和性能密集型計算需求,報告指出"實現(xiàn)高吞吐量可能需要使用并行文件系統(tǒng)或并行NFS(pNFS)等技術(shù)"。
規(guī)模
服務(wù)級別 - 報告提到99.999%是常見的要求。
數(shù)據(jù)物流
數(shù)據(jù)信任
分析師深入探討了每個部分的更多細節(jié),并討論了AI-RDSI本體論和軟件分類法。他們最后為IT供應(yīng)商和IT采購方提供了建議。最終總結(jié)指出"太多AI項目以失敗告終...我們認為對存儲基礎(chǔ)設(shè)施關(guān)注不夠,導(dǎo)致項目受到數(shù)據(jù)孤島、數(shù)據(jù)質(zhì)量差和存儲性能不足的阻礙"。
IDC全球基礎(chǔ)設(shè)施研究部基礎(chǔ)設(shè)施軟件平臺研究副總裁Phil Goodwin在最后表示:"這項研究幫助IT供應(yīng)商定義AI就緒數(shù)據(jù)存儲產(chǎn)品要求,并幫助IT采購方識別適合其需求的解決方案"。
Hammerspace對這份IDC原創(chuàng)研究報告的內(nèi)容非常認可,因此獲得了轉(zhuǎn)載許可。
評論
我們注意到IDC報告忽略了使用閃存硬件和GPU Direct for Objects的快速訪問對象存儲 - 如Cloudian、Scality和MinIO - 將對象存儲定位為適合中等或較低性能需求的解決方案。
報告強調(diào)數(shù)據(jù)可用性的重要性:
以1PB數(shù)據(jù)和99.999%的可用性計算,0.001%的數(shù)據(jù)面臨不可用風(fēng)險;1PB的0.001% = 0.00001 x 1 x 10^15 = 1 x 10^10字節(jié)或10GB。
在對象存儲領(lǐng)域,Scality的RING和Cloudian的Hyperstore提供14個9(99.999999999999%)的數(shù)據(jù)持久性和可用性,意味著只有1KB數(shù)據(jù)不可用,僅為10GB的0.00001%,這樣的表現(xiàn)更好。
本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




