先進(jìn)存力,已是數(shù)智化轉(zhuǎn)型的核心基建。
文|游勇
編|周路平
在人工智能蓬勃發(fā)展和數(shù)智化轉(zhuǎn)型的當(dāng)下,存儲的價(jià)值愈發(fā)凸顯。
隨著數(shù)據(jù)量的急劇膨脹,以及大模型訓(xùn)推和業(yè)務(wù)實(shí)時(shí)分析的需要,傳統(tǒng)的數(shù)據(jù)中心越來越力不從心,存儲系統(tǒng)亟需向更高吞吐量,更低時(shí)延,更高效數(shù)據(jù)管理的先進(jìn)數(shù)據(jù)基礎(chǔ)設(shè)施演變。
IDC則在《構(gòu)建面向智能化時(shí)代的先進(jìn)存力中心》白皮書中提到,要“適度超前建設(shè)先進(jìn)存力中心”。
01
AI時(shí)代下,存儲也是一等公民
39.5ZB,這是IDC預(yù)測的中國在2024年的數(shù)據(jù)總生成量。四年后,這個(gè)數(shù)字將達(dá)到97.1ZB。
或許你對存儲容量單位沒有概念,如果拿當(dāng)下內(nèi)存容量最大的手機(jī)來對比,1ZB就需要10億臺1TB內(nèi)存容量的手機(jī)才能放得下。
數(shù)據(jù)正處于大爆炸階段。從互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)到物聯(lián)網(wǎng)、人工智能,每天產(chǎn)生的數(shù)據(jù)量越來越大,而且種類越來越豐富,不僅有結(jié)構(gòu)化數(shù)據(jù),還有大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。
海量的數(shù)據(jù)對存儲系統(tǒng)提出了更高的容量要求。數(shù)智前線在統(tǒng)計(jì)政企招投標(biāo)采購時(shí)發(fā)現(xiàn),今年前8個(gè)月已經(jīng)出現(xiàn)了數(shù)百個(gè)與存儲相關(guān)的項(xiàng)目,主要涉及金融、制造、能源、運(yùn)營商、交通等行業(yè)。在大模型熱的背景下,存儲市場也分外活躍。
另外,大量數(shù)據(jù)只管存,很少被真正用起來,價(jià)值挖掘不夠。但現(xiàn)在無論是AI的需求,還是業(yè)務(wù)場景的需要,使得高頻率、高速率、大帶寬的實(shí)時(shí)讀寫需求猛增,存儲系統(tǒng)也需要具備大帶寬、低時(shí)延、高并發(fā)的存儲性能,以支持實(shí)時(shí)數(shù)據(jù)的高速讀寫和分析處理。
“AI的興起是對數(shù)據(jù)價(jià)值的再發(fā)現(xiàn)。”曙光存儲副總裁郭照斌說,以前存儲是被動(dòng)響應(yīng)上層需求,但在數(shù)智化時(shí)代下,數(shù)據(jù)的價(jià)值被提到了新的高度,“以前大家覺得死的數(shù)據(jù),現(xiàn)在經(jīng)過反復(fù)的迭代訓(xùn)練,它能產(chǎn)生智能化的東西,它能產(chǎn)生新的數(shù)據(jù),這個(gè)時(shí)候大家才重視起來。”
過去,業(yè)內(nèi)存在“重算力輕存力”的現(xiàn)象,建設(shè)了大量以GPU為主的智能算力基礎(chǔ)設(shè)施,而忽視了對先進(jìn)存力的建設(shè)。去年初,英偉達(dá)發(fā)布過一個(gè)AI數(shù)據(jù)中心購置預(yù)算的構(gòu)成,其中存儲僅占20%。
但越來越多人發(fā)現(xiàn),存儲的性能深刻影響了算力性能的發(fā)揮。
尤其在大模型的訓(xùn)練過程中,光解決算力和數(shù)據(jù)問題遠(yuǎn)遠(yuǎn)不夠,很多企業(yè)在采購了不少GPU后,發(fā)現(xiàn)往往很難滿負(fù)荷運(yùn)轉(zhuǎn),網(wǎng)絡(luò)和存儲經(jīng)常遇到瓶頸,出現(xiàn)等待和浪費(fèi),拖累整個(gè)模型的訓(xùn)練效率。
由于傳統(tǒng)業(yè)務(wù)對存儲的性能基本在百GB級,而大模型的訓(xùn)練,對存儲的需求激增到TB級。無論是海量訓(xùn)練數(shù)據(jù)加載、PB級斷點(diǎn)續(xù)訓(xùn),還是高并發(fā)推理問答,存儲性能直接決定了整個(gè)訓(xùn)練推理過程中的GPU利用率。特別是在萬卡集群下,較差的存儲性能嚴(yán)重增加GPU閑置時(shí)間,造成資源的極大浪費(fèi)。
有報(bào)告曾提到,在同等GPU算力規(guī)模下,存儲性能的高低可能造成模型訓(xùn)練周期數(shù)倍的差異。
而且,相比于傳統(tǒng)AI的需求,大模型的場景具有數(shù)據(jù)量大、參數(shù)規(guī)模大、訓(xùn)練周期長等特點(diǎn)。相對應(yīng)的,它對存力提出了更高的要求,更加強(qiáng)調(diào)高吞吐、高IOPS、高帶寬、低延時(shí)等極致性能。
存儲系統(tǒng)正逐漸演進(jìn)到更高吞吐量,更低時(shí)延,更高效的數(shù)據(jù)平臺。而傳統(tǒng)的數(shù)據(jù)中心面臨升級,新形態(tài)之一就是建設(shè)存算協(xié)同的先進(jìn)存力中心。
曙光存儲副總裁郭照斌說,數(shù)智化時(shí)代,存儲不再是單純的被動(dòng)響應(yīng),它會隨著算力的發(fā)展協(xié)同往前發(fā)展。
中科院院士錢德沛更是直言:存儲也是一等公民。換句話說,在AI時(shí)代,沒有先進(jìn)存力,算力也無法充分發(fā)揮,兩者已經(jīng)是相輔相成的關(guān)系。
越來越多人意識到存儲的價(jià)值。今年,中國計(jì)算機(jī)學(xué)會(CCF)首次舉辦了存儲大會。而2024年10月,中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會也成立了數(shù)據(jù)存儲專業(yè)委員會,曙光是會長單位。業(yè)內(nèi)甚至有一種說法,存儲是算法、算力、數(shù)據(jù)之外,AI基礎(chǔ)設(shè)施的第四支柱。
不過,郭照斌也提到,在存儲標(biāo)準(zhǔn)方面,依然還有很長的路要走。比如存儲的評價(jià)方法、測試方法目前還沒有特別明確的統(tǒng)一標(biāo)準(zhǔn);而存儲的協(xié)議目前也比較老舊,在應(yīng)用端造成很多的不便。
02
先進(jìn)存力,打通中國存儲產(chǎn)業(yè)
構(gòu)建先進(jìn)存力中心,成為智能時(shí)代解決數(shù)據(jù)難題的必然發(fā)展方向。
IDC在《構(gòu)建面向智能化時(shí)代的先進(jìn)存力中心》白皮書中提到,先進(jìn)存力中心的技術(shù)突破和應(yīng)用主要體現(xiàn)在應(yīng)用EB級平滑擴(kuò)展能力、多協(xié)議支持、先進(jìn)軟件架構(gòu)能力、多重防護(hù)機(jī)制、智能化管理平臺、液冷等先進(jìn)技術(shù),共同鑄就其高效融合、提質(zhì)增效、全域流動(dòng)、安全可靠、綠色低碳等五大特征。
這些特征背后對應(yīng)的都是當(dāng)前存儲系統(tǒng)需要應(yīng)對的難題和挑戰(zhàn)。
比如,隨著數(shù)據(jù)來源和格式越來越復(fù)雜,不同存儲系統(tǒng)之間產(chǎn)生了數(shù)據(jù)孤島,影響數(shù)據(jù)的管理和有效利用。而且,許多傳統(tǒng)存儲系統(tǒng)在設(shè)計(jì)時(shí)未充分考慮擴(kuò)展性,難以應(yīng)對業(yè)務(wù)發(fā)展的需要。
而先進(jìn)存力中心具備足夠的靈活性和可擴(kuò)展性,一方面可以兼容不同架構(gòu)技術(shù)棧,用戶可根據(jù)自身需求靈活選擇技術(shù)方案;另一方面,當(dāng)面對高并發(fā)和大數(shù)據(jù)集的存儲需求時(shí),能夠平滑擴(kuò)容。
比如大容量、高速率、低延遲逐漸成為智能化時(shí)代評估存儲系統(tǒng)性能的重要指標(biāo),但當(dāng)前存儲設(shè)備的容量和讀寫性能成為提質(zhì)增效的重要瓶頸。而先進(jìn)存力中心要求具備更高的性能,通過提升NVMe全閃存的比重,應(yīng)用多級數(shù)據(jù)加速技術(shù)等,來實(shí)現(xiàn)海量的存儲空間、超高的吞吐量和IOPS能力。
算力流動(dòng)本質(zhì)是數(shù)據(jù)要素的流動(dòng)。數(shù)據(jù)流動(dòng)需要攻克跨域存儲集群組合管理、數(shù)據(jù)冷熱分級感知、數(shù)據(jù)跨域網(wǎng)智能流動(dòng)及跨域無感知訪問等關(guān)鍵技術(shù),支撐存力資源的優(yōu)化布局。
而先進(jìn)存力中心需要支持?jǐn)?shù)據(jù)的全域流動(dòng),包括數(shù)據(jù)在集中式、分布式存儲之間的跨平臺流動(dòng),支持云端和本地化數(shù)據(jù)之間的流動(dòng),以及熱溫冷數(shù)據(jù)跨形態(tài)的流動(dòng)等。
另外,綠色低功耗也在成為先進(jìn)存力中心的必選項(xiàng)。
IDC數(shù)據(jù)顯示,存儲耗能約占數(shù)據(jù)中心總能耗的35%。IDC中國區(qū)副總裁周震剛提到,過往都是算力中心對能耗有比較高的要求,存儲和GPU消耗的算力不在一個(gè)級別,但隨著大模型訓(xùn)練對于存儲I/O吞吐的訪問猛增,存儲的功耗也被提了起來,所以存儲對液冷等綠色技術(shù)有了更多的需求。
而作為先進(jìn)存力中心概念的倡導(dǎo)者和先行者,曙光存儲正在快速適應(yīng)AI時(shí)代存儲市場的需要。
2024年6月,曙光存儲發(fā)布全球首個(gè)億級IOPS集中式全閃存儲FlashNexus,“帶來了劃時(shí)代的性能革新”,成為業(yè)界唯一具備百控級擴(kuò)展能力的集中式存儲產(chǎn)品,主要用于金融、運(yùn)營商、醫(yī)療等行業(yè)的核心業(yè)務(wù)系統(tǒng)。
當(dāng)下,發(fā)展全閃介質(zhì)已經(jīng)成為行業(yè)共識。相比傳統(tǒng)的HDD,全閃存介質(zhì)支持高IOPS、低時(shí)延,更適用于AI大模型訓(xùn)練階段的隨機(jī)讀寫場景。
在發(fā)布了首個(gè)集中式全閃產(chǎn)品的同時(shí),曙光也升級了分布式存儲產(chǎn)品——ParaStor全閃存儲,主要面向AI應(yīng)用,依托NVMe全閃的技術(shù)優(yōu)化,單節(jié)點(diǎn)帶寬最高達(dá)到150GB/s、320萬IOPS。
ParaStor全閃存儲采用業(yè)界首創(chuàng)五級加速方案。比如BurstBuffer加速層,只需將關(guān)鍵數(shù)據(jù)存儲在計(jì)算節(jié)點(diǎn)本地的NVMe盤上,避免大量的網(wǎng)絡(luò)數(shù)據(jù)傳輸和遠(yuǎn)程存儲訪問,適合存儲和快速讀取海量小文件,能夠?qū)⒆x取性能提升數(shù)倍甚至十倍以上。比如XDS雙棧兼容,讓GPU直接訪問存儲,不僅減少了CPU本身的損耗,也縮短了整個(gè)I/O通路,降低了延時(shí)。
基于分布式帶來的擴(kuò)展能力,曙光ParaStor分布式全閃存儲已經(jīng)在科教、金融、運(yùn)營商、生信等領(lǐng)域,以及自動(dòng)駕駛等AI前沿的應(yīng)用場景中廣泛落地。比如智元機(jī)器人公司在過去一年時(shí)間,頻繁發(fā)布新品,而智元能實(shí)現(xiàn)產(chǎn)品的快速迭代,背后也是曙光ParaStor分布式全閃存儲在提供支撐。
如今,曙光存儲已經(jīng)形成了FlashNexus集中式存儲和ParaStor分布式存儲兩大產(chǎn)品線。曙光將其分別稱為強(qiáng)存和智存,從其字面意思不難理解,集中式存儲面向的是金融、運(yùn)營商等領(lǐng)域的核心業(yè)務(wù)場景,對性能和可靠性要求高;而以分布式存儲為代表的智存面向的是AI等敏態(tài)業(yè)務(wù)需要。
而在這兩大不同架構(gòu)的產(chǎn)品線之間,曙光又推出了通存的方案,打通集中式存儲與分布式存儲壁壘,讓數(shù)據(jù)無界流動(dòng),實(shí)現(xiàn)跨平臺一鍵式容災(zāi)恢復(fù)、跨形態(tài)熱溫冷數(shù)據(jù)無感流動(dòng)和跨域資源池全維度視圖,以充分提升存儲資源利用率,同時(shí)更好地支持東數(shù)西存、東數(shù)西渲、東數(shù)西訓(xùn)等應(yīng)用場景。
通過強(qiáng)存+智存+通存的產(chǎn)品和方案組合,曙光給AI時(shí)代提供的全新數(shù)據(jù)基礎(chǔ)設(shè)施正在得到越來越多用戶的認(rèn)可。根據(jù)IDC年上半年最新數(shù)據(jù)顯示,曙光的市場增速達(dá)到了19.2%,遠(yuǎn)高于市場平均水平。
03
先進(jìn)客戶,走出了最佳實(shí)踐
位于重慶的西部科學(xué)城先進(jìn)數(shù)據(jù)中心是東數(shù)西算的示范項(xiàng)目,也是成渝樞紐的主節(jié)點(diǎn),通過高密度液冷機(jī)架和風(fēng)冷機(jī)架相結(jié)合的方式,這里的核心計(jì)算設(shè)備PUE能做到1.04,能耗遠(yuǎn)低于行業(yè)平均水平。
作為先進(jìn)存力中心的代表之一,這里具備百PB級的海量存儲容量,支持冷溫?zé)岱旨壌鎯鐓^(qū)域無感調(diào)度,可以按需為上層提供從文件、塊、大數(shù)據(jù)等多種協(xié)議的支持,靈活適配前端應(yīng)用。
IDC認(rèn)為,政府建設(shè)區(qū)域先進(jìn)存力中心,需要綜合考慮基礎(chǔ)設(shè)施供應(yīng)、建設(shè)與運(yùn)營成本、中心整體存力及算力性能配比、數(shù)據(jù)安全與隱私保護(hù)、生態(tài)開放、綠色低碳發(fā)展要求等。
為了滿足不同客戶在先進(jìn)存力上的需求,曙光已經(jīng)探索出了三種部署模式。
除了上述為政府建設(shè)區(qū)域先進(jìn)存力中心,在行業(yè)領(lǐng)域,先進(jìn)存力中心也有廣闊的發(fā)揮空間。比如高端計(jì)算在氣象、環(huán)境、海洋等領(lǐng)域已經(jīng)非常普遍,這些行業(yè)對數(shù)據(jù)處理能力有著非常高的要求,構(gòu)建行業(yè)/產(chǎn)業(yè)鏈先進(jìn)存力中心變得至關(guān)重要。
中國氣象局與曙光合作,構(gòu)建了橫跨三地的存力平臺,建立了國省統(tǒng)一的數(shù)據(jù)環(huán)境,并以NVMe全閃存儲帶來超強(qiáng)的IOPS性能。根據(jù)億歐智庫發(fā)布的報(bào)告顯示,中科曙光以52%的市場份額,位居2023年度中國氣象高端計(jì)算服務(wù)市場應(yīng)收份額頭名。
一位曙光的人士透露,針對行業(yè)的先進(jìn)存力中心,曙光會針對行業(yè)數(shù)據(jù)匯聚需求,做跨域流通的準(zhǔn)備。比如中國移動(dòng)攜手曙光存儲打造了業(yè)內(nèi)首個(gè)存力智能調(diào)度平臺。其核心能力包括數(shù)據(jù)的分級及策略管理,可以按照冷、熱、溫?cái)?shù)據(jù)進(jìn)行分級管理;統(tǒng)一觀測,支持異構(gòu)存儲統(tǒng)一管理,數(shù)據(jù)和存力分布一目了然;數(shù)據(jù)跨區(qū)域遷移,支持不同資源池間數(shù)據(jù)自由遷移,實(shí)現(xiàn)業(yè)務(wù)無感訪問。
企業(yè)也有自建先進(jìn)存力中心的需求,海量數(shù)據(jù)成為分析和大模型訓(xùn)練的基礎(chǔ),企業(yè)級先進(jìn)存力中心不僅能夠提供高效、安全的數(shù)據(jù)存儲解決方案,還能夠支持快速的數(shù)據(jù)訪問和處理能力,這對于加速AI模型的訓(xùn)練與推理過程尤為重要。
比如某家人工智能企業(yè),面臨著訓(xùn)練數(shù)據(jù)龐大和推理過程對讀寫速度高的困擾,這家企業(yè)通過與曙光合作,構(gòu)建先進(jìn)存力中心,應(yīng)用簡潔的系統(tǒng)架構(gòu)、高效的數(shù)據(jù)流轉(zhuǎn)性能、百微秒級元數(shù)據(jù)極致訪問性能,為業(yè)務(wù)提供堅(jiān)實(shí)支撐。
除了人工智能廠商,自動(dòng)駕駛企業(yè)也對先進(jìn)存力中心有著旺盛需求,曙光存儲以超過100PB的存儲能力支撐某自動(dòng)駕駛企業(yè)的模型迭代。
而這些先進(jìn)客戶背后,都代表了所在行業(yè)和領(lǐng)域的動(dòng)向和訴求。曙光存儲通過發(fā)揮技術(shù)創(chuàng)新和資源整合能力,打通存儲產(chǎn)業(yè)上下游,持續(xù)推動(dòng)三大創(chuàng)新部署模式落地,也取得了階段性成果。
背后離不開長期的產(chǎn)業(yè)實(shí)踐和技術(shù)積累。曙光在存儲領(lǐng)域的開拓已有二十年,早在2004年開始堅(jiān)定選擇自研路線,致力于解決中國存儲產(chǎn)業(yè)的底層技術(shù)難題。2009年曙光自研的存儲系統(tǒng)ParaStor正式誕生。2022年11月,曙光ParaStor分布式統(tǒng)一存儲系統(tǒng)登頂IO5O0全球存儲性能評測的榜首。
2023年,曙光存儲作為存儲領(lǐng)域的先行者和探索者,率先提出“先進(jìn)存力”的概念,首批試點(diǎn)完成了一些先進(jìn)存力中心的建設(shè)。經(jīng)歷了多個(gè)產(chǎn)業(yè)化升級的曙光存儲,不僅幫助用戶實(shí)現(xiàn)了數(shù)據(jù)基礎(chǔ)設(shè)施的更新迭代,也在服務(wù)用戶的過程中走出了最佳實(shí)踐,實(shí)現(xiàn)了蝶變。