長在云上的大模型,也終將改變云計算的格局
前言:
云計算產(chǎn)業(yè)正面臨一場由大模型技術(shù)引領(lǐng)的變革,背后的驅(qū)動力主要有兩個方面:
首先,AI算力和AI軟件的需求增長速度遠(yuǎn)遠(yuǎn)超過通用算力和傳統(tǒng)軟件;
其次,大模型的應(yīng)用有助于降低軟件和項(xiàng)目交付的成本。
作者 | 方文三
圖片來源 | 網(wǎng) 絡(luò)
算力饑渴有望帶動云服務(wù)復(fù)興
與前兩年的繁榮相比,近兩年來云計算行業(yè)面臨困境,增長乏力。
在大模型熱潮的推動下,云計算廠商成為主要受益者之一,被視為實(shí)現(xiàn)彎道超車的機(jī)會。
預(yù)計大模型將帶動云上AI算力的急劇增長,逐漸縮小AI算力工作負(fù)載與通用算力的差距,為云廠商帶來新的機(jī)遇。
據(jù)硅谷知名風(fēng)投A16Z估計,應(yīng)用層廠商將大約20%—40%的收入用于推理和模型微調(diào),這部分收入通常直接支付給云廠商或第三方模型提供商。
而第三方模型提供商也將一半左右的收入用于云基礎(chǔ)設(shè)施。因此,生成式AI總收入的10%—20%流向了云提供商。
另一方面,OpenAI的研究表明,在最大規(guī)模的人工智能模型訓(xùn)練中,計算量呈指數(shù)級增長。
目前大模型訓(xùn)練所需算力的增速保持在3-4個月/倍速度增長,遠(yuǎn)超摩爾定律的增速。
綜上所述,生成式AI的大量資金最終流向了基礎(chǔ)設(shè)施,AI大模型訓(xùn)練為云廠商帶來了可觀的直接營收。
同時,生成式AI推動了整個云服務(wù)行業(yè)的升級,為其帶來了新的市場增量。
傳統(tǒng)云生態(tài)過渡到新型云生態(tài)
傳統(tǒng)云生態(tài)以軟件、服務(wù)為核心。云計算興起過程中,一批銷售、軟件、服務(wù)、咨詢、集成伙伴自然聚合在云廠商周邊,形成了[云原生]生態(tài)。
云廠商與合作伙伴的默契是,只提供基本的公有云服務(wù)(如計算、存儲、網(wǎng)絡(luò)、數(shù)據(jù)庫),其他都交由合作伙伴負(fù)責(zé)。
這種生態(tài)的好處是邊界清晰、分工明確。但過去多年,中國云市場生態(tài)建設(shè)有大量不足之處。
中國市場應(yīng)用現(xiàn)代化水平還不高。集成項(xiàng)目、人力外包是目前的主流形態(tài)。這帶來的問題是,服務(wù)成本高、協(xié)同效率低。
在大數(shù)據(jù)模型時代,新型的云生態(tài)系統(tǒng)將以多租戶平臺和AI原生應(yīng)用為核心。
經(jīng)過AI技術(shù)改造后的應(yīng)用軟件將在整個生態(tài)系統(tǒng)中發(fā)揮更加關(guān)鍵的作用。
原子化、單點(diǎn)化、碎片化的AI應(yīng)用將更為豐富,且更具價值。
其價值主要體現(xiàn)在解決上一代云生態(tài)系統(tǒng)的主要問題上,即降低服務(wù)成本、提高服務(wù)效率。
以AI為核心的大模型階段云生態(tài),正逐漸成為主流,并逐步取代舊的云生態(tài)。
這一歷史進(jìn)程是由AI算力占比的持續(xù)上升和AI算力成本的持續(xù)下降所決定的。
據(jù)OpenAI預(yù)測,AI大模型的訓(xùn)練成本將持續(xù)快速下降,預(yù)計到2030年將降至僅60萬美元。
MaaS成趨勢,大模型服務(wù)是主流
隨著大模型的數(shù)量日益增多,眾多企業(yè)已認(rèn)識到,獨(dú)立訓(xùn)練大模型并非明智之舉,反而基于現(xiàn)有的通用大模型進(jìn)行二次開發(fā)更為實(shí)際且高效。
這一觀點(diǎn)與當(dāng)前大模型領(lǐng)域中普遍存在的[重復(fù)造輪子]現(xiàn)象的應(yīng)對策略相吻合。
在AI原生應(yīng)用大量涌現(xiàn)的背景下,除了前期的模型訓(xùn)練,云服務(wù)提供商的盈利空間將更多地來自于向開發(fā)者提供強(qiáng)大的基礎(chǔ)大模型,并針對各類業(yè)務(wù)場景和用戶需求收取AI應(yīng)用推理費(fèi)用。
為了實(shí)現(xiàn)這一目標(biāo),云服務(wù)提供商需要確保計算服務(wù)的穩(wěn)定性和推理體驗(yàn)的優(yōu)質(zhì)性,從而在激烈的市場競爭中脫穎而出。
最終,MaaS將成為新的基礎(chǔ)服務(wù),并依賴于新型IT基礎(chǔ)設(shè)施進(jìn)一步顛覆當(dāng)前的云計算市場格局。
在過去數(shù)年中,穩(wěn)態(tài)業(yè)務(wù)通常部署在主機(jī)上,要求絕對穩(wěn)定性,而敏態(tài)業(yè)務(wù)則更多地構(gòu)建在云上,以滿足不斷變化的需求。
在此基礎(chǔ)上,目前存在兩種主要的上云模式:一種是平遷上云,成本較低且能保證數(shù)據(jù)可控性,但同時可用性也較低;
另一種則是將底層架構(gòu)徹底云原生化改造,雖然成本高、周期長,但可以為企業(yè)帶來長期利益。然而,很少有企業(yè)能夠承擔(dān)暫停服務(wù)器進(jìn)行架構(gòu)改造的代價。
云服務(wù)提供商積極發(fā)力
目前,各大云服務(wù)提供商正在積極推出大模型平臺,旨在降低大模型的訓(xùn)練和使用成本。
百度推出了文心千帆大模型平臺,專門面向B端企業(yè)用戶。該平臺提供一站式的大模型定制服務(wù),包括數(shù)據(jù)管理、自動化模型定制微調(diào)以及推理服務(wù)云端部署等,同時還提供文心一言企業(yè)級推理云服務(wù)。
騰訊云推出了新一代HCC高性能計算集群,采用最新一代騰訊云星星海自研服務(wù)器和NVIDIA H800 Tensor Core GPU,提供高達(dá)3.2T的超高互聯(lián)帶寬。
阿里云推出了[魔搭社區(qū)],這是一個面向用戶的模型服務(wù)型平臺。該平臺致力于降低模型的使用門檻,為多個場景提供適配的API。
華為云的一站式AI開發(fā)平臺ModelArts為盤古大模型的訓(xùn)練和推理提供了全面的優(yōu)化支持,包括計算優(yōu)化、通信優(yōu)化、存儲優(yōu)化和算法優(yōu)化,成為盤古大模型重要的基礎(chǔ)平臺資源。
字節(jié)跳動旗下的云服務(wù)平臺火山引擎推出了智能推薦-高速訓(xùn)練引擎,采用軟硬一體優(yōu)化設(shè)計,支持100GB-10TB+超大模型的高效訓(xùn)練。
在大模型的影響下,云計算從互聯(lián)網(wǎng)時代的CPU云為主向AI時代的GPU云為主的轉(zhuǎn)變已成為行業(yè)共識和必然趨勢。
在更底層的芯片端,除了英偉達(dá)之外,高通、英特爾、Arm等廠商也開始將面向大模型訓(xùn)練與推理的芯片設(shè)計與生產(chǎn)納入工作日程,為下一個時代的可能性做好準(zhǔn)備。
然而,除了芯片種類與數(shù)量的變化,大模型對云計算廠商的影響其實(shí)體現(xiàn)在更深層面。
結(jié)尾:
對于大模型相關(guān)能力的研究和投入,各大云廠商必須給予足夠的重視。
通用人工智能的支持是大勢所趨,也是各大云廠商必須完成的任務(wù)。
在這方面,任何疏忽或缺失都可能導(dǎo)致無法在激烈的市場競爭中立足。
因此,各大云廠商應(yīng)將其視為一個必備的核心能力,不斷加大投入力度,以應(yīng)對不斷變化的市場需求和競爭態(tài)勢。
隨著新需求的涌現(xiàn),需要構(gòu)建與之相匹配的新生態(tài),并制定相應(yīng)的新策略。
部分資料參考:財經(jīng)十一人:《大模型,即將改變云生態(tài)》,雷鋒網(wǎng):《年底了,我們來談?wù)勗朴嬎闩c大模型的那些事兒》,中國新聞周刊:《在云上,看見大模型的未來》,比特網(wǎng):《熱度不減的大模型,將給云計算市場帶來什么?》,科技云報到:《生成式AI將開啟云計算未來新十年?》,21世紀(jì)經(jīng)濟(jì)報道:《大模型時代,云廠商的雙重身份》
原文標(biāo)題 : AI芯天下丨深度丨長在云上的大模型,也終將改變云計算的格局
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-12.26立即報名>>> 【在線會議】村田用于AR/VR設(shè)計開發(fā)解決方案
-
1月8日火熱報名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會
-
即日-1.14火熱報名中>> OFweek2025中國智造CIO在線峰會
-
即日-1.24立即參與>>> 【限時免費(fèi)】安森美:Treo 平臺帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容