麻豆传煤网站网址APP免费 ,欧美日韩精品一区三区

中國的“Databricks”們：打造AI基礎架構，我們是認真的

2021-09-28 13:57

中國的“Databricks”們：打造AI基礎架構，我們是認真的

AI落地最大的驅動因素是基礎架構的升級

近年來，大數(shù)據(jù)分析、AI等領域一直備受關注，常有引人關注的融資事件發(fā)生。美國數(shù)據(jù)科學公司Databricks剛剛在今年8月底完成了16億美元H輪融資，其最新估值高達380億美元，相比7個月前G輪融資時280億美元的估值，又輕松增加了100億美元。

Databricks“紅了”，連帶著“深巷里的美酒”——數(shù)據(jù)科學也得到了更多關注。雖然數(shù)據(jù)科學是一門復雜的學科，但如今已進入金融、工業(yè)乃至千行百業(yè)，這一過程其實也是AI從“可用”到“好用”的一個縮影。

“AI落地的關鍵，是其價值的彰顯，以及尋找到適合的商業(yè)落地途徑�！本耪略茦ODataCanvas董事長方磊指出，“以前，人們認為算法可能是壁壘。但隨著技術的快速迭代、開源開放，事實證明算法并非高不可攀，AI落地最大的驅動因素是基礎架構的升級。”

AI基礎架構升級刻不容緩

當前，中國正處于企業(yè)數(shù)智化轉型的時代拐點�；仡櫺畔⒒l(fā)展的歷程可以發(fā)現(xiàn)，1980年－2000年，這是基礎信息化時代，服務器、存儲、操作系統(tǒng)、數(shù)據(jù)庫等基礎設施軟硬件快速發(fā)展；2000年－2020年，進入到流程數(shù)字化時代，云計算開始大行其道，云成為基礎設施，各類SaaS應用百花齊放；2020年以后，市場邁入新的階段，其標志是“決策智能化”，相關領域包括數(shù)據(jù)科學平臺、云原生數(shù)據(jù)倉庫、開源技術等迎來爆發(fā)的機會。

決策智能化的實現(xiàn)，需要一個“智能化的底座”，也就是常說的AI基礎架構。通過AI基礎架構的不斷完善和升級，AI應用落地的效率會更高，也更容易�！癆I基礎架構的價值就在于，它能夠讓企業(yè)在其上自主地開發(fā)AI應用�！狈嚼诟爬ǖ�。

AI落地的探索源于算法的創(chuàng)新，之后涌現(xiàn)出的一批AI企業(yè)，致力于為客戶提供定制化的端到端的AI應用開發(fā)。這在無形中造成了AI落地的高門檻。隨著各行各業(yè)對智能化的需求愈發(fā)迫切，AI已經(jīng)成了眾多行業(yè)頭部客戶的剛需。但是這些頭部客戶不僅業(yè)務規(guī)模龐大，而且十分復雜，其需求也各不相同。如果仍然沿用過去那種“千人千面”的定制化端到端應用開發(fā)模式，很難快速滿足這些頭部客戶的業(yè)務需求，而且AI應用的門檻依然高高在上，客戶始終掌握不了主動權。

“從各行業(yè)頭部客戶的需求來看，他們更希望圍繞自身的業(yè)務開發(fā)自己的AI應用，這就需要一個自主可控的基礎設施�！狈嚼诒硎�，“依托AI基礎架構，由企業(yè)自主開發(fā)AI應用，鍛煉并形成自主的AI能力，這才是市場主流，也是AI應用落地的內驅力�！�

Databricks之所以受到市場追捧，正是因為它以最擅長的流數(shù)據(jù)處理為出發(fā)點，向上發(fā)展機器學習、建模，向下打造數(shù)據(jù)湖倉一體，不斷擴展和完善AI基礎架構，為最上層的AI應用提供一個優(yōu)化的承載平臺，即AI Foundation。

中國的“Databricks”們：打造AI基礎架構，我們是認真的

來源：Databricks

實際上，目前業(yè)內對于AI基礎架構還沒有一個統(tǒng)一而明確的定義。但從應用實踐，以及像Databricks這樣的標桿企業(yè)的做法來看，AI基礎架構至少包含兩大基石，即“數(shù)據(jù)”與“算法”。

以前，大多數(shù)的應用都是離線的，比如獲得一份營銷名單。但是現(xiàn)在，客戶對在線應用的需求越來越迫切，很多時候一個模型已經(jīng)建好，卻發(fā)現(xiàn)數(shù)據(jù)“供不應求”。由此可見，AI應用離不開一個實時的數(shù)據(jù)底座，AI基礎架構的重要性在此時得以凸顯。4年前，九章云極DataCanvas就開始打造支持高并發(fā)的實時數(shù)倉，如今經(jīng)過品牌升級，一個功能和性能都更加完善的HSAP（Hybrid Serving／Analytical Processing）實時數(shù)倉產(chǎn)品DingoDB呈現(xiàn)出來。這就是九章云極DataCanvas眼中，AI應用不可或缺的數(shù)據(jù)底座。

談到AI基礎架構的門檻，方磊表示：“算法是技術上的門檻，但我們已經(jīng)實現(xiàn)了突破。我們的自動機器學習產(chǎn)品，在性能等指標上已經(jīng)不遜于國外同類產(chǎn)品，甚至更強。其實，更高的門檻還是在客戶，或者說應用層面。當前，自建AI基礎架構的需求主要集中在各行業(yè)的頭部客戶身上。作為AI廠商，必須有意愿和能力服務好這些頭部客戶。我們公司從2014年就開始專注并深耕這一領域�！�

九章云極、Databricks像？不像？

從市場大勢來看，正是決策智能化時代的到來，才使得像Snowflake、Databricks這樣以數(shù)據(jù)為驅動，以創(chuàng)新的AI基礎架構支撐AI、大數(shù)據(jù)應用落地的企業(yè)成了資本市場的寵兒。

就在Databricks成立的2013年，同樣崇尚數(shù)據(jù)科學的九章云極DataCanvas也在中國順勢而起。盡管地處不同，但兩者卻有不少相似之處，尤其在能力建設和商業(yè)模式愿景上，九章云極DataCanvas和Databricks更頗有幾分默契，這是巧合？還是殊途同歸？

首先，兩家公司的定位相似，都是數(shù)據(jù)科學的研發(fā)者、應用者和推動者，并且都在主攻AI基礎架構升級的方向。但是由于出發(fā)點不同、所擅長的細分技術領域不同，Databricks最早以流數(shù)據(jù)處理成名，而九章云極DataCanvas則以開源自動機器學習見長，因此在具體構建AI基礎架構時，兩者選擇的路徑有所差異。

其次，從產(chǎn)品線來看，雖然在細節(jié)上略有差異，但從整體能力建設上看，兩家公司的產(chǎn)品可以說是如出一轍，都涵蓋了分析和數(shù)據(jù)兩大部分。在分析部分，九章云極DataCanvas享有業(yè)內頗受好評的開源架構機器學習平臺DataCanvas APS，該平臺囊括了算子倉庫、模型訓練、數(shù)據(jù)處理、自動機器學習等，再配合數(shù)據(jù)層面的DingoDB實時數(shù)倉，構建出數(shù)據(jù)實時計算分析閉環(huán)。而Databricks除了眾所周知的Spark以外，還有同樣知名的數(shù)據(jù)湖倉一體Delta Lake，以及機器學習、數(shù)據(jù)測試與管理、數(shù)據(jù)解釋和建模產(chǎn)品等。兩家公司通過持續(xù)不斷的創(chuàng)新，致力于讓AI基礎架構變得更加“厚實而飽滿”，可謂異曲同工。

中國的“Databricks”們：打造AI基礎架構，我們是認真的

來源：九章云極DataCanvas

“在數(shù)據(jù)科學這一領域，我們與Databricks擁有相似的愿景、目標和戰(zhàn)略，想做同樣的事，即打造AI基礎架構，將算力和網(wǎng)絡充分利用起來�！狈嚼诒硎荆皩τ谟腥藢⑽覀兎Q作‘中國的Databricks’，我們感到非常榮幸。這是對我們的一種認可。但我們也清醒地認識到，AI基礎架構市場空間巨大，還有很多‘細致的活兒’要做。這也是我們繼續(xù)快速前進的動力�！�

把AI嵌入到云里去

任何一個想有一番作為的企業(yè)，肯定都不會滿足于“成為別人”，九章云極DataCanvas也是如此，成為“中國的Databricks”不是終點，“做自己”成為一個獨特的存在才是最終目標。

實際上，因為中美兩國大到市場和競爭環(huán)境，小到企業(yè)的AI應用需求，都存在差異。在兩塊不同的土地上長出的苗，可能屬于同一種類，但在個體上會有顯著的差別。試舉一例，在美國市場，一直是AWS、Azure、Google Cloud“三朵云”打天下。無論是Snowflake還是Databricks，都生長在這“三朵云”之上。但在中國，云計算市場大相徑庭，云的碎片化現(xiàn)象顯而易見，不同的區(qū)域、不同的行業(yè)可能造就了上千朵云。雖然從AI應用落地的角度，中美客戶的需求沒有差別，但是在具體的路徑選擇和落地方式上，還是有各自的傾向和習慣。

方磊坦言，九章云極DataCanvas現(xiàn)階段將主要圍繞各行業(yè)的頭部客戶群體，為其打造AI基礎架構。因為這部分客戶的需求最迫切，并且有資金也有技術能力實現(xiàn)AI的自主開發(fā)�；趯χ袊磥鞟I行業(yè)生態(tài)發(fā)展的預判，九章云極DataCanvas建設性地提出了“云中云”戰(zhàn)略（An AI Cloud in the Clouds），即將AI基礎架構及相關AI能力，嵌入到形形色色的行業(yè)云、區(qū)域云、企業(yè)云、聯(lián)盟云等千朵云中。為了滿足不同云生態(tài)的需求，九章云極DataCanvas必須讓自己的解決方案實現(xiàn)更加靈活、高效的交付。而“云中云”顯然是事半功倍的做法，可以很好地借力打力，將九章云極DataCanvas的AI能力隨云輸出。

中國的“Databricks”們：打造AI基礎架構，我們是認真的

來源：九章云極DataCanvas

對于AI基礎架構，很多行業(yè)用戶一開始的認知是模糊的，仍需要持續(xù)的教育。但是某些先行先試的行業(yè)頭部企業(yè)，已經(jīng)從AI基礎架構的升級中嘗到了甜頭。比如在銀行業(yè)，原來需要幾天才能完成審批的貸款，現(xiàn)在可以實時審批；在制造業(yè)，工業(yè)質量檢測能力的提升、設備預測性維護的實現(xiàn)等都得益于AI的應用……諸如此類的案例應用不勝枚舉。

“在構建AI基礎架構的基礎之上，有數(shù)據(jù)、有場景、有預算、有團隊，用戶就可以開發(fā)自己的AI應用了。”方磊表示，“原來，用戶習慣‘伸手’向廠商要‘交鑰匙’的AI解決方案。但這種單獨定制的解決方案并非長久之計。”例如某大型鋼鐵企業(yè)在全球擁有300多條產(chǎn)線，每條產(chǎn)線用到的設備、供應商各不相同。如果沒有一個統(tǒng)一的平臺支撐其建模、分析、應用開發(fā)和管理，那么系統(tǒng)將不堪重負。說到底，用戶還是要依靠自身AI能力的提高，運用通用的技術，自主掌握AI應用開發(fā)。在這種情況下，AI基礎架構就是必須的。這也是九章云極DataCanvas的商業(yè)機會。

珠玉在前事半功倍

打造千朵云生態(tài)的AI基礎架構，是九章云極DataCanvas的商業(yè)定位；而打造中國開源數(shù)據(jù)科學第一平臺，則是九章云極DataCanvas的初心。兩者并不矛盾。正相反，數(shù)據(jù)科學與AI基礎架構從學科和商業(yè)應用兩個不同的維度，在九章云極DataCanvas身上實現(xiàn)了平衡與統(tǒng)一。

在很長時間里，數(shù)據(jù)科學曲高和寡。在中國，像九章云極DataCanvas這樣長期堅持深耕數(shù)據(jù)科學領域的廠商鳳毛麟角。Databricks可以說是全球范圍內數(shù)據(jù)科學領域最先跑出的企業(yè)。它居高不下的熱度至少證明了，數(shù)據(jù)科學這個市場大有可為。

新基建、云原生、數(shù)智化升級、開源，在這些利好因素下，再加上有Databricks這樣的珠玉在前，以及九章云極DataCanvas等公司多年來的精耕細作，數(shù)據(jù)科學的未來值得期待。