侵權(quán)投訴
訂閱
糾錯
加入自媒體

商湯科技楊帆:人工智能公司從技術(shù)到商業(yè)化落地5個關(guān)鍵環(huán)節(jié)

從技術(shù)到商業(yè)化落地是每個人工智能公司都要面臨的考驗,商湯科技聯(lián)合創(chuàng)始人、副總裁楊帆認為這個過程有五個關(guān)鍵點:真實有效的規(guī)模化剛需、需求的技術(shù)紅線、融合創(chuàng)新能力、有效的數(shù)據(jù)閉環(huán)、核心價值要素轉(zhuǎn)移。

以下是楊帆近期分享的“從技術(shù)突破到商業(yè)變現(xiàn)”的干貨實錄,希望能有所借鑒或幫助:

我個人經(jīng)歷很簡單,清華畢業(yè)后去了微軟。我從小的夢想就是成為一個科學家,其實不管以前的年代還是如今人工智能時代,科學家做出來的算法都很“理想”。

我不知道有多少人承擔把科學家的算法變成產(chǎn)品的,就是你不產(chǎn)出算法但要直接跟算法打交道。你打過交道就會知道,科學家們做事情時往往會把問題理想化,會把問題抽象化。但是要知道在真實世界中面臨的問題,往往很難被抽象化,它的影響因素和干擾因素非常多,所以我一直負責將科學家的“理想”變成現(xiàn)實。

2014年,商湯科技創(chuàng)立。我以前更多想的是做產(chǎn)品,但今天想的是把AI變成一個產(chǎn)業(yè),想用AI幫助公司,甚至幫助行業(yè)。所以在產(chǎn)品之外,還有很多要考慮的問題,一些是商業(yè)問題,還有一些其他方面的問題,最終決定技術(shù)是不是能給我們帶來價值。

價值,是影響一個AI技術(shù)商業(yè)化方向的核心

有個數(shù)據(jù)來源于普華永道,預測到2030年,人工智能將為世界經(jīng)濟貢獻15.7萬億美元,這相當于目前印度加中國的生產(chǎn)總值總和,而中國公司在其中將起到非常重要和關(guān)鍵的作用。

在今天的中國,我們整個AI技術(shù)的落地和應(yīng)用發(fā)展非?,大家都有共識:第一,我們數(shù)據(jù)產(chǎn)生能力特別強;第二,產(chǎn)業(yè)對新技術(shù)擁抱意識特別強。兩者結(jié)合造就了我們在應(yīng)用落地上跑得特別快,這是一個好的大方向。

在我們所認知的未來5-10年,比如對于一個城市如何優(yōu)化它的運營管理,會由細的環(huán)節(jié)組成,包括遙感、安防、樓宇、商業(yè)等領(lǐng)域,都會納入到城市管理中。商湯所涉及的行業(yè)也比較多,從互聯(lián)網(wǎng)到手機、安防、汽車、娛樂等非常多,商湯科技已與超過700家國內(nèi)外知名企業(yè)建立合作。

商湯科技是技術(shù)原創(chuàng)能力非常強的團隊,這讓我們一直引以為傲,今年,商湯和聯(lián)合實驗室在CVPR 2018上發(fā)了44篇論文,中國企業(yè)的論文總數(shù)量為100篇左右,上半年,商湯科技也接連完成了C輪和C+輪融資。

接下來問題就來了,這么多行業(yè),技術(shù)能不能給這些行業(yè)帶來價值?帶來價值后我們能不能也收獲價值?我們收獲的價值是不是足夠多?時間是不是夠長?這些其實都會影響我們選擇一個AI技術(shù)去商業(yè)化的方向。

5G技術(shù)走向成熟會激發(fā)更多視頻類應(yīng)用

AI有很多方面,包括計算機視覺、自然語言處理、人機交互等等。為什么視覺領(lǐng)域誕生了這么多大大小小的新公司?語音處理領(lǐng)域,可能就只是科大迅飛,而沒有新的創(chuàng)業(yè)公司取得比較好的位置?從事自然語言理解或者機器學習分析的,可能也不多,原因是什么?

在這里,我分享一點我的認知,回過頭來看一下AI或整個信息產(chǎn)業(yè),什么是計算機學科?它是對信息采集、分析、存儲、反饋的學科,互聯(lián)網(wǎng)發(fā)展史基本圍繞著這里面某一個環(huán)節(jié)的技術(shù)進步所帶來的產(chǎn)業(yè)升級,催生一些新的公司,給我們創(chuàng)造價值。

前幾年直播很火,現(xiàn)在應(yīng)用類視頻也很火。大家有沒有想過為什么這兩年才火?智能手機是一個原因,讓我們的信息采集和制造能力比以往無比強大,今天的手機攝像頭清晰度非常高,可以快速產(chǎn)出大量視頻,任何人都可以低成本生產(chǎn)。另外,4G通訊網(wǎng)絡(luò),也可以另大家以非常低廉的成本,去傳播信息。如此,這個行業(yè)獲得了催生和成熟。

此外,還有一個維度,就是信息的載體形態(tài)。很早之前,計算機只能處理一些數(shù)字、文本、語音,后來可以流暢地處理圖像、視頻,我們今天所處的環(huán)境是一個多模態(tài)融合,各種信息融合在一起,同時技術(shù)進步伴隨著不同信息載體形態(tài)的發(fā)展。在我看來,載體形態(tài)的發(fā)展挑戰(zhàn)更大,視頻相比語音、文本來說,是信噪比很大的信息形態(tài)。

舉個例子,比如看一部2小時的高清電影,視頻形態(tài)容量是10幾個G,這還是壓縮過的。但是把這個電影寫成一部小說存在硬盤上,可能也就幾十K。但是,不管是讀小說還是看電影,你所獲得的最關(guān)鍵90%信息是一樣的。為什么?視頻形態(tài)包含有大量冗余信息,這些信息可能沒有很高價值,但當你需要時它又包含著更多細節(jié),如果想對整個事物、整個事情有一個更深入和細致的了解,會發(fā)現(xiàn)這里有大量微小的信息,同時它的噪音也非常大,對于計算機而言它的提煉難度更高。所以,這就是為什么語音類技術(shù)、圖像視頻類技術(shù)比文本搜索技術(shù)更晚。

2014、2015年的時候,文本有科技巨頭做了,這種情況下,創(chuàng)業(yè)公司基本不會有機會。但視頻不一樣,2014年之前可能沒有什么公司真正擁有海量的視頻,可能會有一些互聯(lián)網(wǎng)上的視頻,但如果把天然信息量考慮進來的話,相比今天的視頻制造和搜集能力來看仍然是九牛一毛,而隨著5G技術(shù)即將走向成熟,這會激發(fā)更多的視頻類應(yīng)用。

所以,從技術(shù)做商業(yè)化落地到底要注意哪些關(guān)鍵點?我有一些心得。

真實有效的規(guī);瘎傂

我們做任何一件事,哪怕?lián)碛幸粋特別牛的技術(shù),一定最終是從需求出發(fā)的,一定是要說我到底給用戶創(chuàng)造了什么價值。

我們這幾年見過很多偽需求,什么叫偽需求?舉個例子,前些年一個做白色家電的生產(chǎn)商,他們覺得商湯的人臉識別技術(shù)非常棒,說:想把家里空調(diào)變成人臉識別的空調(diào),20多歲年輕人走到這兒的時候調(diào)成16度,當老人進來的時候調(diào)到26度,溫度自適應(yīng),多人性化。

我回復了他的需求,提出了兩個問題:假如人進來時沒有拍到臉,拍到背影怎么辦?假如年輕人和老人同時進來,自適應(yīng)空調(diào)要設(shè)多少度?這個在我看來就是典型的偽需求,用一個遙控器就能很簡單解決。所以,用戶可能很多時候沒有想得很清楚,但是,我們在想要做一個商業(yè)的時候,要清楚是不是能真正解決用戶真實的痛點和需求。

有很多需求是真的,但在經(jīng)濟上不劃算。舉個例子,為公廁推出人臉識別廁紙機,人臉在這兒一刷,廁紙就出這么多,鼓勵大家節(jié)約用紙,不要把廁紙拿走。這個需求是不是真的呢?是真的,因為目的是節(jié)約用紙,但這個需求不剛性,只能作為公益。

大家可以算一算,本身一個塑料殼的廁紙機要多少錢,現(xiàn)在進行改造,裝人臉識別,還要弄一個小屏幕,這個會增加多少錢?例子有點極端,但是我們遇到過很多這樣的問題,做任何商業(yè)一定是雙贏的,雙方一定都有投入,都有回報,這個模式才能持續(xù),才能變大。

當然,對于剛性這個問題有時候很難判斷,因為商業(yè)邏輯往往很復雜。我見過一個跟廁紙機類似的需求,就是超市存包,F(xiàn)在超市存包是按一下出一個小條形碼紙條,條形碼會有一個不便,就是一個小紙條經(jīng)常揉了、丟了會取不出來,確實不是很方便,于是有人提出來,是不是可以把超市存包改成人臉識別的?

這個問題,我首先想到的就是成本問題。因為這個創(chuàng)新能為超市帶來多大便利,超市愿不愿意承擔成本,我沒想通,但后來溝通之后,發(fā)現(xiàn)這個事情背后藏的邏輯很深。

這不光是裝一個攝像頭,為讓刷臉存包更便利,這里一定會放一個屏幕,給顧客操作反饋,不知道大家聽到“屏幕”二字敏不敏感?反正圈里的人聽到屏幕眼睛都是發(fā)亮的,因為有屏幕就可以打廣告,而且廣告可以定向去打。

要知道存包位在商場和超市里,顧客去用一定是要準備發(fā)生消費行為的,這個時機打廣告非常有價值。其次,攝像頭可以分辨出顧客是男是女,大概年齡,所以廣告是定向的。當然,目前不一定打得非常精細,但是隨著商超背后會員體系越來越完整,刷臉的那一刻就會知道你是誰,知道你是超市的一個會員,知道你過去的消費記錄,屆時廣告是不是會更精準?

把需求放到這個邏輯來看,就算幾百塊錢,甚至幾千塊錢成本也是非常低的。所以,我認為這是非常剛性的。

到底什么需求是剛性,什么需求不剛性?需要我們在實際工作生活中跟需求方仔細地去思考,是不是能夠挖掘更大的價值點。

需求的技術(shù)紅線

從2013年到現(xiàn)在,整個人臉識別,在不同場景下,對準確率的要求其實千差萬別。從商湯自身定位來看,每一年我們能把人臉識別誤識率下降一百倍,但在安防領(lǐng)域,還是有很多場景需要我們繼續(xù)提高。

這里有一個很關(guān)鍵的問題,就是當你有這樣一個技術(shù),把它用在不同場景時的技術(shù)需求是不一樣的。這個時候需要一個好的判斷力,在未來半年或者一年剛好能去解決這個場景中的關(guān)鍵問題。如果來的太早,就要花很長時間研發(fā),遲遲拿不到市場回報,企業(yè)就會被耗死;如果來的太晚,就會發(fā)現(xiàn)市場上有很多家都能做這個業(yè)務(wù)的企業(yè),屆時PK的不是技術(shù)而是別的能力,這就不適合技術(shù)企業(yè)切入這個市場。

當決定進入一個市場,第一,要看到這里有剛需性的場景。第二,需要大致判斷這個場景,以我的技術(shù)水平要花多長時間解決掉,現(xiàn)在是不是剛剛好解決?我解決了,同類型市場其他人是不是也能解決?這個是決定下一步是不是要做這個事情的先決點。第三,真正做一個行業(yè)時,以一個技術(shù)點出發(fā),只能解決需求的一小部分,當想讓這個需求進一步發(fā)展完善,它一定有更多技術(shù)點需要去解決。

融合創(chuàng)新能力

這是商湯為直播APP廠商提供的一套AR解決方案,我們的技術(shù)會緊密跟隨用戶需求一起往前走。前一陣我們還發(fā)了一個產(chǎn)品Demo,商湯的“瘦身”技術(shù),可以瘦腰,瘦腿。我當時發(fā)了朋友圈,以前同事給我留言說,互聯(lián)網(wǎng)以前臉不可信,現(xiàn)在連身材都不可信了。沒辦法,順應(yīng)時代的發(fā)展,順應(yīng)用戶的真實需求。

今天,做一個產(chǎn)品,就算其中90%靠人臉識別解決,并不是說把人臉識別做好就夠了,可能剩下70%的工作量是解決剩下的10%,這才決定了產(chǎn)品最終的差異化。

所以,產(chǎn)品能給客戶提供價值,實際上在這個過程中需要重新定義這個問題,除了找到核心技術(shù)競爭力之外,到底離客戶的需求真正被滿足,差距在哪里,以什么樣的方式去解決這樣的差距,這往往是需要投入很大的,進行持續(xù)性投入的一個關(guān)鍵點。

有效的數(shù)據(jù)閉環(huán)

怎么樣保證數(shù)據(jù)的獲取,特別在新的領(lǐng)域,是雞和蛋的問題。

閉環(huán)需要有一個起步可以轉(zhuǎn)起來,只要比別人先轉(zhuǎn)有上三個月時間,很多競爭對手就會被擱在門外了,因為閉環(huán)的加速優(yōu)勢會起到很大作用。任何一點取得突破就可以,比如技術(shù)比別人好,把其他場景的技術(shù)遷移過來,就得到了一個起步技術(shù),就可以開始跑;或者有資源和數(shù)據(jù);或者說與下游行業(yè)用戶形成了很深的合作。

在這個環(huán)節(jié)中怎樣找到合適的切入點切入正反饋,就需要一個案例一個案例去看了,所以存在合適的業(yè)務(wù)模式選擇問題。大家知道,我們現(xiàn)在對數(shù)據(jù)隱私性,數(shù)據(jù)的所有權(quán),有一系列值得我們長期持續(xù)探討的問題。不同行業(yè)、業(yè)務(wù)模式怎么去選,怎么樣對數(shù)據(jù)產(chǎn)權(quán)有有效的界定,成為業(yè)務(wù)發(fā)展的助力,而不是阻礙。

核心價值要素轉(zhuǎn)移

最后一點,我認為這是最關(guān)鍵的。

首先任何一個新技術(shù)解決一個場景一定有時間窗口,技術(shù)一定會擴散,你的技術(shù)會進步,別人也會進步。但是這個行業(yè)的需求,至少這個場景的需求不會隨著時間的流逝而提升。所以技術(shù)壁壘一定是有時間窗口的。

對于一個技術(shù)企業(yè)最重要是在有限的時間窗口到底能夠做什么。一個前提,當你切入一個新市場,有無比強大的技術(shù)能力,保證比別人做出的東西強,這個其實是非常非常難的。如果想認真地在一個行業(yè)進行產(chǎn)品迭代、業(yè)務(wù)提升,很重要的一個問題,就是你的技術(shù)領(lǐng)先對你最重要的是什么?是技術(shù)的打磨,還是收入的回饋和獲?還是說需要去思考行業(yè)要素,到底怎么進行有效的分配轉(zhuǎn)移?

舉個例子,我們曾跟一個大型連鎖超市合作一個項目,用人工智能技術(shù)去解決超市防損的問題。超市有一個掌握了偷東西黑名單的庫,我們就基于這個庫做了一個人臉布控系統(tǒng),在超市入口處安裝上攝像頭,顧客都會被識別一下,如果是黑名單就會報警通知保安人員。

我們當時覺得這個合作特別好,人臉識別,還能做小算力,一整套方案很成熟。我們整個方案不停打磨,把算法也搞得很好,場景也做得很好,產(chǎn)品也不貴,一整套方案拿出去,大概推了幾十家店。后來另一家廠商入場,它就一件事,超市以前都有攝像頭,它用純視頻的NVR(Network Video Recorder),如果這個超市沒裝,今天就賣你這個設(shè)備,而且這個設(shè)備附帶一個人臉識別。

這件事情最關(guān)鍵的一點是什么?它也要做技術(shù)研發(fā),它也會有成本投入,我也有成本投入。按說我們的技術(shù)水平比這家廠商好,但這場仗輸了,兩個核心原因:第一,對手具備強大的供應(yīng)鏈,它從上游供應(yīng)鏈拿到的報價比你低30%甚至40%。第二,它有全國服務(wù)支撐體系,有大量的合作伙伴,所有店都可以去人安裝部署。而我們找一個全國代理商做這樣的服務(wù)和售后,磕磕碰碰非常難。

反過頭來看,這個行業(yè)的核心要素是什么?對于商湯,對于零售,核心要素是一整套解決方案的硬件成本,在這種場景下,在能力基本達標的情況下客戶對硬件成本是極度敏感的。因此,我們更關(guān)注的是細分場景,在那些場景可以形成差異化優(yōu)勢。

今天舉了幾個簡單的例子,從有一個好的技術(shù)到真正完成有效的商業(yè)落地,這里有幾個值得大家注意的關(guān)鍵點,在每個環(huán)節(jié)可能都要想一想。做一個產(chǎn)品,做一個行業(yè),在這幾點上是不是所有道理都想得通,但想通這些事情往后就會好做很多。

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    安防 獵頭職位 更多
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號