ChatGPT之戰(zhàn),科技“托拉斯”之戰(zhàn)
2022年11月30日,微軟旗下的OpenAI發(fā)布ChatGPT,5天內(nèi)涌入100W用戶。
他擁有持續(xù)的上下文對(duì)話能力,同時(shí)支持文章寫(xiě)作、詩(shī)詞生成、代碼生成等能力。
這個(gè)與Siri、小愛(ài)、小度、小冰等完全不在一個(gè)level的聊天機(jī)器人,被認(rèn)為是“通用型人工智能”的開(kāi)端。
面對(duì)它的誕生,有人歡喜有人愁。微軟和谷歌短兵相接,國(guó)內(nèi)的百度、阿里等AI大廠們也在緊繃著弦加速攻堅(jiān)。
為什么ChatGPT會(huì)引發(fā)如此大的轟動(dòng)?它的背后有著怎樣的技術(shù)鋪墊?被甩在后面的中國(guó)科技產(chǎn)業(yè),又該怎樣奮起直追?
本文將分為以下兩部分闡述:
1. ChatGPT是怎樣煉成的?
2.中國(guó)版ChatGPT還有多遠(yuǎn)?
ChatGPT是怎樣煉成的?
最先看到ChatGPT,不是在科技新聞,也不是媒體官宣,而是在朋友圈刷屏的對(duì)話截圖中。面對(duì)稀奇古怪的問(wèn)題,對(duì)面總能給出簡(jiǎn)潔嚴(yán)謹(jǐn)又不失情感的回答,有如訓(xùn)練有素的萬(wàn)能客服。
前微軟亞洲互聯(lián)網(wǎng)工程院副院長(zhǎng)、現(xiàn)小冰公司CEO李笛說(shuō),ChatGPT之所以出圈,是源于它被普通用戶觀察到,并超過(guò)了人們對(duì)人工智能的預(yù)期。
上一次現(xiàn)象級(jí)的AI浪潮還是2016年,AlphGo擊敗李世石。六年過(guò)去,故事的主角從谷歌換成了微軟的OpenAI。
ChatGPT全名為Chat Generative Pre-Trained Transformer,使用基于GPT-3.5架構(gòu)的大型語(yǔ)言模型(LLM),既能夠?qū)懺?shī)歌、編代碼,還能創(chuàng)造劇本、幫你面試出題、發(fā)表論文,以及實(shí)現(xiàn)更廣泛的搜索服務(wù)等。
ChatGPT的誕生,開(kāi)啟了“AIGC元年”。所謂AIGC,即AI Generative Content,是繼UGC、PUGC之后,由AI直接生產(chǎn)內(nèi)容的技術(shù)形式。ChatGPT使AIGC在各行各業(yè)的商業(yè)化落地有了具象的出路,人類(lèi)的生產(chǎn)力迎來(lái)解放革命仿佛就在不遠(yuǎn)的未來(lái)。
目前,如Siri等著名AI實(shí)際上都大同小異,是基于若干個(gè)專(zhuān)業(yè)Agent復(fù)合而成的,也就是說(shuō)單個(gè)Agent只會(huì)做份內(nèi)的活,在AI判斷了用戶的意圖是生成代碼、文學(xué)創(chuàng)作、圖片繪制、視頻制作等等后,就將命令發(fā)給對(duì)應(yīng)的Agent去解決。
而ChatGPT是一個(gè)另類(lèi),它的背后是一個(gè)全能機(jī)器人(大語(yǔ)言模型),用戶借助文字下達(dá)命令(Prompting,提示/指示),ChatGPT將自主適應(yīng)不同領(lǐng)域的任務(wù)。
盡管目前還存在不夠智能的時(shí)刻,但ChatGPT已經(jīng)具備了“通用型人工智能”的雛形。
十足的科幻感背后,也離不開(kāi)實(shí)打?qū)嵉母咄度。ChatGPT最突出的“通用性”,依賴(lài)于背后的通用大模型。
模型的本質(zhì)是一套計(jì)算公式和數(shù)學(xué)模型,參數(shù)可以視為模型中的公式。參數(shù)量越大,模型越復(fù)雜,預(yù)測(cè)也越精準(zhǔn)。大模型就是參數(shù)量極大的模型,目前業(yè)內(nèi)主流的AIGC模型動(dòng)輒有著千億、萬(wàn)億級(jí)的參數(shù)量。
ChatGPT是基于GPT-3模型進(jìn)行優(yōu)化所產(chǎn)生的。OpenAI在訓(xùn)練GPT-3時(shí),用了45TB的數(shù)據(jù)量、近 1 萬(wàn)億個(gè)單詞,約合到1351萬(wàn)本牛津詞典。
這就使得大模型的訓(xùn)練和推理高度依賴(lài)芯片。缺少芯片會(huì)造成算力不足,進(jìn)而無(wú)法處理龐大的數(shù)據(jù)量和模型,最終導(dǎo)致人工智能變成“人工智障”。
高算力是ChatGPT的地基,其中最重要的搭建者是微軟和英偉達(dá)。
2019年,微軟為OpenAI打造了Azure AI超算平臺(tái),該平臺(tái)性能位居全球前五,擁有超過(guò)28.5萬(wàn)個(gè)CPU核心、1萬(wàn)個(gè)GPU、每GPU擁有400Gbps網(wǎng)絡(luò)帶寬的超級(jí)計(jì)算器,成本高達(dá)數(shù)億美元。
此外,2019年微軟向OpenAI投資10億美元。2021年微軟再進(jìn)行了一輪未透露金額的投資。今年1月,微軟宣布將在未來(lái)數(shù)年陸續(xù)向OpenAI投資100億美元。
芯片方面,英偉達(dá)的A100/H100是目前性能最強(qiáng)的數(shù)據(jù)中心專(zhuān)用GPU,市面上幾乎沒(méi)有可規(guī)模替代的方案。據(jù)瑞銀分析師蒂莫西·阿庫(kù)里分析,ChatGPT已導(dǎo)入至少1萬(wàn)顆英偉達(dá)高端GPU來(lái)訓(xùn)練模型。
微軟提供資金與算力支持,英偉達(dá)供應(yīng)高性能芯片,Buff疊滿的OpenAI沉淀了數(shù)年,才一舉驚艷了世界。這其中展現(xiàn)出的,一是OpenAI敢于在無(wú)人區(qū)死磕的工匠精神,二是美國(guó)強(qiáng)大的科技托拉斯力量。
托拉斯(trust),是由生產(chǎn)同類(lèi)商品或在生產(chǎn)上有聯(lián)系的大企業(yè),為壟斷某些產(chǎn)品的產(chǎn)銷(xiāo)以獲取高額利潤(rùn)而聯(lián)合成的一種壟斷組織形式。
OpenAI的成功,根本上是美國(guó)科技托拉斯的成功。下游的終端應(yīng)用、上游的芯片和中間的技術(shù)研發(fā)三大托拉斯,共同催生了ChatGPT:
微軟作為下游應(yīng)用巨頭,其不僅在硬件和AI上投入大量研發(fā)資金,還頻頻收購(gòu)游戲等行業(yè)的多家科創(chuàng)企業(yè),整合前沿科技的技術(shù)與生態(tài),鍛造自己在算力時(shí)代的綜合競(jìng)爭(zhēng)力。
英偉達(dá)在數(shù)據(jù)中心GPU市場(chǎng)占據(jù)超過(guò)90%以上的份額,其供應(yīng)的底層芯片是AIGC賽道不可或缺的稀缺資源。包括特斯拉、Facebook在內(nèi)的企業(yè),都采用英偉達(dá)的A100芯片組建AI計(jì)算集群,采購(gòu)規(guī)模均超過(guò)7000枚。
而研發(fā)的主體OpenAI,由埃隆馬斯克牽頭出資創(chuàng)立,山姆?阿爾特曼、彼得?蒂爾、雷德?霍夫曼等一眾硅谷大佬加盟,最開(kāi)始即定位為非營(yíng)利性組織,劍指AGI(通用人工智能)。
中國(guó)能否在新一輪AI浪潮中追上美國(guó),根本上取決于科技托拉斯的力量。
中國(guó)版ChatGPT還有多遠(yuǎn)?
ChatGPT在線上客服、搜索引擎、內(nèi)容生產(chǎn)等方面展現(xiàn)出的巨大潛力,讓國(guó)內(nèi)外科技公司紛紛加碼布局訓(xùn)練大模型,一場(chǎng)AIGC軍備競(jìng)賽打響了。
2月2日,微軟宣布旗下產(chǎn)品將全線整合ChatGPT,同日ChatGPT宣布推出付費(fèi)訂閱服務(wù)。
2月3日,谷歌向AI初創(chuàng)企業(yè)Anthropic投資約3億美元,并宣布將推出類(lèi)似于ChatGPT的大型語(yǔ)言模型。
2月7日,微軟發(fā)布新品,推出新版搜索引擎必應(yīng)和Edge瀏覽器,新增了和ChatGPT一樣的AI語(yǔ)言模型GPT3.5。
大洋彼岸,北京西二旗的科技園里,百度的算法工程師們也在徹夜備戰(zhàn),所有的核心人才和高端算力資源全部調(diào)用給了大模型“文心一言”。
作為最大的中文搜索引擎,百度在人工智能的四層技術(shù)架構(gòu)上實(shí)現(xiàn)了全棧布局:
模型層,百度在2019年推出了知識(shí)增強(qiáng)的語(yǔ)義理解框架ERNIE(文心大模型),并廣泛應(yīng)用于閱讀理解、情感分析、智能搜索問(wèn)答、視頻推薦、CTR預(yù)測(cè)等領(lǐng)域。目前,ERNIE系列模型經(jīng)過(guò)了多次的迭代,具備了較強(qiáng)泛化能力和性能。
框架層,百度的深度學(xué)習(xí)飛槳平臺(tái)在2022年底已凝聚535萬(wàn)開(kāi)發(fā)者,基于飛槳?jiǎng)?chuàng)建了67萬(wàn)個(gè)模型,服務(wù)20萬(wàn)家企事業(yè)單位,構(gòu)建起了繁榮的AI技術(shù)生態(tài)。
芯片層,百度自研AI芯片“昆侖芯”已在多場(chǎng)景實(shí)際部署幾萬(wàn)片,讓文心一言底層算力有所保證。
應(yīng)用層,百度的搜索服務(wù)每天響應(yīng)幾十億次真實(shí)的用戶使用需求,每天進(jìn)行1萬(wàn)億次深度語(yǔ)義推理與匹配,能夠?yàn)榇竽P吞峁┳钫鎸?shí)、最及時(shí)的反饋。此外智能云、Apollo自動(dòng)駕駛、小度智能設(shè)備等應(yīng)用也將與文心一言整合。
3月16日,百度版ChatGPT“文心一言”如期發(fā)布,CEO李彥宏演示了文心一言的五個(gè)集中場(chǎng)景:文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成。
文心一言大模型的訓(xùn)練數(shù)據(jù)包括萬(wàn)億級(jí)網(wǎng)頁(yè)數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級(jí)的語(yǔ)音日均調(diào)用數(shù)據(jù),以及5500億事實(shí)的知識(shí)圖譜等,這讓百度在中文語(yǔ)言的處理上,能夠處于獨(dú)一無(wú)二的位置。
扎根中文土壤,文心一言在中文語(yǔ)言和中國(guó)文化上有相對(duì)更好的表現(xiàn)。在發(fā)布會(huì)展示中,文心一言正確解釋了成語(yǔ)“洛陽(yáng)紙貴”的含義、“洛陽(yáng)紙貴”對(duì)應(yīng)的經(jīng)濟(jì)學(xué)理論,還用“洛陽(yáng)紙貴”四個(gè)字創(chuàng)作了一首藏頭詩(shī)。
爭(zhēng)奪這波AI潮入場(chǎng)券的當(dāng)然不止百度。
騰訊稱(chēng),在ChatGPT和AIGC相關(guān)方向已有布局,阿里達(dá)摩院正在研發(fā)的類(lèi)ChatGPT的對(duì)話機(jī)器人,目前已開(kāi)放給公司內(nèi)員工測(cè)試。快手、京東、360等多家互聯(lián)網(wǎng)企業(yè)也都表示在相關(guān)領(lǐng)域研發(fā)和布局。
美團(tuán)聯(lián)合創(chuàng)始人王慧文在今年2月發(fā)布了一條“AI英雄榜”,高調(diào)地招兵買(mǎi)馬。他設(shè)立了光年之外科技有限公司,自己出資5千萬(wàn)美元,估值2億美元,并表示:“我當(dāng)前不懂AI技術(shù),正努力學(xué)習(xí),所以個(gè)人肉身不占股份,資金占股25%。”
同時(shí),王慧文與語(yǔ)音搜索應(yīng)用“出門(mén)問(wèn)問(wèn)”創(chuàng)始人李志飛、真格基金兩位合伙人戴雨森和劉元吃飯的照片流出。李志飛也曾公開(kāi)表示決心要“做一個(gè)中國(guó)的語(yǔ)言大模型”。
大廠們瘋狂卷進(jìn)度的比拼,王慧文求賢若渴的姿態(tài),體現(xiàn)出這波AIGC熱潮的窗口期之短——一旦沒(méi)有及時(shí)聚集足夠的資金和人才,拿出像樣的模型或產(chǎn)品,就會(huì)被趕下牌桌。
但在催命般的產(chǎn)業(yè)倒計(jì)時(shí)中,有些事卻急不來(lái)。
ChatGPT的出現(xiàn),數(shù)據(jù)、算力和算法是關(guān)鍵的三個(gè)要素,需要不斷的量的積累,才有望一朝獲得質(zhì)變。而我國(guó)目前在這三方面仍有較大差距。
數(shù)據(jù)方面,中文互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)大量?jī)?chǔ)存在移動(dòng)端APP中,由于互聯(lián)網(wǎng)巨頭之間數(shù)據(jù)相互封閉,數(shù)據(jù)抓取難度高,數(shù)據(jù)孤島化情況嚴(yán)重。數(shù)據(jù)的質(zhì)量和數(shù)量不足,就無(wú)法提供大量模型訓(xùn)練所需的信息。
算力方面,由于英偉達(dá)A100芯片被美國(guó)列入限制出售范圍,中國(guó)企業(yè)只能使用為數(shù)不多的A100存貨和閹割版的A800,高性能芯片嚴(yán)重缺乏。
算法方面,好的算法能夠使AI具有更強(qiáng)的通用性,并優(yōu)化計(jì)算過(guò)程,減少算力負(fù)擔(dān)。我國(guó)在AI算法研究、高端算法人才以及具備自研算法實(shí)力的科技公司數(shù)量等方面仍落后于美國(guó)。
時(shí)間壁壘已經(jīng)產(chǎn)生,在實(shí)力鴻溝面前,要做出對(duì)標(biāo)ChatGPT的模型和產(chǎn)品,只有勇氣和資金是遠(yuǎn)遠(yuǎn)不夠的,中國(guó)的參賽者們必須拿出更強(qiáng)的創(chuàng)新意識(shí)和更深的產(chǎn)業(yè)遠(yuǎn)見(jiàn)。
一味跟著OpenAI的步伐只會(huì)掉入陷阱,更為中國(guó)式的打法,應(yīng)該考慮產(chǎn)業(yè)巨頭的合縱連橫、另辟蹊徑的技術(shù)路線以及潛在的商業(yè)模式,走不同的路才有希望正面應(yīng)戰(zhàn)。
新一輪的科技革命已經(jīng)開(kāi)啟,AIGC時(shí)代將深刻改變每一個(gè)行業(yè)的發(fā)展模式,而中國(guó)AI大廠們?cè)谶@場(chǎng)技術(shù)巔峰賽中也將迎來(lái)終局之戰(zhàn)。孰勝孰敗,我們拭目以待。
原文標(biāo)題 : ChatGPT之戰(zhàn),科技“托拉斯”之戰(zhàn)
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-12.26立即報(bào)名>>> 【在線會(huì)議】村田用于AR/VR設(shè)計(jì)開(kāi)發(fā)解決方案
-
1月8日火熱報(bào)名中>> Allegro助力汽車(chē)電氣化和底盤(pán)解決方案優(yōu)化在線研討會(huì)
-
即日-1.14火熱報(bào)名中>> OFweek2025中國(guó)智造CIO在線峰會(huì)
-
即日-1.24立即參與>>> 【限時(shí)免費(fèi)】安森美:Treo 平臺(tái)帶來(lái)出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專(zhuān)題
- 1 人形機(jī)器人核心零部件,誰(shuí)是盈利最強(qiáng)企業(yè)?
- 2 AI Agent現(xiàn)狀如何?聊聊近期國(guó)內(nèi)的智能體市場(chǎng)動(dòng)向
- 3 5nm重大突破,研祥智能助力半導(dǎo)體企業(yè)高效發(fā)展!
- 4 人形機(jī)器人引爆“PEEK材料”!概念股梳理(名單)
- 5 馬云沒(méi)回牌桌,但重注全壓在了
- 6 蘋(píng)果或?qū)渴肿止?jié)騰訊大模型,我國(guó)大模型產(chǎn)業(yè)發(fā)展駛?cè)肟燔?chē)道
- 7 豆包AI登頂國(guó)內(nèi)第一!概念股梳理(名單)
- 8 押注AI王者歸來(lái),歌爾股份“智能體”在下一盤(pán)“大棋”
- 9 AI超級(jí)應(yīng)用什么時(shí)候才能出現(xiàn)?
- 10 英偉達(dá)迎來(lái)當(dāng)頭一棒
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市