一文讀懂什么是AIGC、ChatGPT、大模型
昨天有讀者私信我,能否解釋一下AIGC和ChatGPT是什么樣的關(guān)系?
確實(shí),在短短的6個(gè)月時(shí)間里,AIGC、ChatGPT、大模型等新詞匯一下成為媒體熱詞,加上所謂“人工智能將取代你的工作”之類(lèi)的焦慮,張棟偉覺(jué)得有必要寫(xiě)這樣一篇科普。
本文將力求簡(jiǎn)單化的說(shuō)明這次人工智能浪潮帶來(lái)的新詞匯和它的意義,帶你一文讀懂什么是AIGC、ChatGPT、大模型。
1、什么是AI
AI,人工智能(Artificial Intelligence)的英文縮寫(xiě)。
AI是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。
人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類(lèi)智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專(zhuān)家系統(tǒng)等。
工廠里的自動(dòng)生產(chǎn)線,小米公司的“鐵蛋”機(jī)器狗,火車(chē)站的人臉識(shí)別通道,科大訊飛的語(yǔ)音輸入法,都是屬于AI系統(tǒng)的應(yīng)用。
2、什么是AIGC
AIGC,全名“AI Generated Content”,中文直譯就是“人工智能生成內(nèi)容”,也可以稱(chēng)為“生成式AI” (Generative AI)。例如AI文本續(xù)寫(xiě),文字轉(zhuǎn)圖像的AI圖、AI數(shù)字化主持人等,都屬于AIGC的范疇。
3、什么是大模型
首先解釋?zhuān)裁词荊PT。
GPT的全稱(chēng),是Generative Pre-Trained Transformer(生成式預(yù)訓(xùn)練轉(zhuǎn)換器)是一種基于互聯(lián)網(wǎng)的、可用數(shù)據(jù)來(lái)訓(xùn)練的、文本生成的深度學(xué)習(xí)模型。
GPT是AIGC的一個(gè)種類(lèi)。
在ChatGPT之前,被公眾關(guān)注的AI模型是用于單一任務(wù)的,比如全球所知的“阿爾法狗”(AlphaGo)可以基于全球圍棋棋譜的計(jì)算,打贏所有的人類(lèi)圍棋大師。谷歌進(jìn)一步開(kāi)發(fā)的“AlphaZero”在圍棋、國(guó)際象棋和日本象棋等項(xiàng)目上,都是所向無(wú)敵。
這種專(zhuān)注于某個(gè)具體任務(wù)建立的AI數(shù)據(jù)模型,叫“小模型”。
ChatGPT與這種“小模型”不同,GPT大模型更像人類(lèi)的大腦。它兼具“大規(guī)模”和“預(yù)訓(xùn)練”兩種屬性,可以在海量通用數(shù)據(jù)上進(jìn)行預(yù)先訓(xùn)練,能大幅提升AI的泛化性、通用性、實(shí)用性。
基于GPT機(jī)制建立的AI數(shù)據(jù)模型,就叫“大模型”。
4、什么是ChatGPT
ChatGPT是由美國(guó)OpenAI公司發(fā)布的大模型。
由于ChatGPT 3.5展現(xiàn)了超出現(xiàn)實(shí)預(yù)期的智能數(shù)據(jù)能力,引發(fā)了一場(chǎng)新的全球人工智能競(jìng)賽。2023年3月,ChatGPT -4進(jìn)一步提高了AI的能力。
5、中國(guó)有ChatGPT嗎?
首先再次強(qiáng)調(diào),ChatGPT是特指美國(guó)OpenAI公司的大模型。這是一個(gè)產(chǎn)品名稱(chēng)。
但是,領(lǐng)先的產(chǎn)品,往往會(huì)成為行業(yè)代名詞,比如我們說(shuō)搜索的時(shí)候,會(huì)簡(jiǎn)單的說(shuō)“百度一下”。但實(shí)際上,搜索引擎還有360、Bing、谷歌等其他方式。
目前,我們把與ChatGPT類(lèi)似的產(chǎn)品,暫時(shí)叫“類(lèi)ChatGPT”產(chǎn)品或者直接叫“大模型”產(chǎn)品。
在ChatGPT火爆以后,中國(guó)的科技企業(yè)紛紛“趕上潮流”,推出了自己的大模型產(chǎn)品。以下是《中國(guó)企業(yè)家》雜志統(tǒng)計(jì)出的一些知名公司的產(chǎn)品列表。
但是,這種復(fù)雜的技術(shù)模型,顯然不是一朝一夕就能實(shí)現(xiàn)。多個(gè)國(guó)內(nèi)的大模型被國(guó)外技術(shù)人員質(zhì)疑,是用ChatGPT進(jìn)行“套殼”,用以提升品牌形象和股價(jià)。
中國(guó)的GPT大模型要成熟,還需要比較多的時(shí)間和機(jī)會(huì),本文后面部分會(huì)繼續(xù)說(shuō)明。
6、ChatGPT有什么用途
ChatGPT是一種能生成文本、圖像等內(nèi)容的復(fù)雜系統(tǒng)。
OpenAI的戰(zhàn)略伙伴微軟(Microsoft)已將該技術(shù)添加到其Office MS 365辦公套件及搜索引擎必應(yīng)(Bing)等產(chǎn)品中。
微軟的競(jìng)爭(zhēng)對(duì)手谷歌(Google)也推出了類(lèi)似的搜索工具Bard。
ChatGPT可以進(jìn)行從歷史到哲學(xué)等話(huà)題的對(duì)話(huà),生成不同風(fēng)格的文案、文章、歌詞、詩(shī)歌,甚至直接生成計(jì)算機(jī)代碼,或者對(duì)已有的計(jì)算機(jī)程序代碼提供修改建議。ChatGPT也能處理視覺(jué)信息,諸如回答關(guān)于照片內(nèi)容的問(wèn)題。
ChatGPT是基于從互聯(lián)網(wǎng)上搜羅的大量文章、圖像、網(wǎng)站和社交媒體內(nèi)容,以及與OpenAI人類(lèi)雇工的實(shí)時(shí)對(duì)話(huà)(主要是英語(yǔ))進(jìn)行訓(xùn)練的。實(shí)際上,早在2014年微軟公司面向中國(guó)推出了AI聊天機(jī)器人小冰,目前不知道小冰的對(duì)話(huà)內(nèi)容是否也是ChatGPT學(xué)習(xí)的數(shù)據(jù)來(lái)源之一。
ChatGPT學(xué)著模仿寫(xiě)作的語(yǔ)法和結(jié)構(gòu),輸出常用表達(dá)。它還學(xué)習(xí)識(shí)別圖像中的形狀和圖案,如一只貓、一個(gè)孩子或一件襯衫的輪廓。它還可以將單詞和短語(yǔ)與這些形狀和圖案相匹配,允許用戶(hù)詢(xún)問(wèn)圖像的內(nèi)容,如貓?jiān)谧鍪裁椿蛞r衫的顏色是什么。
因?yàn)镃hatGPT的原始數(shù)據(jù)來(lái)自于公開(kāi)的互聯(lián)網(wǎng),而互聯(lián)網(wǎng)上的信息并不總是準(zhǔn)確的。因此,ChatGPT給出的答案結(jié)果,并沒(méi)有經(jīng)過(guò)事實(shí)核查,不能100%保證準(zhǔn)確,甚至有些完全是“一本正經(jīng)的胡說(shuō)八道”。
ChatGPT需要依靠人類(lèi)員工的反饋來(lái)提高準(zhǔn)確性。
其他類(lèi)似的大模型,同樣如此,都需要非常海量的人工能力,來(lái)幫助大模型提升準(zhǔn)確性。這就是類(lèi)似于在中國(guó),雖然大家覺(jué)得高德地圖、百度地圖、騰訊地圖很智能,但是實(shí)際上,它們不僅僅是在調(diào)用衛(wèi)星數(shù)據(jù)、交通部門(mén)數(shù)據(jù),還有數(shù)以萬(wàn)計(jì)的人工“標(biāo)記員”在幫助和輔助數(shù)據(jù)修正工作。
7、ChatGPT之類(lèi)的大模型是如何工作的?
前面已經(jīng)說(shuō)過(guò),GPT的意思是“生成式預(yù)訓(xùn)練轉(zhuǎn)換器(Generative Pre-trained Transformer),這是大模型的核心技術(shù)。
轉(zhuǎn)換器是在數(shù)據(jù)序列中尋找長(zhǎng)程模式的專(zhuān)門(mén)算法。轉(zhuǎn)換器不僅能學(xué)會(huì)預(yù)測(cè)一個(gè)句子中的下一個(gè)詞,還能學(xué)會(huì)預(yù)測(cè)一個(gè)段落中的下一個(gè)句子以及一篇文章中的下一個(gè)段落。這就是為什么它能夠在長(zhǎng)文本中緊扣主題。
由于轉(zhuǎn)換器需要大量的數(shù)據(jù),它的訓(xùn)練分為兩個(gè)階段:首先,它用通用數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,這種數(shù)據(jù)更容易大量收集;然后,根據(jù)它要執(zhí)行的具體任務(wù),再利用定制的數(shù)據(jù)進(jìn)行微調(diào)。
張棟偉在最近的兩篇文章中多次強(qiáng)調(diào),大模型的核心取決于三個(gè)因素:數(shù)據(jù)、算力和場(chǎng)景。
所有的大模型都要受制于該公司所能合法獲得的數(shù)據(jù)量,還要具備能支撐這些數(shù)據(jù)的算力。最后,還需要有可以商業(yè)化的場(chǎng)景,形成投資-產(chǎn)出的正循環(huán)。
8、ChatGPT這樣的大模型收費(fèi)嗎?
目前,包括美國(guó)的ChatGPT,以及國(guó)內(nèi)的各種大模型,都是免費(fèi)的。需要個(gè)人去官網(wǎng)注冊(cè)申請(qǐng)。
大模型產(chǎn)品都會(huì)提供一個(gè)API(應(yīng)用程序編程接口),允許各公司將該技術(shù)整合到自家產(chǎn)品或后端解決方案中。這種企業(yè)定制版本,以及面向個(gè)人的高級(jí)版本,會(huì)收費(fèi)。
需要再次提示的是,上文已經(jīng)說(shuō)過(guò),目前大模型都還需要人工進(jìn)行優(yōu)化,因此你在大模型輸入的內(nèi)容,以及大模型給你輸出的答案結(jié)果,這些信息都會(huì)被開(kāi)發(fā)者公司閱讀到。
所以,請(qǐng)不要輸入隱私數(shù)據(jù)或敏感的公司信息。
9、政府對(duì)AIGC的態(tài)度
世界各國(guó)政府正在探索規(guī)范生成式AI工具的方式,擔(dān)心它們可能被濫用于犯罪、傳播虛假信息或威脅國(guó)家安全等情況。
4月11日,國(guó)家互聯(lián)網(wǎng)信息辦公室(簡(jiǎn)稱(chēng)“網(wǎng)信辦”)發(fā)布通知,就《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》向社會(huì)公開(kāi)征求意見(jiàn),意見(jiàn)反饋截止時(shí)間為5月10日。
網(wǎng)信辦表示, “國(guó)家支持人工智能算法、框架等基礎(chǔ)技術(shù)的自主創(chuàng)新、推廣應(yīng)用、國(guó)際合作,鼓勵(lì)優(yōu)先采用安全可信的軟件、工具、計(jì)算和數(shù)據(jù)資源”。
網(wǎng)信辦定義,所謂“生成式人工智能”,是指基于算法、模型、規(guī)則生成文本、圖片、聲音、視頻、代碼等內(nèi)容的技術(shù)。網(wǎng)信辦明確研發(fā)、利用生成式人工智能產(chǎn)品,面向中華人民共和國(guó)境內(nèi)公眾提供服務(wù)的,適用本辦法。
在服務(wù)提供者的準(zhǔn)入資格方面,《意見(jiàn)征求稿》要求利用生成式人工智能產(chǎn)品向公眾提供服務(wù)前,應(yīng)當(dāng)按照《具有輿論屬性或社會(huì)動(dòng)員能力的互聯(lián)網(wǎng)信息服務(wù)安全評(píng)估規(guī)定》(2018年11月發(fā)布)向國(guó)家網(wǎng)信部門(mén)申報(bào)安全評(píng)估,并按照《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》(2021年12月發(fā)布)履行算法備案和變更、注銷(xiāo)備案手續(xù)。
《意見(jiàn)征求稿》詳細(xì)地分別對(duì)提供生成式人工智能產(chǎn)品或服務(wù),對(duì)用于生成式人工智能產(chǎn)品的預(yù)訓(xùn)練、優(yōu)化訓(xùn)練數(shù)據(jù)提出明確要求。
10、AI會(huì)搶人類(lèi)飯碗嗎?
任何最新發(fā)明的技術(shù),都會(huì)對(duì)當(dāng)下的崗位和未來(lái)的工作產(chǎn)生重大影響。
在此前的計(jì)算機(jī)、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的技術(shù)浪潮中,都會(huì)藍(lán)領(lǐng)階層產(chǎn)生了重大影響。
當(dāng)前業(yè)內(nèi)普遍認(rèn)為,AIGC將對(duì)白領(lǐng)職業(yè)產(chǎn)生較大影響。
但是,回首往事,會(huì)發(fā)現(xiàn)計(jì)算機(jī)、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)三大革命性的新技術(shù),使得社會(huì)經(jīng)濟(jì)變得更加生機(jī)勃勃。
這是因?yàn),?jīng)濟(jì)學(xué)家已經(jīng)發(fā)現(xiàn),新技術(shù)的相關(guān)影響往往包含三個(gè)方面:
(1)一些勞動(dòng)者提高了生產(chǎn)力;
(2)部分崗位實(shí)現(xiàn)自動(dòng)化或被合并;
(3)產(chǎn)生出以前不存在的新崗位。
由于新崗位的生產(chǎn)效率,要優(yōu)于被取代崗位的生產(chǎn)效率,所以實(shí)際上整個(gè)社會(huì)的生產(chǎn)效率是提升的。
但是具體到個(gè)人,只能說(shuō)是:
“最先掌握AI的人,將會(huì)比較晚掌握AI的人有競(jìng)爭(zhēng)優(yōu)勢(shì)”。
這句話(huà),放在計(jì)算機(jī)、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的開(kāi)局時(shí)期,都是一樣的道理。
如果你也想盡早掌握AI技術(shù),請(qǐng)關(guān)注我。
作者:張棟偉 (資深互聯(lián)網(wǎng)人士、市場(chǎng)營(yíng)銷(xiāo)專(zhuān)家、大學(xué)生就業(yè)創(chuàng)業(yè)導(dǎo)師)
原文標(biāo)題 : 張棟偉:一文讀懂什么是AIGC、ChatGPT、大模型
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-12.26立即報(bào)名>>> 【在線會(huì)議】村田用于AR/VR設(shè)計(jì)開(kāi)發(fā)解決方案
-
1月8日火熱報(bào)名中>> Allegro助力汽車(chē)電氣化和底盤(pán)解決方案優(yōu)化在線研討會(huì)
-
即日-1.14火熱報(bào)名中>> OFweek2025中國(guó)智造CIO在線峰會(huì)
-
即日-1.24立即參與>>> 【限時(shí)免費(fèi)】安森美:Treo 平臺(tái)帶來(lái)出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專(zhuān)題
- 1 人形機(jī)器人核心零部件,誰(shuí)是盈利最強(qiáng)企業(yè)?
- 2 AI Agent現(xiàn)狀如何?聊聊近期國(guó)內(nèi)的智能體市場(chǎng)動(dòng)向
- 3 5nm重大突破,研祥智能助力半導(dǎo)體企業(yè)高效發(fā)展!
- 4 人形機(jī)器人引爆“PEEK材料”!概念股梳理(名單)
- 5 馬云沒(méi)回牌桌,但重注全壓在了
- 6 蘋(píng)果或?qū)渴肿止?jié)騰訊大模型,我國(guó)大模型產(chǎn)業(yè)發(fā)展駛?cè)肟燔?chē)道
- 7 豆包AI登頂國(guó)內(nèi)第一!概念股梳理(名單)
- 8 押注AI王者歸來(lái),歌爾股份“智能體”在下一盤(pán)“大棋”
- 9 AI超級(jí)應(yīng)用什么時(shí)候才能出現(xiàn)?
- 10 英偉達(dá)迎來(lái)當(dāng)頭一棒
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市