訂閱
糾錯(cuò)
加入自媒體

一文讀懂什么是AIGC、ChatGPT、大模型

2023-05-15 14:02
張棟偉
關(guān)注

昨天有讀者私信我,能否解釋一下AIGC和ChatGPT是什么樣的關(guān)系?

確實(shí),在短短的6個(gè)月時(shí)間里,AIGC、ChatGPT、大模型等新詞匯一下成為媒體熱詞,加上所謂“人工智能將取代你的工作”之類(lèi)的焦慮,張棟偉覺(jué)得有必要寫(xiě)這樣一篇科普。

本文將力求簡(jiǎn)單化的說(shuō)明這次人工智能浪潮帶來(lái)的新詞匯和它的意義,帶你一文讀懂什么是AIGC、ChatGPT、大模型。

1、什么是AI

AI,人工智能(Artificial Intelligence)的英文縮寫(xiě)。

AI是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。

人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類(lèi)智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專(zhuān)家系統(tǒng)等。

工廠里的自動(dòng)生產(chǎn)線,小米公司的“鐵蛋”機(jī)器狗,火車(chē)站的人臉識(shí)別通道,科大訊飛的語(yǔ)音輸入法,都是屬于AI系統(tǒng)的應(yīng)用。

2、什么是AIGC

AIGC,全名“AI Generated Content”,中文直譯就是“人工智能生成內(nèi)容”,也可以稱(chēng)為“生成式AI” (Generative AI)。例如AI文本續(xù)寫(xiě),文字轉(zhuǎn)圖像的AI圖、AI數(shù)字化主持人等,都屬于AIGC的范疇。

3、什么是大模型

首先解釋?zhuān)裁词荊PT。

GPT的全稱(chēng),是Generative Pre-Trained Transformer(生成式預(yù)訓(xùn)練轉(zhuǎn)換器)是一種基于互聯(lián)網(wǎng)的、可用數(shù)據(jù)來(lái)訓(xùn)練的、文本生成的深度學(xué)習(xí)模型。

GPT是AIGC的一個(gè)種類(lèi)。

在ChatGPT之前,被公眾關(guān)注的AI模型是用于單一任務(wù)的,比如全球所知的“阿爾法狗”(AlphaGo)可以基于全球圍棋棋譜的計(jì)算,打贏所有的人類(lèi)圍棋大師。谷歌進(jìn)一步開(kāi)發(fā)的“AlphaZero”在圍棋、國(guó)際象棋和日本象棋等項(xiàng)目上,都是所向無(wú)敵。

這種專(zhuān)注于某個(gè)具體任務(wù)建立的AI數(shù)據(jù)模型,叫“小模型”。

ChatGPT與這種“小模型”不同,GPT大模型更像人類(lèi)的大腦。它兼具“大規(guī)模”和“預(yù)訓(xùn)練”兩種屬性,可以在海量通用數(shù)據(jù)上進(jìn)行預(yù)先訓(xùn)練,能大幅提升AI的泛化性、通用性、實(shí)用性。

基于GPT機(jī)制建立的AI數(shù)據(jù)模型,就叫“大模型”。

4、什么是ChatGPT

ChatGPT是由美國(guó)OpenAI公司發(fā)布的大模型。

由于ChatGPT 3.5展現(xiàn)了超出現(xiàn)實(shí)預(yù)期的智能數(shù)據(jù)能力,引發(fā)了一場(chǎng)新的全球人工智能競(jìng)賽。2023年3月,ChatGPT -4進(jìn)一步提高了AI的能力。

5、中國(guó)有ChatGPT嗎?

首先再次強(qiáng)調(diào),ChatGPT是特指美國(guó)OpenAI公司的大模型。這是一個(gè)產(chǎn)品名稱(chēng)。

但是,領(lǐng)先的產(chǎn)品,往往會(huì)成為行業(yè)代名詞,比如我們說(shuō)搜索的時(shí)候,會(huì)簡(jiǎn)單的說(shuō)“百度一下”。但實(shí)際上,搜索引擎還有360、Bing、谷歌等其他方式。

目前,我們把與ChatGPT類(lèi)似的產(chǎn)品,暫時(shí)叫“類(lèi)ChatGPT”產(chǎn)品或者直接叫“大模型”產(chǎn)品。

在ChatGPT火爆以后,中國(guó)的科技企業(yè)紛紛“趕上潮流”,推出了自己的大模型產(chǎn)品。以下是《中國(guó)企業(yè)家》雜志統(tǒng)計(jì)出的一些知名公司的產(chǎn)品列表。

但是,這種復(fù)雜的技術(shù)模型,顯然不是一朝一夕就能實(shí)現(xiàn)。多個(gè)國(guó)內(nèi)的大模型被國(guó)外技術(shù)人員質(zhì)疑,是用ChatGPT進(jìn)行“套殼”,用以提升品牌形象和股價(jià)。

中國(guó)的GPT大模型要成熟,還需要比較多的時(shí)間和機(jī)會(huì),本文后面部分會(huì)繼續(xù)說(shuō)明。

6、ChatGPT有什么用途

ChatGPT是一種能生成文本、圖像等內(nèi)容的復(fù)雜系統(tǒng)。

OpenAI的戰(zhàn)略伙伴微軟(Microsoft)已將該技術(shù)添加到其Office MS 365辦公套件及搜索引擎必應(yīng)(Bing)等產(chǎn)品中。

微軟的競(jìng)爭(zhēng)對(duì)手谷歌(Google)也推出了類(lèi)似的搜索工具Bard。

ChatGPT可以進(jìn)行從歷史到哲學(xué)等話(huà)題的對(duì)話(huà),生成不同風(fēng)格的文案、文章、歌詞、詩(shī)歌,甚至直接生成計(jì)算機(jī)代碼,或者對(duì)已有的計(jì)算機(jī)程序代碼提供修改建議。ChatGPT也能處理視覺(jué)信息,諸如回答關(guān)于照片內(nèi)容的問(wèn)題。

ChatGPT是基于從互聯(lián)網(wǎng)上搜羅的大量文章、圖像、網(wǎng)站和社交媒體內(nèi)容,以及與OpenAI人類(lèi)雇工的實(shí)時(shí)對(duì)話(huà)(主要是英語(yǔ))進(jìn)行訓(xùn)練的。實(shí)際上,早在2014年微軟公司面向中國(guó)推出了AI聊天機(jī)器人小冰,目前不知道小冰的對(duì)話(huà)內(nèi)容是否也是ChatGPT學(xué)習(xí)的數(shù)據(jù)來(lái)源之一。

ChatGPT學(xué)著模仿寫(xiě)作的語(yǔ)法和結(jié)構(gòu),輸出常用表達(dá)。它還學(xué)習(xí)識(shí)別圖像中的形狀和圖案,如一只貓、一個(gè)孩子或一件襯衫的輪廓。它還可以將單詞和短語(yǔ)與這些形狀和圖案相匹配,允許用戶(hù)詢(xún)問(wèn)圖像的內(nèi)容,如貓?jiān)谧鍪裁椿蛞r衫的顏色是什么。

因?yàn)镃hatGPT的原始數(shù)據(jù)來(lái)自于公開(kāi)的互聯(lián)網(wǎng),而互聯(lián)網(wǎng)上的信息并不總是準(zhǔn)確的。因此,ChatGPT給出的答案結(jié)果,并沒(méi)有經(jīng)過(guò)事實(shí)核查,不能100%保證準(zhǔn)確,甚至有些完全是“一本正經(jīng)的胡說(shuō)八道”。

ChatGPT需要依靠人類(lèi)員工的反饋來(lái)提高準(zhǔn)確性。

其他類(lèi)似的大模型,同樣如此,都需要非常海量的人工能力,來(lái)幫助大模型提升準(zhǔn)確性。這就是類(lèi)似于在中國(guó),雖然大家覺(jué)得高德地圖、百度地圖、騰訊地圖很智能,但是實(shí)際上,它們不僅僅是在調(diào)用衛(wèi)星數(shù)據(jù)、交通部門(mén)數(shù)據(jù),還有數(shù)以萬(wàn)計(jì)的人工“標(biāo)記員”在幫助和輔助數(shù)據(jù)修正工作。

7、ChatGPT之類(lèi)的大模型是如何工作的?

前面已經(jīng)說(shuō)過(guò),GPT的意思是“生成式預(yù)訓(xùn)練轉(zhuǎn)換器(Generative Pre-trained Transformer),這是大模型的核心技術(shù)。

轉(zhuǎn)換器是在數(shù)據(jù)序列中尋找長(zhǎng)程模式的專(zhuān)門(mén)算法。轉(zhuǎn)換器不僅能學(xué)會(huì)預(yù)測(cè)一個(gè)句子中的下一個(gè)詞,還能學(xué)會(huì)預(yù)測(cè)一個(gè)段落中的下一個(gè)句子以及一篇文章中的下一個(gè)段落。這就是為什么它能夠在長(zhǎng)文本中緊扣主題。

由于轉(zhuǎn)換器需要大量的數(shù)據(jù),它的訓(xùn)練分為兩個(gè)階段:首先,它用通用數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,這種數(shù)據(jù)更容易大量收集;然后,根據(jù)它要執(zhí)行的具體任務(wù),再利用定制的數(shù)據(jù)進(jìn)行微調(diào)。

張棟偉在最近的兩篇文章中多次強(qiáng)調(diào),大模型的核心取決于三個(gè)因素:數(shù)據(jù)、算力和場(chǎng)景。

所有的大模型都要受制于該公司所能合法獲得的數(shù)據(jù)量,還要具備能支撐這些數(shù)據(jù)的算力。最后,還需要有可以商業(yè)化的場(chǎng)景,形成投資-產(chǎn)出的正循環(huán)。

8、ChatGPT這樣的大模型收費(fèi)嗎?

目前,包括美國(guó)的ChatGPT,以及國(guó)內(nèi)的各種大模型,都是免費(fèi)的。需要個(gè)人去官網(wǎng)注冊(cè)申請(qǐng)。

大模型產(chǎn)品都會(huì)提供一個(gè)API(應(yīng)用程序編程接口),允許各公司將該技術(shù)整合到自家產(chǎn)品或后端解決方案中。這種企業(yè)定制版本,以及面向個(gè)人的高級(jí)版本,會(huì)收費(fèi)。

需要再次提示的是,上文已經(jīng)說(shuō)過(guò),目前大模型都還需要人工進(jìn)行優(yōu)化,因此你在大模型輸入的內(nèi)容,以及大模型給你輸出的答案結(jié)果,這些信息都會(huì)被開(kāi)發(fā)者公司閱讀到。

所以,請(qǐng)不要輸入隱私數(shù)據(jù)或敏感的公司信息。

9、政府對(duì)AIGC的態(tài)度

世界各國(guó)政府正在探索規(guī)范生成式AI工具的方式,擔(dān)心它們可能被濫用于犯罪、傳播虛假信息或威脅國(guó)家安全等情況。

4月11日,國(guó)家互聯(lián)網(wǎng)信息辦公室(簡(jiǎn)稱(chēng)“網(wǎng)信辦”)發(fā)布通知,就《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》向社會(huì)公開(kāi)征求意見(jiàn),意見(jiàn)反饋截止時(shí)間為5月10日。

網(wǎng)信辦表示, “國(guó)家支持人工智能算法、框架等基礎(chǔ)技術(shù)的自主創(chuàng)新、推廣應(yīng)用、國(guó)際合作,鼓勵(lì)優(yōu)先采用安全可信的軟件、工具、計(jì)算和數(shù)據(jù)資源”。

網(wǎng)信辦定義,所謂“生成式人工智能”,是指基于算法、模型、規(guī)則生成文本、圖片、聲音、視頻、代碼等內(nèi)容的技術(shù)。網(wǎng)信辦明確研發(fā)、利用生成式人工智能產(chǎn)品,面向中華人民共和國(guó)境內(nèi)公眾提供服務(wù)的,適用本辦法。

在服務(wù)提供者的準(zhǔn)入資格方面,《意見(jiàn)征求稿》要求利用生成式人工智能產(chǎn)品向公眾提供服務(wù)前,應(yīng)當(dāng)按照《具有輿論屬性或社會(huì)動(dòng)員能力的互聯(lián)網(wǎng)信息服務(wù)安全評(píng)估規(guī)定》(2018年11月發(fā)布)向國(guó)家網(wǎng)信部門(mén)申報(bào)安全評(píng)估,并按照《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》(2021年12月發(fā)布)履行算法備案和變更、注銷(xiāo)備案手續(xù)。

《意見(jiàn)征求稿》詳細(xì)地分別對(duì)提供生成式人工智能產(chǎn)品或服務(wù),對(duì)用于生成式人工智能產(chǎn)品的預(yù)訓(xùn)練、優(yōu)化訓(xùn)練數(shù)據(jù)提出明確要求。

10、AI會(huì)搶人類(lèi)飯碗嗎?

任何最新發(fā)明的技術(shù),都會(huì)對(duì)當(dāng)下的崗位和未來(lái)的工作產(chǎn)生重大影響。

在此前的計(jì)算機(jī)、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的技術(shù)浪潮中,都會(huì)藍(lán)領(lǐng)階層產(chǎn)生了重大影響。

當(dāng)前業(yè)內(nèi)普遍認(rèn)為,AIGC將對(duì)白領(lǐng)職業(yè)產(chǎn)生較大影響。

但是,回首往事,會(huì)發(fā)現(xiàn)計(jì)算機(jī)、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)三大革命性的新技術(shù),使得社會(huì)經(jīng)濟(jì)變得更加生機(jī)勃勃。

這是因?yàn),?jīng)濟(jì)學(xué)家已經(jīng)發(fā)現(xiàn),新技術(shù)的相關(guān)影響往往包含三個(gè)方面:

(1)一些勞動(dòng)者提高了生產(chǎn)力;

(2)部分崗位實(shí)現(xiàn)自動(dòng)化或被合并;

(3)產(chǎn)生出以前不存在的新崗位。

由于新崗位的生產(chǎn)效率,要優(yōu)于被取代崗位的生產(chǎn)效率,所以實(shí)際上整個(gè)社會(huì)的生產(chǎn)效率是提升的。

但是具體到個(gè)人,只能說(shuō)是:

“最先掌握AI的人,將會(huì)比較晚掌握AI的人有競(jìng)爭(zhēng)優(yōu)勢(shì)”。

這句話(huà),放在計(jì)算機(jī)、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的開(kāi)局時(shí)期,都是一樣的道理。

如果你也想盡早掌握AI技術(shù),請(qǐng)關(guān)注我。

作者:張棟偉 (資深互聯(lián)網(wǎng)人士、市場(chǎng)營(yíng)銷(xiāo)專(zhuān)家、大學(xué)生就業(yè)創(chuàng)業(yè)導(dǎo)師)

       原文標(biāo)題 : 張棟偉:一文讀懂什么是AIGC、ChatGPT、大模型

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)