AI比我懂中文?BAT的新戰(zhàn)爭(zhēng)進(jìn)行中
今年以來(lái),AIGC(AI 生產(chǎn)內(nèi)容)成了新的互聯(lián)網(wǎng)潮頭,就如同年初大火的 Web3。
最新一波熱潮要?dú)w功于上周剛剛發(fā)布的 ChatGPT,憑借超乎想象的語(yǔ)言理解能力、溝通技巧和背后的知識(shí)儲(chǔ)備,不僅技驚四座,也在某種程度上碰到了恐怖谷效應(yīng),有些網(wǎng)友甚至認(rèn)為它「牛得讓人有點(diǎn)畏懼」。
但 ChatGPT 對(duì)人類語(yǔ)言依然存在理解問題,特別是在中文上,比如就有網(wǎng)友提問「如果你是賈寶玉,會(huì)娶誰(shuí)當(dāng)老婆」,結(jié)果得到一個(gè)啼笑皆非的回答:
圖/即刻@雨醫(yī)生
在AI領(lǐng)域,語(yǔ)言理解一直最為核心,也是難以攻克的問題之一,尤其是中文的語(yǔ)言理解。放眼目前全世界的所有語(yǔ)言,中文的難度系數(shù)是最高的。相比拉丁語(yǔ)系中的單詞,中文漢字的語(yǔ)義更加模糊,容易產(chǎn)生歧義、信息失真等問題,這些都給 AI 提出了更大的挑戰(zhàn)。
也是在最近,阿里和騰訊的 AI 接連取得了突破性的進(jìn)展,中文語(yǔ)言理解又往前再走了關(guān)鍵一步。
AI 中文成績(jī)超人類上月底,在中文語(yǔ)言理解領(lǐng)域權(quán)威榜單 CLUE 中,阿里 AI 以 86.685 的總成績(jī)創(chuàng)造了一個(gè)新的紀(jì)錄——該榜單誕生以來(lái)AI第一次超過(guò)人類成績(jī)(86.678)。僅僅不到一周,騰訊 AI 也更新了自己成績(jī),以 86.918 的得分超過(guò)了人類和阿里 AI 的成績(jī)。
CLUE 總榜,圖/CLUE
中國(guó)兩大互聯(lián)網(wǎng)巨頭,在短短一周內(nèi)相繼超越人類的 CLUE 成績(jī)。
作為業(yè)界最權(quán)威的中文自然語(yǔ)言理解榜單,CLUE(中文語(yǔ)言理解測(cè)評(píng)基準(zhǔn))是一組評(píng)估AI機(jī)器人能夠像人類一樣理解和響應(yīng)中文文本的任務(wù),從長(zhǎng)短文本分類、多選閱讀理解、自然語(yǔ)言推理等 17 項(xiàng)任務(wù)中全面考核 AI 模型的語(yǔ)言理解能力。
上線 3 年,該榜單競(jìng)爭(zhēng)激烈,幾乎是中國(guó)互聯(lián)網(wǎng)巨頭的兵家必爭(zhēng)之地,除了阿里達(dá)摩院 NLP 和騰訊混元 AI 大模型團(tuán)隊(duì),OPPO 研究院、快手搜索及美團(tuán) NLP 等研究機(jī)構(gòu)也都參與了該榜單的競(jìng)爭(zhēng)。盡管榜首有過(guò)多次易主,但在阿里和騰訊AI最近一次更新之前,從未有過(guò) AI 超過(guò)人類成績(jī)。
不過(guò),此次超越實(shí)際是指總成績(jī)?cè)诳偘裆铣^(guò)人類,具體到子榜單如自然語(yǔ)言推理榜和分類任務(wù)排行榜,人類的成績(jī)依然位居第一。換言之,阿里和騰訊的AI模型目前與人類在 CLUE 的不同測(cè)評(píng)中互有勝負(fù)。
而另一邊,百度也以中國(guó)學(xué)生更為切身的方式展示了中國(guó)AI的中文理解能力。9 月舉辦的 2022 百度萬(wàn)象大會(huì)上,百度宣稱AI數(shù)字人度曉曉挑戰(zhàn)了高考作文,針對(duì)全國(guó)新高考Ⅰ卷題為《本手、妙手、俗手》作答,憑借 48 分的成績(jī),度曉曉可以排在整體考生作文成績(jī)的前 25%。
圖/百度
中國(guó)互聯(lián)網(wǎng)巨頭對(duì)中文的理解似乎迎來(lái)了一個(gè)奇點(diǎn),阿里云計(jì)算部門就在阿里 AI CLUE 成績(jī)首度超越人類后發(fā)文稱,「這標(biāo)志著中國(guó)對(duì) AI 模型的理解,達(dá)到了一個(gè)新的水平。」
巨頭的AI軍備競(jìng)賽
如果說(shuō)最近數(shù)年 AI 的快速發(fā)展要從 2016 年的 AlphaGo 算起,2020 年夏天 OpenAI 發(fā)布 GPT-3 模型,可以視為又一個(gè)關(guān)鍵節(jié)點(diǎn)。GPT-3 從發(fā)布之初就展現(xiàn)了驚人的 AI 能力,寫文章、做翻譯、寫代碼,甚至可以學(xué)習(xí)一個(gè)人的語(yǔ)言模式并與之對(duì)話。
事實(shí)上,不管是上半年大火的 DALL·E 2(AI 生成圖片),還是 ChatGPT(AI 生成文本)都衍生自 GPT-3 大模型。除此之外,GPT-3 還通過(guò)付費(fèi) API 的形式支持了 300 多個(gè)應(yīng)用。
GPT-3 的推出也引發(fā)了全球范圍 AI 大模型的爆發(fā),全球各大科技巨頭和研究所開始了一場(chǎng)聲勢(shì)浩大的 AI 軍備競(jìng)賽,谷歌就在去年推出了萬(wàn)億級(jí)參數(shù)的 AI 大模型—— Switch Transformer,微軟和英偉達(dá)燒壞了 4480 塊 CPU 后,也完成了完成了 5300 億參數(shù)的自然語(yǔ)言生成模型 MT-NLG(威震天-圖靈)。
國(guó)內(nèi)的巨頭自然也不甘落后。百度也在去年發(fā)布了「鵬城-百度·文心」,并于今年升級(jí)為文心·行業(yè)大模型。阿里則在今年 9 月推出了「通義」大模型系列,第一個(gè)在 CLUE 測(cè)評(píng)中得分超越人類的 AI「通義- AliceMind」正是來(lái)自該模型系列。
圖/阿里
科技巨頭角力 AI 大模型的背景,是AI在下游應(yīng)用層面出現(xiàn)了碎片化、多樣化的產(chǎn)業(yè)趨勢(shì)。華為昇騰計(jì)算業(yè)務(wù)總裁張迪煊指出,過(guò)去在單一的AI應(yīng)用場(chǎng)景,其實(shí)是通過(guò)多個(gè)AI支撐一個(gè)場(chǎng)景來(lái)完成多個(gè)任務(wù)。
傳統(tǒng)AI模型只有較為單一的能力,如 AlphaGo 用于下圍棋,AlphaFold 專注蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)。而大模型如 GPT-3 已經(jīng)可以實(shí)現(xiàn)多個(gè)任務(wù),服務(wù)多個(gè)場(chǎng)景,「這是生產(chǎn)效率的提升!
百度移動(dòng)生態(tài)負(fù)責(zé)人何俊杰就表示,AIGC 可以實(shí)現(xiàn)以十分之一的成本,以千倍百倍的生產(chǎn)速度,創(chuàng)造出有獨(dú)特價(jià)值和獨(dú)立視角的內(nèi)容,讓內(nèi)容生產(chǎn)和傳播進(jìn)入 AI 發(fā)電的階段。
事實(shí)上,百度已經(jīng)推出了 AI 作畫平臺(tái)「文心一格」,騰訊也有寫稿機(jī)器人「夢(mèng)幻寫手」,阿里巴巴則有旗下的 AI 在線設(shè)計(jì)平臺(tái) Lubanner,字節(jié)跳動(dòng)則推出剪映提供 AI 生成視頻功能。
但未來(lái)的 AI 創(chuàng)作會(huì)是什么樣?
AI創(chuàng)作,還是輔助創(chuàng)作?
在 ChatGPT 展現(xiàn)自己超強(qiáng)的自然語(yǔ)言生成能力之后,有網(wǎng)友就想象未來(lái)可以用 ChatGPT 生成文案并輸出為語(yǔ)音,同時(shí)再用 Stable Diffusion(文本生成圖像)生成圖片素材,甚至是直接使用谷歌的 Imagen Video,或是 Meta 的 Make-A-Video 生成視頻。
AI生成的視頻,圖/谷歌
AI 生成文本和圖片今天已經(jīng)比較成熟了,但距離 AI 生成視頻的實(shí)際應(yīng)用還有明顯的差距。阿里資深技術(shù)專家、達(dá)摩院基礎(chǔ)視覺團(tuán)隊(duì)負(fù)責(zé)人趙德麗判斷,大概兩年左右時(shí)間,AI 生成視頻也有望能達(dá)到文生圖級(jí)別的效果。她還指出目前的困難點(diǎn)在于,不論是質(zhì)量還是數(shù)量都和文生圖的數(shù)據(jù)有較大差距。
在 9 月的萬(wàn)象大會(huì)上,百度發(fā)布了一個(gè)「創(chuàng)作者 AI 助理團(tuán)」,其中包括了文案、插畫師、視頻制作等AI助理,實(shí)現(xiàn)一個(gè)人就是一個(gè)制作團(tuán)隊(duì)。
幾乎可以確信,未來(lái) AI 將徹底改變現(xiàn)有的內(nèi)容生產(chǎn)模式,但 AI 帶來(lái)的內(nèi)容革命還很難說(shuō)是好是壞。
ChatGFT 的訓(xùn)練方式主要通過(guò)語(yǔ)料庫(kù)進(jìn)行自然語(yǔ)言處理的訓(xùn)練。首先將大量的對(duì)話記錄和語(yǔ)料庫(kù)分詞并處理成可供模型識(shí)別的格式。接著通過(guò)使用自然語(yǔ)言處理技術(shù),如深度學(xué)習(xí)等對(duì)模型進(jìn)行訓(xùn)練,讓模型能夠通過(guò)對(duì)語(yǔ)料庫(kù)的學(xué)習(xí),模擬人類的聊天行為,并能夠回答用戶提問。
本質(zhì)上,AI 生成內(nèi)容的基礎(chǔ)是互聯(lián)網(wǎng)上海量的語(yǔ)料庫(kù),既不能憑空創(chuàng)造出新的內(nèi)容,也無(wú)法實(shí)時(shí)收集最新產(chǎn)生的語(yǔ)料數(shù)據(jù),只是在一定的參數(shù)范圍收集已經(jīng)存在的信息,包括那些「有毒的」。
OpenAI 去年就指出他們所做的改進(jìn)并不能消除大型語(yǔ)言模型中固有的毒性問題,GPT-3 接受了超過(guò) 600GB 網(wǎng)絡(luò)文本的訓(xùn)練,其中一部分來(lái)自具有性別、種族、身體和宗教偏見的社區(qū)。與其他大型語(yǔ)言模型一樣,它會(huì)放大訓(xùn)練數(shù)據(jù)的偏差。
圖/OpenAI
公允地說(shuō),這既是 AI 的問題,更是人類自身的問題。但 AI 生成內(nèi)容的方便和快捷都讓內(nèi)容生產(chǎn)成本極大下降,好比現(xiàn)在就用自動(dòng)駕駛司機(jī)代替人類司機(jī),這也意味著各種問題,比如更像真人的 AI 水軍將充斥社交媒體、AI 生成的虛假或偏見內(nèi)容隨處可見。
越來(lái)越多人已經(jīng)開始懷疑,社交媒體上的內(nèi)容到底是真人打出來(lái)的,還是由 ChatGPT 生成的文本。長(zhǎng)期以往,社交媒體甚至整個(gè)互聯(lián)網(wǎng)上的內(nèi)容徹底被AI占領(lǐng)并非杞人憂天。
北京大學(xué)新聞與傳播學(xué)院教授胡泳發(fā)文還指出,「中文內(nèi)容寫作中本來(lái)就充滿洗稿,使用機(jī)器學(xué)習(xí)工具來(lái)生成內(nèi)容,將會(huì)使洗稿問題雪上加霜。」由此,胡泳認(rèn)為與其用 AI 直接取代人類生產(chǎn)內(nèi)容,不如思考如何利用 AI 幫助人類的擴(kuò)大內(nèi)容生產(chǎn)能力。
在 ChatGPT 的對(duì)話熱潮中,我們也發(fā)現(xiàn)真正具體到內(nèi)容輸出,ChatGPT 盡管對(duì)自然語(yǔ)言的理解達(dá)到了足以稱道的程度,實(shí)際回答中仍然充斥著各種「廢話文學(xué)」和過(guò)時(shí)偏見信息,不過(guò)在協(xié)助內(nèi)容創(chuàng)作、成為人類寫作的助手方面就要好得多。
寫在最后「人工智能之父」阿蘭·圖靈提出圖靈測(cè)試時(shí),就把語(yǔ)言理解能力作為判斷一個(gè)機(jī)器系統(tǒng)有無(wú)智能的關(guān)鍵標(biāo)準(zhǔn),自然語(yǔ)言理解也因此被認(rèn)為是人工智能皇冠上的明珠。
對(duì)中文來(lái)說(shuō)尤為如此。過(guò)去我們?cè)?AI 語(yǔ)音助手上就看到,現(xiàn)有語(yǔ)音助手對(duì)中文的理解能力很大程度上影響了用戶的語(yǔ)音交互體驗(yàn),畢竟沒有人喜歡對(duì)牛彈琴。
圖/MSF Tech Day
但僅僅在過(guò)去一個(gè)月,阿里和騰訊 AI 在 CLUE 中文理解上接連超越人類成績(jī),ChatGPT 更是至少在中日英三語(yǔ)上彰顯了驚人的語(yǔ)音理解能力。今年以來(lái),AI 繪圖、AI 做視頻已經(jīng)接連挑戰(zhàn)了我們對(duì) AI 的認(rèn)知。AI 對(duì)內(nèi)容產(chǎn)業(yè)的變革似乎近在咫尺了。
不過(guò)就像科幻小說(shuō)《沙丘》中所寫的,AI 深度學(xué)習(xí)的訓(xùn)練模式?jīng)Q定了,「他們受到的訓(xùn)練是去相信,而不是去知道。信仰可以被操縱。只有知識(shí)是危險(xiǎn)的!
本文圖片來(lái)自:123RF 正版圖庫(kù) 來(lái)源:雷科技
原文標(biāo)題 : AI比我懂中文?BAT的新戰(zhàn)爭(zhēng)進(jìn)行中
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-12.26立即報(bào)名>>> 【在線會(huì)議】村田用于AR/VR設(shè)計(jì)開發(fā)解決方案
-
1月8日火熱報(bào)名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會(huì)
-
即日-1.14火熱報(bào)名中>> OFweek2025中國(guó)智造CIO在線峰會(huì)
-
即日-1.24立即參與>>> 【限時(shí)免費(fèi)】安森美:Treo 平臺(tái)帶來(lái)出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
-
2
- 1 人形機(jī)器人核心零部件,誰(shuí)是盈利最強(qiáng)企業(yè)?
- 2 AI Agent現(xiàn)狀如何?聊聊近期國(guó)內(nèi)的智能體市場(chǎng)動(dòng)向
- 3 5nm重大突破,研祥智能助力半導(dǎo)體企業(yè)高效發(fā)展!
- 4 人形機(jī)器人引爆“PEEK材料”!概念股梳理(名單)
- 5 馬云沒回牌桌,但重注全壓在了
- 6 7 豆包AI登頂國(guó)內(nèi)第一!概念股梳理(名單)
- 8 押注AI王者歸來(lái),歌爾股份“智能體”在下一盤“大棋”
- 9 AI超級(jí)應(yīng)用什么時(shí)候才能出現(xiàn)?
- 10 英偉達(dá)迎來(lái)當(dāng)頭一棒
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容