大模型時代進入尾聲:場景式模型接棒
文/彭藝信
編輯/侯煜
ChatGPT像里科技行業(yè)里的鲇魚,攪動一池春水。自從它出現(xiàn)之后,中國科技企業(yè)扎堆發(fā)布AI大模型。
有人嘲諷,ChatGPT在中國即將“畝產過萬”;也有人調侃,下個階段該是“全民大模型,ChatGPT進萬家”了吧;還有人直言,ChatGPT是十月懷胎,中國大模型一個月成型。
中國大模型為何能飛速成型?究竟是養(yǎng)在深閨人未識,還是跟風造概念?阿里云CTO周靖人說過,動輒超千億參數(shù)的大模型研發(fā),不是單一的算法問題,也不是靠簡單堆積GPU就能實現(xiàn)的。大模型是囊括了底層算力、網(wǎng)絡、存儲、大數(shù)據(jù)、AI框架、AI模型等復雜技術的系統(tǒng)性工程,需要AI-云計算的全棧技術能力。
在當下增長乏力的科技互聯(lián)網(wǎng)產業(yè)生態(tài)中,互聯(lián)網(wǎng)企業(yè)把大模型當做救命草。不過,盡管市場火熱,但潮退后才能見識真實力。
中國科技圈,大模型的大躍進如火如荼,但在本月初, OpenAI 的 CEO 在演講中警告稱:我們已經(jīng)處在大模型時代的尾聲,并表示如今的生成式AI (AIGC )發(fā)展中,將數(shù)據(jù)模型進一步做大,塞進更多數(shù)據(jù)的方式,已經(jīng)是目前人工智能發(fā)展中最后一項重大進展,并且還聲稱目前還不清楚未來的發(fā)展方向如何。
可以預言的是,當下大模型技術對于 AIGC 的發(fā)展至關重要,但從長遠來講,AI 的發(fā)展絕不會永遠依賴大模型的參數(shù)提升和算力的堆砌。未來,針對更具體的應用場景,開發(fā)更小更精準、針對應用場景的模型才是發(fā)展的方向。
本文將盤點目前市場上呼聲較高的大模型,中國大模型究竟是曇花一現(xiàn),還是千錘百煉不斷精進,讓我們持續(xù)關注。
OpenAI
2021年11月,OpenAI推出了GPT3.0。它是運用1759億個參數(shù)所實現(xiàn)的預訓練語言模型。去年年底ChatGPT問世,該系統(tǒng)發(fā)布后五天內就吸引了超過100萬用戶。
ChatGPT是人工智能技術驅動的自然語言處理工具,其使用的人類反饋的強化學習技術,可以更容易推斷出用戶的意圖,產生更自然和更合理的回答,像人類一樣來聊天交流,完成撰寫視頻腳本、文案、代碼、論文等任務。
今年2月OpenAl投資人微軟宣布推出由ChatGPT支持的最新版本人工智能搜索引擎Bing(必應)和Edge瀏覽器,到今年3月15日,OpenAI推出GPT-4文本生成AI系統(tǒng),但僅向Plus付費訂閱用戶及企業(yè)和開發(fā)者開放。
OpenAI公布的訓練GPT模型由于訓練過程復雜,數(shù)據(jù)不透明,加上長期的技術迭代等,其在算法層和硬件層積累起巨大優(yōu)勢,外界想要復制ChatGPT并不容易,ChatGPT目前在大模型領域的霸主地位無人能夠撼動,OpenAI市場估值已經(jīng)達到290億美元,成為世界上估值最高的初創(chuàng)公司。
現(xiàn)在的ChatGPT面對的不只是商業(yè)化和監(jiān)管的壓力,由馬斯克、圖靈獎得主Bengio等千人聯(lián)名的“暫停高級AI研發(fā)”的公開信,目前簽名數(shù)量已有9000多人,此外,它也受到越來越多的國家的抵制,在其出現(xiàn)的兩個月后,意大利就宣布禁止使用ChatGPT,原因是認為ChatGPT平臺不安全并且會非法收集大量用戶信息。
特點:可以直接面向C端用戶群體。
參數(shù)量大:ChatGPT-3模型使用了1750億個參數(shù), ChatGPT-4的參數(shù)量更大,
迭代快:OpenAI在原本官網(wǎng)產品下拉菜單中的ChatGPT已換成了GPT-4。
百度“文心一言”大模型
作為國內人工智能(AI)領域的旗手,今年3月,百度就推出直接對標ChatGPT的文心一言。
文心一言也擁有文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成的能力。百度文心一言的發(fā)布會后一小時內,排隊申請文心一言企業(yè)版 API 調用服務測試的企業(yè)用戶超 3 萬家,申請產品測試網(wǎng)頁多次被擠爆。
根據(jù)后期大量試用的反饋,文心一言也暴露出通過模式和規(guī)則來生成文本等問題,對比之下,業(yè)界出現(xiàn)了“百度搶占大模型市場的心態(tài)操之過急”的看法,也讓大家看到了國內外自然語言處理大模型方面的差距。
事實上百度在大模型領域沉淀已久,百度早在2019年就推出了文心大模型ERNIE 1.0,而目前,ERNIE 3.0每天接受數(shù)十億用戶的搜索請求。文心一言會基于飛槳深度學習平臺和文心知識增強大模型,持續(xù)從海量數(shù)據(jù)和大規(guī)模知識中融合學習,具有知識增強、檢索增強和對話增強的技術特色。
已有650家企業(yè)伙伴加入文心一言生態(tài),包括小度和自動駕駛Apollo等產品,以及愛奇藝等公司也已經(jīng)接入百度的文心一言模型。
特點:擁有三級大模型技術體系
形成了“基礎-任務-行業(yè)”三級大模型技術體系,擁有NLP、計算機視覺(CV)、跨模態(tài)等基礎大模型,以及對話、跨語言、搜索等任務大模型,還有生物計算領域大模型、各行業(yè)大模型及支撐大模型應用的工具平臺。
阿里通義大模型
4月11日,阿里云智能首席技術官周靖人在阿里云峰會上正式官宣阿里巴巴“通義千問”。
打開通義千問,是一個聊天對話框,與競品相似,通義千問在作為“問答機器人”基礎上還新增了圖片生成應用功能,通過拍照上傳一張功能草圖,便可以自動生成低代碼業(yè)務應用。
實際上,早在2022年9月阿里巴巴達摩院就發(fā)布了“通義”大模型,打造了國內首個AI統(tǒng)一底座,并且通義M6使用的參數(shù)規(guī)模超過了ChatGPT,是全球參數(shù)規(guī)模最大的AI模型。
去年11月阿里還正式提出“Model as a Service”理念,牽頭搭建了國內規(guī)模最大的AI模型服務社區(qū)“魔塔”,公布的數(shù)據(jù)顯示,魔塔社區(qū)目前已有超100萬活躍用戶,模型累計下載次數(shù)超1600萬,模型總數(shù)達800個,與十幾個頂尖人工智能機構合作。
接下來,阿里所有App,包括天貓、淘寶、釘釘?shù)任磥矶紩尤胪x千問,進行全面改造。
通義大模型更偏向為B端服務,周靖人在峰會上強調,未來每一個企業(yè)在阿里云上既可以調用“通義千問”的全部能力,也可以結合企業(yè)自己的行業(yè)知識和應用場景,訓練自己的企業(yè)大模型。在2022年阿里就將AI應用于電力調度,聯(lián)合電網(wǎng)研發(fā)出高精度電網(wǎng)負荷預測模型,現(xiàn)已在山東德州落地。
特點:服務B端、瞄準企業(yè)客戶
商湯“日日新大模型”
在4月10日的商湯技術交流日活動上,商湯“日日新SenseNova”大模型體系正式問世,作為中文大模型,其包含自然語言處理、內容生成、自動化數(shù)據(jù)標注、自定義模型訓練等多種大模型及能力,商湯還公布了基于該體系的AI內容生成式平臺——包括秒畫、如影、瓊宇、格物等。
目前商湯在AI領域的投入規(guī)模已經(jīng)超過百億,商湯已打造CV(計算機視覺)、NLP(自然語言處理)、AIGC(人工智能內容生成)多個AI大模型,歷時五年,商湯一直秉持“模型重在能力而非規(guī)模”的看法,在2019年于上海臨港建設的商湯人工智能計算中心,共有5000P算力,大裝置擁有2.7萬塊GPU芯片卡,實現(xiàn)自供算力以訓練大模型。
商湯也發(fā)布了自研類ChatGPT產品“商量”,作為千億級參數(shù)的自然語言處理模型,其能夠提供以下功能:編程助手,幫助開發(fā)者編寫和調試代碼;健康咨詢助手,為用戶提供個性化的醫(yī)療建議;PDF文件閱讀助手,能輕松從復雜文檔中提取和概括信息等能力,商湯科技聯(lián)合創(chuàng)始人王曉剛則表示“商量”大模型未來主要面向To B端。
此外商湯的大模型研發(fā)體系在多種行業(yè)場景中落地,比如為政企客戶提供包括視覺感知通用任務與標注服務等多種靈活的API接口和服務,客戶根據(jù)實際應用需求調用大模型的各種AI技術能力。“日日新SenseNova”應用在智能駕駛領域,實現(xiàn)了可識別3000類物體的BEV環(huán)視通用感知算法的實車量產,也構建了感知決策一體化的自動駕駛多模態(tài)模型,能夠給環(huán)境、行為、動機解碼能力帶來突破。
特點:場景式大模型,關注具體的使用場景
Meta
2023年2月25日,作為硅谷三巨頭之一的Meta,在官網(wǎng)公布了一個新的大型語言模型 LLaMA(Large Language Model Meta AI),Meta提供了70億、130億、330億和650億四種參數(shù)規(guī)模的 LLaMA 模型,由Meta的FAIR團隊開發(fā),接受了20種語言的訓練。Guillaume Lample 在其Twitter上聲稱:LLaMA130億參數(shù)版本的表現(xiàn),在大多數(shù)測試上表現(xiàn)優(yōu)于GPT-31750億參數(shù)版。
為了區(qū)別于ChatGPT,Meta首席執(zhí)行官馬克·扎克伯格表示,LLaMA 模型旨在幫助研究人員推進工作,在生成文本、對話、總結書面材料、證明數(shù)學定理或預測蛋白質結構等更復雜的任務方面有很大的前景。
據(jù)了解,LLaMA 模型也有著其他大語言模型的通。簳a生偏見性、虛假的內容。Meta會向非商用的研究機構開放 LLaMA源代碼,根據(jù)具體情況授予學術研究人員訪問權限,開源吸引來的更多的研究者可以幫助解決這些問題。
除此之外,Meta AI在官網(wǎng)發(fā)布了圖像分割大模型SAM,該模型在圖片元素識別與分割上的表現(xiàn)遠超預期。英偉達AI科學家Jim Fan在社交媒體上表示,SAM讓計算機視覺(CV)迎來“GPT-3時刻”,它已經(jīng)了解了物體的一般概念,即使對于未知對象、不熟悉的場景(例如水下圖像)和在模棱兩可的情況下也能很好地進行圖像分割。
特點:開源、圖像識別能力強
谷歌
2023年2月,Google發(fā)布了Bard大模型,這是一款用于對抗ChatGPT、在一個大型語言模型(LLM)基礎上推出的智能聊天機器人,Bard作為谷歌對話應用語言模型,可以說是LLaMDA的一個輕量和優(yōu)化版本。3月21日,谷歌向公眾開放了Bard的訪問權限,但目前僅支持年滿18歲的美英用戶注冊試用,且只支持英文提問。
Bard也為用戶提供了一個單獨的聊天界面,從AI功能上來看,Bard跟其他AI模型大同小異,用戶可以在文本框中進行提問和搜索,比如讓Bard幫你寫一篇文章、列一個計劃、解決一個題目得出結果等。
然而在谷歌短短的幾秒展示里,Bard就出現(xiàn)了大問題:被問到“我可以告訴我 9 歲的孩子關于詹姆斯·韋伯太空望遠鏡(簡稱JWST)的哪些新發(fā)現(xiàn)?”時, Bard的回答里面有一個巨大的錯誤:回答里提到“ JWST 拍攝到了太陽系外行星的第一張照片”,事實上,第一張系外行星照片應該是2004年由歐洲南方天文臺的Very Large Telescope拍攝的。
由于有了上線后曾出現(xiàn)的混亂和批評的前車之鑒,現(xiàn)在谷歌Bard整個界面都透露出谷歌滿滿的求生欲。在你開始使用Bard之前,會有一個免責聲明,明確提醒你Bard目前還只處于實驗階段。無論是在提問的文本框下面還是答案生成框下方,時刻都寫著一行小字,提醒用戶“Bard可能生成不準確或者略帶攻擊性的信息,但并不代表谷歌官方觀點”。
特點:聊天大模型、準確性不佳
360
3月29日,在“2023數(shù)字安全與發(fā)展高峰論壇”上,周鴻祎現(xiàn)場演示了360自研的人工智能語言模型在360瀏覽器上的應用,并宣布了360的人工智能發(fā)展戰(zhàn)略。
360于4月9日公告,基于360GPT大模型開發(fā)的人類智能產品矩陣“360 智能腦”將落地搜索場景,面向企業(yè)用戶開放內測。據(jù)了解,企業(yè)用戶在PC端360 搜索首頁申請并獲得測試資格后,可通過企業(yè)安全云體驗使用。未來,360 智腦將與瀏覽器、數(shù)字助理、蘇打辦公、智能營銷等場景應用深度結合,全面提升用戶工作效率。
特點:面向B端
昆侖萬維
昆侖萬維公眾號在4月10日宣布:由昆侖萬維和奇點智源合作自研的,中國第一個真正實現(xiàn)智能涌現(xiàn)的國產大語言模型——“天工3.5”發(fā)布在即,并于4月17日啟動邀請測試。
昆侖萬維甚至宣稱“天工”大模型已經(jīng)非常接近OpenAI ChatGPT的智能水平。ChatGPT是基于GPT3.5大模型,所以把這個版本命名為“天工3.5”。昆侖萬維研發(fā)團隊2020年從一億級模型做起,上升至十億級模型,再到百億級模型,在三年后將研究成果放入大模型之戰(zhàn),選擇開源的方式入局。
特點:偏向C端的語言大模型
原文標題 : 大模型時代進入尾聲:場景式模型接棒
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-12.26立即報名>>> 【在線會議】村田用于AR/VR設計開發(fā)解決方案
-
1月8日火熱報名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會
-
即日-1.14火熱報名中>> OFweek2025中國智造CIO在線峰會
-
即日-1.24立即參與>>> 【限時免費】安森美:Treo 平臺帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產業(yè)大會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市