GPT-5前瞻!GPT-5將具備哪些新能力?
作者:小巖
編輯:彩云
Sam Altman在整個AI領域,乃至整個科技領域都被看作是極具影響力的存在,而2023年OpenAI無限反轉的宮斗事件更是讓Sam Altman刷足了存在感,他甚至被《時代》雜志評為“2023年度CEO”。
也正因此, Sam Altman的一條推文,瞬間就可以成為轟動整個AI行業(yè)的信號,特別是當這條推文還與萬眾期待的“GPT-5”有關的時候。
2023年平安夜,Sam Altman在社交平臺大膽公布了2024年的雄心壯志。他所發(fā)表的關鍵詞不僅涵蓋了2024年OpenAI的整體規(guī)劃,更契合了用戶的迫切需求。這其中包括:
AGI(請耐心等待)
GPT-5
更好的語音模式
更高的費率限制
更好的GPT
更好的推理
對工作/行為程度的控制
視頻
個性化
更好的瀏覽
“使用OpenAi登錄”
開放源代碼
Sam Altman透露,OpenAI計劃在接下來的一年內實現(xiàn)多個令人矚目的里程碑。其中所涉及到的內容,不僅僅一次簡單的技術更新,更是一場至關重要的AI變革。當然,最受關注的,還是GPT-5。
AI領域的開源與閉源之爭:類似于Android與IOS之爭。
對于AI界來說,大家除了關心 GPT-5能否在技術壁壘上有所突破,更關心一個重點:GPT-5能否實現(xiàn)開源?
大模型的開源和閉源之爭一直是行業(yè)內爭論的焦點,這種爭論,與移動互聯(lián)網時代的Android與IOS之爭有異曲同工之妙。有意思的是,各個AI大廠對于開源還是閉源的選擇也不盡相同。
目前拔得頭籌的OpenAI的GPT-4和百度的文心一言都堅持閉源,Meta選擇了開源的道路,相繼面向“學術研究用途”開源了LLaMA和LLaMA-2模型。百川智能則兼具開源和閉源,在學術領域選擇了開源,使用7B和13B兩種尺寸的大模型;商業(yè)探索上將53B閉源,以保護商業(yè)利益和技術的競爭優(yōu)勢。
GPT的閉源,為OpenAI帶來了可觀的收入。據The Information報道,OpenAI CEO Sam Altman對員工表示,公司正以每年13億美元(約合人民幣94.93億元)的速度產生收入,平均每月收入超過1億美元,相較于去年全年2800萬美元增長超過450倍,達4542%。這個數(shù)據也比3個月前預期的年收入高30 %。這也讓2023年成為OpenAI公司成立8年來,收入增長最快的一年。而這些,恰恰是GPT-4閉源所帶來的。
關鍵詞:GPT-5能實現(xiàn)開源嗎?
那么,GPT-5能實現(xiàn)開源嗎?未必。
對于商業(yè)模式,OpenAI曾在官網中明確指出“打算繼續(xù)免費提供ChatGPT”,但也會選擇從付費的高級服務的用戶和企業(yè)中獲得收入。而且,雖然OpenAI嘴上說著“不指望在近期內盈利”,但考慮到開發(fā)和提供大模型的高成本,生存問題仍然是其不得不面對的挑戰(zhàn)。
此外,盡管OpenAI實現(xiàn)了快速增長,但背后的行業(yè)成本卻不容忽略。根據公開信息顯示,2022 年,OpenAI開發(fā)GPT-4,僅訓練成本支出約5.4億美元。2023年4月,OpenAI每天為ChatGPT支付的運營成本約694.4萬美元(其中主要是電費) ,年化運營成本約為2.5億美元,綜合年化成本可能超過13億美元。毫無疑問,OpenAI依舊處于虧損階段。
所以,倘若沒有商業(yè)化的維持,OpenAI恐怕很快會迎來破產。更重要的是,已經通過GPT-4閉源嘗到甜頭,獲得大量收入的OpenAI,顯然沒有充足的理由將GPT-5完全開源,這無異于自毀壁壘,在大模型賽道的競逐中喪失領先優(yōu)勢。從這個層面來說。GPT-5實現(xiàn)開源的概率不大。
即便Sam Altman在推文中將“開源”標注成了關鍵詞,但更多的也只是在迎合行業(yè)的呼聲,我們還不能將其解讀為“企業(yè)2024年的發(fā)展目標”。
不過,“部分開源”的可能性并非沒有。GPT-5完全開源的可能性雖然比較小,但是為了GPT相關生態(tài)建設,對與GPT相關的工具集提供開源的可能性卻很高。或許,OpenAI會通過為較少部分提供開源的方式,為開發(fā)者的開發(fā),調試,分享提供便利。
未來的GPT-5,究竟會具備哪些新能力?
近日,艾倫人工智能研究所發(fā)布了Unified-IO 2,它的發(fā)布極具意義,因為它可以幫助我們更好的預判GPT-5的能力。
為什么這么說呢?Unified與ChatGPT之間存在著怎樣的關系?
事實上,早在2022年6月,艾倫人工智能研究所就推出了第一代Unified-IO,它是首批能夠處理圖像和語言的多模態(tài)模型之一。大約在同一時間,OpenAI正在內部測試GPT-4,并在2023年3月正式發(fā)布。所以,Unified-IO可以看作是對于未來大規(guī)模AI模型的前瞻。換句話說,因為Unified-IO 2的出現(xiàn),我們可以大致預判一點:OpenAI可能正在內部測試GPT-5,并很有可能在幾個月后發(fā)布。
艾倫人工智能研究所推出的Unified-IO 2是第一個可以處理和生成文本,圖像,音頻,視頻和動作序列的模型。這個新的高級人工智能模型使用幾十億個數(shù)據點進行訓練,雖然模型大小只有7B,卻展現(xiàn)出迄今為止最廣泛的多模態(tài)能力。它的訓練數(shù)據包括:10億個圖像-文本對,1 萬億個文本標記,1.8億個視頻剪輯,1.3億張帶文本的圖像,300萬個3D資產和100萬個機器人代理運動序列。研究團隊將總共120多個數(shù)據集組合成一個600 TB的包,涵蓋220個視覺,語言,聽覺和動作任務。Unified-IO 2采用編碼器-解碼器架構,并進行了一些更改,以穩(wěn)定訓練并有效利用多模態(tài)信號。
模型可以回答問題,根據指令撰寫文本、以及分析文本內容;可以識別圖像內容,提供圖像描述,執(zhí)行圖像處理任務,并根據文本描述創(chuàng)建新圖像;可以根據描述或說明生成音樂或聲音,以及分析視頻并回答有關視頻的問題。此外,通過使用機器人數(shù)據進行訓練,Unified-IO 2還可以為機器人系統(tǒng)生成動作,例如將指令轉換為機器人的動作序列。由于多模態(tài)訓練,它還可以處理不同的模態(tài),例如,在圖像上標記某個音軌使用的樂器等。
總體而言,Unified-IO 2在超過35個基準測試中表現(xiàn)良好,包括圖像生成和理解,自然語言理解,視頻和音頻理解以及機器人操作。在大多數(shù)任務中,它能夠比肩專用模型,甚至更勝一籌。在圖像任務的GRIT基準測試中,Unified-IO 2獲得了目前的最高分。通過這些,我們也可以更好的窺見未來GPT-5的模樣。
對于AI發(fā)展而言,科技生態(tài)與商業(yè)化是缺一不可的核心要素。技術和應用的發(fā)展需要商業(yè)化提供必要的支持和保障;而商業(yè)化的成功也離不開生態(tài)環(huán)境的建設。兩者之間必須相輔相成,有機結合。希望在未來發(fā)布的GPT-5中,OpenAI可以起到先導作用,率先實現(xiàn)生態(tài)與商業(yè)化之間的平衡。
原文標題 : 新火種AI|GPT-5前瞻!GPT-5將具備哪些新能力?
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-12.26立即報名>>> 【在線會議】村田用于AR/VR設計開發(fā)解決方案
-
1月8日火熱報名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會
-
即日-1.14火熱報名中>> OFweek2025中國智造CIO在線峰會
-
即日-1.24立即參與>>> 【限時免費】安森美:Treo 平臺帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網產業(yè)大會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市