年終盤點:AI大模型今年有哪些變化?
2024年,大模型市場可謂熱鬧非凡,一方面,各大廠商紛紛將目光投向具體應用場景,推動行業(yè)定制化的大模型加速落地,這些模型正逐步滲透到金融、醫(yī)療、教育等多個關鍵行業(yè)中,為解決專業(yè)領域的復雜問題提供了方法。另一方面,關于大模型未來發(fā)展路徑的討論持續(xù)升溫,圍繞商業(yè)化落地、大模型與小模型的選擇、應用的方向等成為業(yè)界關注的重點話題。
那么相比于2023年,2024年大模型行業(yè)發(fā)生了哪些變化呢?
01. 理念上:從月亮到六便士,市場越來越關注投資回報
2024年大模型行業(yè)的一大變化就是市場越來越務實,越來越重視商業(yè)化落地程度。時間回到一年前,中國創(chuàng)投圈洋溢著久違的亢奮,從線上的媒體、社區(qū),到線下咖啡館,每個人都在談論著OpenAI、大模型以及對未來AI世界的暢想。許多已功成名就、處于半隱退狀態(tài)的明星創(chuàng)業(yè)者,如李開復、王小川、王慧文等,也不甘心錯過這次難得的技術浪潮,再次出山。
而現(xiàn)在這股亢奮的情緒開始退潮。不少投資人的耐心逐正在逐漸被消耗,與企業(yè)之間的關系產(chǎn)生了裂痕。今年11月,大模型明星創(chuàng)業(yè)公司“月之暗面”與前投資人“反目”,走到仲裁的事件在業(yè)內(nèi)引起廣泛關注。
根據(jù)桔子IT數(shù)據(jù),今年以來(1月1日~12月5日),國內(nèi)AI領域發(fā)生439起融資案例,總?cè)谫Y金額超564億元,大概是去年的80%。粗估來看,今年以來AI領域月均融資金額不到50億元。并且機構縮減投資是普遍現(xiàn)象。據(jù)清科研究中心不完全統(tǒng)計,今年上半年國內(nèi)對外投資活動的早期投資、VC、PE機構數(shù)量同比分別減少23.9%、19.2%、25.2%。
因此如果說2023年,各家大模型廠商們都在專注于打磨模型參數(shù)、模型性能、榜單排名等各個方面的能力,爭相渴望成為“中國的OpenAI”,那么2024年,越來越多的人變得更加務實,開始更關注落地場景和商業(yè)化。
尤其是進入今年下半年,整個行業(yè)的風向更加微妙。市場逐漸對大模型祛魅,資本也回歸理性,行業(yè)的兩股勢力也發(fā)生了站位的轉(zhuǎn)換。
一邊是阿里、字節(jié)等巨頭投入的動作明顯加快,收編大模型創(chuàng)業(yè)公司的核心人才,推出一系列AI產(chǎn)品;一邊是創(chuàng)業(yè)公司開始重新評估自身的路線,國內(nèi)“AI六小虎”有兩家逐步放棄預訓練模型,業(yè)務重心轉(zhuǎn)向AI應用。
“AI大模型(賽道),將只剩下10家企業(yè)扮演重要角色。”中國工程院外籍院士張亞勤曾表示。這幾乎是行業(yè)的共識,最后的勝利屬于少數(shù)的玩家。
大模型最終會進化成什么樣,還不確定,但可以確定的是,大模型浪潮下,技術仍在迭代,場景仍在驚艷,商業(yè)化也始終在探索的路上。
02. 路線上:從堆算力到強化邏輯學習,從大模型到小模型
2024年大模型行業(yè)的第二大變化就是技術路線上不再僅僅是堆算力,而是探索強化學習、知識計算、符號推理、類腦計算及其他新型路徑。其中投入更小,更垂直的小模型不斷涌現(xiàn)。
近年來,大模型發(fā)展迅速,以其出色的性能,在語音識別、自然語言處理、圖像識別等多個領域取得了顯著成果。這些大模型通過深度學習技術,能夠處理海量的數(shù)據(jù),并從中提取出有價值的特征和信息,為各種應用場景提供強大的支持。特別是在金融、醫(yī)療、教育等行業(yè),大模型的應用已經(jīng)逐漸深入到核心業(yè)務領域,成為推動企業(yè)創(chuàng)新發(fā)展的重要動力。
然而,大模型的發(fā)展也面臨著一些挑戰(zhàn)。首先,大模型的訓練和推理需要消耗大量的計算資源,這使得其成本高昂,且只有少數(shù)大型企業(yè)能夠承擔。其次,大模型在處理特定領域的問題時,往往需要大量的數(shù)據(jù)進行微調(diào),以適應不同的應用場景。此外,隨著大模型規(guī)模的不斷擴大,其可解釋性和隱私保護問題也日益凸顯。
并且單純擴大規(guī)模,存在幻覺、效率、可信、安全等瓶頸,現(xiàn)在讓一個大模型做一個奧數(shù)題和計算2+2這樣簡單的算術題,需要的運算量、運算次數(shù)是一樣的。所以,我們能否把大模型做得更安全、更高效,更好解決現(xiàn)在存在的一些瓶頸?
需要指出的是本輪的AI浪潮,核心其實是LLM,即語言大模型——參數(shù)量數(shù)十億乃至上百億,需要專門的GPU集群,訓練成本極高——真正能跑出來的產(chǎn)品,無一例外,都是用真金白銀堆砌起來的。
但AI顯然是要普及的,封閉、資本密集的大模型并不符合這樣的大趨勢。于是乎,開源的小模型成為了新的熱點——大模型的體量,使得它在手機、物聯(lián)網(wǎng)設備等小型終端上部署起來頗為麻煩,但小模型則不同。尤其是那些要求快速反應的領域,比如語音和圖像的識別處理,小模型的處理效率也會更快——某種程度上說,小模型相當于是大模型的精華版。
相較于大模型,小模型在特定場景下展現(xiàn)出了獨特的優(yōu)勢。一是小模型具有較低的計算復雜度和資源消耗,這使得其能夠在資源受限的環(huán)境下運行,如移動設備、邊緣計算節(jié)點等。二是小模型往往針對特定任務進行優(yōu)化,因此在某些應用場景下能夠取得與大模型相近甚至更好的性能。三是小模型的可解釋性較強,更易于被用戶理解和接受。以openai的GPT-4o mini來說,成本下降的情況下,質(zhì)量反而更高,這就是數(shù)據(jù)集和訓練方式改變后帶來的突破。
03. 應用上:從對話到多元應用,AI Agent、具身智能等涌現(xiàn)
2024年大模型行業(yè)的第三大變化就是應用不斷迭代。根據(jù)lifearchitect.ai數(shù)據(jù),截至目前,全球總共有467個大模型。新技術不斷涌現(xiàn),行業(yè)競速賽愈演愈烈,大模型廠商都在不斷迭代升級,旨在離AGI更進一步。進入到今年,除了應用上的百家爭鳴,一個明顯的變化在于,以ChatGPT為代表的大語言模型局限性日益顯現(xiàn)。
例如,他們只能處理文本領域的任務,無法與物理和社會環(huán)境進行互動;雖然大模型語料庫已經(jīng)十分豐富,但關于人類的價值觀的文本,他們并不具備理解能力。
在此前提下,OpenAI今年9月推出的o1系列模型重點在于會思考。彼時,OpenAI CEO奧特曼對o1信心滿滿,“我認為這次 o1 模型發(fā)布最重要的信息是,AI 發(fā)展不僅沒有放緩,而且我們對未來幾年已經(jīng)勝券在握。”
與GPT系列模型不同,o1系列模型有更強大的“思路鏈”,模型會在思考后回答用戶問題,輸出高質(zhì)量的內(nèi)容,而非迅速回應無效回答。此外,o1系列更擅長推理,推理能力大幅提升,特別是在奧數(shù)、編程等領域展現(xiàn)出了優(yōu)勢。
行業(yè)風向標的新動作,引發(fā)國內(nèi)大模型廠商的追趕。11月16日,月之暗面公布了k0 math;11月20日,Deepseek上線DeepSeek-R1-Lite大模型;11月27日,昆侖萬維推出“天工大模型 4.0” o1 版……無一不在強調(diào)大模型的邏輯思考能力。
與此同時,到了今年下半年,幾乎人人都在談“AI Agent”(人工智能代理,也可稱為“智能體”)。在海外市場,微軟、蘋果、谷歌、OpenAI、Anthropic等科技巨頭紛紛公布相關進展;在國內(nèi)市場,百度、阿里、騰訊、智譜、榮耀、聯(lián)想等一眾廠商的智能體平臺也紛至杳來,一場圍繞“AI Agent”的爭奪戰(zhàn)正悄然開啟。
所謂“AI Agent”,OpenAI將“AI Agent”定義為以LLM為大腦驅(qū)動,具有自主理解、感知、規(guī)劃、記憶和使用工具的能力,能自動化執(zhí)行復雜任務的系統(tǒng)。不同于傳統(tǒng)人工智能,AI Agent 具備通過獨立思考、調(diào)用工具去逐步完成給定目標的能力。
舉個簡單的例子,如果用戶想要進行一次家庭聚餐,LLM可以為其提供就餐地點和店鋪相關信息提示,而AI Agent不僅能夠提供擇店鋪建議,還能基于用戶預算搜索菜系和店鋪,執(zhí)行預訂操作,并將行程添加到日歷,還可以發(fā)送行程提醒。
有觀點認為,AI Agent的出現(xiàn)是為了解決LLM在具體應用場景中的局限性。LLM雖然具備了一定的智能,能夠生成文本、圖片和視頻等內(nèi)容,但其功能相對有限,無法獨立完成復雜的任務。AI Agent作為大模型的上層應用,能夠通過感知環(huán)境、進行決策和執(zhí)行動作,幫助大模型實現(xiàn)更多的功能,從而更好地為各行各業(yè)賦能。
此外具身智能也是大模型應用的一大分支。所謂具身智能是指將人工智能(AI)融入機器人等物理實體,賦予它們具有像人類一樣的感知、學習和與環(huán)境動態(tài)交互的能力。在生活中,可感知周邊環(huán)境的智能掃地機器人、已進入路測的自動駕駛汽車,都可被視為具身智能的雛形,而人形機器人則是具身智能最理想的載體。
以上種種,其實都可以視為行業(yè)在為大模型尋找最適合的“殺手級”應用。
04. 結(jié)語:朝著AGI的星辰大海,不斷前進
綜上,無論是理念的變化,亦或是路線的選擇,還是應用的迭代,最終的目的就是一個——走向AGI(通用人工智能)。
所謂AGI,即能夠執(zhí)行任何智能任務的人工智能,是人類智慧的延伸,也是未來科技的燈塔。它不僅僅是對特定任務的自動化,而是對人類智能的全面模擬,包括學習、推理、規(guī)劃、感知、語言理解和創(chuàng)造力等。在這條道路上,我們正逐步攻克技術難題,從深度學習到神經(jīng)網(wǎng)絡,從自然語言處理到機器視覺,每一次技術的突破都是朝著AGI目標邁進的一大步。科學家們在算法優(yōu)化、數(shù)據(jù)集構建、硬件加速等方面不懈努力,以期構建出更加智能、更加靈活、更加接近人類思維的AI系統(tǒng)。
盡管挑戰(zhàn)重重,但人類對知識和智慧的追求從未停止。筆者相信,隨著技術的不斷進步和人類智慧的不斷積累,AGI終將成為現(xiàn)實。它將幫助我們解決復雜的問題,提高生活質(zhì)量,甚至開啟人類文明的新篇章。而在這個過程中,我們不僅要追求技術的極致,更要思考如何讓技術更好地服務于人類,如何確保AGI的發(fā)展能夠促進社會的公平與和諧。
原文標題 : 年終盤點:AI大模型今年有哪些變化?
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構工程師 廣東省/深圳市
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容