日韩欧洲在线高清一区,日本在线看片免费人成视频1000

半年大模型，還在天上飛

2023-08-04 11:54

撰文 | 吳坤諺

編輯 | 吳先之

大模型的火，已經在這片土地上燒了半年。隨著華為、京東、攜程三家發(fā)布會趕上晚集，按互聯(lián)網一貫的范式，國產大模型這個“新東西”也迎來了自己的半年考。

只是跟其他業(yè)務的半年考有所不同，像新能源車、手機、電商平臺等業(yè)務形態(tài)的半年考，都有足夠的公開數(shù)據信息為支撐，便于考據分析，而大模型到現(xiàn)在都還處一個“黑盒子”的狀態(tài)，沒能跑出一個清晰的商業(yè)模式，所謂數(shù)據信息等論據也就無從談起。

頗為戲謔的是，即使是從產品功能角度出發(fā)，大模型也未曾誕生通用的評測手段。面向AGI這一終極目標，評測方法自然五花八門，例如國內C端用戶賴以“測評”大模型的典中典——“松鼠鱖魚法”。

或因如此，國內大廠大多未能像OpenAI一般將自家大模型開放使用，而是實行內測機制。

而大模型更多的落地探索向B端與G端傾斜，例如騰訊先聲奪人的行業(yè)大模型以及華為的盤古3.0、京東靈犀等。作為目前頭部玩家聚焦的賽道，其大模型偏重盡可能展現(xiàn)成熟的產品形態(tài)，以商業(yè)化落地為基本目標。例如這一類大模型為了快速向下普及推動商業(yè)化，除卻業(yè)務落地導向外，本地化部署能力也成為重要的參考指標。

即使如此，在業(yè)內人士看來已經是“把碗送到面前”的行業(yè)大模型仍缺少買賬的企業(yè)，行業(yè)模型的風自6月起已經吹了一個月，至今未曾出現(xiàn)較大規(guī)模的商業(yè)合作。

因此我們也不難看到，在如今的投資市場中，與大模型相關的投資集中于二級市場而非一級市場。即使是王慧文這個級別的大牛入場，公開消息稱其A輪融資遠高于2.3億美元，其融資能力相較時不時接收微軟百億美元投喂的OpenAI不可同日而語。

投資市場是合格的晴雨表。顯然，國內大模型在半年考的時間節(jié)點所提交的答卷不盡如人意，還需要一段時間的蟄伏與打磨，才能讓“故事”成真。

大模型沒有商業(yè)模式？

在國內的大模型需要回應市場的質疑中，商業(yè)模式應該擺在首位。

ChatGPT這位早已占據用戶心智的頭把交椅出現(xiàn)熱度的明顯下降，國內最早發(fā)布通用大模型百度與阿里兩家也在一眾玩家跟進后陷入“沉寂”。究其原因，在于通用大模型的商業(yè)模式未能跑通。即使在輿論場上獲得了用戶的認可，但商業(yè)閉環(huán)始終未能出現(xiàn)。

以測試范圍較廣泛的百度大模型為例，其商業(yè)化應用文心千帆的付費模式是以調用生成的 token 數(shù)量收費，標準為0.012元/千 tokens，輸出千字文稿需花費0.12元。

撇開其回收成本的速度不談，0.012元/千 tokens的收費看看似便宜，但文本生成往往需要多次交互后才能獲取理想結果，多次交互prompt將會無限量增加隱性成本，畢竟文心千帆可不是揮之即來的員工們。

與之相似的場景是問答社區(qū)，學界人士孫權（化名）告訴光子星球，模型應用的使用體驗與問答社區(qū)中搜尋高質量答案相似，其用戶思維是問題粒度，而付費意愿往往只會在找到高質量回答之后才會產生。因此百度選擇了推理文本數(shù)為付費標準，只是目前還無法cover商用隱性成本。

如果采用B端喜聞樂見的月度付費，那也只是將成本支出方從用戶轉為自己，顯然不是長久之計。ChatGPT面對C端用戶20美元/月的定價之下，尚且存在偷工減料之嫌便是最佳佐證。

當下，通用大模型的商業(yè)化無論是走B端還是C端都難以做到盈虧平衡，同時還很可能遭遇諸如AI倫理、監(jiān)管等合規(guī)性風險。因此，大模型的行業(yè)化、垂直化成為落地需求下的范式轉變。

反觀行業(yè)大模型，雖說其產品形態(tài)始于落地需求，但是在實際落地中出現(xiàn)的問題卻也有待解決。

一類值得參考的案例是依托自身產品生態(tài)而打造的垂類to C模型，例如知乎早早宣布于產品內進行內測的知海圖AI以及前不久才發(fā)布的攜程問道。

兩者切入大模型賽道的優(yōu)勢并無二致，在于自有的社區(qū)生態(tài)和以此為基礎衍生的高質量社區(qū)內容。而內容作為行業(yè)數(shù)據，在簡單清洗后便可成為大模型的訓練語料。兩者的細微差別則是知乎自始便是內容社區(qū)，而攜程則是近年才開始發(fā)力做內容。

可是就目前來看，無論是知乎還是攜程，其大模型的產品形態(tài)似乎都未能切中用戶痛點，亦未能對既有功能有足夠的提升。

知海圖AI目前已公布的產品“熱榜摘要”是通過AI抓取優(yōu)質問答并潤色改寫出梗概呈現(xiàn)給用戶，而另一項應用“搜索聚合”則是自回答中聚合觀點，提高用戶獲取信息、形成決策的效率。

本身推薦、熱榜一類聚合功能便是知乎“傳統(tǒng)藝能”，大模型賦能后的表現(xiàn)在用戶層面并未掀起水花。況且，AI改寫潤色的流程也將熱門答案的個性化特征覆蓋，于用戶而言，這項應用的功能僅在于快速了解信息，這與內容社區(qū)所倡導的差異化、個性化交流背道而馳。

而立足OTA的攜程問道，在攜程董事局主席梁建章看來是一個旅游業(yè)的“可靠答案庫”。其產品成效如何還需時間檢驗，但自定位來看，同樣有“舍本逐末”之嫌。

旅游在年輕用戶眼中本就不存在標準答案，“特種兵式”、“打卡式”、“沉浸式”等多樣化旅游形式的出現(xiàn)證明了這一點。如假設大量用戶通過AI制定旅游路線規(guī)劃，千篇一律的路線規(guī)劃反而會影響社區(qū)交流與氛圍，甚至遭致用戶停留時間的下降。

大體看來，垂直模型在C端的落地嘗試算不上順利，甚至有成為“沉沒成本”的可能�；蛟S受到大模型本身“提高效率”神話的影響，產品定位也大多囿于“效率”二字，只是效率僅僅是用戶體驗中一個不算核心的維度。

相同的范式在to B領域也有所展現(xiàn)，而在追求效率的B端，行業(yè)大模型的商業(yè)模式與落地問題得到了更深刻的展現(xiàn)。

摸不清的黑匣子

“AI不是物理，很少有理論上的重大技術突破，更多的是在模型結構、數(shù)據質量等維度做微調和小優(yōu)化，甚至很多時候模型輸出更好了，團隊卻找不到原因。”

在一位業(yè)內人士看來，大模型在業(yè)內外存在巨大的認知偏差，而原因則在于大模型訓練以及AI行業(yè)對于外界而言是一個不折不扣的“黑匣子”，很難審視大模型產生輸出結果的推理過程，它看不見摸不著。

這導致外界在度過ChatGPT帶來的狂熱期后，一旦冷靜下來，便會對大模型這個“黑匣子”持審慎態(tài)度。這將導致大模型在落地上的困境，而這一現(xiàn)象在如今向to B路線轉變的過程中更為明顯。

以如今已明確to B路線的大廠出品為例，包括騰訊云推出的MaaS技術方案、華為云推出的盤古大模型等，依靠自身云計算生態(tài)，均稱其大模型服務支持多樣化部署，包括云端部署、本地化快速部署等。在交互、操作、后續(xù)加入新的行業(yè)數(shù)據迭代優(yōu)化等方面也有建樹，可以說是為了落地，把大模型的門檻降到了極低。

但“審慎”帶來的認知墻還是沒有打破，即使ChatGPT的風吹了半年，許多企業(yè)沒有動力也沒有興趣去研究如何導入大模型。

數(shù)年前的云計算行業(yè)可以看到因循的相似邏輯。云計算是在認識到數(shù)據價值后，以此為基礎的服務和衍生，至于大模型于企業(yè)的價值，相對而言更是數(shù)據價值的躍升。同樣是企業(yè)客戶缺乏的技術能力，連云計算在國內企業(yè)的普及之路都距終點尚遠，大模型自不必說。

行業(yè)大模型究竟好用與否，其實已經并不重要了，畢竟商品的使用價值最終還需使用者來挖掘。更有甚者，外界會粗暴通過某些測試、表現(xiàn)來衡量模型水平，例如“松鼠鱖魚法”或近來因預測特大臺風“杜蘇芮”的登陸地點與強度有錯誤現(xiàn)象而遭受質疑的華為盤古氣象大模型。

或許正因如此，于近期發(fā)布的京東靈犀大模型選擇優(yōu)先跑通自家業(yè)務場景，預計于明年初方對“外部嚴肅商業(yè)場景”開放。

更值一提的是，“行業(yè)成風”之下，商業(yè)化導向下的所謂行業(yè)模型在取代大模型原本的“通用”敘事的同時，也遭致不少人的“迷失”。

所謂行業(yè)大模型的定義存在模糊不清。大模型（Foundation Model）的內涵不在于參數(shù)量多少而在于使用通用數(shù)據訓練而涌現(xiàn)出的通用能力。如采用同樣的模型架構，但在數(shù)據上使用單一領域數(shù)據，不僅喪失了通用能力，甚至會由于涌現(xiàn)的折扣導致領域問題也無法解決。

如在原大模型基礎上使用行業(yè)數(shù)據做二次預訓練，相當于微調了原模型，那么即產品本身仍處于模型層，可以被稱作行業(yè)大模型；如通過prompt或外掛數(shù)據庫的方式加入領域知識，那便僅是對原模型能力的激發(fā)，產品也應歸屬至模型之上的應用層，稱之為行業(yè)大模型言過其實。

目前大廠中發(fā)力行業(yè)大模型的絕大多數(shù)均是前者，如騰訊、京東、華為等。后者則由于更輕的投入與快速提高模型能力的表現(xiàn)，更多會出現(xiàn)在開源社區(qū)中，例如前段時間引發(fā)熱議的法律大模型ChatLaw。

“相比前者，后者在產品形態(tài)上更為成熟，便于快速構建模型能力，但后者在完成灌輸領域知識的流程后，往往上限會更高”，一位業(yè)內人士稱。

開源威脅

近日，Meta在開放商用許可下免費提供其最新開源大模型Llama2，并將其引入微軟的Azure平臺，此舉被譽為開源LLM的重要里程碑，甚至開始威脅閉源的頭部廠商OpenAI的地位。

通過微軟這個大模型金主，Meta以更開放的姿態(tài)挑戰(zhàn)OpenAI。

實際上，“開源派”早在此前便以第三方的身份悄然崛起。“我們沒有護城河，OpenAI 也沒有。”這句話出自5月谷歌意外泄露的一份內部文件。其內容大意是表面上， OpenAI 和谷歌在大模型上你追我趕，但真正的贏家未必會從這兩家中產生，下此判斷的原因便在于愈加豐富的開源生態(tài)。

開源生態(tài)愈發(fā)活躍，乃至于出現(xiàn)了模型能力的代表Llama2以及Finetune（模型微調）范式的代表技術LORA，這一切都讓閉源爭取“大力出奇跡”的巨頭廠商感受到明顯寒意。

開源的技術分享以及人才流轉等因素，也在讓大模型的黑匣子愈發(fā)“玻璃化”，缺少壁壘的必然結果是大廠在巨量資金、時間的投入下的Konw How輕易為開源社區(qū)所傾覆。

國內頭部大廠對此的應對大多是“兩手抓”。左手“關門造車”，以小規(guī)模內測形式不斷打磨產品形態(tài)與能力，右手“集思廣益”，以云端開發(fā)者生態(tài)為基礎打造生態(tài)內的開源社區(qū)，但這剛需廠商自算力層、模型層到應用層的全棧布局。阿里云推出了大模型開源社區(qū)魔搭GPT，華為云、百度云、騰訊云也都有所布局。

總體來看，無論是行業(yè)還是通用，to C還是to B，大模型的半年考給予我們的直接感覺是：落地困難，盈利預期不斷后移；風險漸強，難言技術壁壘。那么，當下的破局之路在哪？

目前而言，有兩個有意思的方向。其一是被譽為“ AI 時代的Memory”的向量數(shù)據庫，其二是模型智能賦予下的智能硬件。

所謂向量，即是可以代表任何東西的多維數(shù)據，包括如今LLM訓練最為重視的文本，以及圖像、視頻、音聲等。這些形式的內容會在數(shù)據庫中清晰表示，并且支持語義檢索，即通過相似性檢索，例如男人與男孩。換句話說，于大模型而言，向量檢索就是大模型的SEO。

如上文所述，領域知識可以通過向量數(shù)據庫能力，或是精調或是外掛來提高行業(yè)模型的建構和使用，于大廠而言自然是下一階段的發(fā)力點所在。自5月起，資本便不斷涌入向量數(shù)據相關賽道，作為前景更為確定的應用層產品，向量數(shù)據也收獲了一眾VC的密切關注。

至于智能硬件內置模型，則是相對曾經的“siri”、“小愛”等智能助手的能力躍升，也是對真正的智能設備（手機、電腦）的外延拓展。開源社區(qū)內早有將大參數(shù)模型內置MAC的嘗試，而大廠則是在過去的移動互聯(lián)網時代便積累了一定硬件生產能力，相對而言其先發(fā)優(yōu)勢更為明顯。

少了PR式的春秋筆法，落地成為核心需求的大模型不再神秘，故事也越來越少，開始“深潛”的賽道玩家們仍在發(fā)力。行業(yè)需要下一個“ChatGPT”時刻，我們方能見到潛水者浮出水面，正面對抗。

原文標題 : 半年大模型，還在天上飛丨祛魅AI