實測訊飛星火App:沒有感情、只有公式
作者|孫鵬越
編輯|大 風
自2022年11月OpenAI推出ChatGPT以后,一場波及全球科技的“海嘯”就此爆發(fā)。
國產AI大模型成了2023年上半年最火熱的項目,僅僅在4月份,就有二三十家大模型宣布成立,其中不乏阿里巴巴通義千問、華為云盤古、360GPT、昆侖萬維“天工”大模型、京東言犀、知乎“知海圖 AI”等互聯(lián)網巨頭。
2023年5月6日,科大訊飛發(fā)布“訊飛星火”認知大模型,正式加入了AI大模型的“千模大戰(zhàn)”。
僅過了一個月的時間,在6月14日,訊飛星火大模型正式內測,并上線IOS和安卓版本,可以說科大訊飛的AI研發(fā)速度異常迅捷。
但“閃電戰(zhàn)”的背后則是高昂的“軍備”。訊飛星火的開發(fā)耗費了巨額硬件成本和開發(fā)費用,甚至一度影響了科大訊飛2023年Q1季度的當期利潤。
在科大訊飛財報凈利潤持續(xù)走低的當下,現(xiàn)金流已經吃緊,對AI大模型后續(xù)的研發(fā)和升級都需要持續(xù)燒錢,這對科大訊飛來講也是不小的挑戰(zhàn)。
實測訊飛星火
目前在AppStore上,訊飛星火App版本為1.0.06,已經累計362個評價,評分高達4.8。
訊飛星火仍處于內測狀態(tài),需要注冊賬號之后,填寫申請表,并寫下自己所在公司才能提交申請,最后由科大訊飛審核通過后才能使用。
訊飛星火官網
訊飛星火主要推出的五種使用場景為:語言理解、知識問答、邏輯推理、數(shù)學題解答、代碼理解與編寫,每個場景下又細分出十幾個到幾十個不同的功能。
科大訊飛對于訊飛星火的數(shù)學能力頗為推崇,鋅財經分別提問了一道七年級數(shù)學題和高考數(shù)學題,以實測了一下關于訊飛星火解析數(shù)學題的能力。訊飛星火均回應出正確答案:
鋅財經實測
緊接著測試代碼理解與編寫,讓訊飛星火寫一個俄羅斯方塊的程序代碼,訊飛星火也能做出立即響應:
鋅財經實測
但對于文章撰寫方面,訊飛星火卻頗為吃力,鋅財經給出一個明確的寫作背景,但是訊飛星火并沒有構思出通順的故事情節(jié),反而有種東拼西湊的矛盾感:
鋅財經實測
同時,在測試訊飛星火情感理解和邏輯推理的提問:有兩個小姑娘,Sally和Anne,她們每個人都有一個箱子,Sally的箱子里有一顆玻璃珠子,但是Anne沒有;有一天,Sally出門了,Anne偷偷打開了Sally的箱子,偷走了玻璃珠子放進了自己的箱子里,那么,等到Sally回到家里要找自己的珠子,她應該去誰的箱子里找?
鋅財經實測
如果一個人有健全的讀心能力,那么他應該能想到:“Sally是不知道Anne偷了自己的珠子的,所以肯定會先去自己的箱子里找”;而訊飛星火則是上帝視角行動,所以會認為Sally要去Anne的箱子里找。
通過對比正常人類和訊飛星火截然相反的回答,我們能清晰的得知,訊飛星火在情感理解和邏輯推理仍有較大的空缺。
綜上測試可以發(fā)現(xiàn),在數(shù)學和編程方面,訊飛星火的算力都處于大模型產品的前列,在互聯(lián)網上能搜索到答案的問題都能立即響應給予準確答案。但是在文章撰寫、情感和邏輯上,訊飛星火還是能很明顯看到生硬的AI邏輯。
套殼還是創(chuàng)新?
雖然訊飛星火已經是國產AI大模型的佼佼者,但外界對于它的質疑從未停歇。其中,質疑聲最大的傳聞,就是訊飛星火“套殼”ChatGPT。
5月9日,網上一段關于訊飛星火的群聊記錄在各個群廣為流傳,一張截圖顯示,得到內測資格的提問者咨詢訊飛星火:“你的開發(fā)API哪里可以看到?”訊飛星火則表示:“是的,我是由OpenAI開發(fā)的”。
一時間引發(fā)軒然大波,不少用戶調侃訊飛星火:“國外一開源,國內創(chuàng)新遍地開花。”并將其與“總線事件”掛鉤,也就是指某些公司在開發(fā)對話AI時直接使用已經存在的模型或代碼,而非自己研究開發(fā),從而導致產品的質量和創(chuàng)新性受到質疑。
面對質疑聲,科大訊飛回應稱:“這種說法既不符合事實,也不符合邏輯。訊飛星火大模型是基于科大訊飛自主研發(fā)的深度學習框架XDL和自主搭建的超算平臺X-Brain構建的,兩者之間并不存在“套殼”關系。”
是“套殼”還是“創(chuàng)新”,AI大模型就像是著名哲學問題“忒修斯之船”:如果忒修斯的船上的木頭被逐漸替換,直到所有的木頭都不是原來的木頭,那這艘船還是原來的那艘船嗎?
把別人開源的模型拿過來直接用,在自然語言處理科研領域是很常見的的做法,但如果“借鑒”了ChatGPT,那還算是原創(chuàng)的大模型嗎?
推出大模型,再經歷被質疑“套殼OpenAI”事件,科大訊飛想要殺出重圍不容易,但它太需要一個落地的AI大模型產品來振奮市場了。
來源:科大訊飛
2023年4月20日,科大訊飛發(fā)布2022年全年財報:營收188.20億元,同比微增2.77%;凈利5.61億元,同比下滑63.94%;扣非后歸母凈利4.18億元,同比下滑57.31%。
這份堪稱“差生成績單”的財報,一舉打破科大訊飛多項紀錄:營收增速個位數(shù),打破了2012年起連續(xù)10年的兩位數(shù)增態(tài);凈利腰斬,打破了2018年以來的四連增。
2022年的寒氣一直吹到了2023年。據科大訊飛2023年Q1季度財報顯示:實現(xiàn)營業(yè)收入28.88億元,同比下降17.64%;凈利潤虧損5790萬元,同比下降152.25%,扣非后歸母凈虧損3.38億元,去年同期為1.46億元。
除了虧損,科大訊飛的現(xiàn)金流也頗為緊張。
財報顯示,2023年Q1季度公司資產負債比率為48.73%,負債合計金額近150億,其中應付票據及應付賬款高達63億元;Q1季度現(xiàn)金流金額為-166.84億元,科大訊飛的資金壓力較大。
在發(fā)布這份“差生成績單”的第二天,科大訊飛股價大幅跳水9%。無奈之下,科大訊飛只好宣布即將推出認知大模型“星火”,全力押寶AI大模型,才讓股價重新上漲。
訊飛星火,成了科大訊飛的救命稻草。
押寶AI大模型
2022年12月15日,科大訊飛正式啟動“1+N”認知大模型專項攻關,其中“1”就是指通用認知智能大模型,“N”就是大模型在教育、辦公、汽車、人機交互等各個領域的落地。
為了大模型,科大訊飛在今年Q1季度研發(fā)投入高達7.157億,可謂是下了血本。
為了不讓巨額投資打了水漂,科大訊飛為訊飛星火搖旗吶喊,不斷在公開場合稱贊訊飛星火的算力強大。據公開信息統(tǒng)計,訊飛星火手機版本上線的前后幾天里,科大訊飛股價再度拉升近17%,6月14日收盤價達到75.13元,股價創(chuàng)歷史新高。
雖然依靠資本市場對于AI大模型的熱度,讓不斷下探的財報有了喘息之機。但AI大模型并不是“吃草的牛”,反而是“吃肉的狼”。
來源:科大訊飛
據了解,大模型所需要的硬件成本極為高昂,上一代GPT-3模型需要1024張A100 GPU芯片才能支撐起一次訓練,OpenAI至少需要32400張A100芯片用于日常推理,單ChatGPT硬件成本,就高達8億美元以上。
訊飛星火開了個好頭,但保持一定算力水準仍然需要后續(xù)不斷的升級、不斷持續(xù)的投入。
按照科大訊飛官方公布的消息,星火認知大模型今年的產品規(guī)劃如下:6月9日:突破開放式問答、多輪對話能力再升級、數(shù)學能力再升級(已完成);8月15日:突破代碼能力、多模態(tài)交互再升級;10月24日:通用模型對標ChatGPT (中文超越,英文相當) ……
而每一次的升級,背后都是數(shù)以億計的研發(fā)費用和硬件成本,無疑是科大訊飛沉重的包袱。
原文標題 : 實測訊飛星火App:沒有感情、只有公式
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-12.26立即報名>>> 【在線會議】村田用于AR/VR設計開發(fā)解決方案
-
1月8日火熱報名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會
-
即日-1.14火熱報名中>> OFweek2025中國智造CIO在線峰會
-
即日-1.24立即參與>>> 【限時免費】安森美:Treo 平臺帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網產業(yè)大會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市