實現(xiàn)AGI道路上,數(shù)據(jù)科學(xué)家防不勝防的9大陷阱
最近幾個月,科技研發(fā)的速度也越來越快。微軟宣布將投資10億美元,與科研實驗室OpenAI聯(lián)手打造通用人工智能(AGI),也就是人工智能的最高目標。OpenAI的首席執(zhí)行官Sam Altman表示,AGI將成為人類歷史上最重要的技術(shù)。
對于某些特定的任務(wù),計算機能做得比人類好很多。但他們不具備智慧、常識和批判性思維,因此它們無法像人類那樣去應(yīng)對一些特殊情況(比如一些未定義的情形、模糊的規(guī)則、模棱兩可甚至自相矛盾的要求)。隨著技術(shù)的發(fā)展,計算機也許能做到人類大腦能夠完成的任何事情,但之前微軟的表現(xiàn)并不讓人滿意。
2016年,微軟發(fā)布了聊天機器人Tay,這家公司稱“它能與人類在線交流,語言隨和風(fēng)趣”。Tay的編程語言讓它表現(xiàn)得像一位千禧一代的女性,在學(xué)習(xí)訓(xùn)練過程中,它就是在模仿千禧一代的講話方式。微軟表示,“你和Tay聊得越久,那么它就會越聰明。”在不到一天的時間里,Tay發(fā)送了9.6萬條推特,擁有超過5萬名關(guān)注者。但這個問題最終出在Tay自己身上,它講的內(nèi)容越來越令人厭惡!霸资菍Φ,我討厭猶太人!薄911事件是有內(nèi)幕的!薄拔曳浅S憛捘切┡畽(quán)主義者。”Tay非常善于利用它接收到的詞匯和詞組,但它無法根據(jù)語境來說話,也不理解自己發(fā)送的推特到底是什么意思。因此微軟在16個小時后就關(guān)閉了Tay,但不到一周,它又重新上線。后來微軟稱第二次上線是個意外,并再次關(guān)閉了Tay。
AGI也許是一個美好的夢想,而數(shù)據(jù)科學(xué)讓我們有機會去利用大數(shù)據(jù)和強大的計算機,作出基于現(xiàn)實而非空想或偏見的決策。但不幸的是,在數(shù)據(jù)大規(guī)模出現(xiàn)之后,企業(yè)和政府仍然在重復(fù)之前犯過的一些錯誤,而且重復(fù)的速度更快。將重要的決策交給機器,只是實現(xiàn)了“犯錯的自動化”。
數(shù)據(jù)科學(xué)不僅僅是數(shù)學(xué)證明、統(tǒng)計計算和計算機編程。真實的人類智能也必不可少:比如實驗設(shè)計、智慧、常識、懷疑和批判思維等。數(shù)據(jù)科學(xué)家并不是要成為一臺機器,不斷地嘗試新模式,不斷地進行曲線擬合;他們更應(yīng)該成為一位科學(xué)家。
如果數(shù)據(jù)科學(xué)家想要充分挖掘數(shù)據(jù)科學(xué)的潛力,他們應(yīng)該避免以下九種常見的錯誤。
1.使用劣質(zhì)的數(shù)據(jù)
第一代機械計算機的投資者Charles Babbage曾被國會成員兩次提問:“Babbage先生,如果我們給計算機輸入錯誤的數(shù)據(jù),那么它會得到正確的答案嗎?”顯然優(yōu)質(zhì)的數(shù)據(jù)必不可少,而非可有可無。
芝加哥醫(yī)院對一批膿毒癥患者進行過一次研究,它發(fā)現(xiàn),血液pH值較低的患者在出院后,重新回醫(yī)院治療的可能性更低。兩者的相關(guān)系數(shù)達到了0.96。但是這些數(shù)據(jù)還包含了一些在住院期間死去的患者,也就是說這些患者通過太平間離開了醫(yī)院,是絕對不可能回來重新治療的。最后將這些死者的數(shù)據(jù)去掉,就會發(fā)現(xiàn)血液pH值較低的患者反而是更加危險的。
2.將數(shù)據(jù)的地位放在理論之上
一些數(shù)據(jù)科學(xué)家在沒有理論和常識的指導(dǎo)下,為了模型搜索大量數(shù)據(jù)。他們認為對于一個問題的定向思維會影響新的發(fā)現(xiàn)。然而不幸的是,大多數(shù)時候泛濫的數(shù)據(jù)都是沒什么意義的。大數(shù)據(jù)領(lǐng)域的一個悖論就是,我們?yōu)橐粋模型輸入的數(shù)據(jù)越多,最后發(fā)現(xiàn)它無用或錯誤的可能性越大。
一位互聯(lián)網(wǎng)營銷人員在大約100個國家測試過三種可選的登錄頁面顏色(黃色、紅色和藍綠色)與它傳統(tǒng)的藍色之間的對比,從理論上講,他應(yīng)該會發(fā)現(xiàn)某些國家采用特定的顏色,會帶來更高的收入。比如他認為英格蘭更喜歡藍綠色,但實際上并不是。
3.盲目崇拜數(shù)學(xué)
數(shù)學(xué)家熱愛數(shù)學(xué),非數(shù)學(xué)專業(yè)的人懼怕數(shù)學(xué)。這兩者的組合可能會催生大量不切實際的模型。
在經(jīng)濟大蕭條時期,由于假定違約事件的發(fā)生是獨立分布的,許多按揭貸款違約的數(shù)學(xué)模型都失效了。這些人低估了極端事件的可能性,同時也沒有考慮在經(jīng)濟大蕭條的背景下,無法按期償還貸款的可能性本身就更高。
4.盲目崇拜計算機
常常有人認為,計算機做某些事情做得很好,所以它們一定有非常高的智能,但要知道適用于特定任務(wù)和普遍適用多項任務(wù)之間還有很大的差別(甚至這些任務(wù)還可能完全不一樣)。我們對計算機的依賴并非百利而無一害。如果認為計算機比我們更聰明,從而將所有決策交給計算機,可能會帶來災(zāi)難性的后果。
5.反復(fù)搗騰數(shù)據(jù)
為了尋找數(shù)據(jù)之間的隱藏關(guān)系,有些人會把數(shù)據(jù)按照多種方式進行分類。諾貝爾經(jīng)濟學(xué)獎得主羅納德·科斯就說過:“如果你不停地操作一些數(shù)據(jù),機器自己都會糊涂!钡髷(shù)據(jù)和強大的計算機卻助長了這種行為。
一位著名研究員曾在他的助手分析數(shù)據(jù)時,告訴后者“盡可能多地從數(shù)據(jù)中榨取信息”。當時他的助手試圖通過機器視覺將一間意大利自助餐廳的客人分為“男性、女性、吃中飯的、吃晚飯的、單獨吃飯的、兩人吃飯的、兩人以上一起吃飯的、點了酒精飲料的、點了軟飲料的”等。最后這些“榨取的信息”變成了四篇“披薩論文”,其中最著名的一篇稱“男性在女性一起吃飯時,會多吃93%的披薩”。如今他的十幾篇論文都被退回,人也被大學(xué)辭退。
6.自我欺騙
諾貝爾物理學(xué)獎得主理查德·費曼曾向科學(xué)家們提出過一條建議:“首要原則就是不要欺騙你自己——因為你自己是最容易被糊弄的!闭嬲目茖W(xué)家是分享自己的理論、質(zhì)疑自己的假設(shè),然后尋找機會做實驗來驗證或推翻假設(shè)。而擺弄數(shù)據(jù)的人只會看到自己想看的東西。
曾有一份研究要求一所高校的學(xué)生預(yù)測自己的數(shù)學(xué)測驗成績。結(jié)果預(yù)測的平均分數(shù)比實際分數(shù)要高,但兩組數(shù)據(jù)之間的相關(guān)系數(shù)高達0.70。因此作者得出兩條結(jié)論。第一,這些學(xué)生高估了自己的能力。第二,為提高學(xué)生的自信心,打分可以適當高一些。對于第一條,可能是學(xué)生低估了測驗的難度。對于第二條,較高的相關(guān)系數(shù)表明學(xué)生其實對自己的數(shù)學(xué)水平很有信心,少數(shù)認為自己考不好的,也只是不太熟悉材料。他們并不是太過于悲觀,而是非常現(xiàn)實。
7.把相關(guān)性當作誘因
不論被告知多少遍“存在相關(guān)性并不一定是誘因”,但研究人員總是會不自覺地忽略這條重要的建議。
2011年,谷歌創(chuàng)建了一個人工智能項目Google Flu,它用搜索請求來預(yù)測流感的爆發(fā)。當時他們夸下海口:“我們能精準地預(yù)測出美國各個地區(qū)未來一周的傳染狀況,每天更新一次!彼麄兎Q模型的精準度已經(jīng)達到97.5%,也就是模型預(yù)測結(jié)果和實際流感案例的相關(guān)系數(shù)已達到0.975。谷歌是怎么做到的呢?它的數(shù)據(jù)挖掘項目瀏覽了5000萬條搜索請求,并確定了其中45條請求最有可能和流感相關(guān)。由于流感的爆發(fā)具有高度的季節(jié)性,Google Flue更像是一個季節(jié)檢測器,它會挑選季候性的搜索詞匯(如圣誕節(jié)、寒假和情人節(jié)等)。當離開了歷史數(shù)據(jù),開始真刀真槍地預(yù)測時,Google Flu的準確率就大大地下降。在發(fā)布報告后,Google Flu誤報了未來108周內(nèi)的100起流感案例。從此,Google Flu再也不去預(yù)測流感了。
8.不要對平均值的回歸過于驚訝
當數(shù)據(jù)波動時,預(yù)測值可能會高于檢測值,但隨后就會繼續(xù)趨于平均值。比如一位高爾夫選手贏了大師錦標賽冠軍,不代表下一次他也能贏。并不是說他下次會倒霉,或者技術(shù)會退步,也許這次勝利本來就是超水平發(fā)揮。
數(shù)據(jù)也會在未來回歸平均值,這有點類似于防止一次“發(fā)揮失;虺0l(fā)揮”。例如一家數(shù)據(jù)科學(xué)公司做過一個實驗,它將一位客戶的網(wǎng)頁布局和100多萬域名中20個常用的布局進行比較。客戶們經(jīng)常會抱怨自己的網(wǎng)站表現(xiàn)不佳,認為網(wǎng)站本來還能賺更多的廣告營收。因此它給一位數(shù)據(jù)分析師一系列網(wǎng)站域名,這些網(wǎng)站在過去三個月的營收都在下降,分析師可以根據(jù)它來調(diào)整網(wǎng)頁布局,看看能否提高營收。結(jié)果他成功了,第二天的營收數(shù)額上漲了20%,當時他就仿佛一位萬眾矚目的搖滾歌手。但直到某一天他太忙了,來不及做任何改變,營收就開始下降。所以這些網(wǎng)站仍然屬于那些表現(xiàn)不佳的一類,他們的營收最終會回歸平均值。
9.不要傷害用戶
不幸的是,在大數(shù)據(jù)時代,企業(yè)和政府為了預(yù)測和影響我們的行為,都在時時刻刻搜集我們的數(shù)據(jù)。優(yōu)秀的數(shù)據(jù)科學(xué)家會很謹慎地處理這個過程,充分尊重我們的權(quán)利和隱私。數(shù)據(jù)科學(xué)的黃金法則:對待別人就像對待你自己那樣。
一家互聯(lián)網(wǎng)約會網(wǎng)站做過三個實驗。實驗一,他們暫時移除了網(wǎng)站上所有的照片,結(jié)果發(fā)現(xiàn)很少有人愿意主動發(fā)信息,這證明了愛情不是“盲目”的。實驗二,他們隨機隱藏了人們的部分簡介,結(jié)果發(fā)現(xiàn)對用戶的評價沒有太大影響,這證明了愛情是“不會仔細閱讀”的。實驗三,他們對調(diào)了匹配程度評級,例如將最匹配的人貼上“最不匹配”的標簽,反之亦然。第一和第二個實驗對用戶沒有太大的傷害,但第三個就有問題了。因為用戶不希望自己的生活被不合適的人打擾。約會時遇到一個錯誤的對象還只是痛苦一時,錯過一個合適的對象可能會影響一生。
要避免這些陷阱,必須時刻留意。為了將數(shù)據(jù)融入科學(xué),我們更應(yīng)該表現(xiàn)得像一位科學(xué)家,而非一臺機器。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-12.26立即報名>>> 【在線會議】村田用于AR/VR設(shè)計開發(fā)解決方案
-
1月8日火熱報名中>> Allegro助力汽車電氣化和底盤解決方案優(yōu)化在線研討會
-
即日-1.14火熱報名中>> OFweek2025中國智造CIO在線峰會
-
即日-1.24立即參與>>> 【限時免費】安森美:Treo 平臺帶來出色的精密模擬
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容