www插插插无码视频网站,亚洲七七久久精品中文国产

實現(xiàn)AGI道路上，數(shù)據(jù)科學(xué)家防不勝防的9大陷阱

2019-08-01 09:49

最近幾個月，科技研發(fā)的速度也越來越快。微軟宣布將投資10億美元，與科研實驗室OpenAI聯(lián)手打造通用人工智能（AGI），也就是人工智能的最高目標。OpenAI的首席執(zhí)行官Sam Altman表示，AGI將成為人類歷史上最重要的技術(shù)。

對于某些特定的任務(wù)，計算機能做得比人類好很多。但他們不具備智慧、常識和批判性思維，因此它們無法像人類那樣去應(yīng)對一些特殊情況（比如一些未定義的情形、模糊的規(guī)則、模棱兩可甚至自相矛盾的要求）。隨著技術(shù)的發(fā)展，計算機也許能做到人類大腦能夠完成的任何事情，但之前微軟的表現(xiàn)并不讓人滿意。

2016年，微軟發(fā)布了聊天機器人Tay，這家公司稱“它能與人類在線交流，語言隨和風(fēng)趣”。Tay的編程語言讓它表現(xiàn)得像一位千禧一代的女性，在學(xué)習(xí)訓(xùn)練過程中，它就是在模仿千禧一代的講話方式。微軟表示，“你和Tay聊得越久，那么它就會越聰明。”在不到一天的時間里，Tay發(fā)送了9．6萬條推特，擁有超過5萬名關(guān)注者。但這個問題最終出在Tay自己身上，它講的內(nèi)容越來越令人厭惡�！霸资菍Φ�，我討厭猶太人�！薄�911事件是有內(nèi)幕的�！薄拔曳浅Ｓ憛捘切┡畽�(quán)主義者。”Tay非常善于利用它接收到的詞匯和詞組，但它無法根據(jù)語境來說話，也不理解自己發(fā)送的推特到底是什么意思。因此微軟在16個小時后就關(guān)閉了Tay，但不到一周，它又重新上線。后來微軟稱第二次上線是個意外，并再次關(guān)閉了Tay。

AGI也許是一個美好的夢想，而數(shù)據(jù)科學(xué)讓我們有機會去利用大數(shù)據(jù)和強大的計算機，作出基于現(xiàn)實而非空想或偏見的決策。但不幸的是，在數(shù)據(jù)大規(guī)模出現(xiàn)之后，企業(yè)和政府仍然在重復(fù)之前犯過的一些錯誤，而且重復(fù)的速度更快。將重要的決策交給機器，只是實現(xiàn)了“犯錯的自動化”。

數(shù)據(jù)科學(xué)不僅僅是數(shù)學(xué)證明、統(tǒng)計計算和計算機編程。真實的人類智能也必不可少：比如實驗設(shè)計、智慧、常識、懷疑和批判思維等。數(shù)據(jù)科學(xué)家并不是要成為一臺機器，不斷地嘗試新模式，不斷地進行曲線擬合；他們更應(yīng)該成為一位科學(xué)家。

如果數(shù)據(jù)科學(xué)家想要充分挖掘數(shù)據(jù)科學(xué)的潛力，他們應(yīng)該避免以下九種常見的錯誤。

1．使用劣質(zhì)的數(shù)據(jù)

第一代機械計算機的投資者Charles Babbage曾被國會成員兩次提問：“Babbage先生，如果我們給計算機輸入錯誤的數(shù)據(jù)，那么它會得到正確的答案嗎？”顯然優(yōu)質(zhì)的數(shù)據(jù)必不可少，而非可有可無。

芝加哥醫(yī)院對一批膿毒癥患者進行過一次研究，它發(fā)現(xiàn)，血液pH值較低的患者在出院后，重新回醫(yī)院治療的可能性更低。兩者的相關(guān)系數(shù)達到了0．96。但是這些數(shù)據(jù)還包含了一些在住院期間死去的患者，也就是說這些患者通過太平間離開了醫(yī)院，是絕對不可能回來重新治療的。最后將這些死者的數(shù)據(jù)去掉，就會發(fā)現(xiàn)血液pH值較低的患者反而是更加危險的。

2．將數(shù)據(jù)的地位放在理論之上

一些數(shù)據(jù)科學(xué)家在沒有理論和常識的指導(dǎo)下，為了模型搜索大量數(shù)據(jù)。他們認為對于一個問題的定向思維會影響新的發(fā)現(xiàn)。然而不幸的是，大多數(shù)時候泛濫的數(shù)據(jù)都是沒什么意義的。大數(shù)據(jù)領(lǐng)域的一個悖論就是，我們?yōu)橐粋€模型輸入的數(shù)據(jù)越多，最后發(fā)現(xiàn)它無用或錯誤的可能性越大。

一位互聯(lián)網(wǎng)營銷人員在大約100個國家測試過三種可選的登錄頁面顏色（黃色、紅色和藍綠色）與它傳統(tǒng)的藍色之間的對比，從理論上講，他應(yīng)該會發(fā)現(xiàn)某些國家采用特定的顏色，會帶來更高的收入。比如他認為英格蘭更喜歡藍綠色，但實際上并不是。

3．盲目崇拜數(shù)學(xué)

數(shù)學(xué)家熱愛數(shù)學(xué)，非數(shù)學(xué)專業(yè)的人懼怕數(shù)學(xué)。這兩者的組合可能會催生大量不切實際的模型。

在經(jīng)濟大蕭條時期，由于假定違約事件的發(fā)生是獨立分布的，許多按揭貸款違約的數(shù)學(xué)模型都失效了。這些人低估了極端事件的可能性，同時也沒有考慮在經(jīng)濟大蕭條的背景下，無法按期償還貸款的可能性本身就更高。

4．盲目崇拜計算機

常常有人認為，計算機做某些事情做得很好，所以它們一定有非常高的智能，但要知道適用于特定任務(wù)和普遍適用多項任務(wù)之間還有很大的差別（甚至這些任務(wù)還可能完全不一樣）。我們對計算機的依賴并非百利而無一害。如果認為計算機比我們更聰明，從而將所有決策交給計算機，可能會帶來災(zāi)難性的后果。

5．反復(fù)搗騰數(shù)據(jù)

為了尋找數(shù)據(jù)之間的隱藏關(guān)系，有些人會把數(shù)據(jù)按照多種方式進行分類。諾貝爾經(jīng)濟學(xué)獎得主羅納德·科斯就說過：“如果你不停地操作一些數(shù)據(jù)，機器自己都會糊涂�！钡髷�(shù)據(jù)和強大的計算機卻助長了這種行為。

一位著名研究員曾在他的助手分析數(shù)據(jù)時，告訴后者“盡可能多地從數(shù)據(jù)中榨取信息”。當時他的助手試圖通過機器視覺將一間意大利自助餐廳的客人分為“男性、女性、吃中飯的、吃晚飯的、單獨吃飯的、兩人吃飯的、兩人以上一起吃飯的、點了酒精飲料的、點了軟飲料的”等。最后這些“榨取的信息”變成了四篇“披薩論文”，其中最著名的一篇稱“男性在女性一起吃飯時，會多吃93％的披薩”。如今他的十幾篇論文都被退回，人也被大學(xué)辭退。

6．自我欺騙

諾貝爾物理學(xué)獎得主理查德·費曼曾向科學(xué)家們提出過一條建議：“首要原則就是不要欺騙你自己——因為你自己是最容易被糊弄的�！闭嬲目茖W(xué)家是分享自己的理論、質(zhì)疑自己的假設(shè)，然后尋找機會做實驗來驗證或推翻假設(shè)。而擺弄數(shù)據(jù)的人只會看到自己想看的東西。

曾有一份研究要求一所高校的學(xué)生預(yù)測自己的數(shù)學(xué)測驗成績。結(jié)果預(yù)測的平均分數(shù)比實際分數(shù)要高，但兩組數(shù)據(jù)之間的相關(guān)系數(shù)高達0．70。因此作者得出兩條結(jié)論。第一，這些學(xué)生高估了自己的能力。第二，為提高學(xué)生的自信心，打分可以適當高一些。對于第一條，可能是學(xué)生低估了測驗的難度。對于第二條，較高的相關(guān)系數(shù)表明學(xué)生其實對自己的數(shù)學(xué)水平很有信心，少數(shù)認為自己考不好的，也只是不太熟悉材料。他們并不是太過于悲觀，而是非常現(xiàn)實。

7．把相關(guān)性當作誘因

不論被告知多少遍“存在相關(guān)性并不一定是誘因”，但研究人員總是會不自覺地忽略這條重要的建議。

2011年，谷歌創(chuàng)建了一個人工智能項目Google Flu，它用搜索請求來預(yù)測流感的爆發(fā)。當時他們夸下海口：“我們能精準地預(yù)測出美國各個地區(qū)未來一周的傳染狀況，每天更新一次�！彼麄兎Q模型的精準度已經(jīng)達到97．5％，也就是模型預(yù)測結(jié)果和實際流感案例的相關(guān)系數(shù)已達到0．975。谷歌是怎么做到的呢？它的數(shù)據(jù)挖掘項目瀏覽了5000萬條搜索請求，并確定了其中45條請求最有可能和流感相關(guān)。由于流感的爆發(fā)具有高度的季節(jié)性，Google Flue更像是一個季節(jié)檢測器，它會挑選季候性的搜索詞匯（如圣誕節(jié)、寒假和情人節(jié)等）。當離開了歷史數(shù)據(jù)，開始真刀真槍地預(yù)測時，Google Flu的準確率就大大地下降。在發(fā)布報告后，Google Flu誤報了未來108周內(nèi)的100起流感案例。從此，Google Flu再也不去預(yù)測流感了。

8．不要對平均值的回歸過于驚訝

當數(shù)據(jù)波動時，預(yù)測值可能會高于檢測值，但隨后就會繼續(xù)趨于平均值。比如一位高爾夫選手贏了大師錦標賽冠軍，不代表下一次他也能贏。并不是說他下次會倒霉，或者技術(shù)會退步，也許這次勝利本來就是超水平發(fā)揮。

數(shù)據(jù)也會在未來回歸平均值，這有點類似于防止一次“發(fā)揮失�；虺０l(fā)揮”。例如一家數(shù)據(jù)科學(xué)公司做過一個實驗，它將一位客戶的網(wǎng)頁布局和100多萬域名中20個常用的布局進行比較。客戶們經(jīng)常會抱怨自己的網(wǎng)站表現(xiàn)不佳，認為網(wǎng)站本來還能賺更多的廣告營收。因此它給一位數(shù)據(jù)分析師一系列網(wǎng)站域名，這些網(wǎng)站在過去三個月的營收都在下降，分析師可以根據(jù)它來調(diào)整網(wǎng)頁布局，看看能否提高營收。結(jié)果他成功了，第二天的營收數(shù)額上漲了20％，當時他就仿佛一位萬眾矚目的搖滾歌手。但直到某一天他太忙了，來不及做任何改變，營收就開始下降。所以這些網(wǎng)站仍然屬于那些表現(xiàn)不佳的一類，他們的營收最終會回歸平均值。

9．不要傷害用戶

不幸的是，在大數(shù)據(jù)時代，企業(yè)和政府為了預(yù)測和影響我們的行為，都在時時刻刻搜集我們的數(shù)據(jù)。優(yōu)秀的數(shù)據(jù)科學(xué)家會很謹慎地處理這個過程，充分尊重我們的權(quán)利和隱私。數(shù)據(jù)科學(xué)的黃金法則：對待別人就像對待你自己那樣。

一家互聯(lián)網(wǎng)約會網(wǎng)站做過三個實驗。實驗一，他們暫時移除了網(wǎng)站上所有的照片，結(jié)果發(fā)現(xiàn)很少有人愿意主動發(fā)信息，這證明了愛情不是“盲目”的。實驗二，他們隨機隱藏了人們的部分簡介，結(jié)果發(fā)現(xiàn)對用戶的評價沒有太大影響，這證明了愛情是“不會仔細閱讀”的。實驗三，他們對調(diào)了匹配程度評級，例如將最匹配的人貼上“最不匹配”的標簽，反之亦然。第一和第二個實驗對用戶沒有太大的傷害，但第三個就有問題了。因為用戶不希望自己的生活被不合適的人打擾。約會時遇到一個錯誤的對象還只是痛苦一時，錯過一個合適的對象可能會影響一生。

要避免這些陷阱，必須時刻留意。為了將數(shù)據(jù)融入科學(xué)，我們更應(yīng)該表現(xiàn)得像一位科學(xué)家，而非一臺機器。