發表日期 3/15/2022, 5:12:32 PM
早間新聞說上個月的消費指數上升瞭n個點;
手機上跳齣實時的股票漲跌,順便可以看一下上市公司的年報以判斷股票前景;
工作例會上,你使用的數據PPT模闆讓展示更加美觀有趣,獲得老闆好評;
你心情不錯想聽聽音樂,音樂APP跳齣你的上周聽歌時長統計,再聽n首便可升級;
一把遊戲結束,係統自動送上戰力統計,你的隊友明顯拖瞭後腿,下次不要和ta組隊瞭;
此時手機又提醒你視屏時間過長,建議休息一下,因為科學研究錶明,連續視屏超過x小時便會使視力下降y%……
如今我們每天、每時、每刻都被各種數據包圍、淹沒。這些信息有的隻是作為日常生活的點綴,大可一笑瞭之;而有的則會成為決策的依據,變得舉足輕重。
我們信任數據,認為數據總是客觀情況的客觀反映。 可真的如此嗎?
2018年,復旦大學開設瞭一門新的通識課程,邀請學校多個專業的教授對學生每天可能接觸到的信息進行“真僞鑒定”,嚮學生闡述什麼是“僞科學”,一經開課便節節爆滿。
這門名叫“似是而非”的新課並非復旦大學首創,它的靈感來源於美國華盛頓大學的 “拆穿鬍扯”(Calling Bullshit)公開課 。這門課由生物學教授卡爾・伯格斯特龍和信息學副教授傑文・韋斯特聯閤主講,他們從邏輯和傳播渠道的角度揭開數據僞科學如何産生與傳播。課程信息一掛在官網就被搶光名額。
這兩門課如此火爆是因為: 識彆數據陷阱,已然成為當代生活的剛需。 數據信息真的可以為“僞科學”操控,雖然我們已經能夠識彆齣披著“震驚!”外衣的老式鬍扯,但它們分裂齣來的新亞種令人眼花繚亂。
伯格斯特龍和韋斯特將這些把戲統稱為“鬍扯”,這門教大傢識彆並指斥鬍扯的課程廣受好評,講義的衍生書籍保留瞭課程辛辣的原名,中文版便是 《拆穿數據鬍扯》 。
《拆穿數據鬍扯》
【美】卡爾・伯格斯特龍,傑文・韋斯特 著
鬍小銳 譯
中信齣版・鸚鵡螺
2022年3月
何為鬍扯?
那麼鬍扯到底指什麼呢?鬍扯可能毫無意義。在交流的過程中,鬍扯者與聽話人並不是盟友。相反,說話人的目的是利用修辭天賦、冗繁的細節或統計上的伎倆來操縱聽話人。
所以伯格斯特龍和韋斯特認為:
“
鬍扯就是全然 不顧事實 、邏輯連貫性或實際傳遞的信息,而是 利用 語言、統計數字、數據圖錶和其他 錶現形式 ,通過分散注意力、震懾或恐嚇等方法, 達到 說服或打動聽話人的 目的 。
數據鬍扯的最終目的, 是通過有意為之的操作,使本應該客觀的數據,為己所用。
我們暴露在鬍扯麵前的時間和機率可能遠遠超過我們所認為的,形式也是五花八門。
鬍扯的視覺把戲
“大鴨子”是一個養鴨戶於1931年建造的鴨子形商店,如今已經成為一個受人喜愛的地標。
“大鴨子”,位於美國紐約長島佛蘭德斯
但是作為一座建築,大鴨子並沒有什麼特彆的功能。在建築理論中,它已經成為形式優先於功能的標誌,“ 鴨子 ”也由此成瞭裝飾超過用途的建築的代名詞。
國內最為著名的建築“鴨子”之一――福祿壽酒店
相似地,形式大於數據的圖形就可被稱為“鴨子”。
《今日美國》是製造數據可視化“鴨子”的先驅之一。上圖顯然可以代錶《今日美國》的風格。
下麵這個圖形的設計者用兩個餐叉的尖齒代錶條形圖中的條形。
這樣做有什麼壞處呢?壞處很多:
條形是圖形中 承載信息 的部分,但它們在這張圖中隻占瞭 很小一部分空間;
傾斜的角度 也會引發爭議,因為我們不習慣解讀這種角度的條形圖;
兩把餐叉並排,但 底部水平綫並沒有對齊 ,容易造成錯覺;
幸好數值被寫齣來瞭。但如果必須依靠數值來解讀圖形, 為什麼不直接用錶格 避免前三個壞處呢?
我們說鬍扯就是公然無視事實和邏輯連貫性,企圖通過分散注意力、震懾或恐嚇來說服或打動受眾。但可愛有什麼不對嗎?其實“鴨子”真正讓我們擔心的原因在於, 試圖裝得可愛會讓讀者更難理解它錶示的數據,逐漸變成鬍扯 。
比如這張圖,創意可嘉,但是把一個餅形圖扭麯成羊角,隻會在讀者對這些數量進行視覺比較時增加難度。
數據可視化的“鴨子”隻是有鬍扯的影子,那麼被我們稱為 “水晶鞋” 的那一類數據可視化就是 完美的鬍扯 。
“水晶鞋”是將一種類型的數據硬套上用於展示另一類數據的視覺形式。 這樣做的目的是藉用好的可視化形式的權威性錶現自己的權威性,完全不考慮數據本身與形式的兼容性。就像格林兄弟的原版《灰姑娘》故事中,繼姐為瞭穿上水晶鞋切掉瞭腳趾,削平瞭腳後跟。
其中最被濫用的形式之一就是 地鐵綫路圖 ,它甚至引發瞭元層級的評論――“以地鐵綫路圖作為象徵的地圖的地鐵綫路圖”。
以地鐵綫路圖作為象徵的地圖的地鐵綫路圖
另一種流行的圖錶形式是 帶標簽的示意圖 。這種圖的“重災區”之一,就是 PPT 。
誰沒用過幾個看起來豐富、有趣又清晰的PPT模闆呢?或者自創一些可愛的模型,就像這隻獨角獸。
然而圖錶上的標簽毫無道理可言。 前肢與“機器學習”和“可視化”有什麼關係?為什麼“R編程”與後腿有關呢?右後腿為什麼沒有加標簽?為什麼頭部的“分析型思想者”指的是一種人,而身體的其他部分指的是技能?……
類似的還有:
“幸福與筆”
“老師的自行車”
扭麯的數字黑箱
如果我們給“鴨子”們“拔毛”,讓數據赤裸裸地呈現在我們眼前,是不是就可以規避掉鬍扯瞭?一定意義上是的,但不絕對。因為還存在著另一種更加隱形的欺詐―― 數據的來源本身 。
當科學傢測量元素的原子質量時,這些元素不會密謀增加自己的重量,以便把自己在元素周期錶上的位置悄悄往後挪一點兒。
順便說一句,元素周期錶也是一款常用“水晶鞋”
但是,管理者往往會有所體會――當他們衡量員工的工作效率時,員工往往會在量化數據上做文章,以讓工作錶現更好看一些。
我們在很多領域都能看到這個現象。
當汽車銷售人員按達成的銷售額獲得奬金時,他們就會為客戶提供更大的摺扣,以便快速完成銷售額;而當銷售數量成為目標時,銷售人員也會提供更大的摺扣,以快速增加銷售量。 這兩個方式並不能都保證利潤成正比增長,而利潤往往是企業最看重的。
這便是“ 古德哈特定律 ”:
“
指標變成目標後,就不再是一個好的指標。
如果某個指標附加有足夠多的奬勵,人們就會想方設法地提高自己的得分,而這樣做就會削弱該指標原本的評估價值。 正是量化指標本身改變瞭需要量化的對象的行為。
還有一種更接近純粹鬍扯的現象―― 數學濫用 ,而且它並不罕見。
數學濫用(Mathiness)指的是那些看起來都像是數學錶達式的東西,但它們和數學可以說是毫無關係。
比如信任方程:
按照這個方程,當自利感降到最低時,信任度就會非常高,那麼我們是不是應該根據 拋硬幣 的結果決定一切呢?畢竟硬幣真實可靠又不會自私自利。
又如“一年中最悲傷的一天”(一月的第三個星期一)的公式:
W代錶天氣,d代錶債務,T代錶聖誕節以來的時間,Q代錶放棄新年決心以來的時間,M代錶乾勁不足,Na代錶采取行動的必要性。(不清楚D在公式中代錶什麼。)
看起來多麼像是一種嚴謹的數學方法!但它到底是什麼意思呢? 這些量如何測量,單位又是什麼? 如果隻是要錶達正相關還是負相關,那麼大可不必采取這種形式,它不但無用,還會讓人費解。
科學的易感性
是的,科學領域也會屢屢中招。
還記得古德哈特定律嗎?“指標變成目標後,就不再是一個好的指標。”在科學領域, 使用引文指標來衡量期刊質量已經導緻編輯鑽製度空子 。
有的期刊會在1月份發錶更多文章,這樣一來,這些文章本年度被引用的機會就會增加。 所有這些反常的行為都違背瞭期刊的使命,削弱瞭引用數作為質量指標的有效性。
類似地,對科研人士的論文數量指標催生瞭隻要給錢便可發錶文章的“ 掠奪性期刊 ”,也讓科研領域成為瞭鬍扯的高發地帶。
雖然掠奪性期刊的主要客戶是給簡曆增色的邊緣學術人,但也包括氣候懷疑論者、反對疫苗者、神創論者和艾滋病否認論者。他們以版麵費為代價換取在科研領域的“一麵之地”,然後說他們的邊緣信仰通過瞭“同行評議”的科學。這是典型的鬍扯汙染。
作為讀者,我們沒有任何萬無一失的方法,可以確定無疑地知道一篇科學論文是否完全正確。但伯格斯特龍和韋斯特提醒我們,至少要 保持閤理的懷疑,這是辨彆鬍扯的第一步。
比如注意論文中的論斷與它是在哪兒發錶的是否相匹配,尤其要警惕低層次期刊上齣現的異乎尋常的論斷。
如果一篇名為《尼安德特人滅絕於英法百年戰爭的證據》的論文齣現在並不引人關注的《威斯特法階曆史地理學雜誌》上,這就絕對值得懷疑瞭。如果這一成果是真實的,就會徹底改變我們對古人類曆史的理解,那它理應會齣現在一本備受矚目的期刊上。你可以把這想象成科學傢版本的“ 如果你真那麼聰明,為什麼沒錢呢? ”。
拆穿鬍扯,你需要一些技巧
辨彆可能的鬍扯的最終目的,是指斥鬍扯 。然而清除鬍扯的代價要遠遠高於製造鬍扯,哪怕真正符閤科研方法論的論文也是如此。伯格斯特龍和韋斯特就藉助一個精彩的駁斥案例,反證瞭這種“高端鬍扯”的屏蔽性與危險。他們給這種方法取名為“ 令人難忘駁斥法 ”。
這個令人難忘的針對功能磁共振成像技術(fMRI)的駁斥齣現在一次神經科學會議上。fMRI能夠幫助神經科學傢探索哪些大腦區域參與瞭哪些認知,典型的研究會比較對象和對照組的fMRI圖像,並思考為什麼大腦的某些部分亮度有所不同。
但是,實驗軟件必須對評估結果的統計學意義做齣假設。而最近的一項研究錶明,這些假設 有時會嚴重誇大差異 。問題已經暴露,但科學傢們並未對這個問題的嚴重性達成一緻。
於是一份標題為《通過死大西洋鮭魚研究人類神經活動:論多重比較校正的重要性》的學術牆報登場瞭。你沒看錯: 一條死鮭魚 。
這是一個故意為之的愚蠢實驗。研究人員跟那條死魚交談,還給它看瞭人們在不同社交環境中的照片。結果令人震驚。當鮭魚被問及人們的情緒時,影像顯示它腦乾的幾個區域錶現齣來的活躍性高於它在“休息”時的活躍性。
這還隻是對人類社交場景的“反應”,想象一下,如果這條鮭魚被問及鮭魚的情緒,這些區域會多麼明亮。
要麼是我們在死魚認知方麵取得瞭驚人發現,要麼是我們未經修正的統計方法齣瞭問題。
指斥鬍扯不隻是為瞭增強自信,它還是一種道義上的責任 。正如我們在開頭所說,世界充斥著各式各樣的鬍扯,有些是無傷大雅的,有些是小麻煩,還有一些甚至很有趣,但很多鬍扯會給科學的誠實和生死攸關的決策帶來嚴重的後果。
“數據成瞭新式鬍扯的殺手鐧” 。但我們絕不否認科學是理解物理世界的一個成功的標準手段。不管我們抱怨什麼,不管我們發現瞭什麼偏見,不管我們遇到什麼問題,不管我們說瞭什麼廢話, 科學最終還是會成功的 。
希望本書能幫助你麵對衝擊,將事實與虛構區分開來。