夏寧
信息化和數(shù)字化時代,人們無疑經(jīng)常被各式各樣的數(shù)據(jù)所“包圍”著,并且基于這些數(shù)據(jù),數(shù)據(jù)分析師和行業(yè)觀察家們也產(chǎn)生了許多分析結(jié)論。然而,這些看似建基于數(shù)據(jù)之上的“實(shí)證”分析是否完全可靠?
美國統(tǒng)計學(xué)家加里·史密斯(Gary Smith)所著的《簡單統(tǒng)計學(xué)》(《Standard Deviations》)則提醒人們,現(xiàn)實(shí)中的一些“數(shù)字陷阱”完全可能存在,書中列舉了美國大量現(xiàn)實(shí)案例,揭示了一些領(lǐng)域的統(tǒng)計數(shù)據(jù)如何被誤用,并提醒讀者要具備基本的統(tǒng)計思維識別這些不太靠譜的結(jié)論。作者認(rèn)為,統(tǒng)計學(xué)并不是只屬于學(xué)者的專業(yè)工具,它與普通人的日常生活息息相關(guān)。該書中譯本由九州出版社出版,本書也獲得了諾獎經(jīng)濟(jì)學(xué)獎得主羅伯特·希勒的贊賞和推薦。

作者列舉的例子既包括生活中的一些例子,也包括醫(yī)療研究、商業(yè)廣告、金融投資、運(yùn)動比賽等例子。比如“棒球迷信”,作者在書中寫道,美國棒球比賽中存在一種所謂的“棒球迷信”,從投手的角度微小的差異足以區(qū)分所有明星投手、熟練投手和失敗者。用一根圓圓的木棒擊打一個以每小時90英里的速度飛行,并且可能具有左旋、右旋、上旋或下旋的圓形棒球,也許是一切運(yùn)動項(xiàng)目中最為困難的挑戰(zhàn)。如果球被擊中,它可能直接飛向外野手,造成出局,或者安全落地,形成安打。平均而言,棒球選手每四次擊球只能擊出一次安打。如果你能將這個比例提高到,你就能進(jìn)入名人堂。作者認(rèn)為,也許這就是棒球選手的迷信如此出名的原因,他們傾向于相信這個“規(guī)則”不管這種事物多么可笑。奇怪的是,一些研究人員常常會做同樣的事情,尋找看上去具有某種模式的事物,不管這種事物多么可笑。
作者還重點(diǎn)討論了美國醫(yī)療研究領(lǐng)域,在醫(yī)療研究中,不嚴(yán)謹(jǐn)?shù)慕y(tǒng)計分析可能誤導(dǎo)公眾對藥物或療法的認(rèn)識。關(guān)于健康、飲食、疾病風(fēng)險和用藥的統(tǒng)計研究,一些結(jié)論往往只挑一些能博眼球的方面說,例如說某個生活習(xí)慣會導(dǎo)致風(fēng)險增加,的確這種風(fēng)險看似存在,但如果概率本身很小,那么實(shí)際對人的影響可能微乎其微。作者提醒人們要注意“絕對風(fēng)險”和“相對風(fēng)險”的區(qū)別,對于判斷這些研究的意義很重要。
再比如一些商業(yè)領(lǐng)域的小調(diào)查。作者舉了一個例子,一家航空公司做了顧客滿意度的調(diào)查后認(rèn)為“84%的旅客更喜歡本航空公司”,作者就認(rèn)為其選取的樣本有偏差和預(yù)設(shè)立場。的確,有時候數(shù)據(jù)是沒錯,但分析過程中往往隱藏著分析師的預(yù)設(shè)、選擇性樣本以及誤導(dǎo)性的解釋。如果存在樣本偏差,即調(diào)查對象的選擇本身就不具有代表性,那么調(diào)查結(jié)果必然失真。比如上述的航空公司調(diào)查的樣本選取就是只在某一人群中進(jìn)行調(diào)查,卻試圖得出一個更為普遍的結(jié)論。
另外,作者也對美國金融投資領(lǐng)域的一些數(shù)據(jù)分析進(jìn)行了討論。常見的現(xiàn)象是,一些基金公司選擇性地展示歷史高收益,以及制勝的策略,但卻往往有意無意避開市場的大環(huán)境和其他的一些因素,該書認(rèn)為這主要是在回溯歷史數(shù)據(jù),在過去的數(shù)據(jù)中尋找規(guī)律,而這種規(guī)律在未來未必繼續(xù)存在。簡單說,就是有點(diǎn)像“馬后炮”,更多是一種總結(jié),而并非是一種可以直接應(yīng)用到下一次投資的“規(guī)律”,所以我們看到,其實(shí)現(xiàn)實(shí)中也不是人人應(yīng)用后都能有效,相反一些“規(guī)律”在真實(shí)交易中常常失靈。
在海量數(shù)據(jù)時代,人們可以通過不斷嘗試各種變量組合,總能找到一些看似顯著的關(guān)聯(lián),但作者認(rèn)為其中一些關(guān)聯(lián)往往只是偶然出現(xiàn)的幻象。作者旨在通過該書提醒讀者,面對數(shù)據(jù),要有基礎(chǔ)的統(tǒng)計常識,并保持冷靜清醒的態(tài)度。真正的科學(xué)研究需要嚴(yán)格的實(shí)驗(yàn)設(shè)計、嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)處理和可重復(fù)的結(jié)果驗(yàn)證,而非單一結(jié)論。許多統(tǒng)計結(jié)論只有在對照組存在時才有意義。例如某種藥物是否有效,必須與未使用藥物的人群進(jìn)行比較。另外,最重要的,盡信書不如無書,如果一個基于數(shù)據(jù)的分析結(jié)論明顯違背常識,那么你還是要理性看待、清醒地保持和回歸常識。
這本書通俗易懂,對當(dāng)下熱門的數(shù)字?jǐn)⑹乱灿休^深的研究,并保持了一種理性客觀的審視態(tài)度,提供了多維度視野,值得一讀。
