#英國Amazon網站1,700多位讀者,四顆半星強力推薦!

#英國劍橋大學統計學權威,帶給你最有趣、最有價值的統計思維

立體書封.jpg

 

 

統計的藝術:如何從數據中了解事實,掌握世界

The Art of Statistics: Learning from Data

大衛.史匹格哈特(David Spiegelhalter

羅耀宗

 

內容簡介

統計學如何幫助我們了解世界?

當資料不完美,我們能做出可靠的結論嗎?

在資料科學的時代,統計學如何與時俱進?

當疫情來襲,我們如何自己做好觀念上的準備?

 

在許多領域中,統計學都是必備的技能;在人工智慧的時代,統計在商務上的運用也越來越重要。

但是一般的統計學內容,即使有嚴謹的定義和推論,卻總是感覺和現實世界隔了一層,不知如何運用,也很難理解它。

許多人在學校或許讀過一點統計學,大概知道隨機變數、標準差、平均數、中位數的意義,但到底該怎麼用?如何應用到現實世界的問題呢?

然而,這本書不同,它帶你用一種全新的方式來了解統計學。它從一些現實世界的問題開始,例如:

 

地球上有多少棵樹?

培根三明治的致癌風險有多高?

我們能夠相信群眾智慧嗎?

如何衡量藥物的有效性?

英國人的一生中有多少個性伴侶?

病人多的醫院,存活率比較高嗎?

半個世紀以來,全球人口成長的型態如何?

為什麼老男人的耳朵都很大?

 

配上生動有趣的圖表,讓讀者更容易進入,也展示了將資料化為圖表的強大力量與陷阱,以及溝通、道德問題在統計上的重要性。

本書的作者,英國劍橋大學的統計學權威大衛.史匹格哈特(David Spiegelhalter),十分擅長利用統計學說故事,而且概念清晰,盡量不談技術性的細節,他將統計學當中極易混淆的觀念,例如平均數和中位數、標準差、隨機試驗、母體、迴歸模型、隨機變數、預測區間和信賴區間、假說檢定(偽陽性、偽陰性問題)、P值、貝氏方法等等,以生動的實例和圖表,一步步清楚說明。

這本書也強調,統計學應該要教「PPDAC問題解決循環」,即「問題計畫資料分析結論及溝通」。先從定義問題開始,再制定計畫,包括要測量什麼、如何測量,然後要收集資料,根據計畫展開統計分析,最後決定適當的結論,並清晰準確地溝通給外界知道。

正如一句名言所說的:「所有的模型都是錯的,但有些模型有用。」雖然統計的模型並不完美,但是如果我們想要得出一些結論,在數據的洪流當中增進對這個世界的理解,這些模型還是有幫助的。

作者強調,統計學對於已知的事實作匯總,對於未知的事物作出估計,最後應該以謙遜的態度,說明我們能從資料中得到什麼,不能得到什麼。要抱持小心審慎的態度,包括對於各種媒體報導的數據和說法,進行審慎的判斷

本書對於統計學及其廣泛的應用作了深入解讀,讀這本書,你會對統計學產生興趣,知道統計學在做什麼,以及如何應用到實際問題上,還有統計學這門學問的美妙精髓與限制,這些將是讀者珍貴的收穫。

 

專家好評:

史匹格哈特可能是世界上最出色的統計溝通大師……《統計的藝術》值得拜讀和學習。我讀過,受益良多。

──提姆.哈福德(Tim Harford),《親愛的臥底經濟學家》(The Undercover Economist)作者

 

如果你想要培養看清真實世界的技能,並且誠實且嚴肅地告訴別人它的真實面貌,那麼這是你該讀的書。

──邁克爾.布拉斯特蘭德(Michael Blastland),《如何用數字唬人:用常識看穿無所不在的數字陷阱》(The Tiger That Isn’t)共同作者

 

威爾斯(H.G. Wells)說的『統計思想有一天會像讀寫一樣,成為高效率公民必備的能力』這句話經常為人引用。那一天肯定已經到了。這本精彩好書提供非技術性和生動有趣的敲門磚,介紹統計思想的基本工具。威爾斯一定讚許有加。

──阿德里安.史密斯爵士(Sir Adrian Smith)教授,英國皇家學會會士,艾倫.圖靈研究所(Alan Turing Institute)董事

 

即使具有統計專長的人,也能在本書找到不少深具啟發性的文字,因為史匹格哈特思緒清晰,溝通能力卓越,經驗豐富。這是值得一般大眾閱讀的精心力作。

──多蘿西.畢曉普Dorothy Bishop),牛津大學教授

 

現代統計學深入淺出的出色踏腳石。

──大衛.漢德(David J. Hand),《不大可能法則》(The Improbability Principle)作者

 

作者簡介

大衛.史匹格哈特(David Spiegelhalter

© Clive Sherlock.png © Clive Sherlock

大衛.史匹格哈特爵士是英國的統計學家,劍橋大學統計實驗室(Statistical Laboratory)的溫頓風險與證據溝通中心(Winton Centre for Risk and Evidence Communication)主任。他是他所鑽研領域中最常被引用、且最具影響力的研究工作者之一,並獲選為2017-18年皇家統計學會(Royal Statistical Society)總裁。

 
譯者簡介

羅耀宗

台灣清華大學工業工程系、政治大學企業管理研究所碩士班畢業。曾任《經濟日報》國外新聞組主任、寰宇出版公司總編輯。所著《GoogleGoogle成功的七堂課》(The Seven Success Lessons from Google)獲中華民國經濟部中小企業處九十四年度金書獎。另著有《第二波網路創業家:Google, eBay, Yahoo劃時代的繁榮盛世》(Netpreneurs 2.0)。譯作無數,包括《一課經濟學》、《選擇的自由》等。現為財金、商業、科技專業自由文字工作者、《哈佛商業評論》全球中文版特約譯者。
 
 
目錄

致謝 11

導論 13

我們為什麼需要統計學/將世界化為資料/統計教學法/關於本書

第1章   用百分比了解情況:類別資料和百分率 31

次數和百分比的溝通/類別變數/比較一對百分比

第2章   滙總和溝通數字 51

描述資料分布的廣度/描述數字群之間的差異/描述變數之間的關係/描述趨勢/溝通/使用統計量說故事

第3章   為什麼我們還是要查看資料?母體與測量值 85

從資料中找答案──「歸納推論」的過程/當我們有了全部的資料/「鐘形曲線」/母體是什麼?

第4章   什麼因造成什麼果?隨機試驗 105

「相關不表示有因果關係」/到底什麼是「因果關係」?/不能隨機化時,怎麼辦?/當我們觀測到有關聯性,能夠怎麼做?/我們能否從觀測性資料得出因果關係的結論?

第5章   利用迴歸將關係建模 129

迴歸線就是模型/處理一個以上的解釋變數/不同種類的反應變數/超越基本的迴歸建模

第6章   演算法、分析和預測 149

尋找型態/分類和預測/分類樹/評估演算法的表現/機率「準確度」的組合測量值/過度配適/迴歸模型/更複雜的技術/演算法面對的挑戰/人工智慧

第7章   對於正在發生的事,我們能有多確定?估計和區間 191

性伴侶人數/拔靴法

第8章   機率:不確定性和變異性的語言 207

一點都不難的機率法則/條件機率─當機率取決於其他的事件/「機率」到底是什麼?/如果我們觀測一切,機率從何處介入?

第9章   結合機率與統計 229

中央極限定理/這個理論如何幫助我們確定估計值的準確度?/計算信賴區間/調查的誤差範圍/我們應該相信誤差範圍嗎?/當我們擁有所有的資料,會發生什麼事?

第10章  回答問題和宣稱發現:假說檢定 251

什麼是「假說」?/為什麼我們需要對虛無假說做正式的檢定?/統計顯著性/運用機率論/執行許多次顯著性檢定的危險/內曼─皮爾遜理論

第11章  用貝氏方法,從經驗中找答案 299

貝氏方法是什麼?/勝率和概似比/概似比和法醫學/貝氏統計推論/意識形態之爭

第12章  事情怎麼會出錯? 331

「可再現性危機」/蓄意詐欺/「有問題的研究實務」/研究人員實際上做了多少有問題的研究實務?/溝通失敗/文獻會出什麼問題?/新聞辦公室/媒體

第13章  如何把統計做得更好 351

改善產生的結果/改進溝通/協助找出不良的做法/發表偏差/評估一項統計宣稱或報導/面對根據統計證據發表的聲明,要問的十個問題/資料倫理/良好的統計科學實例

第14章  結論 367

詞彙解釋 369

註釋 397

|編後記|一本有特色且跟得上時代的統計學書

文/林博華(經濟新潮社總編輯)

從5月到7月多,在疫情漸漸嚴重、紛紛居家辦公的時期,我看著這本書的書稿,忍不住泛起微笑。啊,偽陽性。啊,疫苗的臨床(隨機)試驗、雙盲測試、三盲測試。

這本書《統計的藝術:如何從數據中了解事實,掌握世界》(The Art of Statistics: Learning from Data)上個星期終於出版了。多謝資深譯者羅耀宗先生的翻譯,若非他的功力,這本來自劍橋大學統計系教授大衛.史匹格哈特(David Spiegelhalter)的專書,還是很難搞定的。

作者說,這本書是寫給:

1. 想要尋找非技術性的、介紹統計學基本概念的入門書的統計學學生。

2. 希望更了解在工作及日常生活中碰到的統計問題的一般讀者。

我不禁想起三十年前,念經濟系大二時上的一年統計學課程。所幸我保留了當時的筆記,那時是一種純數學的典型統計學教材,以定義、定理、證明為主。如今回想起來,對於當時什麼都不懂、數學勉強可以的我來說,或許那是合理的教材吧!但是當然,學到的只是皮毛,甚至連從數學的觀點了解基礎統計學都談不上。但是想想,能先學會那些東西,還是比沒有要好。至今看來也是挺受用的。

三十年後,看今天這本談統計學的書,會有什麼不同?我覺得它有幾個特色:

1.一開始它先從我們會在媒體上看到的許多統計數據談起。先談統計數字、統計數字化為圖表的問題,再談到資料本身,這些資料有些是已經存在的,有些是經過抽樣而獲得的,然後才導入主題。

一開始先不談定義、定理,而是談大眾接觸最多的統計數據,這也提醒我們,統計學是多麼實際地想要解決如何描述事實的問題(現在發生了什麼事、以後會發生什麼事)而演化出來的學問。

相較之下,三十年前的統計學教材,一開始先走一些基礎的機率概念,接著就開始講隨機變數、機率密度函數(p.d.f.),接著就是mean、variance、白努利試驗…….等等。或許這本現代的統計學,才是跟現代人、現實世界比較相關的。

2.作者很會說故事。他會舉一些現實世界中的問題,有些是他參與過的專案調查,例如:

地球上有多少棵樹?

培根三明治的致癌風險有多高?

英國人的一生中有多少個性伴侶?

病人多的醫院,存活率比較高嗎?

半個世紀以來,全球人口成長的型態如何?

為什麼老男人的耳朵都很大?

藉由這些例子,來談一些統計觀念(例如平均數、中位數、標準差、母體——天啊,其實以前的教材是完全不談母體,因為它都假設抽樣一定會成功完美),或者統計工作是如何做的。

3.統計學不光是用於研究、學術的領域,在實務上,它可以做分類和預測。這些正是如今人們要人工智慧(AI)做的事。在書的第6章談了一些如何用演算法來預測的例子(包括我們比較容易理解的天氣預測系統;也包括針對「鐵達尼號」的船難,用演算法試著去預測哪些人生還!)

但是由於演算法大多都缺乏透明度,因而容易衍生出一些倫理問題,嚴重者如2008年的金融海嘯,就是過度依賴演算法的結果。

4.機率和統計的關係。正如三十年前的純數學統計學,不會交代機率和統計有什麼相關,只是把機率論擺在統計學前面,甚至三十年來我都覺得理所當然。

但是在這本書裡,機率論在書的中段(第8章)才出現!作者也說,他在劍橋大學任教時也是先從機率開始教,「但是一開始就談數學,可能會妨礙理解前面幾章不需要機率論就可以理解的重要觀念。」有興趣的讀者,請務必讀讀這個部分(第8、第9章),看看作者如何解釋機率為何是統計推論的基礎,以及從條件機率,談到之後的貝氏方法。

5.貝氏推論。作者自承是屬於貝氏學派,他認為那是最令人滿意的一種統計方法。他也介紹這位英格蘭的特立獨行牧師貝氏(Thomas Bayes)死於1761年,1763年他的開創性論文才發表,而又過了250年之後,他的名字才跟這種方法搭上邊,重新為世人所知。貝氏方法的背後含意並不簡單,初始機率(先驗機率)的概念應用很廣,但其涵義值得深究。

當然,他也介紹了費雪(Ronald Fisher)和內曼─皮爾遜(Neyman-Pearson)之間的論戰,以及與貝氏學派的關係。

看了這些,再加上群眾智慧的始祖高爾頓(Francis Galton),我不禁覺得英國真的是統計人才輩出,或者應該說,英國本來就是科學發展的大國!

6.統計詐欺。既然是這兩年出版的統計學書籍,不免要提到近年來引起反省風潮的p值的問題(可參考p值的陷阱 https://pansci.asia/archives/110923),為了登上知名期刊,太多的研究者只報告統計顯著的研究,為了追求p<0.05而跨越研究倫理的界線,這些有問題的研究結果再經過期刊的審查、公關辦公室,流到媒體及媒體的小編手上,於是造成了有問題的科學新聞屢屢出現的情況。也因此作者要花最後兩章來談這些問題,包括「科學的可再現性危機」,以及如何把統計工作做得更好。

可以帶來諸多啟發的一本好書,推薦給大家。

 

​​​​​​​學測數A太難 恐衝擊頂大商管

arrow
arrow
    創作者介紹
    創作者 EcoTrend 的頭像
    EcoTrend

    經濟新潮社EcoTrend官方部落格

    EcoTrend 發表在 痞客邦 留言(0) 人氣()