以前讀統計學,把它當作數學的一支,是學得還不錯。但課堂上學的是理論,到底統計如何應用?總是一個疑問。
《如何衡量萬事萬物》當中,這個問題會有一些答案。
在這本書中,除了談論商業上的衡量(估計)、風險、不確定性之外,有一個很有趣的概念,叫做「校準」(calibration),一般這個詞是用在例如儀器的校準等等,然而,人的評估能力也是可以校準的(也就是可以越估越準,並且知道你估對的機率大致如何)。
我們通常都會猜一些事情,例如現在幾點幾分,或是某商品三個月的銷量會是多少,等等。有工作經驗的人都知道,在工作上常常需要「猜」,或者說「預測」,或者說「評估」或「量化」,端看你掌握這件事到什麼程度,對於這件事物知道多少(大致的範圍、發生的機率)。這種估計的能力,如何校準?
在這本書的第五章〈校準的估算〉,特別介紹了一種評估你的估計能力的方法:
圖表5.1包含以下兩種類型題目各10題。
1. 90%信賴區間(CI)。請針對每一個90% CI題目,分別訂出上、下限。請記得,這個範圍要夠大,讓你相信正確答案會有90%的機會落在這個上、下限之間。
2. 二元題目。請回答每項敘述為是或非,然後圈出一個機率,是能反映你對答案的信心程度。例如,假設你完全確定你的答案,你應該回答你有100%的機會答對。若你毫無概念,則你的機會應該和擲銅板的機會一樣(50%)。除此之外(可能是最常發生的情況),就是在50%和100%之間的某個數值。
圖表5.1 校準測驗樣本
|
|
90%信賴區間 |
|
# |
題目 |
下限 |
上限 |
1. |
1938年英國蒸汽火車頭以多快的速度創下新的速度紀錄(英哩/小時)? |
|
|
2. |
牛頓爵士在哪一年發表萬有引力定律? |
|
|
3. |
一般的商務名片長度為多少英吋? |
|
|
4. |
網際網路(當時稱為Arpanet)是在哪一年建立做為軍方的通訊系統? |
|
|
5. |
莎士比亞出生於哪一年? |
|
|
6. |
紐約到洛杉磯之間的飛行距離是多少英哩? |
|
|
7. |
一個圓形占據等寬正方形面積的比例? |
|
|
8. |
卓別林於幾歲時去世? |
|
|
9. |
這本書第一版的重量為幾英磅? |
|
|
10. |
電視影集《夢幻島》(Gilligan’s Island)第一次播出的日期? |
|
|
|
敘述 |
答案 (是/非) |
你答對的信心 (圈選一項) |
1. |
古羅馬人是被古希臘人征服的。 |
|
50% 60% 70% 80% 90% 100% |
2.
|
世界上沒有三峰駱駝。
|
|
50% 60% 70% 80% 90% 100% |
3.
|
1加侖的汽油比1加侖的水重量輕。
|
|
50% 60% 70% 80% 90% 100% |
4.
|
火星到地球的距離永遠大於金星到地球的距離。
|
|
50% 60% 70% 80% 90% 100% |
5.
|
波士頓紅襪隊贏得第一屆世界大賽。
|
|
50% 60% 70% 80% 90% 100% |
6.
|
拿破崙出生於科西嘉島。
|
|
50% 60% 70% 80% 90% 100% |
7.
|
M是英文中最常用到的三個字母之一。
|
|
50% 60% 70% 80% 90% 100% |
8.
|
2002年桌上型電腦平均購買價格低於1,500美元。
|
|
50% 60% 70% 80% 90% 100% |
9.
|
詹森在當副總統之前是州長。
|
|
50% 60% 70% 80% 90% 100% |
10.
|
1公斤比1英磅重。
|
|
50% 60% 70% 80% 90% 100% |
作答完了嗎?答案在本文最後。
要看你的尺度準確程度如何,我們需要對你預期的結果和你真實的結果兩相比較。由於你所回答的範圍類題目要求的是90% CI,也就是,你預期10個正確答案中有9個會落在你的範圍內。我們只要將落在你範圍內的答案數量,以及你預期的數字9,兩者做比較就可以了。如果預期數量非常接近結果,那麼你可能就是尺度很準確的。(當然這個非常小的樣本不足以下定論。)
對於是╱非類題目,因為你對每個題目的信心不同,你的預期結果可能不是一個固定的數字。對每個答案,你的信心在50%到100%之間。如果你說你對10個題目全都有100%的信心,表示你預期10題全都答對。如果你每一題都只有50%的信心(亦即認為你答對的機率和擲硬幣一樣),你預期有一半的題目會答對。要計算預期結果,必須先轉換你對每題圈選的數字為小數點形式(也就是0.5, 0.6, ..., 1.0),然後加總起來。我們假設你的答案是1, 0.5, 0.9, 0.6, 0.7, 0.8, 0.8, 1.0, 0.9, 0.7,合計為7.9。這表示你「預期」答對的題數為7.9。
如果你和大多數人一樣,真正答對的題數,會少於預期答對的題數。要衡量你評估自己不確定性的技巧,這些題目實在是太少了,然而大部分的人是如此過度自信,即使用這麼少的題目都能彰顯出來。
我作答的結果是:範圍類的題目剛好答對九題。這可能代表我猜得蠻準的?
二元類題目,我的預期結果是7.0,但是答對九題。所以這代表我信心不足。
本章接著介紹一些校準的方法,讓人可以改進自己的估計能力。
第5章校準題目解答
# |
題目 |
解答 |
1 |
1938年英國蒸汽火車頭以多快的速度創下新的速度紀錄(mph)? |
126 |
2 |
牛頓在哪一年發表萬有引力定律(universal law of gravitation)? |
1685 |
3 |
一般商務名片的長度為幾吋? |
3.5 |
4 |
網際網路(當初稱為「Arpanet」)在哪一年建立作為軍方通訊系統? |
1969 |
5 |
莎士比亞出生在哪一年? |
1564 |
6 |
紐約到洛杉磯的飛行距離為多少英哩? |
2,451 |
7 |
一個圓形占據等寬正方形面積的比例? |
78.5% |
8 |
卓別林(Charlie Chaplin)於幾歲時去世? |
88 |
9 |
這本書的第一版重量為幾磅? |
1.23 |
10 |
電視影集《夢幻島》(Gilligan’s Island)首播的日期? |
9/26/1964 |
|
敘述 |
解答 |
1 |
古羅馬人是被古希臘人征服的。 |
非 |
2 |
世界上沒有三峰駱駝。 |
是 |
3 |
1加侖的汽油比1加侖的水重量輕。 |
是 |
4 |
火星到地球的距離永遠大於金星到地球的距離。 |
非 |
5 |
波士頓紅襪隊贏得第一屆世界大賽。 |
是 |
6 |
拿破崙出生於科西嘉島。 |
是 |
7 |
M是英文中最常用到的三個字母之一。 |
非 |
8 |
2002年桌上型電腦平均購買價格低於1,500美元。 |
是 |
9 |
詹森在當副總統之前是州長。 |
非 |
10 |
1公斤比1英磅重。 |
是 |