遠得要命的數學王國: Bayes' Theorem

很多時候我們會希望了解，在某一個條件之下，另外一件事情發生的可能性，此時條件機率(Conditional Probability)就能派上用場了，例如:

達比修有(ダルビッシュ有)已經連續2球都投出滑曲球的情況下，下一球還是滑曲球的機率有多大
在21點的賭局中，目前2張牌已經有14點的情況下，第3張牌是7點的機率
在台股加權指數已經有10500點的情況下，明天能上漲100點的機率

現實生活當中，有不少的情況會牽涉到條件機率的問題，而條件機率的公式也相當簡單且直觀，假設A與B是兩個事件，則在B事件發生的情況下，A事件會發生的機率被定義為

而若A與B事件是彼此獨立的，則兩事件的交集(Intersection)之機率就被定義成P(A)P(B)，也就是說B事件發生不會受到A事件影響，反之亦然，此情況下A之條件機率就是A發生的機率本身，P(A) 。

可是要求解條件機率會遇上一個問題，那就是我們其實無法準確判定那個條件發生的機率有多高。在現實生活中常常會遇上這種問題，例如我們希望藉由儀器檢測的方式來判定某人是否有吸大麻，雖然現在儀器檢測技術非常高明，但是當他檢測出來是陽性反應，就能據此判定他真的有吸大麻嗎?

國土安全相關單位要找到恐怖份子時也會遇上類似的麻煩。假設有一個小組相信他們要追蹤的恐怖分子都是C教派的信徒，那他們在某座機場問到某人說他自稱是C教派的信徒，該小組就能確定那個信徒是恐怖份子嗎?

儀器檢測出某人有大麻陽性反應，不一定代表他有吸大麻

要了解這種情況的來龍去脈，統計學上的貝氏定理(Bayes' Theorem)就可以派上用場了。貝氏定理將剛剛提及的條件機率擴充成以下的版本:

解釋貝氏定理以前首先要明白兩種機率，即「先驗機率」(Prior Probability，又稱為「邊緣機率」，與「後驗機率」(Posterior Probability)。在統計學上，先驗機率被定義為考慮到觀測數據以前，對於某種不確定性(機率)的不確定程度初始的估計。這樣講似乎有些拗口，但現實生活中我們有時會主觀認定某件事情會發生的可能性，其實就是先驗機率了。以下這些例子都是先驗機率:

小華跟小美告白成功的機率是1%
看晚上月光皎潔，只有少許雲層，我覺得明天會下雨的機率僅有10%
阿明很討厭某個主委會，所以覺得下一場選舉會是公平的可能性大概只有35%
「我給你個數字吧....62%...有62%的機率不會受到攻擊」(電影《破•天•慌》(The Happening)台詞)

我夜觀天象，發現事情不單純，所以主張明天就是世界末日的機率為95%

但是你會只憑這種說法就相信明天就是世界末日嗎?

由於在現實生活中要求條件機率時，通常也無法肯定某個條件會發生的機率到底有多高，事實上日常生活中常常聽到的「機率」，以統計學的角度來講，在沒有任何條件支撐下，全部都是「先驗機率」。以上的貝氏定理的敘述中，P(A)與P(B)皆為先驗機率。

但如果有確切證據或是有資料佐證等等的完善條件下，計算出的機率值又大不相同了。此情況下求得的機率即為「後驗機率」，而實際上，統計學上的「條件機率」就是「後驗機率」。如果沒有考慮到先驗機率或是後驗機率的問題，而執法僅憑他的刻板印象或者過於相信一面之詞的話，其實有很大的可能是會誤傷無辜的。假設某項檢測器的準確性為99%，也就是吸毒者可以檢測出陽性，沒有吸毒者可以檢測為陰性的機率皆為99%，而某間公司想要藉由這個儀器來找出誰吸了毒，並且有可靠消息指出全體員工當中有0.5%在吸毒，那檢測出陽性反應者真的有吸毒的機率有多大呢?假設:

P(D)=員工吸毒機率，0.5% (只是公司方面認定而已，尚未確定誰真的有吸毒)
P(N)=員工沒有吸毒的機率，99.5%
P(+)=檢測出陽性的機率，1.49% (全機率公式得到，P(+|D)P(D)+P(+|N)P(N))
P(-)=檢測出陰性的機率
P(+|D)=員工真的有吸毒，也檢測出陽性(即為準確率)，99%
P(+|N)=員工沒有吸毒卻檢測出陽性，1%

根據貝氏定理，我們想要求解的P(D|+)，也就是在儀器檢測為陽性的情況下，員工真的有吸毒的機率，實際上是:

也就是說，雖然儀器檢測準確率非常高，但檢測難免會出差錯，檢測呈陽性的員工真的有吸毒的機率，在這種情況下僅有大約33%，單憑儀器檢測來找出有誰吸毒其實不是太可靠的執法方式。同樣的，根據貝氏定理，只因為某人信某個宗教就斷定他是恐怖分子的可靠度也相當低。

貝氏統計

在統計學上，利用貝氏定理來做研究的門派就被歸為貝氏統計(Bayesian Statistics)，貝氏統計相信機率應該是要根據未知的命題來賦予，在這種情況下，即使樣本數量很小，若已經有觀測到某個現象，並且能給出先驗機率，也能夠利用貝氏定理來估計未知的參數。貝氏統計認為機率應該要能隨著觀測數據的增加與方法的不同而不斷地調整，也就是說機率是一種信念程度(Degree of Belief)。依據數學模型來分析看似很精確，但是機率模型經常只是一種有不確定性的東西，通常沒有實體去驗證，而且決策時是會牽涉到主觀性的。如果沒有適時調整方法，很容易就會被模型牽著鼻子走了。犯下了盲目將模型套用於現實生活中而不做修改的謬誤，《黑天鵝效應》的作者塔雷伯(Nassim Nicholas Taleb)將其稱為「戲局謬誤」(Ludic Fallacy)。

與貝氏統計相對的門派則是頻率主義統計(Frequentist Statistics)，他們主張應該要藉由大量的實驗與數據來理出一個規律，並且認為機率算是一種當樣本趨近無窮時的極限頻率。相對於貝氏統計將未知的量值視為隨機變數，頻率主義統計將未知的量值視為固定值，換言之頻率主義統計並不像貝氏統計一樣，允許未知參數之機率與參數相關。直到大學結束以前，無論是大學統計系或是部分應用數學系教的數理統計學與機率論，全校整合開課的統計學，或者是高中時剛開始接觸到的統計知識，基本上都是屬於頻率主義統計。貝氏統計則是在研究所或是博士班才開始會探討。雖然頻率主義相對於貝氏統計執行起來較簡單，然而結果通常需要更多解釋，而且對於機率的解釋也相對於貝氏統計更傾向於從實證的角度。對於某些較為主觀的問題則無法解釋，例如在賭博上會遇到的荷蘭書問題(Dutch Book)，也就是說每個人心中對於某個隨機事件都會有他主觀定義的機率，而那個機率必須符合機率公理。換言之，對於模型與參數之詮釋以及使用也是隨時都應該要變通的。今天被解釋為對的定理，可能某一天會被另一個看法給取代掉。