商品簡介
作者簡介
名人/編輯推薦
目次
書摘/試閱
商品簡介
1. 顛覆認知的“萬物理論”貝葉斯定理以簡潔公式揭示複雜世界的不確定性規律,從醫學檢測到AI決策,從法庭證據到科學實驗,重新定義我們對概率的認知。2. 跨學科的實用指南醫學決策:揭秘癌症篩查誤診率真相,解讀新冠檢測數據背後的邏輯。法律與AI:剖析“檢察官謬誤”,展示DNA證據的局限性;拆解ChatGPT等AI技術的底層貝葉斯邏輯。日常生活:用三門問題、超能力謠言等案例,教會讀者理性應對信息陷阱。3. 歷史與科學的雙重敘事傳奇人物群像:從牧師貝葉斯到統計學家費希爾,還原定理誕生背後的思想交鋒與人性故事。科學革命現場:重現“可重複性危機”等現代科學困局,揭露p值濫用如何導致研究結論失真。4. 大腦與認知的終極解碼神經科學突破:用貝葉斯原理解釋視錯覺、致幻劑體驗,提出“大腦是貝葉斯預測機器”的顛覆理論。精神疾病新解:探討精神分裂症患者為何無法自我撓癢癢,展現意識形成的數學本質。5. 寫給普通人的硬核科普零公式恐懼:作者以自嘲式幽默消解數學門檻,用撲克牌、賭局等生活場景化解抽象概念。時代共鳴:結合新冠疫情檢測爭議、陰謀論傳播等熱點,提供對抗信息氾濫的思維武器。一個誕生於200多年前的數學定理,為什麼能在漫長的時間裡改變醫學、法律、科研、人工智能等多個領域,並成為個人理性思考和決策的強大工具?這正是貝葉斯定理的魅力所在。它不僅僅是一個數學公式,更是一種幫助我們在不確定性中尋找答案的思維方法。當體檢報告出現異常指標時,它幫助你理性評估是否需要進一步檢查;當需要對重要事實做出判斷時,它教你如何權衡各種證據;在人工智能時代,它甚至是許多智能算法背後的核心原理。本書以生動活潑的筆調,通過引人入勝的故事和案例,展示了這個源自18世紀長老會牧師托馬斯‧貝葉斯的研究如何產生深遠影響。貝葉斯定理將幫助你學會區分相關性和因果關係,避免常見的認知偏差和決策陷阱,在紛繁複雜的信息中提取真正有價值的內容。即使沒有任何數學基礎,書中的真實案例分析和實踐指南也能讓你輕鬆掌握這套思維方法。在信息爆炸的時代,擁有一個可靠的思維框架比任何時候都重要。讓我們一起走進貝葉斯的世界,在這
作者簡介
湯姆‧奇弗斯(Tom Chivers)
著名科普作者、出版人,他擅長解釋複雜理論在日常生活中的實際應用,因而成為了科學寫作領域廣受歡迎的作家之一。2018年、2020年兩次獲得皇家統計學會卓越獎;2021年榮獲英國科學作家協會的年度科學記者獎。
著名科普作者、出版人,他擅長解釋複雜理論在日常生活中的實際應用,因而成為了科學寫作領域廣受歡迎的作家之一。2018年、2020年兩次獲得皇家統計學會卓越獎;2021年榮獲英國科學作家協會的年度科學記者獎。
名人/編輯推薦
1. 颠覆认知的“万物理论”
贝叶斯定理以简洁公式揭示复杂世界的不确定性规律,从医学检测到AI决策,从法庭证据到科学实验,重新定义我们对概率的认知。
2. 跨学科的实用指南
医学决策:揭秘癌症筛查误诊率真相,解读新冠检测数据背后的逻辑。
法律与AI:剖析“检察官谬误”,展示DNA证据的局限性;拆解ChatGPT等AI技术的底层贝叶斯逻辑。
日常生活:用三门问题、超能力谣言等案例,教会读者理性应对信息陷阱。
3. 历史与科学的双重叙事
传奇人物群像:从牧师贝叶斯到统计学家费希尔,还原定理诞生背后的思想交锋与人性故事。
科学革命现场:重现“可重复性危机”等现代科学困局,揭露p值滥用如何导致研究结论失真。
4. 大脑与认知的终极解码
神经科学突破:用贝叶斯原理解释视错觉、致幻剂体验,提出“大脑是贝叶斯预测机器”的颠覆理论。
精神疾病新解:探讨精神分裂症患者为何无法自我挠痒痒,展现意识形成的数学本质。
5. 写给普通人的硬核科普
零公式恐惧:作者以自嘲式幽默消解数学门槛,用扑克牌、赌局等生活场景化解抽象概念。
时代共鸣:结合新冠疫情检测争议、阴谋论传播等热点,提供对抗信息泛滥的思维武器。
贝叶斯定理以简洁公式揭示复杂世界的不确定性规律,从医学检测到AI决策,从法庭证据到科学实验,重新定义我们对概率的认知。
2. 跨学科的实用指南
医学决策:揭秘癌症筛查误诊率真相,解读新冠检测数据背后的逻辑。
法律与AI:剖析“检察官谬误”,展示DNA证据的局限性;拆解ChatGPT等AI技术的底层贝叶斯逻辑。
日常生活:用三门问题、超能力谣言等案例,教会读者理性应对信息陷阱。
3. 历史与科学的双重叙事
传奇人物群像:从牧师贝叶斯到统计学家费希尔,还原定理诞生背后的思想交锋与人性故事。
科学革命现场:重现“可重复性危机”等现代科学困局,揭露p值滥用如何导致研究结论失真。
4. 大脑与认知的终极解码
神经科学突破:用贝叶斯原理解释视错觉、致幻剂体验,提出“大脑是贝叶斯预测机器”的颠覆理论。
精神疾病新解:探讨精神分裂症患者为何无法自我挠痒痒,展现意识形成的数学本质。
5. 写给普通人的硬核科普
零公式恐惧:作者以自嘲式幽默消解数学门槛,用扑克牌、赌局等生活场景化解抽象概念。
时代共鸣:结合新冠疫情检测争议、阴谋论传播等热点,提供对抗信息泛滥的思维武器。
目次
引言 一個近乎於 “萬物理論” 的理論
第一章 從《公禱書》到《蒙特卡羅六壯士》
托馬斯・貝葉斯
帕斯卡與費曼
大數定律
亞伯拉罕・棣莫弗與正態分佈
辛普森與貝葉斯
貝葉斯的 “檯球” 比喻
理查德・普萊斯,世上第一位貝葉斯主義者,試圖將上帝從大衛・休謨的手中拯救回來
從貝葉斯到高爾頓
高爾頓、皮爾遜、費希爾與頻率學派的興起
頻率學派涉嫌種族歧視?
貝葉斯主義的衰落
統計顯著性
貝葉斯理論岌岌可危?
“我雙眼已見證,概率之神托馬斯・貝葉斯牧師的榮耀”
第二章 科學中的貝葉斯思想
可重複性危機及應對方案
奶酪做的月亮、超能力、超光速粒子
卡爾・波普爾和他的 “天鵝理論”
貝葉斯理論與可重複性危機
丹尼斯・林德利悖論
如何確定你的先驗概率
你並不是在白費力氣,你只是尚未成功
第三章 決策論中的貝葉斯思想
亞裡士多德與喬治・布爾
貝葉斯理論是決策論的核心思想
克倫威爾法則
意料之中的證據
效用、博弈論、荷蘭賭
奧卡姆剃刀與先驗概率
超先驗
非此即彼的假說&多個假說
AI 中的貝葉斯思想
第四章 生活中的貝葉斯思想
人類是理性的嗎?
人們對 “三門問題” 的誤解
超級預測者(第一部分)
超級預測者(第二部分)
貝葉斯認識論
第五章 貝葉斯式的大腦
從柏拉圖到格裡高利
視錯覺
真實只是一種 “受控的幻覺”?
多巴胺與 “複雜的計算裝置”
網球、猜詞遊戲、“眼跳”
為什麼精神分裂症患者可以自己撓自己的癢癢?
你有沒有認認真真、仔仔細細地看過自己的手?
上帝保佑!
總結 貝葉斯式的生命
致謝
第一章 從《公禱書》到《蒙特卡羅六壯士》
托馬斯・貝葉斯
帕斯卡與費曼
大數定律
亞伯拉罕・棣莫弗與正態分佈
辛普森與貝葉斯
貝葉斯的 “檯球” 比喻
理查德・普萊斯,世上第一位貝葉斯主義者,試圖將上帝從大衛・休謨的手中拯救回來
從貝葉斯到高爾頓
高爾頓、皮爾遜、費希爾與頻率學派的興起
頻率學派涉嫌種族歧視?
貝葉斯主義的衰落
統計顯著性
貝葉斯理論岌岌可危?
“我雙眼已見證,概率之神托馬斯・貝葉斯牧師的榮耀”
第二章 科學中的貝葉斯思想
可重複性危機及應對方案
奶酪做的月亮、超能力、超光速粒子
卡爾・波普爾和他的 “天鵝理論”
貝葉斯理論與可重複性危機
丹尼斯・林德利悖論
如何確定你的先驗概率
你並不是在白費力氣,你只是尚未成功
第三章 決策論中的貝葉斯思想
亞裡士多德與喬治・布爾
貝葉斯理論是決策論的核心思想
克倫威爾法則
意料之中的證據
效用、博弈論、荷蘭賭
奧卡姆剃刀與先驗概率
超先驗
非此即彼的假說&多個假說
AI 中的貝葉斯思想
第四章 生活中的貝葉斯思想
人類是理性的嗎?
人們對 “三門問題” 的誤解
超級預測者(第一部分)
超級預測者(第二部分)
貝葉斯認識論
第五章 貝葉斯式的大腦
從柏拉圖到格裡高利
視錯覺
真實只是一種 “受控的幻覺”?
多巴胺與 “複雜的計算裝置”
網球、猜詞遊戲、“眼跳”
為什麼精神分裂症患者可以自己撓自己的癢癢?
你有沒有認認真真、仔仔細細地看過自己的手?
上帝保佑!
總結 貝葉斯式的生命
致謝
書摘/試閱
引言 一個近乎“萬物理論”的理論
精神病學領域有一條通用準則:如果你認為自己找到了可 以解釋萬物的終極理論, 那你應該是患上了妄想症,快去醫院 看看吧。
—斯科特‧亞歷山大
我們能預測未來嗎?當然可以! 可以肯定的是,接下來的幾秒鐘內你必然會吸進一口氣,再把 它呼出去。你還可以自信地預測,你的心臟會繼續跳動,每秒一到 三下;明早太陽會照常升起,儘管具體時刻取決於你所處的緯度和 時節,但精准的數據並不難找。
你還可以預測火車到站的時間,預測你的朋友會準時抵達事先 說好的飯店,儘管你在做出這些預測時的自信程度會受到具體是哪 家鐵路公司、哪位朋友的影響。
此外你還可以預測,世界人口將持續增長至 21 世紀中葉,然後開始下降;2030 年的全球平均地表溫度將高於 1930 年。
未來並非無法窺測,我們有能力撥開迷霧一探究竟。有些東西 很好預測,比如根據傳統力學預測幾千年之內的行星軌跡;有些東 西則很難預測, 比如在混沌理論的背景下預測天氣——能預測幾天 就很了不起了。但不管怎麼說,我們總能掀開帷幔,或多或少地看 到一些未來。
大眾口中的“預測未來”通常指的是一些極為神秘的、 涉及 超自然力量的、神一般的預言。但本書提到的“預測未來”並不是 這個意思,我們很難有這種通天之術(後文會提到一位科學家,他 認為我們的確有這種能力,讀完之後你就會明白,他肯定是錯的)。 事實上,我們根本不需要那種誇張的能力就能做出預測。我們這一 生從來就沒有停止過對未來的預測,預測和生命是密不可分的。有 些預測是很基本的,比如每次吸氣時,我們都會下意識地預測“空 氣一直是可吸入的”。 有些預測是較為複雜的, 比如“街角的商店 裡會有歐倍牌麥片,我走進去就能買到”,每個決策都伴隨著類似的 預測。我們做出這些預測並非基於超能力,而是基於我們的經驗。
所有預測都存在一個問題,即結果的不確定性。我們不清楚這 個世界到底是建立在決定論之上的, 還是建立在非決定論之上的。 倘若我們可以像全知全能的上帝一樣,知曉宇宙中每個粒子的位置、 動量、性質,那我們或許就能完美地預測世間萬物,比如每只麻雀 的死亡 1 。可惜我們並非全知全能,我們能夠掌握的信息很有限 2 。 我們沒有完美的感知能力,所以我們無法看到宇宙的每個細節,但 我們可以利用有限的信息做出不完美的預測,比如我們可以大體預 測出不同事物的活動方式:像人一樣的事物會傾向於尋找食物、組建團隊,像岩石一樣的事物往往只能靜止不動。 生命不是一局國際象棋,而是一場撲克遊戲,因為前者的信息 是完全的,理論上我們可以“應對”任何狀況;而後者的信息是有 限的,我們只能儘量根據掌握的信息做出最佳決策。
本書的主要內容就是幫你學會做出最佳決策的“公式”。
《時間簡史》出版之後,史蒂芬‧霍金曾說過這樣一句話:“有人 對我說,書裡每多出一個公式,它的銷量就會減少一半。” 2 可我這本書的核心內容就是一個公式,想要一個公式都沒有也太困難了。1
這個公式就是著名的貝葉斯定理,它是一個極為簡潔的等式:
說來實在慚愧,其實我也討厭看到數學公式。雖然硬要我去使 用公式的話,我也不是做不到,但我實在感到乏味無趣。可你知道 嗎,最尷尬的是,雖然我已經寫了 3 本書,且每本書都和數學密切 相關, 但在看到 Σ 這個符號的時候, 我的大腦仍會頻頻宕機。 我 想大多數讀者都和我有著類似的感受,這或許就是出版社警告霍金 儘量不要在書中列出公式的原因。
不過我們也沒必要談方程色變,方程並不是什麼晦澀難懂的咒 語或密碼,它只是一種簡便的書寫方式,每個小符號都代表一個簡 單的步驟(我常常這樣安慰自己)。
貝葉斯定理也是如此,它只是一個概率公式,它可以根據已知信息算出某件事發生的概率。具體來說,它是一種條件概率。公式中的 豎線“|”是“在此情況下”或“以此為前提條件”的簡寫, P(A |B) 則指的是“在事件 B 已經發生的情況下,事件 A 發生的概率”。
這裡我們給出一個條件概率的簡例。你手中有一副去掉大小王 的撲克牌,你想知道從中抽到紅桃的概率。已知撲克牌一共有 52 張, 紅桃有 13 張, 我們可以據此算出其概率——記作 P( )——等於 13/52, 或 1/4, 用數學語言表示就是 p=0.25。 然後我們假定你抽了 一張牌,是梅花,那麼此時抽到紅桃的概率是多少呢?我們知道牌 堆中仍然有 13 張紅桃, 但牌的總數變成了 51, 所以此時概率變成 了 13/51,或者說 p ≈ 0.255。這就是你已經抽出一張梅花的情況下, 再抽到一張紅桃的概率,即 P( | )。
再舉一例:倫敦某天下雨的概率是多少?答案是 0.4 左右, 因 為倫敦每年大約有 150 天在下雨。現在你往窗外瞥了一眼,發現烏 雲密佈,那麼此時下雨的概率是多少?我也不知道確切答案,但我 知道,陰天下雨的概率肯定更高。
貝葉斯定理其實也是這個意思,只不過它的適用場景更為廣泛。 用通俗的語言來解釋公式的四個部分, 就是這個樣子:(事件 B 已 經發生的情況下, 事件 A 發生的概率)=(事件 A 已經發生的情況 下,事件 B 發生的概率)×(事件 A 單獨發生的概率)÷(事件 B 單獨發生的概率)。
現在假設我們的社會出現了一種大規模傳播的疾病(可以參考 剛剛經歷的新冠疫情)。
為了弄清自己到底有沒有染上這種病, 你做了一個測試。測試的指導手冊上寫著這樣一句話:“本測試的靈敏度和特異度均為 99%。”也就是說, 如果你真的染上了這種病, 那麼這個測試有 99% 的概率可以準確地告訴你,你確實染上了這種病;如果你沒有 染上這種病, 那麼它也有 99% 的概率可以準確地告訴你, 你沒有 染上這種病。另外我們還可以這樣理解:該測試的“假陰性率”和 “假陽性率”都是 1%。
現在假定你的試紙上出現了兩條紅線,也就是說測試結果呈陽 性。 這意味著什麼呢?你可能會自然而然地認為, 自己有 99% 的 概率被傳染了。
但貝葉斯定理會告訴我們,事實並非如此。
貝葉斯定理是一個非常奇怪的定理。它的表達式十分簡潔,寫 出來不占什麼篇幅,涉及的運算只有乘法和除法,就連 8 歲小孩都 會算。 它的提出者也只是一個生活在 18 世紀的普通富紳, 這位富 紳白天會在坦布裡奇韋爾斯擔任牧師,但他並不信奉英格蘭國教1 , 研究數學也只是業餘愛好。 儘管如此, 貝葉斯定理仍舊產生了極 為深遠的影響——它可以解釋為什麼即便癌症測試呈陽性的人中有 99% 都沒有癌症, 測試的準確率仍然可以高達 99%;為什麼 DNA (脫氧核糖核酸)鑒定只有兩千萬分之一的概率匹配錯人, 但它仍 有很大概率導致冤假錯案;為什麼一個科學結論明明具有“統計顯 著性”,但它仍舊有很大概率是錯的。
貝葉斯定理還涉及迷人的哲學思辨。“概率”是真實存在的 嗎?我們說擲色子有六分之一的概率擲出 1,這到底是什麼意思?它是宇宙中確切存在的事實, 還是我們對這個世界所持有的一種信 念?一次性事件也有概率嗎?如果我告訴你, 曼城隊有 90% 的概 率成為 2025 年的英超冠軍,那這到底意味著什麼呢?
每次我們面對不確定的事物做出決策時—— 一直以來我們都是 這樣做的——都可以利用貝葉斯定理來判斷該決策在多大程度上算 是個好決策。事實上,無論是怎樣的決策過程,無論你為了實現某 個目標對世界產生了多大的影響,無論你掌握的信息多麼有限,無 論你是正在尋找高濃度葡萄糖環境的細菌,是正在利用複製行為傳 播遺傳信息的基因,還是正在努力實現經濟增長的政府,只要你想 把事情幹好,你就離不開貝葉斯定理。
AI(人工智能)本質上也是貝葉斯定理的一個具體應用。 從 最基本的層面來說,AI 所做的事情就是“預測”。 一個可以分辨 貓狗圖像的 AI 應用, 本質上就是在根據過往的訓練數據和當前 的圖像信息去“預測”人類對圖片的判斷。DALL-E 2、GPT-4、 Midjourney 等各種優秀的 AI 應用, 正在以令人應接不暇的速度一 次次衝擊人們的認知,我寫下這段話的時候可能就剛好有一個震撼 世界的 AI 應用橫空出世。 不過, 這些和你談笑風生、 為你生成高 質量圖像的 AI,本質上也是在做預測,只不過它們預測的是人類作 家、人類藝術家面對這些提示詞時會如何作答。這些預測行為的基 礎都是貝葉斯定理。
大腦的工作也離不開貝葉斯定理,這就是人類容易產生視錯覺、 致幻劑可以致幻的原因,同時也是思想意識的工作原理。
貝葉斯定理可以讓我們明白, 為什麼陰謀論的觀點難以轉變; 為什麼兩個人可以根據同樣的證據得出完全相反的結論。比如,為
什麼那些科學事實能夠讓我相信疫苗安全有效,卻無法說服一個懷 疑論者呢?答案就是,根據貝葉斯定理,一個人對新信息的判斷會 受到既有認知的影響。這並不是說那些懷疑疫苗的人、那些陰謀論 者是大腦運轉方式與眾不同的外星人,而是說他們也是完全理性的 人,只不過他們的行為建立在固有思想之上。貝葉斯定理可以很好 地解釋這一點。
由此可見,雖然貝葉斯定理不是萬物理論,但實際上也差不多 了。一旦你開始站在貝葉斯定理的視角去看待問題,你就會發現貝葉 斯定理真的是無處不在。我寫這本書的目的就是幫你做到這一點。
通常人們會用醫療檢測來解釋貝葉斯定理,本書也不例外。這 裡我們給出一些比較可靠的數據:假定你正準備進行乳腺癌的篩查 檢測,且已經知道,如果某位女性的確患有癌症,那麼乳房 X 光在 80% 的情況下可以正確識別出癌症(靈敏度為 80%), 在另外 20% 的情況下會發生漏診,即假陰性;如果某位女性沒有癌症,那麼乳 房 X 光在 90% 的情況下可以正確排除癌症(特異度為 90%),在另 外 10% 的情況下會發生誤診,即假陽性。
假定你的檢測結果呈陽性, 那是不是說明, 你有 90% 的概率 患上了乳腺癌?不是的。事實是,根據上面給定的這些信息,你根 本無法判斷自己患上乳腺癌的概率到底有多大。
你還需要額外掌握一個信息,那就是在參加檢測之前,你對自己 患上乳腺癌的概率的預估。最簡單的預估方式就是找出特定時期內, 與你同齡的女性中的乳腺癌患者的比例。我們假定這一比例為 1%。
為了讓案例更加具體,我們進一步假定共有 10 萬名女性參加了 檢測,那麼按照 1% 的患病比例來看,這些人中一共有 1000 名乳腺
癌患者。 在這 1000 名患者當中, 乳房 X 光只能正確檢測出 800 名, 另外 200 名將會出現漏診;剩下的 99000 人沒有患乳腺癌, 在這些 健康人當中, 乳房 X 光只能正確判斷出 89100 人, 這意味著會有 99000-89100=9900 人被誤診為乳腺癌。下面我們把數據整理成表格:
有乳腺癌 (共 1000 人)
80% (真陽性) 800 人
20% (假陰性) 200 人
沒有乳腺癌 (共 99000 人)
檢測結果呈陽性
檢測結果呈陰性
10% (假陽性) 9900 人
90% (真陰性) 89100 人
現在你明白了吧,得到陽性結果的女性一共有 10700 名,其中 只有 800 人真的患有乳腺癌。換句話說,假定你的測試結果呈陽性, 那麼你真正患有乳腺癌的概率是 800/10700 ≈ 0.07,即 7%。
具體結果完全取決於檢測前人群中患有乳腺癌者的比例。假如 檢測對象是高風險人群,比如具有家族癌症史的老年婦女,那麼這 一比例可能高達 10%,此時計算結果會發生翻天覆地的變化。
有乳腺癌 (共 10000 人)
80% (真陽性) 8000 人
20% (假陰性) 2000 人
沒有乳腺癌 (共 90000 人)
檢測結果呈陽性
檢測結果呈陰性
10% (假陽性) 9000 人
90% (真陰性) 81000 人
現在真陽性的人數從 800 漲到了 8000, 假陽性的人數下降 至 9000。 此時一個拿到陽性結果的人真正患乳腺癌的概率變成了 8000/17000,結果約為 47%。知道這一點後,拿到陽性結果的人會 比剛才更加憂慮。整個檢測方法沒有任何變化,發生變化的只有先 驗概率。
換句話說,貝葉斯定理可以告訴你結果的可靠程度。可是要做 到這一點的話,你必須對這件事有一個先驗預估。
現在我們再來看看這個公式(本書的銷量該不會又減半了 吧……畢竟這個公式剛才已經出現過一次)。
經過一系列計算之後, 我們得到的結果就是 P(A|B) , 即事件 B 已經發生的情況下, 事件 A 發生的概率。 癌症檢測與之類似, 我 們想知道的是, 在檢測結果呈陽性的情況下, 該患者真正患癌的 概率。
可是“靈敏度 80%”並沒有給出 P(A|B) , 反而給出了與之相 反的 P(B|A), 即事件 A 已經發生的情況下,事件 B 發生的概率。也 就是說,它可以告訴我們,一個真正患有乳腺癌的人,有多大概率 取得陽性結果。
乍一看好像沒什麼不同,實際上這兩者的區別就像“某個人剛 好是教皇的概率僅有八十億分之一”和“教皇剛好是個人類的概率 僅有八十億分之一”的區別一樣大。3
為了得到想要的數據,我們需要更多信息。在癌症檢測的例子中,我們需要的額外信息是乳腺癌患者在人群中的比例。在醫學中, 我們將其稱為發病率,或背景發生率;在貝葉斯定理中,這種額外 信息一般被稱為先驗概率。
醫學中的先驗概率比較容易獲得, 也很容易定義。 比如你想 知道某人患上亨廷頓病的風險,那你可以去查詢全科診所的診療記 錄 4 ,然後據此算出平均每 10 萬人當中約有 12.3 人患有該疾病。
其他情況則要複雜得多。如果幾年前你想計算俄烏爆發衝突的 概率,那這個先驗概率該怎麼算?先算一下俄烏每年爆發衝突的頻 次?還是先統計一下所有衝突爆發的頻次?或是先調查一下,看看 兩國邊境突然增派大量坦克的時候,雙方爆發衝突的概率?
再舉一例。 假定我提出了一個科學假說, 做了一次相關實 驗,且取得了不錯的數據,此時該假說是一個正確假說的概率有多 高?我們進一步假定, 如果該假說是錯誤的, 那每 20 次實驗中只 有 1 次能取得這種數據。這是不是意味著,我的假說大概率是正確 的?不是這樣的, 因為它還和另一個概率有關——我開始做實驗之 前,該假說為真的概率,即先驗概率。可我該上哪兒去搞到這個數 據呢?
法庭辯護中也有一個經典案例。 在已經取得某些法庭證據的 情況下, 該嫌疑人有罪的概率是多少?假定嫌疑人的 DNA 恰好出 現在現場的概率只有百萬分之一,那是不是說明警察只有百萬分之 一的概率抓錯了嫌疑人?不是這樣的,因為這還取決於一開始警察 就抓到了正確嫌疑人的概率有多大。可問題是,這項數據上哪兒去 找呢?
放心,這些問題本書都會一一作答(有很多數學家研究過相關
10
貝葉斯定理 問題)。 需要牢記的是, 必須先得到一個先驗概率, 我們才能進一 步應用貝葉斯定理。缺失了先驗概率,我們只能得到一些不靠譜的 結論。 大多數人第一次聽說貝葉斯定理都是在醫學領域,所以我們的 旅程也從醫學領域開始。
這麼多年來, 我逐漸愛上了貝葉斯定理。 第一次聽說貝葉斯 定理, 是在本‧戈爾達克瑞於 21 世紀初在《衛報》上開設的《小 心壞科學!》專欄當中。自那時起,我就對貝葉斯定理越來越著迷。 包括本書在內,我已經出版了 3 部作品,其中每本書都或多或少地 提到了貝葉斯定理。該定理常常能夠得出一些反直覺的結論,令人 連連稱奇。比如,某項測試的準確率為 99%,並不意味著該測試在 99% 的情況下是正確的。這到底是什麼鬼話?雖然只要按部就班地 推導,就能逐漸理解這一事實,但類似的結論總是能夠讓人感到不 可思議,刷新認知(至少我的感受是這樣的)。
過去 4 年當中, 也就是 2020 年初全球暴發新冠疫情之後, 貝 葉斯定理推導出的那些結論變得越來越重要了。早在 2020 年 4 月, 大部分人還處於居家隔離狀態的時候,英國前首相托尼‧布萊爾等 人就呼籲政府向那些已經得過新冠肺炎、體內已有抗體的人發放免 疫證明,允許他們外出活動(當然這發生在人們意識到各種變異病 毒會導致患者很容易複陽之前)。
抗體測試問世沒多久,美國政府就緊急批准了一種抗體檢測方 法,該方法的靈敏度和特異度大約都是 95%。5
聽上去挺靠譜。事實上,2020 年 4 月,英國大約有 3% 的人口感染了新冠病毒,這一比例就是所謂的先驗概率。如果有 100 萬人 參加檢測,那麼其中大約會有 3 萬人是新冠肺炎感染者。在這 3 萬 名患者當中,會有 28500 人的檢測結果呈陽性;剩下的 97 萬健康人 當中,則會有 48500 人的結果呈現陽性。
由此可見,在全部 77000 個陽性結果當中,只有三分之一多一 點的檢測者的確感染了新冠病毒(這就是後驗概率)。 英國人口一 共有 6500 萬, 假如政府真的讓所有人都參加了這項檢測, 並向那 些結果呈陽性的人發放免疫證明,就會導致有 300 多萬根本沒有感 染過新冠病毒的人可以自由地走街串巷,甚至去擁抱免疫力低下的 爺爺奶奶, 而事實上這些人根本不安全。 不弄懂貝葉斯定理的話, 你就沒法搞清楚這件事。
當時英國有一群所謂的“權威人士”對居家隔離政策持懷疑態 度,其中有一部人已經察覺到檢測數據有些不對勁,從而引發了一 場和貝葉斯定理相關的巨大爭議。這些人當中最著名的應該就是前 威爾士國務大臣約翰‧雷德伍德,他認為那些錯誤的檢測結果會歪 曲新冠疫情的真相,並強烈要求政府顧問儘快給出一個制止這種現 象的方案。6
這些懷疑論者之所以會覺得檢測數據不對勁,是因為他們誤解 了統計學教授戴維‧斯皮格霍爾特爵士在一個訪談節目中的言論。 戴維‧斯皮格霍爾特經常積極地在各種電視節目和廣播頻道中向公 眾耐心解釋什麼是檢測的準確度,什麼是疫苗的有效性。大家已經 明白, 檢測的假陽性率為 1%, 並不意味著只有 1% 的陽性結果是 誤診。當時社會正處於第一波疫情和第二波疫情之間的緩衝期,此 時人們只要一打噴嚏就得做 PCR(聚合酶鏈式反應)檢測。從數據上來看,當時英國的新冠肺炎患者非常少,隔離政策似乎的確降低 了感染率,可整體上來看,感染率似乎又有一種上升趨勢。
那些持懷疑論的“權威人士”認為,感染率上升只是一種假像, 貝葉斯定理可以解釋個中玄機。 具體來說, 當時有 0.1% 的人感染 了新冠病毒。如果我們隨機對人群進行檢測,且該檢測方式可以在 99% 的情況下正確識別出那些沒有感染新冠病毒的健康人,在 90% 的情況下正確識別出那些的確感染了新冠病毒的患者,那麼最終將 有超過 90% 的人得到假陽性結果。1
這個結論的確沒錯,問題在於他們對貝葉斯定理的理解不夠深 刻。 首先, 先驗概率真的是 0.1% 嗎?這一概率成立的前提是, 參 與檢測的人員都是從整個人口當中隨機挑選出來的,但事實並非如 此:參與檢測的要麼是已經表現出一定症狀的人,要麼是接觸過確 診病例的人,這些人感染新冠病毒的概率要比其他人高得多。雖然 我們不知道具體高多少, 但我們知道, 即便先驗概率只有 1%, 假 陽性的比例也會大幅下降至 50%;如果先驗概率為 10%,那麼大約 有 90% 的陽性結果是真陽性。
那麼, 我們假定假陽性率為 1%, 會不會有點太誇張了呢?事 實上,2020 年夏天新冠疫情開始減弱的時候,檢測結果呈陽性的比 例只有 0.05%, 其中包括了真陽性和假陽性, 所以假陽性率不可能 比這一數值還高。如此一來,在新冠肺炎發病率為 0.1% 的前提下,假定檢測人數為 100 萬,其中有 1000 人確實感染了新冠病毒,那麼該檢測只能識 別出其中的 900 名患者。剩下的 999000 人當中,該檢測將給出 9990 份假陽性報 告。所以拿到陽性結果的人一共有 900+9990=10890,真陽性的比例只有 900/10890, 還不到 9%。假陽性率將下降至 35%。發病率越高,假陽性率就越低。 其實不僅僅是新冠疫情,幾乎任何形式的醫學檢測都會涉及貝 葉斯定理。
英國的國家醫療服務體系(NHS)提供 3 種常規的癌症篩查, 即乳腺癌、 宮頸癌、 結腸癌。 雖然前列腺檢查不在常規檢查之內, 但 50 歲以上的男性如果有需求,也可以把這項檢查加進去。
為什麼前列腺檢查沒有加進常規的癌症篩查呢?畢竟癌症篩查 聽上去就是件有益無害的事,越早發現越容易治療嘛。難道前列腺 檢查有什麼壞處嗎?
就像本書中的其他所有問題一樣,貝葉斯定理可以給出答案。
前列腺癌的篩查是通過 PSA(前列腺特異性抗原)檢測來進行 的。醫護人員會檢驗測試者的血液,如果血液中的 PSA 指數過高—正常值是 3~4 納克每毫升——測試者就有必要接受進一步的檢查, 比如掃描或活檢。 需要注意的是,PSA 過高既有可能是前列腺癌的 信號,也有可能是感染、炎症的徵兆,還有可能是年邁導致的自然 現象。
PSA 檢測沒有前面提到的那些檢測方法那麼精准。 根據英國醫 療諮詢機構——國家衛生與臨床優化研究所(NICE)提供的數據 7 , 如果以 3 納克每毫升的標準對患者進行 PSA 檢測,那麼該檢測將成 功識別出 32% 的患者(靈敏度),以及 85% 的健康人(特異度)。
另外我們知道,50 歲以上的男性患者中,大約有 2% 患有前列 腺癌。 8 假如參加 PSA 檢測的人數共計為 100 萬, 那其中大約會有 2 萬人確實患有前列腺癌。可是這項檢測只能正確識別其中的 6400 名患者。 剩下的 98 萬健康人當中, 將有 147000 人需要進行額外的後續檢查。如果一名 50 多歲的男性在該檢測中得到了陽性結果, 那他實際上只有 4% 的概率真正患有前列腺癌。
4% 的概率需要我們認真對待嗎?或許吧, 但可以肯定的是, 陽性患者需要進行額外檢測:有些會造成創傷,有些會令身體不適, 有些甚至還具有一定風險。當然,英國的國家醫療服務體系還要為 這些數以萬計的核磁掃描、活體檢測支付數百萬英鎊,而這些錢本 可以用來支付他汀類藥物、腎移植費用或是護士的工資。此外,前 列腺癌的檢測還有很多問題,比如很多情況下前列腺癌細胞的擴散 極為緩慢,以至於很多患者根本無法意識到自己得了前列腺癌;有 時,直到屍檢這一步,人們才發現患者患有前列腺癌,但他們的死 因卻和前列腺癌毫不相干。
當然, 這裡面還有一個問題, 那就是 32% 的靈敏度、85% 的 特異度這兩個數值,其實是 3 納克每毫升這項檢測標準造成的。如 果我們把檢測標準提高到 4 納克每毫升,會發生什麼?
答案就是, 特異度會從 85% 升到 91%, 也就是說該檢測能夠 正確識別出更多健康人。 但代價是靈敏度會從 32% 降至 21%, 也 就是說該檢測正確識別癌症患者的能力下降了。 假如這次也有 100 萬人參加了測試, 那麼假陽性人數會下降至 88200, 但與此同時真 陽性人數也變少了——20000 名患者當中只能正確識別出 4200 人。 這種情況下,如果一名 50 多歲的男性在該檢測中得到了陽性結果, 那他實際上只有 4.5% 的概率真正患有前列腺癌, 並沒有比之前高 多少。
我們無法規避這些數據之前的關聯性。我們可以繼續提高檢測 閾值,比如把標準設定為 5 納克每毫升,那麼假陽性的數量會進一步下降,但代價是假陰性的數量會進一步上升。如果降低檢測閾值, 那麼假陰性的數量會下降,但代價是假陽性的數量會上升。二者互 相拖後腿的現象是不可避免的。想要真正解決這一矛盾,我們只能 在醫學上尋求另一種更優秀的檢測方式(這有點像“統計顯著性” 問題,在後文中我們還會具體分析)。
雖然乳腺癌和結腸癌的篩查更為精准,但即便是在這兩個領域, 其準確性也高度依賴于患者人數在全部人口中的比例。一項大型調 查發現 9 ,在連續 10 年、每年都進行乳房 X 光檢查的女性當中,有 60% 的人得到過一次或多次的假陽性結果,繼而參加了活檢等形式 的額外檢查,這些煩瑣的檢查令她們感到“焦慮、痛苦,總是擔心 自己真的得了乳腺癌”。 這一切真的值得嗎?答案取決於該疾病在 人群中的發病率,即先驗概率。年輕人很少得乳腺癌,如果我們對 40 歲以下的女性進行乳腺癌篩查,那麼即便靈敏度和特異度都很高, 也會出現較高的假陽性率,所以對大齡女性進行乳腺癌篩查會更有 價值。 英國國家衛生與臨床優化研究所認為, 只有對 50 歲以上的 女性進行乳腺癌篩查, 才具有成本效益。 10 如果不懂貝葉斯定理, 我們就無法得出這一結論。
各位准父母最好也瞭解一下貝葉斯定理。 市面上有一種叫作 “無創產前篩查”(NIPT)的技術, 這種技術會利用孕婦的血液樣 本來分析胎兒的染色體狀況。在英國,國家醫療服務體系會向高風 險孕婦提供這一服務。當然你也可以去私人診所,其價格在 500 英 鎊左右。
雖然該篩查的準確率高達 99%, 但就像前面的例子一樣, 其 準確率無法幫助我們判斷手中的檢測結果到底在多大程度上是準確的。唐氏綜合征、帕托綜合征、18 三體綜合征都是這項檢測的目標 疾病,這些疾病不僅非常罕見,而且相當嚴重。患有唐氏綜合征的 孩子,幸運的話可以活幾十年,大多需要終生陪護;而患有帕托綜 合征、18 三體綜合征的孩子通常會在出生後的數月、 數年之內夭 折。顯然,檢測結果是否準確對父母來說非常重要。
調查發現 11 , 如果參加無創產前篩查的人不是高危孕婦, 而是 一群普通孕婦, 那麼檢測結果往往會呈現假陽性。 唐氏綜合征的 “陽性預測值”,即陽性檢測結果為真陽性的概率為 82%,帕托綜合 征的為 49%,18 三體綜合征的為 37%。
如果參加無創產前篩查的是一群高危孕婦, 那麼這些疾病的 陽性預測值會大幅上升——18 三體綜合征的陽性預測值會躍升至 84%。 也就是說, 如果對所有孕婦進行無差別檢測, 那麼每 3 份陽 性結果中就有 2 份是假的;如果只對高危孕婦進行檢測,那麼得到 假陽性結果的概率還不到六分之一。
這背後仍然是貝葉斯定理。手中剛拿到的檢測結果並不能反映 整個事實,我們必須想辦法得到先驗概率,而這既不是什麼理論假 說,也不是什麼學術難題。如果你已經懷上了寶寶,並參加了這些 測試,且拿到了陽性結果,那貝葉斯定理將會成為你應該採取何種 行動的關鍵。 而且, 正如後文所說, 你的醫生也不一定能幫到你, 因為大部分醫生也和普通人一樣, 認為 99% 的準確率就等同於檢 測結果在 99% 的情況下都是正確的。
和醫學界類似,法律界也有一個叫作“檢察官謬誤”(prosecutor’s fallacy)的案例, 該案例就犯了沒有認真考慮貝葉斯定理的錯誤。 該案例是這樣的:假定你正在犯罪現場做犯罪調查,在兇器上採集
到了 DNA 樣本, 且該樣本與數據庫中某人的 DNA 樣本匹配。 要 知道,DNA 匹配的精度極高——平均每 300 萬個樣本中才能有 1 個擁有如此高的匹配度。
這是否意味著,嫌疑人只有三百萬分之一的概率是無辜的?讀 到這裡你應該已經有能力意識到,事實並非如此。
你還需要一個信息, 即先驗概率。 你是因為掌握了確切證據, 才確定了嫌疑人的嗎?還是說你只有 DNA 匹配這一個理由去懷疑 他, 而且該 DNA 數據庫是從全國人口中隨機挑選出來的?如果是 後者,那麼該嫌疑人的確是罪犯的先驗概率只有六千五百萬分之一: 因為全國人口為 6500 萬, 而此起案件的罪犯只有一名。 如果你對 全英國人口進行 DNA 檢測,你會得到大約 20 份匹配結果,運氣好 的話,罪犯也會在裡面。在這種情況下,剛好抓到罪犯的概率大約 為 5%。
但如果你事先能把嫌疑人的範圍縮小至 10 人, 比如你就是神 探赫爾克裡‧波洛, 犯罪現場只有 10 個疑犯, 他們被暴風雪困在 一幢鄉間別墅裡, 那情況就完全不同了。 此時的先驗概率是 10%, 如果 10 人當中有人和現場遺留的 DNA 匹配上了,那該結果為假陽 性的概率只有大約三十萬分之一。1
這不是誇大其詞,也不是故弄玄虛,因為法庭上真的有法官曾 以類似的細節為嫌疑人定罪。1990 年,一個名叫安德魯‧迪恩的男 性被法庭判有強姦罪, 證據之一就是 DNA 匹配。 當時有位專家證
1
顯然,這未必意味著他只有三十萬分之一的概率是無辜的——就算不是兇手,他 的 DNA 也有可能以某種方式出現在兇器上。
人跟法官說,DNA 來自其他人的概率只有三百萬分之一。 但安德 魯‧迪恩的罪名還是被推翻了(儘管重審之後還是判他有罪), 原 因就像某位統計學家所解釋的那樣 12 ,“如果某人是無辜的, 他的 DNA 有多大概率和犯罪現場的 DNA 匹配?”和“如果某人的 DNA 和犯罪現場的 DNA 匹配,他有多大概率是無辜的?”是兩個不同的 問題,正如“某人是教皇的可能性”和“某教皇是人的可能性”是 不一樣的。
有時謬誤也會反過來。 奧倫塔爾‧詹姆斯‧辛普森是美國橄 欖球巨星,曾被指控謀殺自己的妻子妮科爾‧布朗‧辛普森。在該 案的審判過程中, 檢方指出辛普森曾對自己的妻子施暴, 而辯方 表示:“那些打過妻子耳光或毆打過妻子的男性當中, 只有不到兩 千五百分之一的人會在一年之內謀殺妻子,這一概率可以說是微乎 其微。”13
這一謬誤與檢察官謬誤剛好相反。一年之內不僅毆打妻子,還 進一步謀殺妻子的概率,或許真的“只有”兩千五百分之一。但這 並不是我們想問的問題。我們想知道的是,如果一個男性毆打妻子, 而妻子又被謀殺了,那兇手是他丈夫的概率是多少?
德國心理學家、 風險理論專家格爾德‧吉仁澤表示, 如果兩 千五百分之一這個數字是正確的, 那麼每 10 萬名遭受家暴的女性 中就有 40 人會被謀殺。 14 而在整個美國社會中, 女性被謀殺的比 例為十萬分之五。
由此可見,雖然遭受家暴的美國婦女被丈夫殺害的先驗概率約 為每年兩千五百分之一, 但我們現在可以利用新掌握的信息——已 知該婦女是被謀殺的——來修正這個概率。
現在我們把數據代入貝葉斯公式。 假如某一年有 10 萬名婦女 遭受家暴,那麼其中大約會有 99955 人沒有被謀殺。在被謀殺的 45 名婦女中, 有 40 名是被她們的丈夫謀殺的。 所以我們說, 辯方的 謬誤與檢察官謬誤剛好相反:他們只使用了先驗概率,而忽視了新 出現的信息。
貝葉斯定理不僅能夠幫助我們分辨推理中的謬誤,還能告訴我 們某些更深刻的東西。 借用剛才的一個詞,“相反”往往是問題的 關鍵。通常,統計學與概率學會告訴我們出現某個結果的概率有多 大。如果色子沒被動手腳,那“擲 3 個色子全是數字 6 朝上”這件 事,每擲 216 次才會發生 1 次。如果我從未去過犯罪現場,那麼我 的 DNA 和現場樣本匹配的概率只有三百萬分之一。
不過我們想知道的往往並不是這些。如果我們懷疑一起玩色子 的某人是個老千, 那我們可能想知道“如果他擲出了 3 個 6, 那這 些色子沒被動手腳的概率有多大”。如果某人的 DNA 和犯罪現場的 樣本匹配上了,那我們或許想知道這是一個巧合的概率有多大。這 些問題往往都是一些“相反”的問題。
在相當長的時間裡, 概率論所關心的都是前面那一類問題。 但是在托馬斯‧貝葉斯(後面我們會介紹他的故事)於 18 世紀提 出後面的第二類問題之後, 類似的“反概率”便逐漸引起了世人 的注意。
正如你將在本書中看到的那樣,第二類問題總是能夠引發大量 爭論。貝葉斯定理不僅有大量“信徒”,也有很多“敵人”,從沒有 哪個簡短的公式能夠像它一樣引發如此廣泛的爭議。想想看,你在 網上見過有人因為球面面積公式或歐拉恒等式而吵得不可開交嗎?
我認為之所以會出現這種現象, 是因為貝葉斯定理幾乎影響 著一切事物。在已經取得某些研究結果的情況下,某科學假說為真 的概率有多大?好吧, 我可以告訴你在該假說為假的情況下, 你 取得這些研究結果的概率有多大, 可二者並不是一回事。 為了研 究前者——已經有越來越多的科學家認為這才是統計學該研究的事 情——我們需要貝葉斯定理,需要先驗概率。
不僅如此, 其實所有在不確定的情況下做出最終決策的行為, 都離不開貝葉斯定理。 更準確地說, 貝葉斯定理代表了理想決策, 決策人在多大程度上遵循貝葉斯定理,決定著該決策在多大程度上 是一個正確決策。 蘇格拉底憑藉“所有人都會死;蘇格拉底是人, 所以蘇格拉底也會死”建立了完整的形式邏輯,而這其實也只是貝 葉斯定理在“非此即彼”這種極端情況下的一個特例而已。
人類似乎就是一台貝葉斯機器,這一結論在相當深的層面上是 正確的:雖然人類在計算貝葉斯定理的時候表現得像個垃圾,但我 們在日常生活中所做出的那些決定,實際上和一個理想的貝葉斯決 策者所做出的決定幾乎一致。可惜這並不意味著所有人的決定會達 成一致——如果我和你對某件事的先驗概率的判斷大相徑庭, 那麼 即便掌握的證據相同,我們也會得出完全不同的結論。這就是我們 在面對氣候、疫苗等證據確鑿的問題時,仍會發自內心地出現重大 分歧的原因。
在更深的層次上,我們仍然是貝葉斯定理的執行者。我們的大 腦、感知,似乎都是通過“預測世界—先驗概率—通過感官獲取新 數據—更新自己的預測”這種方式工作的。我們對世界的意識體驗 似乎就是最佳的先驗概率。正所謂,我預測,故我在。
精神病學領域有一條通用準則:如果你認為自己找到了可 以解釋萬物的終極理論, 那你應該是患上了妄想症,快去醫院 看看吧。
—斯科特‧亞歷山大
我們能預測未來嗎?當然可以! 可以肯定的是,接下來的幾秒鐘內你必然會吸進一口氣,再把 它呼出去。你還可以自信地預測,你的心臟會繼續跳動,每秒一到 三下;明早太陽會照常升起,儘管具體時刻取決於你所處的緯度和 時節,但精准的數據並不難找。
你還可以預測火車到站的時間,預測你的朋友會準時抵達事先 說好的飯店,儘管你在做出這些預測時的自信程度會受到具體是哪 家鐵路公司、哪位朋友的影響。
此外你還可以預測,世界人口將持續增長至 21 世紀中葉,然後開始下降;2030 年的全球平均地表溫度將高於 1930 年。
未來並非無法窺測,我們有能力撥開迷霧一探究竟。有些東西 很好預測,比如根據傳統力學預測幾千年之內的行星軌跡;有些東 西則很難預測, 比如在混沌理論的背景下預測天氣——能預測幾天 就很了不起了。但不管怎麼說,我們總能掀開帷幔,或多或少地看 到一些未來。
大眾口中的“預測未來”通常指的是一些極為神秘的、 涉及 超自然力量的、神一般的預言。但本書提到的“預測未來”並不是 這個意思,我們很難有這種通天之術(後文會提到一位科學家,他 認為我們的確有這種能力,讀完之後你就會明白,他肯定是錯的)。 事實上,我們根本不需要那種誇張的能力就能做出預測。我們這一 生從來就沒有停止過對未來的預測,預測和生命是密不可分的。有 些預測是很基本的,比如每次吸氣時,我們都會下意識地預測“空 氣一直是可吸入的”。 有些預測是較為複雜的, 比如“街角的商店 裡會有歐倍牌麥片,我走進去就能買到”,每個決策都伴隨著類似的 預測。我們做出這些預測並非基於超能力,而是基於我們的經驗。
所有預測都存在一個問題,即結果的不確定性。我們不清楚這 個世界到底是建立在決定論之上的, 還是建立在非決定論之上的。 倘若我們可以像全知全能的上帝一樣,知曉宇宙中每個粒子的位置、 動量、性質,那我們或許就能完美地預測世間萬物,比如每只麻雀 的死亡 1 。可惜我們並非全知全能,我們能夠掌握的信息很有限 2 。 我們沒有完美的感知能力,所以我們無法看到宇宙的每個細節,但 我們可以利用有限的信息做出不完美的預測,比如我們可以大體預 測出不同事物的活動方式:像人一樣的事物會傾向於尋找食物、組建團隊,像岩石一樣的事物往往只能靜止不動。 生命不是一局國際象棋,而是一場撲克遊戲,因為前者的信息 是完全的,理論上我們可以“應對”任何狀況;而後者的信息是有 限的,我們只能儘量根據掌握的信息做出最佳決策。
本書的主要內容就是幫你學會做出最佳決策的“公式”。
《時間簡史》出版之後,史蒂芬‧霍金曾說過這樣一句話:“有人 對我說,書裡每多出一個公式,它的銷量就會減少一半。” 2 可我這本書的核心內容就是一個公式,想要一個公式都沒有也太困難了。1
這個公式就是著名的貝葉斯定理,它是一個極為簡潔的等式:
說來實在慚愧,其實我也討厭看到數學公式。雖然硬要我去使 用公式的話,我也不是做不到,但我實在感到乏味無趣。可你知道 嗎,最尷尬的是,雖然我已經寫了 3 本書,且每本書都和數學密切 相關, 但在看到 Σ 這個符號的時候, 我的大腦仍會頻頻宕機。 我 想大多數讀者都和我有著類似的感受,這或許就是出版社警告霍金 儘量不要在書中列出公式的原因。
不過我們也沒必要談方程色變,方程並不是什麼晦澀難懂的咒 語或密碼,它只是一種簡便的書寫方式,每個小符號都代表一個簡 單的步驟(我常常這樣安慰自己)。
貝葉斯定理也是如此,它只是一個概率公式,它可以根據已知信息算出某件事發生的概率。具體來說,它是一種條件概率。公式中的 豎線“|”是“在此情況下”或“以此為前提條件”的簡寫, P(A |B) 則指的是“在事件 B 已經發生的情況下,事件 A 發生的概率”。
這裡我們給出一個條件概率的簡例。你手中有一副去掉大小王 的撲克牌,你想知道從中抽到紅桃的概率。已知撲克牌一共有 52 張, 紅桃有 13 張, 我們可以據此算出其概率——記作 P( )——等於 13/52, 或 1/4, 用數學語言表示就是 p=0.25。 然後我們假定你抽了 一張牌,是梅花,那麼此時抽到紅桃的概率是多少呢?我們知道牌 堆中仍然有 13 張紅桃, 但牌的總數變成了 51, 所以此時概率變成 了 13/51,或者說 p ≈ 0.255。這就是你已經抽出一張梅花的情況下, 再抽到一張紅桃的概率,即 P( | )。
再舉一例:倫敦某天下雨的概率是多少?答案是 0.4 左右, 因 為倫敦每年大約有 150 天在下雨。現在你往窗外瞥了一眼,發現烏 雲密佈,那麼此時下雨的概率是多少?我也不知道確切答案,但我 知道,陰天下雨的概率肯定更高。
貝葉斯定理其實也是這個意思,只不過它的適用場景更為廣泛。 用通俗的語言來解釋公式的四個部分, 就是這個樣子:(事件 B 已 經發生的情況下, 事件 A 發生的概率)=(事件 A 已經發生的情況 下,事件 B 發生的概率)×(事件 A 單獨發生的概率)÷(事件 B 單獨發生的概率)。
現在假設我們的社會出現了一種大規模傳播的疾病(可以參考 剛剛經歷的新冠疫情)。
為了弄清自己到底有沒有染上這種病, 你做了一個測試。測試的指導手冊上寫著這樣一句話:“本測試的靈敏度和特異度均為 99%。”也就是說, 如果你真的染上了這種病, 那麼這個測試有 99% 的概率可以準確地告訴你,你確實染上了這種病;如果你沒有 染上這種病, 那麼它也有 99% 的概率可以準確地告訴你, 你沒有 染上這種病。另外我們還可以這樣理解:該測試的“假陰性率”和 “假陽性率”都是 1%。
現在假定你的試紙上出現了兩條紅線,也就是說測試結果呈陽 性。 這意味著什麼呢?你可能會自然而然地認為, 自己有 99% 的 概率被傳染了。
但貝葉斯定理會告訴我們,事實並非如此。
貝葉斯定理是一個非常奇怪的定理。它的表達式十分簡潔,寫 出來不占什麼篇幅,涉及的運算只有乘法和除法,就連 8 歲小孩都 會算。 它的提出者也只是一個生活在 18 世紀的普通富紳, 這位富 紳白天會在坦布裡奇韋爾斯擔任牧師,但他並不信奉英格蘭國教1 , 研究數學也只是業餘愛好。 儘管如此, 貝葉斯定理仍舊產生了極 為深遠的影響——它可以解釋為什麼即便癌症測試呈陽性的人中有 99% 都沒有癌症, 測試的準確率仍然可以高達 99%;為什麼 DNA (脫氧核糖核酸)鑒定只有兩千萬分之一的概率匹配錯人, 但它仍 有很大概率導致冤假錯案;為什麼一個科學結論明明具有“統計顯 著性”,但它仍舊有很大概率是錯的。
貝葉斯定理還涉及迷人的哲學思辨。“概率”是真實存在的 嗎?我們說擲色子有六分之一的概率擲出 1,這到底是什麼意思?它是宇宙中確切存在的事實, 還是我們對這個世界所持有的一種信 念?一次性事件也有概率嗎?如果我告訴你, 曼城隊有 90% 的概 率成為 2025 年的英超冠軍,那這到底意味著什麼呢?
每次我們面對不確定的事物做出決策時—— 一直以來我們都是 這樣做的——都可以利用貝葉斯定理來判斷該決策在多大程度上算 是個好決策。事實上,無論是怎樣的決策過程,無論你為了實現某 個目標對世界產生了多大的影響,無論你掌握的信息多麼有限,無 論你是正在尋找高濃度葡萄糖環境的細菌,是正在利用複製行為傳 播遺傳信息的基因,還是正在努力實現經濟增長的政府,只要你想 把事情幹好,你就離不開貝葉斯定理。
AI(人工智能)本質上也是貝葉斯定理的一個具體應用。 從 最基本的層面來說,AI 所做的事情就是“預測”。 一個可以分辨 貓狗圖像的 AI 應用, 本質上就是在根據過往的訓練數據和當前 的圖像信息去“預測”人類對圖片的判斷。DALL-E 2、GPT-4、 Midjourney 等各種優秀的 AI 應用, 正在以令人應接不暇的速度一 次次衝擊人們的認知,我寫下這段話的時候可能就剛好有一個震撼 世界的 AI 應用橫空出世。 不過, 這些和你談笑風生、 為你生成高 質量圖像的 AI,本質上也是在做預測,只不過它們預測的是人類作 家、人類藝術家面對這些提示詞時會如何作答。這些預測行為的基 礎都是貝葉斯定理。
大腦的工作也離不開貝葉斯定理,這就是人類容易產生視錯覺、 致幻劑可以致幻的原因,同時也是思想意識的工作原理。
貝葉斯定理可以讓我們明白, 為什麼陰謀論的觀點難以轉變; 為什麼兩個人可以根據同樣的證據得出完全相反的結論。比如,為
什麼那些科學事實能夠讓我相信疫苗安全有效,卻無法說服一個懷 疑論者呢?答案就是,根據貝葉斯定理,一個人對新信息的判斷會 受到既有認知的影響。這並不是說那些懷疑疫苗的人、那些陰謀論 者是大腦運轉方式與眾不同的外星人,而是說他們也是完全理性的 人,只不過他們的行為建立在固有思想之上。貝葉斯定理可以很好 地解釋這一點。
由此可見,雖然貝葉斯定理不是萬物理論,但實際上也差不多 了。一旦你開始站在貝葉斯定理的視角去看待問題,你就會發現貝葉 斯定理真的是無處不在。我寫這本書的目的就是幫你做到這一點。
通常人們會用醫療檢測來解釋貝葉斯定理,本書也不例外。這 裡我們給出一些比較可靠的數據:假定你正準備進行乳腺癌的篩查 檢測,且已經知道,如果某位女性的確患有癌症,那麼乳房 X 光在 80% 的情況下可以正確識別出癌症(靈敏度為 80%), 在另外 20% 的情況下會發生漏診,即假陰性;如果某位女性沒有癌症,那麼乳 房 X 光在 90% 的情況下可以正確排除癌症(特異度為 90%),在另 外 10% 的情況下會發生誤診,即假陽性。
假定你的檢測結果呈陽性, 那是不是說明, 你有 90% 的概率 患上了乳腺癌?不是的。事實是,根據上面給定的這些信息,你根 本無法判斷自己患上乳腺癌的概率到底有多大。
你還需要額外掌握一個信息,那就是在參加檢測之前,你對自己 患上乳腺癌的概率的預估。最簡單的預估方式就是找出特定時期內, 與你同齡的女性中的乳腺癌患者的比例。我們假定這一比例為 1%。
為了讓案例更加具體,我們進一步假定共有 10 萬名女性參加了 檢測,那麼按照 1% 的患病比例來看,這些人中一共有 1000 名乳腺
癌患者。 在這 1000 名患者當中, 乳房 X 光只能正確檢測出 800 名, 另外 200 名將會出現漏診;剩下的 99000 人沒有患乳腺癌, 在這些 健康人當中, 乳房 X 光只能正確判斷出 89100 人, 這意味著會有 99000-89100=9900 人被誤診為乳腺癌。下面我們把數據整理成表格:
有乳腺癌 (共 1000 人)
80% (真陽性) 800 人
20% (假陰性) 200 人
沒有乳腺癌 (共 99000 人)
檢測結果呈陽性
檢測結果呈陰性
10% (假陽性) 9900 人
90% (真陰性) 89100 人
現在你明白了吧,得到陽性結果的女性一共有 10700 名,其中 只有 800 人真的患有乳腺癌。換句話說,假定你的測試結果呈陽性, 那麼你真正患有乳腺癌的概率是 800/10700 ≈ 0.07,即 7%。
具體結果完全取決於檢測前人群中患有乳腺癌者的比例。假如 檢測對象是高風險人群,比如具有家族癌症史的老年婦女,那麼這 一比例可能高達 10%,此時計算結果會發生翻天覆地的變化。
有乳腺癌 (共 10000 人)
80% (真陽性) 8000 人
20% (假陰性) 2000 人
沒有乳腺癌 (共 90000 人)
檢測結果呈陽性
檢測結果呈陰性
10% (假陽性) 9000 人
90% (真陰性) 81000 人
現在真陽性的人數從 800 漲到了 8000, 假陽性的人數下降 至 9000。 此時一個拿到陽性結果的人真正患乳腺癌的概率變成了 8000/17000,結果約為 47%。知道這一點後,拿到陽性結果的人會 比剛才更加憂慮。整個檢測方法沒有任何變化,發生變化的只有先 驗概率。
換句話說,貝葉斯定理可以告訴你結果的可靠程度。可是要做 到這一點的話,你必須對這件事有一個先驗預估。
現在我們再來看看這個公式(本書的銷量該不會又減半了 吧……畢竟這個公式剛才已經出現過一次)。
經過一系列計算之後, 我們得到的結果就是 P(A|B) , 即事件 B 已經發生的情況下, 事件 A 發生的概率。 癌症檢測與之類似, 我 們想知道的是, 在檢測結果呈陽性的情況下, 該患者真正患癌的 概率。
可是“靈敏度 80%”並沒有給出 P(A|B) , 反而給出了與之相 反的 P(B|A), 即事件 A 已經發生的情況下,事件 B 發生的概率。也 就是說,它可以告訴我們,一個真正患有乳腺癌的人,有多大概率 取得陽性結果。
乍一看好像沒什麼不同,實際上這兩者的區別就像“某個人剛 好是教皇的概率僅有八十億分之一”和“教皇剛好是個人類的概率 僅有八十億分之一”的區別一樣大。3
為了得到想要的數據,我們需要更多信息。在癌症檢測的例子中,我們需要的額外信息是乳腺癌患者在人群中的比例。在醫學中, 我們將其稱為發病率,或背景發生率;在貝葉斯定理中,這種額外 信息一般被稱為先驗概率。
醫學中的先驗概率比較容易獲得, 也很容易定義。 比如你想 知道某人患上亨廷頓病的風險,那你可以去查詢全科診所的診療記 錄 4 ,然後據此算出平均每 10 萬人當中約有 12.3 人患有該疾病。
其他情況則要複雜得多。如果幾年前你想計算俄烏爆發衝突的 概率,那這個先驗概率該怎麼算?先算一下俄烏每年爆發衝突的頻 次?還是先統計一下所有衝突爆發的頻次?或是先調查一下,看看 兩國邊境突然增派大量坦克的時候,雙方爆發衝突的概率?
再舉一例。 假定我提出了一個科學假說, 做了一次相關實 驗,且取得了不錯的數據,此時該假說是一個正確假說的概率有多 高?我們進一步假定, 如果該假說是錯誤的, 那每 20 次實驗中只 有 1 次能取得這種數據。這是不是意味著,我的假說大概率是正確 的?不是這樣的, 因為它還和另一個概率有關——我開始做實驗之 前,該假說為真的概率,即先驗概率。可我該上哪兒去搞到這個數 據呢?
法庭辯護中也有一個經典案例。 在已經取得某些法庭證據的 情況下, 該嫌疑人有罪的概率是多少?假定嫌疑人的 DNA 恰好出 現在現場的概率只有百萬分之一,那是不是說明警察只有百萬分之 一的概率抓錯了嫌疑人?不是這樣的,因為這還取決於一開始警察 就抓到了正確嫌疑人的概率有多大。可問題是,這項數據上哪兒去 找呢?
放心,這些問題本書都會一一作答(有很多數學家研究過相關
10
貝葉斯定理 問題)。 需要牢記的是, 必須先得到一個先驗概率, 我們才能進一 步應用貝葉斯定理。缺失了先驗概率,我們只能得到一些不靠譜的 結論。 大多數人第一次聽說貝葉斯定理都是在醫學領域,所以我們的 旅程也從醫學領域開始。
這麼多年來, 我逐漸愛上了貝葉斯定理。 第一次聽說貝葉斯 定理, 是在本‧戈爾達克瑞於 21 世紀初在《衛報》上開設的《小 心壞科學!》專欄當中。自那時起,我就對貝葉斯定理越來越著迷。 包括本書在內,我已經出版了 3 部作品,其中每本書都或多或少地 提到了貝葉斯定理。該定理常常能夠得出一些反直覺的結論,令人 連連稱奇。比如,某項測試的準確率為 99%,並不意味著該測試在 99% 的情況下是正確的。這到底是什麼鬼話?雖然只要按部就班地 推導,就能逐漸理解這一事實,但類似的結論總是能夠讓人感到不 可思議,刷新認知(至少我的感受是這樣的)。
過去 4 年當中, 也就是 2020 年初全球暴發新冠疫情之後, 貝 葉斯定理推導出的那些結論變得越來越重要了。早在 2020 年 4 月, 大部分人還處於居家隔離狀態的時候,英國前首相托尼‧布萊爾等 人就呼籲政府向那些已經得過新冠肺炎、體內已有抗體的人發放免 疫證明,允許他們外出活動(當然這發生在人們意識到各種變異病 毒會導致患者很容易複陽之前)。
抗體測試問世沒多久,美國政府就緊急批准了一種抗體檢測方 法,該方法的靈敏度和特異度大約都是 95%。5
聽上去挺靠譜。事實上,2020 年 4 月,英國大約有 3% 的人口感染了新冠病毒,這一比例就是所謂的先驗概率。如果有 100 萬人 參加檢測,那麼其中大約會有 3 萬人是新冠肺炎感染者。在這 3 萬 名患者當中,會有 28500 人的檢測結果呈陽性;剩下的 97 萬健康人 當中,則會有 48500 人的結果呈現陽性。
由此可見,在全部 77000 個陽性結果當中,只有三分之一多一 點的檢測者的確感染了新冠病毒(這就是後驗概率)。 英國人口一 共有 6500 萬, 假如政府真的讓所有人都參加了這項檢測, 並向那 些結果呈陽性的人發放免疫證明,就會導致有 300 多萬根本沒有感 染過新冠病毒的人可以自由地走街串巷,甚至去擁抱免疫力低下的 爺爺奶奶, 而事實上這些人根本不安全。 不弄懂貝葉斯定理的話, 你就沒法搞清楚這件事。
當時英國有一群所謂的“權威人士”對居家隔離政策持懷疑態 度,其中有一部人已經察覺到檢測數據有些不對勁,從而引發了一 場和貝葉斯定理相關的巨大爭議。這些人當中最著名的應該就是前 威爾士國務大臣約翰‧雷德伍德,他認為那些錯誤的檢測結果會歪 曲新冠疫情的真相,並強烈要求政府顧問儘快給出一個制止這種現 象的方案。6
這些懷疑論者之所以會覺得檢測數據不對勁,是因為他們誤解 了統計學教授戴維‧斯皮格霍爾特爵士在一個訪談節目中的言論。 戴維‧斯皮格霍爾特經常積極地在各種電視節目和廣播頻道中向公 眾耐心解釋什麼是檢測的準確度,什麼是疫苗的有效性。大家已經 明白, 檢測的假陽性率為 1%, 並不意味著只有 1% 的陽性結果是 誤診。當時社會正處於第一波疫情和第二波疫情之間的緩衝期,此 時人們只要一打噴嚏就得做 PCR(聚合酶鏈式反應)檢測。從數據上來看,當時英國的新冠肺炎患者非常少,隔離政策似乎的確降低 了感染率,可整體上來看,感染率似乎又有一種上升趨勢。
那些持懷疑論的“權威人士”認為,感染率上升只是一種假像, 貝葉斯定理可以解釋個中玄機。 具體來說, 當時有 0.1% 的人感染 了新冠病毒。如果我們隨機對人群進行檢測,且該檢測方式可以在 99% 的情況下正確識別出那些沒有感染新冠病毒的健康人,在 90% 的情況下正確識別出那些的確感染了新冠病毒的患者,那麼最終將 有超過 90% 的人得到假陽性結果。1
這個結論的確沒錯,問題在於他們對貝葉斯定理的理解不夠深 刻。 首先, 先驗概率真的是 0.1% 嗎?這一概率成立的前提是, 參 與檢測的人員都是從整個人口當中隨機挑選出來的,但事實並非如 此:參與檢測的要麼是已經表現出一定症狀的人,要麼是接觸過確 診病例的人,這些人感染新冠病毒的概率要比其他人高得多。雖然 我們不知道具體高多少, 但我們知道, 即便先驗概率只有 1%, 假 陽性的比例也會大幅下降至 50%;如果先驗概率為 10%,那麼大約 有 90% 的陽性結果是真陽性。
那麼, 我們假定假陽性率為 1%, 會不會有點太誇張了呢?事 實上,2020 年夏天新冠疫情開始減弱的時候,檢測結果呈陽性的比 例只有 0.05%, 其中包括了真陽性和假陽性, 所以假陽性率不可能 比這一數值還高。如此一來,在新冠肺炎發病率為 0.1% 的前提下,假定檢測人數為 100 萬,其中有 1000 人確實感染了新冠病毒,那麼該檢測只能識 別出其中的 900 名患者。剩下的 999000 人當中,該檢測將給出 9990 份假陽性報 告。所以拿到陽性結果的人一共有 900+9990=10890,真陽性的比例只有 900/10890, 還不到 9%。假陽性率將下降至 35%。發病率越高,假陽性率就越低。 其實不僅僅是新冠疫情,幾乎任何形式的醫學檢測都會涉及貝 葉斯定理。
英國的國家醫療服務體系(NHS)提供 3 種常規的癌症篩查, 即乳腺癌、 宮頸癌、 結腸癌。 雖然前列腺檢查不在常規檢查之內, 但 50 歲以上的男性如果有需求,也可以把這項檢查加進去。
為什麼前列腺檢查沒有加進常規的癌症篩查呢?畢竟癌症篩查 聽上去就是件有益無害的事,越早發現越容易治療嘛。難道前列腺 檢查有什麼壞處嗎?
就像本書中的其他所有問題一樣,貝葉斯定理可以給出答案。
前列腺癌的篩查是通過 PSA(前列腺特異性抗原)檢測來進行 的。醫護人員會檢驗測試者的血液,如果血液中的 PSA 指數過高—正常值是 3~4 納克每毫升——測試者就有必要接受進一步的檢查, 比如掃描或活檢。 需要注意的是,PSA 過高既有可能是前列腺癌的 信號,也有可能是感染、炎症的徵兆,還有可能是年邁導致的自然 現象。
PSA 檢測沒有前面提到的那些檢測方法那麼精准。 根據英國醫 療諮詢機構——國家衛生與臨床優化研究所(NICE)提供的數據 7 , 如果以 3 納克每毫升的標準對患者進行 PSA 檢測,那麼該檢測將成 功識別出 32% 的患者(靈敏度),以及 85% 的健康人(特異度)。
另外我們知道,50 歲以上的男性患者中,大約有 2% 患有前列 腺癌。 8 假如參加 PSA 檢測的人數共計為 100 萬, 那其中大約會有 2 萬人確實患有前列腺癌。可是這項檢測只能正確識別其中的 6400 名患者。 剩下的 98 萬健康人當中, 將有 147000 人需要進行額外的後續檢查。如果一名 50 多歲的男性在該檢測中得到了陽性結果, 那他實際上只有 4% 的概率真正患有前列腺癌。
4% 的概率需要我們認真對待嗎?或許吧, 但可以肯定的是, 陽性患者需要進行額外檢測:有些會造成創傷,有些會令身體不適, 有些甚至還具有一定風險。當然,英國的國家醫療服務體系還要為 這些數以萬計的核磁掃描、活體檢測支付數百萬英鎊,而這些錢本 可以用來支付他汀類藥物、腎移植費用或是護士的工資。此外,前 列腺癌的檢測還有很多問題,比如很多情況下前列腺癌細胞的擴散 極為緩慢,以至於很多患者根本無法意識到自己得了前列腺癌;有 時,直到屍檢這一步,人們才發現患者患有前列腺癌,但他們的死 因卻和前列腺癌毫不相干。
當然, 這裡面還有一個問題, 那就是 32% 的靈敏度、85% 的 特異度這兩個數值,其實是 3 納克每毫升這項檢測標準造成的。如 果我們把檢測標準提高到 4 納克每毫升,會發生什麼?
答案就是, 特異度會從 85% 升到 91%, 也就是說該檢測能夠 正確識別出更多健康人。 但代價是靈敏度會從 32% 降至 21%, 也 就是說該檢測正確識別癌症患者的能力下降了。 假如這次也有 100 萬人參加了測試, 那麼假陽性人數會下降至 88200, 但與此同時真 陽性人數也變少了——20000 名患者當中只能正確識別出 4200 人。 這種情況下,如果一名 50 多歲的男性在該檢測中得到了陽性結果, 那他實際上只有 4.5% 的概率真正患有前列腺癌, 並沒有比之前高 多少。
我們無法規避這些數據之前的關聯性。我們可以繼續提高檢測 閾值,比如把標準設定為 5 納克每毫升,那麼假陽性的數量會進一步下降,但代價是假陰性的數量會進一步上升。如果降低檢測閾值, 那麼假陰性的數量會下降,但代價是假陽性的數量會上升。二者互 相拖後腿的現象是不可避免的。想要真正解決這一矛盾,我們只能 在醫學上尋求另一種更優秀的檢測方式(這有點像“統計顯著性” 問題,在後文中我們還會具體分析)。
雖然乳腺癌和結腸癌的篩查更為精准,但即便是在這兩個領域, 其準確性也高度依賴于患者人數在全部人口中的比例。一項大型調 查發現 9 ,在連續 10 年、每年都進行乳房 X 光檢查的女性當中,有 60% 的人得到過一次或多次的假陽性結果,繼而參加了活檢等形式 的額外檢查,這些煩瑣的檢查令她們感到“焦慮、痛苦,總是擔心 自己真的得了乳腺癌”。 這一切真的值得嗎?答案取決於該疾病在 人群中的發病率,即先驗概率。年輕人很少得乳腺癌,如果我們對 40 歲以下的女性進行乳腺癌篩查,那麼即便靈敏度和特異度都很高, 也會出現較高的假陽性率,所以對大齡女性進行乳腺癌篩查會更有 價值。 英國國家衛生與臨床優化研究所認為, 只有對 50 歲以上的 女性進行乳腺癌篩查, 才具有成本效益。 10 如果不懂貝葉斯定理, 我們就無法得出這一結論。
各位准父母最好也瞭解一下貝葉斯定理。 市面上有一種叫作 “無創產前篩查”(NIPT)的技術, 這種技術會利用孕婦的血液樣 本來分析胎兒的染色體狀況。在英國,國家醫療服務體系會向高風 險孕婦提供這一服務。當然你也可以去私人診所,其價格在 500 英 鎊左右。
雖然該篩查的準確率高達 99%, 但就像前面的例子一樣, 其 準確率無法幫助我們判斷手中的檢測結果到底在多大程度上是準確的。唐氏綜合征、帕托綜合征、18 三體綜合征都是這項檢測的目標 疾病,這些疾病不僅非常罕見,而且相當嚴重。患有唐氏綜合征的 孩子,幸運的話可以活幾十年,大多需要終生陪護;而患有帕托綜 合征、18 三體綜合征的孩子通常會在出生後的數月、 數年之內夭 折。顯然,檢測結果是否準確對父母來說非常重要。
調查發現 11 , 如果參加無創產前篩查的人不是高危孕婦, 而是 一群普通孕婦, 那麼檢測結果往往會呈現假陽性。 唐氏綜合征的 “陽性預測值”,即陽性檢測結果為真陽性的概率為 82%,帕托綜合 征的為 49%,18 三體綜合征的為 37%。
如果參加無創產前篩查的是一群高危孕婦, 那麼這些疾病的 陽性預測值會大幅上升——18 三體綜合征的陽性預測值會躍升至 84%。 也就是說, 如果對所有孕婦進行無差別檢測, 那麼每 3 份陽 性結果中就有 2 份是假的;如果只對高危孕婦進行檢測,那麼得到 假陽性結果的概率還不到六分之一。
這背後仍然是貝葉斯定理。手中剛拿到的檢測結果並不能反映 整個事實,我們必須想辦法得到先驗概率,而這既不是什麼理論假 說,也不是什麼學術難題。如果你已經懷上了寶寶,並參加了這些 測試,且拿到了陽性結果,那貝葉斯定理將會成為你應該採取何種 行動的關鍵。 而且, 正如後文所說, 你的醫生也不一定能幫到你, 因為大部分醫生也和普通人一樣, 認為 99% 的準確率就等同於檢 測結果在 99% 的情況下都是正確的。
和醫學界類似,法律界也有一個叫作“檢察官謬誤”(prosecutor’s fallacy)的案例, 該案例就犯了沒有認真考慮貝葉斯定理的錯誤。 該案例是這樣的:假定你正在犯罪現場做犯罪調查,在兇器上採集
到了 DNA 樣本, 且該樣本與數據庫中某人的 DNA 樣本匹配。 要 知道,DNA 匹配的精度極高——平均每 300 萬個樣本中才能有 1 個擁有如此高的匹配度。
這是否意味著,嫌疑人只有三百萬分之一的概率是無辜的?讀 到這裡你應該已經有能力意識到,事實並非如此。
你還需要一個信息, 即先驗概率。 你是因為掌握了確切證據, 才確定了嫌疑人的嗎?還是說你只有 DNA 匹配這一個理由去懷疑 他, 而且該 DNA 數據庫是從全國人口中隨機挑選出來的?如果是 後者,那麼該嫌疑人的確是罪犯的先驗概率只有六千五百萬分之一: 因為全國人口為 6500 萬, 而此起案件的罪犯只有一名。 如果你對 全英國人口進行 DNA 檢測,你會得到大約 20 份匹配結果,運氣好 的話,罪犯也會在裡面。在這種情況下,剛好抓到罪犯的概率大約 為 5%。
但如果你事先能把嫌疑人的範圍縮小至 10 人, 比如你就是神 探赫爾克裡‧波洛, 犯罪現場只有 10 個疑犯, 他們被暴風雪困在 一幢鄉間別墅裡, 那情況就完全不同了。 此時的先驗概率是 10%, 如果 10 人當中有人和現場遺留的 DNA 匹配上了,那該結果為假陽 性的概率只有大約三十萬分之一。1
這不是誇大其詞,也不是故弄玄虛,因為法庭上真的有法官曾 以類似的細節為嫌疑人定罪。1990 年,一個名叫安德魯‧迪恩的男 性被法庭判有強姦罪, 證據之一就是 DNA 匹配。 當時有位專家證
1
顯然,這未必意味著他只有三十萬分之一的概率是無辜的——就算不是兇手,他 的 DNA 也有可能以某種方式出現在兇器上。
人跟法官說,DNA 來自其他人的概率只有三百萬分之一。 但安德 魯‧迪恩的罪名還是被推翻了(儘管重審之後還是判他有罪), 原 因就像某位統計學家所解釋的那樣 12 ,“如果某人是無辜的, 他的 DNA 有多大概率和犯罪現場的 DNA 匹配?”和“如果某人的 DNA 和犯罪現場的 DNA 匹配,他有多大概率是無辜的?”是兩個不同的 問題,正如“某人是教皇的可能性”和“某教皇是人的可能性”是 不一樣的。
有時謬誤也會反過來。 奧倫塔爾‧詹姆斯‧辛普森是美國橄 欖球巨星,曾被指控謀殺自己的妻子妮科爾‧布朗‧辛普森。在該 案的審判過程中, 檢方指出辛普森曾對自己的妻子施暴, 而辯方 表示:“那些打過妻子耳光或毆打過妻子的男性當中, 只有不到兩 千五百分之一的人會在一年之內謀殺妻子,這一概率可以說是微乎 其微。”13
這一謬誤與檢察官謬誤剛好相反。一年之內不僅毆打妻子,還 進一步謀殺妻子的概率,或許真的“只有”兩千五百分之一。但這 並不是我們想問的問題。我們想知道的是,如果一個男性毆打妻子, 而妻子又被謀殺了,那兇手是他丈夫的概率是多少?
德國心理學家、 風險理論專家格爾德‧吉仁澤表示, 如果兩 千五百分之一這個數字是正確的, 那麼每 10 萬名遭受家暴的女性 中就有 40 人會被謀殺。 14 而在整個美國社會中, 女性被謀殺的比 例為十萬分之五。
由此可見,雖然遭受家暴的美國婦女被丈夫殺害的先驗概率約 為每年兩千五百分之一, 但我們現在可以利用新掌握的信息——已 知該婦女是被謀殺的——來修正這個概率。
現在我們把數據代入貝葉斯公式。 假如某一年有 10 萬名婦女 遭受家暴,那麼其中大約會有 99955 人沒有被謀殺。在被謀殺的 45 名婦女中, 有 40 名是被她們的丈夫謀殺的。 所以我們說, 辯方的 謬誤與檢察官謬誤剛好相反:他們只使用了先驗概率,而忽視了新 出現的信息。
貝葉斯定理不僅能夠幫助我們分辨推理中的謬誤,還能告訴我 們某些更深刻的東西。 借用剛才的一個詞,“相反”往往是問題的 關鍵。通常,統計學與概率學會告訴我們出現某個結果的概率有多 大。如果色子沒被動手腳,那“擲 3 個色子全是數字 6 朝上”這件 事,每擲 216 次才會發生 1 次。如果我從未去過犯罪現場,那麼我 的 DNA 和現場樣本匹配的概率只有三百萬分之一。
不過我們想知道的往往並不是這些。如果我們懷疑一起玩色子 的某人是個老千, 那我們可能想知道“如果他擲出了 3 個 6, 那這 些色子沒被動手腳的概率有多大”。如果某人的 DNA 和犯罪現場的 樣本匹配上了,那我們或許想知道這是一個巧合的概率有多大。這 些問題往往都是一些“相反”的問題。
在相當長的時間裡, 概率論所關心的都是前面那一類問題。 但是在托馬斯‧貝葉斯(後面我們會介紹他的故事)於 18 世紀提 出後面的第二類問題之後, 類似的“反概率”便逐漸引起了世人 的注意。
正如你將在本書中看到的那樣,第二類問題總是能夠引發大量 爭論。貝葉斯定理不僅有大量“信徒”,也有很多“敵人”,從沒有 哪個簡短的公式能夠像它一樣引發如此廣泛的爭議。想想看,你在 網上見過有人因為球面面積公式或歐拉恒等式而吵得不可開交嗎?
我認為之所以會出現這種現象, 是因為貝葉斯定理幾乎影響 著一切事物。在已經取得某些研究結果的情況下,某科學假說為真 的概率有多大?好吧, 我可以告訴你在該假說為假的情況下, 你 取得這些研究結果的概率有多大, 可二者並不是一回事。 為了研 究前者——已經有越來越多的科學家認為這才是統計學該研究的事 情——我們需要貝葉斯定理,需要先驗概率。
不僅如此, 其實所有在不確定的情況下做出最終決策的行為, 都離不開貝葉斯定理。 更準確地說, 貝葉斯定理代表了理想決策, 決策人在多大程度上遵循貝葉斯定理,決定著該決策在多大程度上 是一個正確決策。 蘇格拉底憑藉“所有人都會死;蘇格拉底是人, 所以蘇格拉底也會死”建立了完整的形式邏輯,而這其實也只是貝 葉斯定理在“非此即彼”這種極端情況下的一個特例而已。
人類似乎就是一台貝葉斯機器,這一結論在相當深的層面上是 正確的:雖然人類在計算貝葉斯定理的時候表現得像個垃圾,但我 們在日常生活中所做出的那些決定,實際上和一個理想的貝葉斯決 策者所做出的決定幾乎一致。可惜這並不意味著所有人的決定會達 成一致——如果我和你對某件事的先驗概率的判斷大相徑庭, 那麼 即便掌握的證據相同,我們也會得出完全不同的結論。這就是我們 在面對氣候、疫苗等證據確鑿的問題時,仍會發自內心地出現重大 分歧的原因。
在更深的層次上,我們仍然是貝葉斯定理的執行者。我們的大 腦、感知,似乎都是通過“預測世界—先驗概率—通過感官獲取新 數據—更新自己的預測”這種方式工作的。我們對世界的意識體驗 似乎就是最佳的先驗概率。正所謂,我預測,故我在。
主題書展
更多
主題書展
更多書展購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。










