相關商品
商品簡介
序
目次
商品簡介
本書對因果推斷相關知識進行了系統、全面的介紹,為便於學習,對大多數知識點都進行了詳細的推導說明。
序
近年來,人工智能技術取得了長足的進步,DeepMind公司的AlphaGo橫掃世界圍棋高手,AlphaFold能夠精確地基於氨基酸序列來預測蛋白質結構,其準確性可以與使用冷凍電子顯微鏡(CryoEM)、核磁共振或X單晶衍射等方法解析蛋白質結構的準確性相媲美。人工智能技術在許多領域取得了不可思議的進步,語音翻譯、圖像場景識別等曾是科幻小說中夢想的成就,現在已經成為現實。在技術突破和市場需求的多方驅動下,人工智能技術已經從學術走向實踐,正加速向各個產業滲透,改造各行各業。如同蒸汽時代的蒸汽機、電氣時代的發電機、信息時代的計算機和互聯網,人工智能正成為推動人類進入智能時代的決定性力量。
但是,現有的人工智能技術幾乎都是基於統計學或黑箱的形式,主要關注變量之間的相關性而非因果性,這使其性能有嚴重的理論局限性。它在動物擅長的一些技能方面表現並不好,特別是將解決問題的能力遷移至新問題,以及進行任意形式的泛化時。一些常識問題對於人類而言很簡單,但對於現在的人工智能技術而言並不簡單。因此,2011年圖靈獎得主、貝葉斯網絡之父朱迪亞·珀爾(Judea Pearl)教授認為,現在人工智能技術的發展進入了新的瓶頸期,“所有令人印象深刻的深度學習成果加起來不過是曲線擬合罷了”(All the impressive achievements of deep learning amount to just curve fitting),而且“深度學習技術是一種非常通用和強大的曲線擬合技術,它可以識別以前隱藏的模式,推斷出趨勢,並預測出各種問題的結果,但它僅僅停留在相關性這個層次上,也就是曲線擬合,而曲線擬合方法在表示給定數據集方面的一個風險是過度擬合,即算法不能識別出數據中的正常波動,終會被干擾所迷惑”。珀爾認為,除非算法及其控制的機器能夠推理因果關係,或者至少概念化差異,否則算法的效用和通用性永遠不會接近於人類。麻省理工學院(MIT)的研究人員發表的一篇論文也指出,要創建類人的學習和思考的機器,需要它們能夠構建出世界的因果模型,能夠理解和解釋它們的環境,而不僅僅是使用模式識別來解決問題。因此,現有的人工智能技術需要超越現在的相關性關係層次,深入探究因果關係,終製造出像人一樣思考的機器。
因果關係一直是人類認識世界的基本方式,也是現代科學的兩大基石之一。自古以來,關於因果關係的研究一直吸引著人們。通過系統性觀察和試驗發現自然規律、探索現象之間的因果關係,一直是各種科學研究的終目標。愛因斯坦就認為西方科學是建立在以因果律為基礎的形式邏輯之上的。
相關性關係與因果關係之間的關係由萊辛巴赫(Reichenbach)形式化為著名的共同原因原理,即如果兩個隨機變量X和Y在統計學上具有相關性,那麼其相互關係必為以下關係之一:
● X導致Y;
● Y導致X;
● 存在一個隨機變量Z,它是引起X和Y的共同原因。
因此,與相關性關係相比,因果關係具有更多的信息量,體現了變量之間更本質的關係。因果推斷的中心任務就是研究變量之間的因果關係:
● 分析如果某些變量被干預會發生什麼;
● 分析影響干預及其結果的混雜因素;
● 分析以前從未觀察到的情況的結果。
因果關係與相關性關係不同,相關性關係指的是,如果我們觀測到了一個變量X的分布,就能推斷出另一個變量Y的分布,那麼說明X和Y是有相關性的。而因果性則強調,如果我們干預了某個變量X,且這種干預引起了變量Y的變化,那麼我們才能說明X是Y的因(cause),而Y是X的果(effect)——這是因果關係的基本出發點。基於因果關係的分析方法,我們可以避免得出“制止公雞打鳴就可以阻擋日出”這樣荒謬的結論。因此,基於因果關係的預測方法比基於相關性關係的預測方法更具有普適性。我們在人工智能研究中需要尋找這樣的因果關係,而不僅僅是簡單的相關性關係。
除人工智能研究領域之外,因果推斷在經濟學、社會學、醫學和法學等領域也有廣泛的應用。比如,在廣告界有一句廣為流傳的話:“我知道我的廣告費有一半被浪費了,但遺憾的是,我不知道是哪一半被浪費了。”這實際上是一個衡量廣告效果的問題。因為無法很精確地衡量廣告的效果,所以沒辦法進行進一步的廣告投放優化,只能白白浪費廣告費。從因果推斷的角度來看,如果我們把投放廣告看作一種“干預”(intervention),這個問題其實就是廣告投放的因果效應分析問題,需要我們通過因果推斷的方法進行分析。
從數據中分析、挖掘相關性關係的研究發展迅速,相關學習資料也很多,但因果推斷方面的學習資料還相對較少。國外有少量關於因果推斷的書籍。Judea Pearl教授在因果推斷方面有三本著作:The Book of Why: The New Science of Cause and Effect、Causal Inference in Statistics: A Primer和Causality: Models,Reasoning,and Inference。耶魯大學Scott Cunningham教授編寫的Causal Inference:The Mixtape 2021年剛出版。哈佛大學流行病學家James Robins和他的同事也在寫一本關於因果推斷的書,目前提供了網絡版。這些書籍從不同角度對因果推斷進行了介紹,並且對因果推斷各個方面的問題都有比較精辟的論述,但對於因果推斷的初學者而言,這些材料相對較難。因
但是,現有的人工智能技術幾乎都是基於統計學或黑箱的形式,主要關注變量之間的相關性而非因果性,這使其性能有嚴重的理論局限性。它在動物擅長的一些技能方面表現並不好,特別是將解決問題的能力遷移至新問題,以及進行任意形式的泛化時。一些常識問題對於人類而言很簡單,但對於現在的人工智能技術而言並不簡單。因此,2011年圖靈獎得主、貝葉斯網絡之父朱迪亞·珀爾(Judea Pearl)教授認為,現在人工智能技術的發展進入了新的瓶頸期,“所有令人印象深刻的深度學習成果加起來不過是曲線擬合罷了”(All the impressive achievements of deep learning amount to just curve fitting),而且“深度學習技術是一種非常通用和強大的曲線擬合技術,它可以識別以前隱藏的模式,推斷出趨勢,並預測出各種問題的結果,但它僅僅停留在相關性這個層次上,也就是曲線擬合,而曲線擬合方法在表示給定數據集方面的一個風險是過度擬合,即算法不能識別出數據中的正常波動,終會被干擾所迷惑”。珀爾認為,除非算法及其控制的機器能夠推理因果關係,或者至少概念化差異,否則算法的效用和通用性永遠不會接近於人類。麻省理工學院(MIT)的研究人員發表的一篇論文也指出,要創建類人的學習和思考的機器,需要它們能夠構建出世界的因果模型,能夠理解和解釋它們的環境,而不僅僅是使用模式識別來解決問題。因此,現有的人工智能技術需要超越現在的相關性關係層次,深入探究因果關係,終製造出像人一樣思考的機器。
因果關係一直是人類認識世界的基本方式,也是現代科學的兩大基石之一。自古以來,關於因果關係的研究一直吸引著人們。通過系統性觀察和試驗發現自然規律、探索現象之間的因果關係,一直是各種科學研究的終目標。愛因斯坦就認為西方科學是建立在以因果律為基礎的形式邏輯之上的。
相關性關係與因果關係之間的關係由萊辛巴赫(Reichenbach)形式化為著名的共同原因原理,即如果兩個隨機變量X和Y在統計學上具有相關性,那麼其相互關係必為以下關係之一:
● X導致Y;
● Y導致X;
● 存在一個隨機變量Z,它是引起X和Y的共同原因。
因此,與相關性關係相比,因果關係具有更多的信息量,體現了變量之間更本質的關係。因果推斷的中心任務就是研究變量之間的因果關係:
● 分析如果某些變量被干預會發生什麼;
● 分析影響干預及其結果的混雜因素;
● 分析以前從未觀察到的情況的結果。
因果關係與相關性關係不同,相關性關係指的是,如果我們觀測到了一個變量X的分布,就能推斷出另一個變量Y的分布,那麼說明X和Y是有相關性的。而因果性則強調,如果我們干預了某個變量X,且這種干預引起了變量Y的變化,那麼我們才能說明X是Y的因(cause),而Y是X的果(effect)——這是因果關係的基本出發點。基於因果關係的分析方法,我們可以避免得出“制止公雞打鳴就可以阻擋日出”這樣荒謬的結論。因此,基於因果關係的預測方法比基於相關性關係的預測方法更具有普適性。我們在人工智能研究中需要尋找這樣的因果關係,而不僅僅是簡單的相關性關係。
除人工智能研究領域之外,因果推斷在經濟學、社會學、醫學和法學等領域也有廣泛的應用。比如,在廣告界有一句廣為流傳的話:“我知道我的廣告費有一半被浪費了,但遺憾的是,我不知道是哪一半被浪費了。”這實際上是一個衡量廣告效果的問題。因為無法很精確地衡量廣告的效果,所以沒辦法進行進一步的廣告投放優化,只能白白浪費廣告費。從因果推斷的角度來看,如果我們把投放廣告看作一種“干預”(intervention),這個問題其實就是廣告投放的因果效應分析問題,需要我們通過因果推斷的方法進行分析。
從數據中分析、挖掘相關性關係的研究發展迅速,相關學習資料也很多,但因果推斷方面的學習資料還相對較少。國外有少量關於因果推斷的書籍。Judea Pearl教授在因果推斷方面有三本著作:The Book of Why: The New Science of Cause and Effect、Causal Inference in Statistics: A Primer和Causality: Models,Reasoning,and Inference。耶魯大學Scott Cunningham教授編寫的Causal Inference:The Mixtape 2021年剛出版。哈佛大學流行病學家James Robins和他的同事也在寫一本關於因果推斷的書,目前提供了網絡版。這些書籍從不同角度對因果推斷進行了介紹,並且對因果推斷各個方面的問題都有比較精辟的論述,但對於因果推斷的初學者而言,這些材料相對較難。因
目次
前言
第1章緒論1
11辛普森悖論1
12相關性與因果關係5
13變量之間的關係9
14本書主要內容及安排11
第2章數學基礎13
21隨機變量和隨機事件13
211隨機變量13
212隨機事件14
22概率及其計算16
221概率與條件概率16
222概率分布19
223概率的計算公式19
23獨立性22
24貝葉斯公式及其應用25
25隨機變量的數字特徵30
26回歸33
261一元線性回歸33
262多元線性回歸35
27因果關係的表示:圖模型與結構
因果模型37
271因果關係的概念37
272圖模型38
273結構因果模型40
274圖模型和結構因果模型的
比較41
28因子分解42
281圖模型的馬爾可夫性43
282因子分解表達式44
29圖模型結構的程序實現46
291R軟件的安裝46
292DAGitty包的安裝與
加載48
293圖模型的生成50
第3章圖模型分析55
31基本圖模型結構的分析55
311鏈式結構56
312分叉結構57
313對撞結構59
32d劃分66
321d劃分的概念66
322d劃分的判斷70
323d劃分變量集合搜索73
33圖模型與概率分布78
34圖模型分析的程序實現80
第4章干預分析89
41因果效應的調整表達式計算89
411混雜偏差89
412干預的數學表達90
413通過調整表達式計算
因果效應92
414調整變量的設計96
42後門準則與前門準則101
421後門準則101
422前門準則107
43多變量干預和特定變量
取值干預112
431多變量干預112
432特定變量取值時的干預
分析115
433條件干預118
44直接因果效應與間接因果效應119
45因果效應的估計125
451反概率權重法125
452傾向值評分匹配法129
46線性系統中的因果推斷133
461線性系統因果推斷分析的
特點133
462路徑系數及其在因果推斷
分析中的應用137
463線性系統中路徑系數的
計算141
47工具變量150
48干預分析的程序實現154
481獲取調整變量集合154
482通過傾向值評分匹配
計算ACE158
第5章反事實分析及其應用164
51反事實概念的引入及表達
符號164
52反事實分析的基本方法168
521反事實假設與結構因果
模型修改168
522反事實分析的基本法則171
53反事實分析計算173
531外生變量取值與個體173
532確定性反事實分析175
533概率性反事實分析177
534反事實分析中概率計算的
一般化方法182
54反事實符號表達式與do算子符號
表達式的對比185
55基於圖模型的反事實分析191
56SCM參數未知及線性環境下的
反事實分析195
561SCM參數未知條件下的反
事實分析195
562線性模型在給定事實條件下
的反事實分析198
57中介分析201
571自然直接效應和自然間接
效應的定義202
572自然直接效應和自然間接
效應的計算204
58反事實的應用205
第6章因果關係概率分析211
61因果關係概率的定義211
62因果關係概率的性質214
63必要性概率與充分性概率的
量化計算216
631外生性與單調性216
632在外生性條件下PN、PS和
PNS的計算219
633在外生性和單調性條件下
PN、PS和PNS的計算221
634在不具有外生性但具有單調性
條件下PN、PS和PNS的
計算222
635在外生性和單調性都不成立
條件下PN、PS和PNS的
計算226
64因果關係概率的應用228
第7章複雜條件下因果效應的
計算23871非理想依從條件下因果效應的
計算238
711研究模型假設238
712一般條件下平均因果
效應的計算239
713附加假設條件下平均因果
效應的計算243
72已干預條件下因果效應的計算246
721ETT的計算247
722增量干預的計算249
723非理想依從條件下ETT的
計算251
73複雜圖模型條件下因果效應的
計算253
731do算子推理法則253
732do算子推理法則應用
示例254
733因果效應的可識別性257
734試驗中干預變量的替代
設計262
74非理想數據采集條件下因果
效應的計算265
第8章圖模型結構的學習270
81圖模型結構學習算法概述270
811圖模型結構學習的過程270
812圖模型結構學習的假設271
82圖模型結構學習算法的分類及基於
評分的學習算法簡介272
83基於約束的算法273
831獨立性測試273
832IC算法簡介277
833IC算法的具體實現過程278
834其他基於約束的算法282
84圖模型結構學習的程序實現283
841pcalg包的安裝283
842圖模型結構的學習284
843因果效應計算293
第9章因果推斷的應用299
91因果推斷在推薦系統中的應用299
92因果推斷在強化學習中的應用306
921多臂賭博機問題場景307
922基於因果推斷的多臂賭博機
問題分析309
923基於因果推斷的多臂賭博機
問題算法改進311
924基於因果推斷的多臂賭博機
問題算法改進效果313
參考文獻315
第1章緒論1
11辛普森悖論1
12相關性與因果關係5
13變量之間的關係9
14本書主要內容及安排11
第2章數學基礎13
21隨機變量和隨機事件13
211隨機變量13
212隨機事件14
22概率及其計算16
221概率與條件概率16
222概率分布19
223概率的計算公式19
23獨立性22
24貝葉斯公式及其應用25
25隨機變量的數字特徵30
26回歸33
261一元線性回歸33
262多元線性回歸35
27因果關係的表示:圖模型與結構
因果模型37
271因果關係的概念37
272圖模型38
273結構因果模型40
274圖模型和結構因果模型的
比較41
28因子分解42
281圖模型的馬爾可夫性43
282因子分解表達式44
29圖模型結構的程序實現46
291R軟件的安裝46
292DAGitty包的安裝與
加載48
293圖模型的生成50
第3章圖模型分析55
31基本圖模型結構的分析55
311鏈式結構56
312分叉結構57
313對撞結構59
32d劃分66
321d劃分的概念66
322d劃分的判斷70
323d劃分變量集合搜索73
33圖模型與概率分布78
34圖模型分析的程序實現80
第4章干預分析89
41因果效應的調整表達式計算89
411混雜偏差89
412干預的數學表達90
413通過調整表達式計算
因果效應92
414調整變量的設計96
42後門準則與前門準則101
421後門準則101
422前門準則107
43多變量干預和特定變量
取值干預112
431多變量干預112
432特定變量取值時的干預
分析115
433條件干預118
44直接因果效應與間接因果效應119
45因果效應的估計125
451反概率權重法125
452傾向值評分匹配法129
46線性系統中的因果推斷133
461線性系統因果推斷分析的
特點133
462路徑系數及其在因果推斷
分析中的應用137
463線性系統中路徑系數的
計算141
47工具變量150
48干預分析的程序實現154
481獲取調整變量集合154
482通過傾向值評分匹配
計算ACE158
第5章反事實分析及其應用164
51反事實概念的引入及表達
符號164
52反事實分析的基本方法168
521反事實假設與結構因果
模型修改168
522反事實分析的基本法則171
53反事實分析計算173
531外生變量取值與個體173
532確定性反事實分析175
533概率性反事實分析177
534反事實分析中概率計算的
一般化方法182
54反事實符號表達式與do算子符號
表達式的對比185
55基於圖模型的反事實分析191
56SCM參數未知及線性環境下的
反事實分析195
561SCM參數未知條件下的反
事實分析195
562線性模型在給定事實條件下
的反事實分析198
57中介分析201
571自然直接效應和自然間接
效應的定義202
572自然直接效應和自然間接
效應的計算204
58反事實的應用205
第6章因果關係概率分析211
61因果關係概率的定義211
62因果關係概率的性質214
63必要性概率與充分性概率的
量化計算216
631外生性與單調性216
632在外生性條件下PN、PS和
PNS的計算219
633在外生性和單調性條件下
PN、PS和PNS的計算221
634在不具有外生性但具有單調性
條件下PN、PS和PNS的
計算222
635在外生性和單調性都不成立
條件下PN、PS和PNS的
計算226
64因果關係概率的應用228
第7章複雜條件下因果效應的
計算23871非理想依從條件下因果效應的
計算238
711研究模型假設238
712一般條件下平均因果
效應的計算239
713附加假設條件下平均因果
效應的計算243
72已干預條件下因果效應的計算246
721ETT的計算247
722增量干預的計算249
723非理想依從條件下ETT的
計算251
73複雜圖模型條件下因果效應的
計算253
731do算子推理法則253
732do算子推理法則應用
示例254
733因果效應的可識別性257
734試驗中干預變量的替代
設計262
74非理想數據采集條件下因果
效應的計算265
第8章圖模型結構的學習270
81圖模型結構學習算法概述270
811圖模型結構學習的過程270
812圖模型結構學習的假設271
82圖模型結構學習算法的分類及基於
評分的學習算法簡介272
83基於約束的算法273
831獨立性測試273
832IC算法簡介277
833IC算法的具體實現過程278
834其他基於約束的算法282
84圖模型結構學習的程序實現283
841pcalg包的安裝283
842圖模型結構的學習284
843因果效應計算293
第9章因果推斷的應用299
91因果推斷在推薦系統中的應用299
92因果推斷在強化學習中的應用306
921多臂賭博機問題場景307
922基於因果推斷的多臂賭博機
問題分析309
923基於因果推斷的多臂賭博機
問題算法改進311
924基於因果推斷的多臂賭博機
問題算法改進效果313
參考文獻315
主題書展
更多
主題書展
更多書展本週66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。