TOP
0
0
魅麗。花火原創小說66折起
隨機的世界:大數據時代的機率統計學
滿額折

隨機的世界:大數據時代的機率統計學

定  價:NT$ 320 元
優惠價:85272
領券後再享89折
團購優惠券B
8本以上且滿1500元
再享89折,單本省下30元
庫存 > 10
可得紅利積點:8 點
相關商品
商品簡介
作者簡介
目次
書摘/試閱

商品簡介

巴菲特曾說:「我寧要模糊的正確,也不要精確的錯誤。」
連氣象預報都不能相信,這世界上還有什麼是百分之百確定的?

全球貓奴磨刀霍霍向薛丁格,怒吼著接受制裁吧!
薛丁格表示任君處置──如果你能證明貓真的被毒死的話!

致敬「球神」Kobe的殞落,球迷獻花、演講哀悼,
透過計算頻率、平均數和中位數,黑曼巴之魂在統計學中永恆不滅!

談到世界上最神奇的常數,你大概會說:有位捲捲頭裸男站在圓圈裡──
黃金比例已經成為一種套路,但我要說的是常數e!

從前,有一個宋國農夫,撿到一隻撞樹的死兔子──大家都聽膩了我知道
但孟子寫完故事只感嘆宋國人很笨,他卻不知道等到兔子的機率有37%!

數據會說話,但說的到底是真話還是假話?

每年公布平均薪資時,總是有民眾抗議「根本不準」!
──這數字確實有問題,所以沒達標別氣餒,超過也不代表你已躋身上流社會!

Google剛推出「流感趨勢」的工具時,神準媲美章魚哥
人們天真的以為靠蘋果就能遠離醫生了──
後來季節性流感在美國大爆發,你要蘋果還是要口罩?

後悔高中沒好好上數學課嗎?《隨機的世界》這就幫你補足人生遺憾!

本書拋棄死板的數學定義,挑選經典而貼近日常的實例,讓讀者在看故事的同時也能破除數字迷思!

說簡單到「老嫗能解」就有點太浮誇了,
但能百分之百確定的是:絕對比高中數學課本有趣N倍!

作者簡介

李帥,大學和碩士均就讀電子工程系,現就職於某網路技術研究所,任網路工程師。碩士和工作期間曾參與雲端運算、大數據、網路流量分析等多個科學研究項目,在雲端運算和資料分析等技術領域富有一定經驗,與妻子曾共同翻譯英文科普讀物《讓你愛上數學的50個遊戲》等書,著有《世界是隨機的:大數據時代的機率統計學》。

凱文•凱利在《失控》中曾提道,當高度連結的群體數量大到一定程度時,群體特徵便會湧現,這是群體中任何個體都不具備的特徵。比如,大量水滴彙集成河水、海水,便會產生讓水滴「感到陌生」的新特徵——漩渦和波浪。

二〇一三年八月,Google提出了一個票房預測模型,該模型僅以單詞搜索量為依據,便可以提前一個月預測電影的首週票房,準確度高達94%;更令人驚訝的是,這是一個簡單的線性迴歸模型。Google是如何做到的呢?

人類已經進入大數據時代,可是絕大多數的人,對數據統計等基本常識還在算術常識時代。這是一個科技的時代,相對於十年前和二十年前,全球市值最大、最受人尊敬的公司Top10,全部變成了蘋果、微軟、Google……這些高科技公司。任何普通人都用智慧手機,任何人都在享受高科技技術帶來的便利。
為了更好地工作和生活,我們要瞭解一下這些高科技技術的常識。筆者在這方面有一些經驗,所以特地編寫了本書,希望以比較科普和有趣的筆調,讓你瞭解一門新的科學,甚至進入一個新的領域。

大學時,我曾上過「機率論」和「數理統計」兩門課,雖然完整地學習了機率統計,卻只是一知半解;攻讀碩士時,我在科學研究工作中需要用到機率統計,方才無奈地發現,當年所學已完完全全地還給了老師。我只能匆忙地自學了機率統計,勉強能應付科學研究工作,但心中對機率統計的很多概念仍舊一頭霧水。後來,我有幸與我的妻子走到了一起,她大學和碩士期間主修「應用數學」,在她的幫助下,我這個機率統計的門外漢終於入門了。

碩士畢業前,我和妻子共同翻譯了一部英文科普讀物《讓你愛上數學的50個遊戲》,這本書幫助我進一步鞏固了機率統計知識,也讓我萌生了寫書的念頭。畢業後我仍從事科學研究工作,參與了幾個與數據分析有關的項目,發現自己對機率統計的理解仍然不夠深刻,於是一口氣閱讀了幾本機率統計的科普書,比如《深入淺出數據分析》、《深入淺出統計學》和《生活中的機率趣事》,終於搞懂了「貝氏定理」、「假設檢定」等概念。看書之餘,我在「部落格」上寫了幾篇讀書心得,出版社的編輯看到我寫的文章,問我是否願意寫一本機率統計的科普書,說實話,能寫作一本屬於自己的書是我的小小理想,既然機會來了,我怎麼會拒絕呢?

開始寫作前,我為自己設定了三個原則。

一是理解而非定義。機率統計的教科書充滿了數學公式,雖然數學公式能對抽象的概念做出精確的定義,但這樣的定義太晦澀,難以理解。這是一本寫給初學者的書,我想幫助讀者理解概念的含義,而非求解某個具體問題。所以,我會用解釋性的語言來描述概念,而不是給出標準的定義。這麼做風險很大,但我願意嘗試,希望本書可以幫助讀者更快速、更深刻地理解概念。

二是引導而非灌輸。從小到大,我們都承受了太多的灌輸式教育,我很慶幸,自己在灌輸式教育下活了下來,但我不希望「灌輸」給讀者任何東西。所以,我總是以案例作先導,先引起讀者的興趣和思考,然後在解答問題的過程中講述知識。希望這麼做可以為讀者減負,讓讀者更流暢的閱讀,在輕鬆愉快中學到知識。

三是有趣而非無趣。很多人說,「有趣」是對一個人最高的評價,而我覺得一本書同樣如此。圖書銷售排行榜上,小說永遠是主角,因為它們「有趣」。讀者喜歡故事,不喜歡說教,這是事實,更是真理。我要努力避開說教式的言辭,把知識融入故事中,在講解知識的同時,帶給讀者閱讀的樂趣。
寫作時,我盡量堅持這三個原則,雖然期間有過掙扎和迷茫,但最終還是完成了這本書。

本書共有九章,第一章和第二章介紹機率和隨機變量的基礎知識;第三章和第四章介紹統計和分布的基礎知識;第五章是專門介紹賭博中的機率統計的一章,前四章的知識在這裡得到了應用;第六、七、八章分別介紹了機率統計的三個重要方法——假設檢定、貝氏定理和線性迴歸;第九章是漫談機率統計。

我的閱讀建議是:第一、二章合併閱讀,第三、四章合併閱讀,再閱讀第五、六、七、八、九章,後五章各自獨立,不需按順序閱讀。

本書由李帥主筆編寫,同時參與編寫的還有黃維、金寶花、李陽、程斌、胡亞麗、焦帥偉、馬新原、能永霞、王雅瓊、於健、周洋、謝國瑞、朱珊珊、李亞傑、王小龍、張彥梅、李楠、黃丹華、夏軍芳、武浩然、武曉蘭、張宇微、毛春豔、張敏敏、呂夢琪等作者,在此一併感謝。
這是我的第一本書,其中難免出現錯誤,希望讀者理解包涵,也歡迎讀者批評指正。

最後,我要感謝我的家人和朋友。感謝我的父母,陪伴我成長,幫助我養成了讀書和寫作的習慣。感謝我的妻子,一直理解我、陪伴我,並給我講解了一些晦澀的數學概念。感謝劉子沖、王充山、秦培根、劉翼、孫淼、趙瑋琪等老朋友,你們的支持和鼓勵是我堅持寫作的動力!

編者

目次

前言
第一章 機率
1.1 生還是死:這是一個機率問題
1.2 隨機事件:翻飛的硬幣
1.3 條件機率:門後的老山羊與豪車
1.4 獨立事件:反覆拋起的硬幣
1.5 全機率公式:英超冠軍爭奪戰

第二章 隨機變量
2.1 隨機變量:骰子遊戲
2.2 期望與變異數:百變骰子
2.3 大數法則:莊家的信條

第三章 統計
3.1 從樣本到總體:管中窺豹
3.2 頻率、平均數與中位數:致敬「黑曼巴」
3.3 變異數與標準差:致敬馬刺
3.4 平均數與變異數估計:近射與狙擊

第四章 分布
4.1 分布:統計學的「九九乘法表」
4.2 等機率分布:硬幣的兩面
4.3 幾何分布:一次就好
4.4 二項分布:反覆擲骰子
4.5 帕松分布:神奇的e
4.6 正態分布:完美曲線
4.7 指數分布:「二八」與「長尾」

第五章 賭博中的機率統計
5.1 賭博:激情與理性
5.2 雙色球:千年等一回
5.3 足彩:愛足球,更愛足彩
5.4 德州撲克:我不是教你詐
5.5 「21點」:保守未必是壞事

第六章 假設檢定
6.1 主場優勢:規律還是假象?
6.2 假設檢定:主場真的有優勢嗎?
6.3 反證法:無罪推定

第七章 貝氏定理
7.1 牧師貝氏:深藏功與名
7.2 賭神貝氏:一賭定終身
7.3 死神貝氏:連環恐怖攻擊
7.4 神探貝氏:嫌疑犯X的獻身
7.5 單純貝氏:智慧分類

第八章 線性迴歸
8.1 預測未來:以數據之名
8.2 線性迴歸:奇準的票房預測
8.3 適合度評估:適合度檢定與分區段適合度檢定

第九章 漫談機率統計
9.1 觀念導正:機率統計常識
9.2 後設認知:機率統計之「道」
9.3 兵器譜:統計軟體大盤點
9.4 大數據:創新與挑戰

參考文獻

書摘/試閱

連環攻擊不是巧合

對待小機率事件,統計數字不僅無用,而且會使人麻木,震驚全球的「911」事件是最好的例證。二〇〇一年九月十一日,「基地」組織的恐怖分子劫持了四架大型客機,其中兩架撞擊了世貿中心的南樓和北樓,一架撞擊了美國國防部五角大樓,還有一架最終墜毀。

「911」事件徹底挑戰了美國安保部門的想像力,在「911」事件發生前,幾乎沒人會想到,恐怖分子會駕駛飛機撞擊世貿中心大樓。因為統計數字告訴我們:在「911」事件前的兩萬五千天裡,曼哈頓上空一直有飛機通航,但是只發生過兩次類似「撞樓」的事件,因此從時間來衡量,「飛機撞大樓」發生的機率只有0.008%,如果按照飛機架次來衡量則更低;與此同時,另一組數據卻沒有受到應有的重視,自一九九五年起,全球的自殺式攻擊數量大幅增加,二〇〇〇年迎來了最高峰——三十九起,而且早在一九九八年,「蓋達」組織就曾企圖用飛機撞擊世貿中心大樓,但未能得逞。北美防空司令部曾提議進行一次有關「被劫客機攻擊五角大樓」的軍事演習,卻因這一想法太不現實而未被採納。

從歷史統計數據上看,「恐怖分子駕機撞世貿中心大樓」的確是小機率事件;但是在特定的時期、特定的條件下,這一事件卻未必是「小機率」,尤其是在類似事件已經發生的情況下。當恐怖分子駕駛第一架被劫客機撞上世貿中心大樓的時候,這件事瞬間便不再是小機率事件了;不僅如此,「飛機再次撞擊世貿中心大樓」幾乎是一定!一切都歸因於貝氏定理。

設隨機事件A表示「恐怖分子駕機撞世貿中心大樓」,隨機事件B表示「飛機第一次撞擊世貿中心大樓」,P(A)、P(B|A)和如表7-2所示。由於美國歷史上從未發生過類似事件,所以我們把先驗機率P(A)設成0.005%,根據貝氏定理,P(A|B)=38%。也就是說,僅僅「恐怖分子駕機撞擊世貿中心大樓」這一個事件的發生,就讓「飛機撞擊世貿中心大樓」這一事件的先驗機率從0.005%暴漲到38%!

(表7-2 已知恐怖分子駕機撞擊世貿中心大樓時的貝氏定理)

更要命的還在後頭!

設隨機事件A表示「恐怖分子再次駕機撞世貿中心大樓」,隨機事件B表示「第二架飛機撞上世貿中心大樓」,P(A)、P(B|A)和如表7-3所示,在先驗機率38%的情況下,P(A|B)居然高達99.99%!這似乎應了中國的那句老話——禍不單行!

(表7-3 已知恐怖分子第二次駕機撞擊世貿中心大樓時的貝氏定理)

貝氏定理為我們開啟了另一個視角,去看待地震、瘟疫、金融危機等「小機率事件」。統計數字只能告訴我們,這些事件極少發生,可是這沒有實踐意義。事實是,當某些相關事件發生時,小機率事件很可能會變成普通事件,甚至必然事件!所以,在對待小機率事件時,最具實踐意義的做法是,不斷蒐集相關資訊,不斷更新事件發生的機率,只有這樣才能做到有備無患。

您曾經瀏覽過的商品

購物須知

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:85 272
庫存 > 10

暢銷榜

客服中心

收藏

會員專區