TOP
0
0
魅麗。花火原創小說66折起
數據科學概念與實踐(原書第2版)(簡體書)
滿額折

數據科學概念與實踐(原書第2版)(簡體書)

人民幣定價:119 元
定  價:NT$ 714 元
優惠價:87621
領券後再享89折
無庫存,下單後進貨(採購期約45個工作天)
可得紅利積點:18 點
相關商品
商品簡介
名人/編輯推薦
目次

商品簡介

數據科學已經成為從數據中提取價值的基本工具,任何企業都可以將數據收集、存儲和處理作為其業務的一部分。本書搭建了一個易於理解的概念框架,幫助讀者掌握數據科學的基礎知識,並在學習理論的過程中同步使用RapidMiner平臺進行實踐。書中將分享實用的數據分析方法,討論如何揭示隱藏的模式和關係,無論你是新手還是專家,都能借助這些方法做出更好的決策和預測。本書非常適合商務用戶、數據分析師、商務分析師、工程師和分析專家以及任何與數據打交道的人。

名人/編輯推薦

關於數據科學的“百科指南”,涵蓋約30種常用算法,在學習基礎知識的同時,利用開源RapidMiner平臺同步實踐

目次

讚譽
譯者序
序言
前言
致謝
作者簡介
第1章 簡介 1
1.1 AI、機器學習和數據科學 2
1.2 什麼是數據科學 3
1.2.1 提取有意義的模式 3
1.2.2 構建表示模型 3
1.2.3 統計、機器學習和計算的結合 4
1.2.4 學習算法 4
1.2.5 相關領域 4
1.3 數據科學的案例 5
1.3.1 體量 5
1.3.2 維度 5
1.3.3 複雜問題 6
1.4 數據科學的分類 6
1.5 數據科學的算法 7
1.6 本書路線圖 8
1.6.1 數據科學入門 8
1.6.2 練習使用RapidMiner 8
1.6.3 核心算法 9
參考文獻 11
第2章 數據科學過程 12
2.1 先驗知識 13
2.1.1 目標 13
2.1.2 主題範圍 14
2.1.3 數據 14
2.1.4 因果關係與相關性 15
2.2 數據準備 15
2.2.1 數據探索 15
2.2.2 數據質量 16
2.2.3 缺失值 16
2.2.4 數據類型和轉換 16
2.2.5 轉換 17
2.2.6 異常值 17
2.2.7 特徵選擇 17
2.2.8 數據採樣 17
2.3 建模 18
2.3.1 訓練數據集和測試數據集 18
2.3.2 學習算法 19
2.3.3 模型評估 20
2.3.4 集成模型 20
2.4 應用 21
2.4.1 生產準備 21
2.4.2 技術整合 21
2.4.3 響應時間 21
2.4.4 模型刷新 22
2.4.5 同化 22
2.5 知識 22
參考文獻 23
第3章 數據探索 24
3.1 數據探索的目標 24
3.2 數據集 25
3.3 描述性統計 26
3.3.1 單變量探索 27
3.3.2 多變量探索 28
3.4 數據可視化 30
3.4.1 單變量的可視化 31
3.4.2 多變量的可視化 34
3.4.3 可視化高維數據 38
3.5 數據探索的路線圖 40
參考文獻 41
第4章 分類 42
4.1 決策樹 42
4.1.1 工作原理 42
4.1.2 實現過程 47
4.1.3 小結 55
4.2 規則歸納 56
4.2.1 工作原理 58
4.2.2 實現過程 60
4.2.3 小結 63
4.3 k-NN(k-近鄰) 63
4.3.1 工作原理 64
4.3.2 實現過程 69
4.3.3 小結 71
4.4 樸素貝葉斯 71
4.4.1 工作原理 72
4.4.2 實現過程 77
4.4.3 小結 79
4.5 人工神經網絡 80
4.5.1 工作原理 82
4.5.2 實現過程 84
4.5.3 小結 86
4.6 支持向量機 87
4.6.1 工作原理 89
4.6.2 實現過程 91
4.6.3 小結 95
4.7 集成學習 95
4.7.1 工作原理 97
4.7.2 實現過程 98
4.7.3 小結 105
參考文獻 105
第5章 回歸方法 107
5.1 線性回歸 107
5.1.1 工作原理 108
5.1.2 實現過程 112
5.1.3 檢查點 117
5.2 邏輯回歸 120
5.2.1 工作原理 122
5.2.2 實現過程 124
5.2.3 總結要點 127
5.3 總結 127
參考文獻 127
第6章 關聯分析 128
6.1 挖掘關聯規則 129
6.1.1 項集 130
6.1.2 規則生成 132
6.2 Apriori算法 133
6.3 頻繁模式增長算法 136
6.3.1 工作原理 136
6.3.2 實現過程 138
6.4 總結 141
參考文獻 141
第7章 聚類 142
7.1 k-means聚類 145
7.1.1 工作原理 147
7.1.2 實現過程 149
7.2 DBSCAN聚類 153
7.2.1 工作原理 153
7.2.2 實現過程 155
7.3 自組織映射 158
7.3.1 工作原理 159
7.3.2 實現過程 161
參考文獻 166
第8章 模型評估 168
8.1 混淆矩陣 169
8.2 ROC和AUC 170
8.3 提升曲線 172
8.4 實現過程 174
8.5 總結 177
參考文獻 178
第9章 文本挖掘 179
9.1 工作原理 180
9.1.1 詞頻–逆文檔頻率 180
9.1.2 詞語 181
9.2 實現過程 184
9.2.1 實現1:關鍵詞聚類 184
9.2.2 實現2:預測博客作者的性別 187
9.3 總結 193
參考文獻 194
第10章 深度學習 195
10.1 AI冬天 197
10.1.1 AI冬天:20世紀70年代 197
10.1.2 冬季解凍:20世紀80年代 198
10.1.3 人工智能的春夏:2006年至今 200
10.2 工作原理 201
10.2.1 神經網絡的回歸模型 201
10.2.2 梯度下降法 202
10.2.3 需要反向傳播 204
10.2.4 分類超過2個:softmax 205
10.2.5 卷積神經網絡 207
10.2.6 密集層 211
10.2.7 隨機失活層 211
10.2.8 循環神經網絡 212
10.2.9 自動編碼器 213
10.2.10 相關AI模型 213
10.3 實現過程 214
10.4 總結 217
參考文獻 218
第11章 推薦引擎 219
11.1 推薦引擎的概念 221
11.2 協同過濾 225
11.2.1 基於鄰域的方法 226
11.2.2 矩陣分解 233
11.3 基於內容的過濾 238
11.3.1 用戶畫像的計算 239
11.3.2 有監督學習方法 245
11.4 混合推薦器 249
11.5 總結 250
參考文獻 251
第12章 時間序列預測 253
12.1 時間序列分解 256
12.1.1 經典分解 258
12.1.2 實現過程 258
12.2 基於平滑的方法 260
12.2.1 簡單預測方法 260
12.2.2 指數平滑 261
12.2.3 實現過程 263
12.3 基於回歸的方法 264
12.3.1 回歸 265
12.3.2 週期性回歸 266
12.3.3 集成移動平均自回歸模型 268
12.3.4 週期性ARIMA 272
12.4 機器學習方法 274
12.4.1 窗口化 275
12.4.2 神經網絡自回歸 280

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 621
無庫存,下單後進貨
(採購期約45個工作天)

暢銷榜

客服中心

收藏

會員專區