TOP
0
0
【13悅讀日】4/13~4/17 消費滿699送100元E-coupon
數據挖掘導論(原書第2版)(簡體書)
滿額折

數據挖掘導論(原書第2版)(簡體書)

人民幣定價:139 元
定  價:NT$ 834 元
優惠價:87726
領券後再享88折
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:21 點
相關商品
商品簡介
作者簡介
名人/編輯推薦
目次

商品簡介

本書所涵蓋的主題包括:數據預處理、預測建模、關聯分析、聚類分析、異常檢測和避免錯誤發現。通過介紹每個主題的基本概念和算法,為讀者提供將數據挖掘應用於實際問題所需的必要背景。

作者簡介

陳封能(Pang-Ning Tan) ,密歇根州立大學計算機科學與工程系教授,主要研究方向是數據挖掘、數據庫系統、網絡空間安全、網絡分析等。

名人/編輯推薦

從基礎概念和算法的角度介紹數據挖掘所使用的主要原理與技術,有助於讀者將其應用於實際的問題中。

目次

出版者的話
譯者序
前言
第1章 緒論1
1.1 什麼是數據挖掘2
1.2 數據挖掘要解決的問題3
1.3 數據挖掘的起源4
1.4 數據挖掘任務5
1.5 本書組織結構7
文獻注釋8
參考文獻10
習題12
第2章 數據14
2.1 數據類型15
2.1.1 屬性與度量16
2.1.2 數據集的類型19
2.2 數據質量24
2.2.1 測量和數據收集問題24
2.2.2 關於應用的問題27
2.3 數據預處理28
2.3.1 聚集28
2.3.2 抽樣30
2.3.3 維歸約31
2.3.4 特徵子集選擇32
2.3.5 特徵創建34
2.3.6 離散化和二元化35
2.3.7 變量變換38
2.4 相似性和相異性的度量40
2.4.1 基礎40
2.4.2 簡單屬性之間的相似度和相異度41
2.4.3 數據對象之間的相異度42
2.4.4 數據對象之間的相似度44
2.4.5 鄰近度度量的例子44
2.4.6 互信息50
* 2.4.7 核函數51
* 2.4.8 Bregman散度53
2.4.9 鄰近度計算問題54
2.4.10 選擇正確的鄰近度度量56
文獻注釋56
參考文獻58
習題60
第3章 分類:基本概念和技術65
3.1 基本概念65
3.2 一般的分類框架67
3.3 決策樹分類器69
3.3.1 構建決策樹的基本算法70
3.3.2 表示屬性測試條件的方法71
3.3.3 選擇屬性測試條件的方法73
3.3.4 決策樹歸納算法79
3.3.5 示例:Web機器人檢測79
3.3.6 決策樹分類器的特徵81
3.4 模型的過擬合85
3.5 模型選擇90
3.5.1 驗證集應用90
3.5.2 模型複雜度合併91
3.5.3 統計範圍估計93
3.5.4 決策樹的模型選擇94
3.6 模型評估95
3.6.1 保持方法95
3.6.2 交叉驗證96
3.7 超參數的使用97
3.7.1 超參數選擇98
3.7.2 嵌套交叉驗證98
3.8 模型選擇和評估中的陷阱99
3.8.1 訓練集和測試集之間的重疊99
3.8.2 使用驗證錯誤率作為泛化錯誤率100
* 3.9 模型比較100
3.9.1 估計準確率的置信區間100
3.9.2 比較兩個模型的性能101
文獻注釋102
參考文獻105
習題108
第4章 分類:其他技術114
4.1 分類器的種類114
4.2 基於規則的分類器115
4.2.1 基於規則的分類器原理116
4.2.2 規則集的屬性116
4.2.3 規則提取的直接方法117
4.2.4 規則提取的間接方法120
4.2.5 基於規則的分類器的特點121
4.3 最近鄰分類器122
4.3.1 算法123
4.3.2 最近鄰分類器的特點124
4.4 樸素貝葉斯分類器124
4.4.1 概率論基礎125
4.4.2 樸素貝葉斯假設127
4.5 貝葉斯網絡132
4.5.1 圖表示132
4.5.2 推理與學習135
4.5.3 貝葉斯網絡的特點139
4.6 logistic回歸140
4.6.1 logistic回歸用作廣義線性模型141
4.6.2 學習模型參數141
4.6.3 logistic回歸模型的特點142
4.7 人工神經網絡143
4.7.1 感知機144
4.7.2 多層神經網絡146
4.7.3 人工神經網絡的特點150
4.8 深度學習151
4.8.1 使用協同損失函數151
4.8.2 使用響應激活函數153
4.8.3 正則化154
4.8.4 模型參數的初始化155
4.8.5 深度學習的特點157
4.9 支持向量機158
4.9.1 分離超平面的邊緣158
4.9.2 線性SVM159
4.9.3 軟邊緣SVM162
4.9.4 非線性SVM165
4.9.5 SVM的特點167
4.10 組合方法168
4.10.1 組合方法的基本原理168
4.10.2 構建組合分類器的方法169
4.10.3 偏置方差分解170
4.10.4 裝袋171
4.10.5 提升173
4.10.6 隨機森林176
4.10.7 組合方法的實驗比較177
4.11 類不平衡問題178
4.11.1 類不平衡的分類器構建179
4.11.2 帶類不平衡的性能評估180
4.11.3 尋找最優的評分閾值183
4.11.4 綜合評估性能183
4.12 多類問題188
文獻注釋189
參考文獻193
習題198
第5章 關聯分析:基本概念和算法205
5.1 預備知識205
5.2 頻繁項集的產生207
5.2.1 先驗原理209
5.2.2 Apriori算法的頻繁項集產生210
5.2.3 候選項集的產生與剪枝212
5.2.4 支持度計數215
5.2.5 計算複雜度217
5.3 規則的產生219
5.3.1 基於置信度的剪枝219
5.3.2 Apriori算法中規則的產生219
5.3.3 示例:美國國會投票記錄221
5.4 頻繁項集的緊湊表示221
5.4.1 極大頻繁項集221
5.4.2 閉項集223
* 5.5 其他產生頻繁項集的方法225
* 5.6 FP增長算法228
5.6.1 FP樹表示法228
5.6.2 FP增長算法的頻繁項集產生229
5.7 關聯模式的評估231
5.7.1 興趣度的客觀度量232
5.7.2 多個二元變量的度量239
5.7.3 辛普森悖論240
5.8 傾斜支持度分佈的影響241
文獻注釋244
參考文獻248
習題256
第6章 關聯分析:高級概念263
6.1 處理

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 726
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區