評論

滿額折

文本機器學習（簡體書）

ISBN13：9787111648055
出版社：機械工業出版社
作者：(美)查魯‧C.阿加沃爾
譯者：黎琳;潘微科;明仲
出版日：2020/05/25
裝訂／頁數：平裝／438頁
規格：24cm*17cm (高/寬)
版次：一版
關鍵字：文本機器學習（簡體書）、文本、機器、學習、簡體、機械工業出版社、 (美)查魯‧C.阿加沃爾、簡體書、工業技術、自動化技術、計算技術、自動推理、機器學習、

中國圖書館分類

：

自動推理、機器學習

人民幣定價：129 元

定價

：NT$ 774 元

優惠價

：87 折 673 元

領券後再享88折起

領

海外經銷商無庫存，到貨日平均30天至45天

可得紅利積點：20 點

相關商品

商品簡介

名人/編輯推薦

商品簡介

《文本機器學習》系統性地介紹了多個經典的和前沿的機器學習技術及其在文本域中的應用。首先，詳細介紹了面向文本數據的預處理技術和經典的機器學習技術(如矩陣分解與主題建模、聚類與分類/回歸等)，並深入探討了模型的原理和內在聯繫以及相應的性能評估；其次，詳細介紹了結合異構數據的文本學習技術(如知識共享與遷移學習等)，以及面向信息檢索與排序的索引和評分等技術；末尾，詳細介紹了一些文本應用相關的重要技術，包括序列建模與深度學習、文本摘要與信息提取、意見挖掘與情感分析、文本分割與事件檢測等。本書從技術原理到實際應用，綜合梳理了文本機器學習的多個技術，深入分析了模型的優缺點和內在聯繫，並在每章結束時提供了詳細的參考資料、軟件資源和習題。
《文本機器學習》不僅可以作為工具書供具有相關背景的專業人士使用，也可以作為教材幫助具有線性代數和概率論基礎的初學者入門。

名人/編輯推薦

唐傑、熊輝、楊強、俞士綸強烈推薦， SIAM、ACM和IEEE Fellow撰寫，詳解文本學習的基本流程、相關算法、實際應用和評估方式等

譯者序
原書前言
致謝
第1章文本機器學習導論1
1.1導論1
1.1.1本章內容組織結構2
1.2文本學習有何特別之處3
1.3文本分析模型4
1.3.1文本預處理和相似度計算4
1.3.2降維與矩陣分解6
1.3.3文本聚類6
1.3.4文本分類與回歸建模8
1.3.5結合文本與異構數據的聯合分析10
1.3.6信息檢索與網頁搜索11
1.3.7序列語言建模與嵌入11
1.3.8文本摘要11
1.3.9信息提取11
1.3.10意見挖掘與情感分析12
1.3.11文本分割與事件檢測12
1.4本章小結12
1.5參考資料13
1.5.1軟件資源13
1.6習題13
第2章文本預處理與相似度計算15
2.1導論15
2.1.1本章內容組織結構16
2.2原始文本提取與詞條化16
2.2.1文本提取中與網頁相關的問題18
2.3從詞條中提取詞項19
2.3.1停用詞移除19
2.3.2連字符19
2.3.3大小寫轉換20
2.3.4基於用法的合併20
2.3.5詞幹提取21
2.4向量空間表示與歸一化21
2.5文本中的相似度計算23
2.5.1idf歸一化和詞幹提取是否總是有用25
2.6本章小結26
2.7參考資料26
2.7.1軟件資源26
2.8習題27
第3章矩陣分解與主題建模28
3.1導論28
3.1.1本章內容組織結構30
3.1.2將二分解歸一化為標準的三分解30
3.2奇異值分解（SVD)31
3.2.1SVD的例子33
3.2.2實現SVD的冪迭代法35
3.2.3SVD/LSA的應用35
3.2.4SVD/LSA的優缺點36
3.3非負矩陣分解36
3.3.1非負矩陣分解的可解釋性38
3.3.2非負矩陣分解的例子39
3.3.3融入新文檔40
3.3.4非負矩陣分解的優缺點41
3.4概率潛在語義分析（PLSA）41
3.4.1與非負矩陣分解的聯繫44
3.4.2與SVD的比較44
3.4.3PLSA的例子45
3.4.4PLSA的優缺點45
3.5隱含狄利克雷分佈（LDA）概覽46
3.5.1簡化的LDA模型46
3.5.2平滑的LDA模型49
3.6非線性變換和特徵工程50
3.6.1選擇一個相似度函數52
3.6.2Nystrom估計58
3.6.3相似度矩陣的部分可用性60
3.7本章小結61
3.8參考資料62
3.8.1軟件資源62
3.9習題63
第4章文本聚類65
4.1導論65
4.1.1本章內容組織結構66
4.2特徵選擇與特徵工程66
4.2.1特徵選擇67
4.2.2特徵工程68
4.3主題建模和矩陣分解70
4.3.1混合隸屬度模型與重疊簇70
4.3.2非重疊簇與雙聚類：矩陣分解的角度70
4.4面向聚類的生成混合模型74
4.4.1伯努利模型75
4.4.2多項式模型76
4.4.3與混合隸屬度主題模型的比較77
4.4.4與樸素貝葉斯分類模型的聯繫77
4.5k均值算法78
4.5.1收斂與初始化80
4.5.2計算複雜度80
4.5.3與概率模型的聯繫81
4.6層次聚類算法81
4.6.1高效實現與計算複雜度83
4.6.2與k均值的自然聯姻84
4.7聚類集成85
4.7.1選擇集成分量86
4.7.2混合來自不同分量的結果86
4.8將文本當作序列來進行聚類87
4.8.1面向聚類的核方法87
4.8.2數據相關的核方法：譜聚類90
4.9聚類到有監督學習的轉換91
4.9.1實際問題92
4.10聚類評估93
4.10.1內部有效性度量的缺陷93
4.10.2外部有效性度量93
4.11本章小結97
4.12參考資料97
4.12.1軟件資源98
4.13習題98
第5章文本分類：基本模型100
5.1導論100
5.1.1標記的類型與回歸建模101
5.1.2訓練與測試102
5.1.3歸納、直推和演繹學習器102
5.1.4基本模型103
5.1.5分類器中與文本相關的挑戰103
5.2特徵選擇與特徵工程104
5.2.1基尼係數104
5.2.2條件熵105
5.2.3逐點互信息105
5.2.4緊密相關的度量方式106
5.2.5χ2-統計量106
5.2.6嵌入式特徵選擇模型108
5.2.7特徵工程技巧108
5.3樸素貝葉斯模型109
5.3.1伯努利模型109
5.3.2多項式模型111
5.3.3實際觀察113
5.3.4利用樸素貝葉斯對輸出進行排序113
5.3.5樸素貝葉斯的例子113
5.3.6半監督樸素貝葉斯116
5.4最近鄰分類器118
5.4.11-最近鄰分類器的屬性119
5.4.2Rocchio與最近質心分類121
5.4.3加權最近鄰122
5.4.4自適應最近鄰：一系列有效的方法124
5.5決策樹與隨機森林126
5.5.1構造決策樹的基本步驟126
5.5.2分裂一個節點127
5.5.3多變量分裂128
5.5.4決策樹在文本分類中的問題129
5.5.5隨機森林129
5.5.6把隨機森林看作自適應最近鄰方法130
5.6基於規則的分類器131
5.6.1順序覆蓋算法131
5.6.2從決策樹中生成規則133
5.6.3關聯分類器134
5.6.4預測135
5.7本章小結135
5.8參考資料135
5.8.1軟件資源137
5.9習題137
第6章面向文本的線性分類與回歸140
6.1導論140
6.1.1線性模型的幾何解釋141
6.1.2我們需要偏置變量嗎142
6.1.3使用正則化的線性模型的一般定義143
6.1.4將二值預測推廣到多類144
6.1.5面向文本的線性模型的特點145
6.2最小二乘回歸與分類145
6.2.1使用L2正則化的最小二乘回歸145
6.2.2LASSO:使用L1正則化的最小二乘回歸148
6.2.3Fisher線性判別與最小二乘分類器150
6.3支持向量機(SVM)156
6.3.1正則優化解釋156
6.3.2最大間隔解釋157
6.3.3Pegasos：在原始空間中求解SVM 159
6.3.4對偶SVM優化形式160
6.3.5對偶SVM的學習算法162
6.3.6對偶SVM的自適應最近鄰解釋163
6.4對數幾率回歸165
6.4.1正則優化解釋165
6.4.2對數幾率回歸的訓練算法166
6.4.3對數幾率回歸的概率解釋167
6.4.4多元對數幾率回歸與其他推廣

主題書展

主題書展

更多書展

本週66折

不只蘋果掉下來！：現代科學之父牛頓

滿分必考英文單字帶著走：擴散式聯想記憶＋分級程度對照＋重要考點練習＆解析應考速記三大策略（外掛！滿分策略必考單字隨掃即聽英中對照音檔）

種瓜得瓜種豆得豆：遺傳學之父孟德爾

一星期零一夜：電話爺爺貝爾說故事

敲療：經絡對位敲打法－比拍打更有效，比刀療更安全！第一本完整介紹經絡原理的治痠止痛圖解書

詹姆士(平)

日本近代藝術史

Diamond：鮮血、汗水與泥土，一部鑽石貿易的全球史

海天漫筆─三民叢刊209

淨土概論(平)

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大，除封面破損、內頁脫落等較嚴重的狀態，其餘商品將正常出貨。

特別提醒：部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供，需以QR CODE 連結至當地網站註冊“並通過驗證程序”，方可下載使用。

無現貨庫存之簡體書，將向海外調貨：
海外有庫存之書籍，等候約45個工作天;
海外無庫存之書籍，平均作業時間約60個工作天，然不保證確定可調到貨，尚請見諒。

為了保護您的權益，「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨，請在商品鑑賞期內寄回，且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

熱搜：

文本機器學習（簡體書）

商品資訊

ISBN13：9787111648055

出版社：機械工業出版社

作者：(美)查魯‧C.阿加沃爾

譯者：黎琳;潘微科;明仲

出版日：2020/05/25

裝訂／頁數：平裝／438頁

規格：24cm*17cm (高/寬)

版次：一版

商品簡介

名人/編輯推薦

目次

主題書展

簡體熱門影劇書展

簡體書新到貨

魅力．花火特展

悅讀紀特展

簡體新書搶先報

簡體新生代華文原創小說特展

領券專區

文具禮品大賞

泰戈爾經典詩集與小說戲劇集

母親節書展

本週66折

不只蘋果掉下來！：現代科學之父牛頓

滿分必考英文單字帶著走：擴散式聯想記憶＋分級程度對照＋重要考點練習＆解析 應考速記三大策略（外掛！滿分策略必考單字隨掃即聽英中對照音檔）

種瓜得瓜種豆得豆：遺傳學之父孟德爾

一星期零一夜：電話爺爺貝爾說故事

敲療：經絡對位敲打法－比拍打更有效，比刀療更安全！第一本完整介紹經絡原理的治痠止痛圖解書

詹姆士(平)

日本近代藝術史

Diamond：鮮血、汗水與泥土，一部鑽石貿易的全球史

海天漫筆─三民叢刊209

淨土概論(平)

您曾經瀏覽過的商品

購物須知

滿分必考英文單字帶著走：擴散式聯想記憶＋分級程度對照＋重要考點練習＆解析應考速記三大策略（外掛！滿分策略必考單字隨掃即聽英中對照音檔）