Collective Intelligence實戰(簡體書)
商品資訊
ISBN13:9787302233022
出版社:清華大學出版社(大陸)
作者:(美)阿拉克 (Alag.S.)
出版日:2010/08/26
裝訂:平裝
人民幣定價:58 元
定價
:NT$ 348 元優惠價
:
87 折 303 元
絕版無法訂購
商品簡介
作者簡介
目次
商品簡介
《Collective Intelligence實戰》內容簡介:在互聯網上,利用用戶的集體智慧是成功的關鍵。集體智慧是一種新興的編程技術,可讓您從人們訪問web和與web交互的過程中找到有價值的模式、發現這些訪問者之間的關係和確定他們的個人偏好及習慣等。《collective Intelligence實戰》首先介紹了集體智慧的原則和構建更具交互性網站的思想,然后通過示例開發了一個直接可用的基於Java的CI工具包。您將學會如何從自己的網站和互聯網中提取有價值的信息,進而發現流行趨勢、做出實際預測和進行推薦。在此過程中,將使用大量可顯著減少開發丁作的API和開源工具包。本書專門為Java Web開發人員而寫。
作者簡介
作者:(美國)阿拉克(Satnam Alag) 譯者:騰靈靈 馮飛
Satnam Alag目前是NextBio的工程副總裁。他曾是Reartden commerce的CSA(首席軟件架構師),擁有加州大學伯克利分校的博士學位。
Satnam Alag目前是NextBio的工程副總裁。他曾是Reartden commerce的CSA(首席軟件架構師),擁有加州大學伯克利分校的博士學位。
目次
第1部分 收集數據,獲取智慧
第1章 了解集體智慧(CI)
1.1 什麼是集體智慧
l.2 集體智慧在Web應用程序中的應用
1.2.1 通過一個示例全面了解集體智慧
1.2.2 使用集體智慧的好處
1.2.3 集體智慧是web2.0的核心
1.2.4 利用CI將以內容為中心的應用程序轉化為以用戶為中心的應用程序
l.3 對智慧進行分類
1.3.1 顯性智慧
1.3.2 隱性智慧
1.3.3 衍生智慧
1.4 小結
1.5 相關資源
第2章 從用戶交互中學習
2.1 運用智慧的體系結構
2.1.1 同步和異步服務
2.1.2 事件驅動系統中的實時學習
2.1.3 非事件驅動系統中的輪詢
2.1.4 事件驅動和非事件驅動體系結構的優缺點
2.2 應用集體智慧的算法
2.2.1 用戶和項目
2.2.2 表示用戶信息
2.2.3 基於內容的分析和協作過濾
2.2.4 從非結構化文本中提取智慧
2.2.5 計算相似度
2.2.6 數據集的類型
2.3 用戶交互的形式
2.3.1 評分和投票
2.3.2 郵寄或轉發鏈接
2.3.3 書簽和保存
2.3.4 購物記錄
2.3.5 點擊流
2.3.6 評論
2.4 將用戶交互轉化為集體智慧
2.4.1 一個將評分轉化為智慧的示例
2.4.2 來自書簽、保存項目、購物記錄、鏈接轉發、點擊流和評論的智慧
2.5 小結
2.6 相關資源
第3章 從標簽中提取智慧
3.1 標記
3.1.1 用廣和項目的標簽元數據
3.1.2 專業生成的標簽
3.1.3 用戶生成的標簽
3.1.4 計算機生成的標簽
3.1.5 有關標記的建議
3,l,6用戶進行標記的原因
3.2 如何利用標簽
3.2.1 構建動態導航
3.2.2 創新使用標簽云
3.2.3 目標搜索
3.2.4 公眾分類與構建一個字典
3.3 從用戶標簽中提取智慧的一個示例
3.3.1 與其他項目相關的項目
3.3.2 用戶感興趣的項目
3.3.3 某個項目的相關用戶
3.4 用于標記的可擴展持久化體系結構
3.4.1 回顧其他方法
3.4.2 推薦的持久化體系結構
3.5 構建標簽云
3.5.1 標簽云的持久化設計
3.5.2 構建一個標簽云的算法
3.5.3 實現標簽云
3.5.4 顯示標簽云
3.6 找到類似標簽
3.7 小結
3.8 相關資源
第4章 從內容中提取智慧
4.1 內容類型與整合
4.1.1 對內容進行分類
4.1.2 整合內容的體系結構
4.2 與集體智慧有關的主要內容類型
4.2.1 博客
4.2.2 維基
4.2.3 組和留言板
4.3 逐步提取智慧
4.3.1 構建示例
4.3.2 樸素分析
4.3.3 刪除常見詞
4.3.4 提取詞干
4.3.5 檢測短語
4.4 簡單和復合內容類型
4.5 小結
4.6 相關資源
第5章 搜索博客圈
5.1 博客圈簡介
5.1.1 利用博客圈
5.1.2 RSS:發布格式
5.1.3 博客跟蹤公司
5.2 構建一個架構以搜索博客圈
5.2.1 搜索器
5.2.2 搜索參數
5.2.3 查詢結果
5.2.4 處理XML響應
5.2.5 異常處理
5.3 實現基類
5.3.1 實現搜索參數
5.3.2 實現結果對象
5.3.3 實現搜索器
5.3.4 解析XML響應
5.3.5 擴展該架構
5.4 整合Technorati
5.4.1 Technorati搜索API概述.
5.4.2 實現整合Technorati所需的類
5.5 整合Bloglines
5.5.1 Bloglines搜索API概述
5.5.2 實現整合Bloglines所需的類
5.6 使用RSS整合提供商
5.6.1 泛化查詢參數
5.6.2 泛化博客搜索器
5.6.3 構建RSS2.0XML解析器
5.7 小結
5.8 相關資源
第6章 智能Web爬行
6.1 Web爬行簡介
6.1.1 為什麼要在Web上爬行
6.1.2 爬行過程
6.1.3 智能爬行和聚焦爬行
6.1.4 深度爬行
6.1.5 可用的爬蟲
6.2 逐步構建一個智能爬蟲
6.2.1 實現核心算法
6.2 12遵循robots.txt文件
6.2.3 檢索內容
6.2.4 提取URL
6.2.5 使爬蟲具有智能
6.2.6 運行爬蟲
6.2.7 擴展爬蟲.
6.3 使用Nutch進行可擴展的爬行
6.3.1 搭建Nutch
6.3.2 運行Nutch爬蟲
6.3.3 使用Nutch進行搜索
6.3.4 Apache Hadoop、MapReduce和Dryad
6.4 小結
6.5 相關資源
第Ⅱ部 分衍生智慧
第7章 數據挖掘:過程、工具包和標準
7.1 數據挖掘中的核心概念
7.1.1 屬性
7.1.2 監督性和非監督性學習
7.1.3 關鍵的學習算法
7.1.4 挖掘過程
7.2 使用開源數據挖掘架構:WEKA
7.2.1 使用WEKA應用程序
7.2.2 理解WEKA的API
7.2.3 WEKA的API使用示例
7.3 標準數據挖掘API:Java Data Mining(JDM)
7.3.1.IDM體系結構
7.3.2 關鍵的JDM對象
7.3.3 表示數據集
7.3.4 學習模型
7.3.5 算法設置
7.3.6 JDM任務
7.3.7 JDM:連接
7.3.8 訪問DME的示例代碼
7.3.9 JDM模型和PMML
7.4 小結
7.5 相關資源
第8章 構建文本分析工具包
8.1 構建文本分析器
8.1.1 利用Lucene
8.1.2 編寫一個詞干分析器
8.1.3 編寫一個TokenFilter來注入同義詞和檢測短語
8.1.4 編寫一個分析器來注入同義詞和檢測短語
8.1.5 讓分析器工作起來
8.2 構建文本分析基礎結構
8.2.1 構建標簽基礎結構
8.2.2 構建單詞向量基礎結構
8.2.3 構建Text Analyzer類
8.2.4 應用文本分析基礎結構
8.3 架構的使用案例
8.4 小結
8.5 相關資源
第9章 通過聚類發現模式
9.1 聚類博客文章
9.1.1 定義文本聚類基礎結構
9.1.2 從Technorati中檢索博客文章
9.1.3 為本處理實現k.均值聚類算法
9.1.4 為文本處理實現層次聚類算法
9.1.5 期望最大化以及其他聚類高維稀疏數據的示例
9.2 使用WEKA的聚類
9.2.1 創建學習數據集
9.2.2 創建聚類器
9.2.3 評估聚類過程的結果
9.3 使用JDMAPI的聚類
9.3.1 與聚類相關的重要的JDM類
9.3.2 使用JDMAPI的聚類設置
9.3.3 使用JDMAPI創建聚類任務
9.3.4 使用JDMAPI執行聚類任務
9.3.5 使用JDMAPI檢索聚類模型
9.4 小結
9.5 相關資源
第10章 進行預測
10.1 分類的基礎知識
10.1.1 通過示例學習決策樹
10.1.2 樸素貝葉斯分類器
10.1.3 信度網
10.2 使用WEKAAPI來給博客文章分類
10.2.1 為博客文章的分類構建數據集
10.2.2 構建分類器的類
10.3 回歸的基礎知識
10.3.1 線性回歸
10.3.2 多層感知器(MLP)
10.3.3 徑向基函數(RBF)
10.4 使用WEKA的回歸
10.5 使用JDM的分類和回歸
10.5.1 與監督性學習相關的、重要的JDM類
10.5.2 使用了,JDMAPI的監督性學習設置
10.5.3 使用JDMAPI創建分類任務
10.5.4 使用JDMAPI執行分類任務
10.5.5 使用JDMAPI檢索分類模型
10.5.6 使用JDMAPI檢索分類模型
10.6 小結
10.7 相關資源.
第Ⅲ部分 在應用程序中運用集體智慧
第11章 智能搜索
11.1 搜索的基礎知識
11.1.1 搜索的體系結構
11.1.2 核心的Lucene類
11.1.3 通過示例介紹索引和搜索的基本過程
11.2 通過Lucene建立索引
11.2.1 理解索引的格式
11.2.2 修改索引
11.2.3 增量索引
11.2.4 訪問詞頻向量
11.2.5 優化建立索引過程的性能
11.3 使用Lucene進行搜索
11.3.1 理解Lucene的評分機制
11.3.2 查詢Lucene
11.3.3 給搜索結果排序
11.3.4 在多個字段上查詢
11.3.5 過濾
11.3.6 搜索多個索引
11.3.7 使用Hit Collector
ll.3.8 優化搜索性能
11.4 有用的工具和架構.
11.4.1 Luke
11.4 12Solr
11.4.3 Compass
11.4.4 Hibernate搜索
11.5 實現智能搜索的方法
11.5.1 通過分類器和預測器增強搜索
11.5.2 聚類搜索的結果
11.5.3 為用戶個性化結果
11.5.4 基於群體的搜索
11.5.5 基於語言學的搜索
11.5.6 數據搜索
11.6 小結
11.7 相關資源
第12章 構建推薦引擎
12.1 推薦引擎的基礎知識
12.1.1 推薦引擎簡介
12.1.2 基於項目和基於用戶的分析
12.1.3 使用基於內容的技術和協作技術來計算相似度
12.1.4 基於內容的技術與協作技術的比較
12.2 基於內容的分析
12.2.1 使用搜索引擎(Lucene)尋找類似的項目
12.2.2 構建基於內容的搜索引擎
12.2.3 文檔聚類的相關項目
12.2.4 為用戶個性化內容
12.3 協作過濾
12.3.1 k最近鄰算法
12.3.2 實現協作過濾的包
12.3.3 通過潛在語義索引減少維度
……
第1章 了解集體智慧(CI)
1.1 什麼是集體智慧
l.2 集體智慧在Web應用程序中的應用
1.2.1 通過一個示例全面了解集體智慧
1.2.2 使用集體智慧的好處
1.2.3 集體智慧是web2.0的核心
1.2.4 利用CI將以內容為中心的應用程序轉化為以用戶為中心的應用程序
l.3 對智慧進行分類
1.3.1 顯性智慧
1.3.2 隱性智慧
1.3.3 衍生智慧
1.4 小結
1.5 相關資源
第2章 從用戶交互中學習
2.1 運用智慧的體系結構
2.1.1 同步和異步服務
2.1.2 事件驅動系統中的實時學習
2.1.3 非事件驅動系統中的輪詢
2.1.4 事件驅動和非事件驅動體系結構的優缺點
2.2 應用集體智慧的算法
2.2.1 用戶和項目
2.2.2 表示用戶信息
2.2.3 基於內容的分析和協作過濾
2.2.4 從非結構化文本中提取智慧
2.2.5 計算相似度
2.2.6 數據集的類型
2.3 用戶交互的形式
2.3.1 評分和投票
2.3.2 郵寄或轉發鏈接
2.3.3 書簽和保存
2.3.4 購物記錄
2.3.5 點擊流
2.3.6 評論
2.4 將用戶交互轉化為集體智慧
2.4.1 一個將評分轉化為智慧的示例
2.4.2 來自書簽、保存項目、購物記錄、鏈接轉發、點擊流和評論的智慧
2.5 小結
2.6 相關資源
第3章 從標簽中提取智慧
3.1 標記
3.1.1 用廣和項目的標簽元數據
3.1.2 專業生成的標簽
3.1.3 用戶生成的標簽
3.1.4 計算機生成的標簽
3.1.5 有關標記的建議
3,l,6用戶進行標記的原因
3.2 如何利用標簽
3.2.1 構建動態導航
3.2.2 創新使用標簽云
3.2.3 目標搜索
3.2.4 公眾分類與構建一個字典
3.3 從用戶標簽中提取智慧的一個示例
3.3.1 與其他項目相關的項目
3.3.2 用戶感興趣的項目
3.3.3 某個項目的相關用戶
3.4 用于標記的可擴展持久化體系結構
3.4.1 回顧其他方法
3.4.2 推薦的持久化體系結構
3.5 構建標簽云
3.5.1 標簽云的持久化設計
3.5.2 構建一個標簽云的算法
3.5.3 實現標簽云
3.5.4 顯示標簽云
3.6 找到類似標簽
3.7 小結
3.8 相關資源
第4章 從內容中提取智慧
4.1 內容類型與整合
4.1.1 對內容進行分類
4.1.2 整合內容的體系結構
4.2 與集體智慧有關的主要內容類型
4.2.1 博客
4.2.2 維基
4.2.3 組和留言板
4.3 逐步提取智慧
4.3.1 構建示例
4.3.2 樸素分析
4.3.3 刪除常見詞
4.3.4 提取詞干
4.3.5 檢測短語
4.4 簡單和復合內容類型
4.5 小結
4.6 相關資源
第5章 搜索博客圈
5.1 博客圈簡介
5.1.1 利用博客圈
5.1.2 RSS:發布格式
5.1.3 博客跟蹤公司
5.2 構建一個架構以搜索博客圈
5.2.1 搜索器
5.2.2 搜索參數
5.2.3 查詢結果
5.2.4 處理XML響應
5.2.5 異常處理
5.3 實現基類
5.3.1 實現搜索參數
5.3.2 實現結果對象
5.3.3 實現搜索器
5.3.4 解析XML響應
5.3.5 擴展該架構
5.4 整合Technorati
5.4.1 Technorati搜索API概述.
5.4.2 實現整合Technorati所需的類
5.5 整合Bloglines
5.5.1 Bloglines搜索API概述
5.5.2 實現整合Bloglines所需的類
5.6 使用RSS整合提供商
5.6.1 泛化查詢參數
5.6.2 泛化博客搜索器
5.6.3 構建RSS2.0XML解析器
5.7 小結
5.8 相關資源
第6章 智能Web爬行
6.1 Web爬行簡介
6.1.1 為什麼要在Web上爬行
6.1.2 爬行過程
6.1.3 智能爬行和聚焦爬行
6.1.4 深度爬行
6.1.5 可用的爬蟲
6.2 逐步構建一個智能爬蟲
6.2.1 實現核心算法
6.2 12遵循robots.txt文件
6.2.3 檢索內容
6.2.4 提取URL
6.2.5 使爬蟲具有智能
6.2.6 運行爬蟲
6.2.7 擴展爬蟲.
6.3 使用Nutch進行可擴展的爬行
6.3.1 搭建Nutch
6.3.2 運行Nutch爬蟲
6.3.3 使用Nutch進行搜索
6.3.4 Apache Hadoop、MapReduce和Dryad
6.4 小結
6.5 相關資源
第Ⅱ部 分衍生智慧
第7章 數據挖掘:過程、工具包和標準
7.1 數據挖掘中的核心概念
7.1.1 屬性
7.1.2 監督性和非監督性學習
7.1.3 關鍵的學習算法
7.1.4 挖掘過程
7.2 使用開源數據挖掘架構:WEKA
7.2.1 使用WEKA應用程序
7.2.2 理解WEKA的API
7.2.3 WEKA的API使用示例
7.3 標準數據挖掘API:Java Data Mining(JDM)
7.3.1.IDM體系結構
7.3.2 關鍵的JDM對象
7.3.3 表示數據集
7.3.4 學習模型
7.3.5 算法設置
7.3.6 JDM任務
7.3.7 JDM:連接
7.3.8 訪問DME的示例代碼
7.3.9 JDM模型和PMML
7.4 小結
7.5 相關資源
第8章 構建文本分析工具包
8.1 構建文本分析器
8.1.1 利用Lucene
8.1.2 編寫一個詞干分析器
8.1.3 編寫一個TokenFilter來注入同義詞和檢測短語
8.1.4 編寫一個分析器來注入同義詞和檢測短語
8.1.5 讓分析器工作起來
8.2 構建文本分析基礎結構
8.2.1 構建標簽基礎結構
8.2.2 構建單詞向量基礎結構
8.2.3 構建Text Analyzer類
8.2.4 應用文本分析基礎結構
8.3 架構的使用案例
8.4 小結
8.5 相關資源
第9章 通過聚類發現模式
9.1 聚類博客文章
9.1.1 定義文本聚類基礎結構
9.1.2 從Technorati中檢索博客文章
9.1.3 為本處理實現k.均值聚類算法
9.1.4 為文本處理實現層次聚類算法
9.1.5 期望最大化以及其他聚類高維稀疏數據的示例
9.2 使用WEKA的聚類
9.2.1 創建學習數據集
9.2.2 創建聚類器
9.2.3 評估聚類過程的結果
9.3 使用JDMAPI的聚類
9.3.1 與聚類相關的重要的JDM類
9.3.2 使用JDMAPI的聚類設置
9.3.3 使用JDMAPI創建聚類任務
9.3.4 使用JDMAPI執行聚類任務
9.3.5 使用JDMAPI檢索聚類模型
9.4 小結
9.5 相關資源
第10章 進行預測
10.1 分類的基礎知識
10.1.1 通過示例學習決策樹
10.1.2 樸素貝葉斯分類器
10.1.3 信度網
10.2 使用WEKAAPI來給博客文章分類
10.2.1 為博客文章的分類構建數據集
10.2.2 構建分類器的類
10.3 回歸的基礎知識
10.3.1 線性回歸
10.3.2 多層感知器(MLP)
10.3.3 徑向基函數(RBF)
10.4 使用WEKA的回歸
10.5 使用JDM的分類和回歸
10.5.1 與監督性學習相關的、重要的JDM類
10.5.2 使用了,JDMAPI的監督性學習設置
10.5.3 使用JDMAPI創建分類任務
10.5.4 使用JDMAPI執行分類任務
10.5.5 使用JDMAPI檢索分類模型
10.5.6 使用JDMAPI檢索分類模型
10.6 小結
10.7 相關資源.
第Ⅲ部分 在應用程序中運用集體智慧
第11章 智能搜索
11.1 搜索的基礎知識
11.1.1 搜索的體系結構
11.1.2 核心的Lucene類
11.1.3 通過示例介紹索引和搜索的基本過程
11.2 通過Lucene建立索引
11.2.1 理解索引的格式
11.2.2 修改索引
11.2.3 增量索引
11.2.4 訪問詞頻向量
11.2.5 優化建立索引過程的性能
11.3 使用Lucene進行搜索
11.3.1 理解Lucene的評分機制
11.3.2 查詢Lucene
11.3.3 給搜索結果排序
11.3.4 在多個字段上查詢
11.3.5 過濾
11.3.6 搜索多個索引
11.3.7 使用Hit Collector
ll.3.8 優化搜索性能
11.4 有用的工具和架構.
11.4.1 Luke
11.4 12Solr
11.4.3 Compass
11.4.4 Hibernate搜索
11.5 實現智能搜索的方法
11.5.1 通過分類器和預測器增強搜索
11.5.2 聚類搜索的結果
11.5.3 為用戶個性化結果
11.5.4 基於群體的搜索
11.5.5 基於語言學的搜索
11.5.6 數據搜索
11.6 小結
11.7 相關資源
第12章 構建推薦引擎
12.1 推薦引擎的基礎知識
12.1.1 推薦引擎簡介
12.1.2 基於項目和基於用戶的分析
12.1.3 使用基於內容的技術和協作技術來計算相似度
12.1.4 基於內容的技術與協作技術的比較
12.2 基於內容的分析
12.2.1 使用搜索引擎(Lucene)尋找類似的項目
12.2.2 構建基於內容的搜索引擎
12.2.3 文檔聚類的相關項目
12.2.4 為用戶個性化內容
12.3 協作過濾
12.3.1 k最近鄰算法
12.3.2 實現協作過濾的包
12.3.3 通過潛在語義索引減少維度
……
主題書展
更多
主題書展
更多書展購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

