TOP
0
0
【簡體曬書節】 單本79折,5本7折,優惠只到5/31,點擊此處看更多!
提醒您!您有折價券未完成領取,請盡速登入以保存至您的帳號。
大數據實訓案例:電影推薦系統(Scala版)(簡體書)
滿額折

大數據實訓案例:電影推薦系統(Scala版)(簡體書)

商品資訊

人民幣定價:45 元
定價
:NT$ 270 元
優惠價
87235
領券後再享88折起
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:7 點
相關商品
商品簡介
作者簡介
名人/編輯推薦
目次

商品簡介

本書詳細介紹了一個大數據應用案例――電影推薦系統(Scala版),案例涉及數據預處理、數據存儲與管理、數據分析和數據可視化等流程,涵蓋Linux、MySQL、Hadoop、Spark、IntelliJ IDEA、Spring等系統和軟件的安裝與使用方法。案例採用的編程語言是Scala和Java。

作者簡介

林子雨(1978-)

男,博士,廈門大學計算機科學系助理教授,廈門大學雲計算與大數據研究中心創始成員,廈門大學數據庫實驗室負責人,中國計算機學會數據庫專委會委員,中國計算機學會信息系統專委會委員。于2001年獲得福州大學水利水電專業學士學位,2005年獲得廈門大學計算機專業碩士學位,2009年獲得北京大學計算機專業博士學位。中國高校**“數字教師”提出者和建設者,2009年至今,“數字教師”大平臺累計向網絡免費發佈超過500萬字高價值的教學和科研資料,累計網絡訪問量超過500萬次。 主要研究方向為數據庫、數據倉庫、數據挖掘和大數據,發表期刊和會議學術論文多篇,並作為課題負責人主持了1項國家自然科學基金、1項福建省自然科學基金項目和1項福建省教改課題。曾作為志願者翻譯了Google Spanner、BigTable和《Architecture of a Database System》等大量英文學術資料,與廣大網友分享,深受歡迎。2013年開始在廈門大學開設大數據課程,並因在教學領域的突出貢獻和學生的認可,成為2013年度和2017年度廈門大學教學類獎教金獲得者。獲得2017年福建省精品在線開放課程、2018年廈門大學高等教育教學成果特等獎、2018年福建省高等教育教學成果二等獎。 主講課程:《大數據處理技術》。 建設了高校大數據課程公共服務平臺,成為全國高校大數據教學****。平臺為教師教學和學生學習大數據課程提供包括教學大綱、講義PPT、學習指南、備課指南、實驗指南、上機習題、授課視頻、技術資料等全方位、一站式免費服務,平臺年訪問量超過100萬次,同時提供面向高校的大數據實驗平臺建設方案和大數據課程師資培訓服務。

名人/編輯推薦

本書是廈門大學作者團隊長期經驗總結的結晶。本書是在廈門大學《大數據技術原理與應用》入門級大數據教材的基礎之上編寫的。為了確保教程質量,在編著出版紙質教材之前,實驗室已經於2016年10月通過實驗室官網免費發布共享了簡化版的Spark在線教程和相關教學資源,同時,該在線教程也已經用於廈門大學計算機科學系研究生的大數據課程教學,並成為全國高校大數據課程教師培訓交流班的授課內容。實驗室根據讀者對在線Spark教程的大量反饋意見以及教學實踐中發現的問題,對Spark在線教程進行了多次修正和完善,所有這些前期準備工作,都為紙質教材的編著出版打下了堅實的基礎。

目次

第1章 案例概述 1

1.1 案例目的 1

1.2 適用對象 1

1.3 時間安排 2

1.4 預備知識 2

1.5 硬件要求 2

1.6 軟件工具 3

1.7 數據集 3

1.8 案例任務 3

1.9 實驗步驟 4

1.10 在線資源 6

1.10.1 在線資源一覽表 6

1.10.2 下載專區 7

1.10.3 先修課程 8

1.10.4 大數據課程公共服務平臺 8

1.11 本章小結 9

第2章 大數據實驗環境搭建 10

2.1 Linux系統及相關軟件使用方法 10

2.1.1 Shell 11

2.1.2 root用戶 11

2.1.3 創建普通用戶 11

2.1.4 sudo命令 12

2.1.5 常用的Linux系統命令 12

2.1.6 文件解壓縮 13

2.1.7 常用的目錄 13

2.1.8 目錄的權限 14

2.1.9 更新APT 14

2.1.10 切換中英文輸入法 15

2.1.11 vim編輯器的安裝和使用方法 16

2.2 JDK的安裝 16

2.3 Scala的安裝 17

2.4 Hadoop的安裝和基本使用方法 18

2.4.1 安裝Hadoop前的準備工作 18

2.4.2 安裝Hadoop 20

2.4.3 HDFS操作常用Shell命令 23

2.5 Spark的安裝和基本使用方法 25

2.5.1 下載安裝文件 25

2.5.2 配置相關文件 26

2.5.3 Spark和Hadoop的交互 26

2.5.4 在spark-shell中運行代碼 27

2.6 MySQL數據庫的安裝和基本

使用方法 29

2.6.1 安裝MySQL 29

2.6.2 MySQL常用操作 32

2.7 本章小結 34

第3章 IntelliJ IDEA開發工具的安裝和使用方法 35

3.1 下載和安裝IDEA 35

3.2 下載Scala插件安裝包 35

3.3 啟動IDEA 36

3.4 為IDEA安裝Scala插件 39

3.5 配置項目的JDK 42

3.6 使用IDEA開發WordCount程序 44

3.6.1 創建一個新項目WordCount 45

3.6.2 為WordCount項目添加Scala框架支持 47

3.6.3 設置項目目錄 50

3.6.4 新建Scala代碼文件 52

3.6.5 配置pom.xml文件 53

3.6.6 更新Maven的依賴文件 55

3.6.7 運行WordCount程序 56

3.6.8 打包WordCount程序生成

JAR包 57

3.6.9 把JAR包提交到Spark中運行 61

3.7 本章小結 61

第4章 ETL工具Kettle的安裝和

使用方法 62

4.1 安裝Kettle 62

4.1.1 下載安裝包 62

4.1.2 解壓文件到安裝目錄 62

4.1.3 複製MySQL數據庫驅動程序

JAR包 63

4.1.4 啟動Kettle中的Spoon 63

4.1.5 設置中文界面 65

4.2 使用Kettle把數據加載到HDFS中 65

4.2.1 配置Kettle 66

4.2.2 新建作業 66

4.2.3 添加START組件 67

4.2.4 添加“Hadoop Copy Files”控件 68

4.2.5 設置“Hadoop Copy Files”

控件的屬性 68

4.2.6 執行作業並查看運行結果 69

4.2.7 到HDFS中查看數據 70

4.3 本章小結 70

第5章 使用Spark SQL讀寫

MySQL數據庫的方法 71

5.1 Spark SQL概述 71

5.2 創建MySQL數據庫 72

5.3 在spark-shell交互式環境中

讀寫MySQL數據庫 72

5.3.1 讀取MySQL數據庫中的數據 73

5.3.2 向MySQL數據庫寫入數據 74

5.4 編寫獨立應用程序讀寫MySQL

數據庫 75

5.4.1 新建項目 75

5.4.2 設置依賴包 76

5.4.3 設置代碼目錄 78

5.4.4 新建Scala代碼文件 79

5.4.5 配置pom.xml文件 80

5.4.6 編譯運行程序 82

5.4.7 生成應用程序JAR包 83

5.4.8 把JAR包提交到Spark中運行 85

5.5 本章小結 86

第6章 使用Spark MLlib實現協同

過濾算法 87

6.1 推薦系統概述 87

6.1.1 什麼是推薦系統 87

6.1.2 長尾理論 88

6.1.3 推薦方法 88

6.1.4 推薦系統模型 89

6.1.5 推薦系統的應用 89

6.2 協同過濾算法 90

6.2.1 基於用戶的協同過濾 90

6.2.2 基於物品的協同過濾 91

6.2.3 UserCF算法和ItemCF算法的

對比 92

6.2.4 基於模型的協同過濾 92

6.3 Spark MLlib中的協同過濾算法 92

6.3.1 ALS算法的基本原理 93

6.3.2 在spark-shell中運行ALS算法 95

6.3.3 編寫獨立應用程序運行ALS

算法 99

6.4 本章小結 103

第7章 Node.js的安裝和使用

方法 104

7.1 Node.js的安裝 104

7.2 創建Node.js應用 105

7.2.1 引入Node.js模塊 105

7.2.2 創建服務器 105

7.2.3 接收請求與響應請求 106

7.3 使用Express框架和Jade模板引擎 106

7.3.1 創建項目目錄 106

7.3.2 安裝Express開發框架 107

7.3.3 安裝Jade模板引擎 107

7.3.4 創建服務器 107

7.3.5 創建模板文件 107

7.3.6 測試網頁 108

7.4 實例1:設計網頁實現用戶註冊登錄

功能 108

7.4.1 創建MySQL數據庫 108

7.4.2 創建項目目錄 109

7.4.3 安裝Express開發框架 109

7.4.4 安裝MySQL驅動模塊 109

7.4.5 創建服務器 109

7.4.6 創建網頁 111

7.4.7 測試網頁 112

7.5 實例2:採用Jade模板引擎實現

用戶註冊登錄功能 113

7.5.1 創建項目目錄 113

7.5.2 安裝Express開發框架 113

7.5.3 安裝Jade模板引擎 114

7.5.4 安裝MySQL驅動模塊 114

7.5.5 安裝body-parser模塊 114

7.5.6 創建服務器 114

7.5.7 創建網頁模板文件 116

7.5.8 測試網頁 116

7.6 實例3:通過網頁調用詞頻統計應用

程序 118

7.6.1 創建項目目錄 119

7.6.2 安裝Express開發框架 119

7.6.3 創建服務器 119

7.6.4 安裝Jade模板引擎 119

7.6.5 為應用入口index.js增加路由等

功能 121

7.6.6 在網頁中調用程序並展現結果 123

7.7 本章小結 124

第8章 電影推薦系統(基礎版)的

實現過程 125

8.1 數據分析整體過程 125

8.2 把數據集加載到HDFS中 126

8.2.1 數據集基本情況 126

8.2.2 數據集下載 127

8.2.3 使用Kettle工具清洗數據並加載到HDFS中 127

8.3 編寫Spark程序實現電影推薦 134

8.3.1 新建項目 134

8.3.2 設置依賴包 136

8.3.3 設置代碼目錄 137

8.3.4 新建Scala代碼文件 137

8.3.5 配置pom.xml文件 141

8.3.6 編譯運行程序 142

8.3.7 生成應用程序JAR包 145

8.3.8 把JAR包提交到Spark中運行 147

8.4 使用Node.js在網頁中展現結果 148

8.4.1 創建項目目錄 148

8.4.2 安裝相關模塊 148

8.4.3 創建服務器 148

8.4.4 添加模板文件 149

8.4.5 在網頁中調用程序並展現結果 150

8.5 本章小結 151

第9章 電影推薦系統(升級版)的

設計與實現 152

9.1 系統概述 152

9.2 系統總體設計 153

9.3 數據庫的設計與實現 153

9.3.1 數據庫設計 153

9.3.2 數據庫實現 154

9.4 Spark程序的設計與實現 155

9.4.1 新建項目 156

9.4.2 新建Scala代碼文件 156

9.4.3 配置pom.xml文件 161

9.4.4 運行程序 163

9.4.5 生成應用程序JAR包 165

9.5 系統網站的設計與實現 166

9.5.1 系統網站的設計 166

9.5.2 系統網站的實現 168

9.6 本章小結 179

參考文獻 180

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 235
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區