評論

滿額折

實戰Hadoop 2.0從雲計算到大數據(第二版)全新升級版（簡體書）

ISBN13：9787121285646
出版社：電子工業出版社
作者：葉曉江; 劉鵬
裝訂／頁數：平裝／50頁
規格：23.5cm*16.8cm (高/寬)
出版日：2016/06/01
關鍵字：實戰Hadoop 2.0從雲計算到大數據(第二版)全新升級版（簡體書）、實戰、 Hadoop、計算、算到、大數據、數據、全新、升級、升級版、簡體、電子工業出版社、葉曉江、劉鵬、簡體書、工業技術、自動化技術、計算技術、數據處理、數據處理系統、

中國圖書館分類：數據處理、數據處理系統

人民幣定價：79 元

定價：NT$ 474 元

優惠價：87 折 412 元

領券後再享88折

領

海外經銷商無庫存，到貨日平均30天至45天

可得紅利積點：12 點

相關商品

商品簡介

書是劉鵬教授主編的國內第一本Hadoop程式設計書籍《實戰Hadoop》的第二版。Hadoop堪稱業界最經典的開源雲計算和大資料平臺軟體。本書系統介紹了Hadoop 2.0生態圈的核心和擴展組件，包括：管理工具Ambari、分散式檔案系統HDFS、分散式資源管理器YARN、分散式並行處理MapReduce、記憶體型計算框架Spark、資料流程即時處理系統Storm、分散式鎖服務ZooKeeper、分散式資料庫HBase、資料倉庫工具Hive，以及Pig、Oozie、Flume、Mahout等。

目錄

|第1章| 大資料元件概述 1
1.1 Google大資料元件 2
1.2 Apache大資料元件 6
1.2.1 Hadoop核心組件 7
1.2.2 基於MR的資料分析元件 10
1.2.3 資料庫元件 16
1.2.4 BSP組件 19
1.2.5 基於YARN框架組件 20
1.2.6 基於YARN的程式設計類庫組件 24
1.2.7 搜尋引擎組件 25
1.2.8 工作流元件 26
1.2.9 資料流程組件 27
1.2.10 序列化和持久化組件 29
1.2.11 調試工具 30
1.2.12 安全性組件 31
1.2.13 相容性組件 33
1.2.14 集群部署與管理組件 33
習題 34
參考文獻 35
|第2章| 大資料集群 39
2.1 大資料集群簡介 40
2.2 大資料集群bigCstor 45
2.3 我的大資料集群littleCstor 48
2.4 小結 52
習題 52
參考文獻 53
|第3章| 集群管理工具Ambari 55
3.1 Ambari簡介 56
3.2 使用Ambari部署HDP 59
3.3 使用Ambari搭建littleCstor 62
3.3.1 相關約定 62
3.3.2 制定部署規劃 63
3.3.3 搭建prelittleCstor 64
3.3.4 本地建倉 72
3.3.5 部署AmbariServer 77
3.3.6 搭建littleCstor 83
3.3.7 小結 105
3.4 使用Ambari管理littleCstor 110
3.5 小結 111
習題 111
參考文獻 111
|第4章| 分散式檔案系統HDFS 113
4.1 分散式存儲引例 114
4.1.1 問題描述 114
4.1.2 常規解決方案 115
4.1.3 分散式解決方案 117
4.2 HDFS簡介 124
4.2.1 HDFS邏輯架構 124
4.2.2 HDFS物理拓撲 129
4.2.3 HDFS部署 133
4.2.4 HDFS其他概念[9] 135
4.3 HDFS介面 138
4.4 實戰HDFS Shell 140
4.4.1 HDFS文件級命令集 141
4.4.2 HDFS系統級命令集 143
4.5 實戰WebHDFS 149
4.5.1 WebHDFS簡介 149
4.5.2 WebHDFS示例 151
4.6 實戰HDFS JAVA API 156
4.6.1 搭建開發環境 156
4.6.2 常規操作示例 158
4.7 實戰HDFS大專案：用HDFS存儲海量視頻資料 163
4.7.1 應用場景 163
4.7.2 設計實現 164
習題 166
參考文獻 166

|第5章| 分散式資源管理器YARN 169
5.1 分散式資源管理器引例 170
5.1.1 分散式資源管理器簡介 170
5.1.2 分散式資源管理器架構 173
5.2 YARN簡介 177
5.2.1 基礎概念 177
5.2.2 物理拓撲 179
5.2.3 體系架構 180
5.2.4 集群部署 190
5.3 YARN介面 192
5.4 實戰YARN Shell 194
5.4.1 系統級命令 195
5.4.2 程式級命令 197
5.4.3 其他輔助命令 199
5.5 實戰YARN程式設計 199
5.5.1 常見並行化範式 199
5.5.2 YARN程式設計步驟 205
5.6 實戰YARN程式設計之DistributedShell 213
5.6.1 DistributedShell簡介 213
5.6.2 編寫DistributedShell 214
5.7 實戰YARN程式設計之三大範式 221
5.7.1 DistributedShell 222
5.7.2 MapReduce 222
5.7.3 Giraph 223
習題 224
參考文獻 224
|第6章| 分散式並行處理MapReduce 225
6.1 並行化範式M-S-R引例 226
6.1.1 問題描述 226
6.1.2 常規解決方案 227
6.1.3 分散式解決方案 228
6.1.4 小結 234
6.2 MapReduce簡介[1] 234
6.2.1 基本概念 235
6.2.2 程式設計模型 237
6.2.3 集群部署 239
6.2.4 體系架構 241
6.2.5 執行過程 245
6.3 MapReduce介面 247
6.4 實戰MapReduce Shell 250
6.5 實戰MapReduce程式設計 253
6.6 實戰MapReduce程式設計之WordCount[3] 256
6.6.1 WordCount代碼分析 256
6.6.2 WordCount處理過程 260
6.7 實戰MapReduce程式設計之SecondarySort 261
6.8 實戰MapReduce程式設計之倒排索引 265
6.8.1 簡介 265
6.8.2 分析與設計 266
6.8.3 倒排索引完整源碼 269
6.9 實戰MapReduce之性能優化 271
習題 280
參考文獻 280
|第7章| 分散式鎖服務ZooKeeper 281
7.1 ZooKeeper簡介 282
7.1.1 ZooKeeper應用場景 282
7.1.2 ZooKeeper體系架構[3] 285
7.1.3 ZooKeeper服務模型 287
7.1.4 ZooKeeper部署 289
7.2 ZooKeeper介面 292
7.2.1 介面匯總 292
7.2.2 實戰ZooKeeper Shell 292
7.3 實戰ZooKeeper程式設計 294
7.4 實戰ZooKeeper之進程通信 296
7.5 實戰ZooKeeper之進程調度系統 297
7.5.1 設計方案 297
7.5.2 設計實現 297
7.6 實戰ZooKeeper之實現NameNode自動切換 303
7.6.1 設計思想 304
7.6.2 詳細設計 304
7.6.3 編碼 305
7.6.4 實戰總結 310
習題 311
參考文獻 311
|第8章| 分散式資料庫HBase 313
8.1 HBase簡介 314
8.1.1 體系架構 314
8.1.2 資料模型 320
8.1.3 集群部署[21] 321
8.2 HBase介面 326
8.3 實戰HBase Shell 327
8.4 實戰HBase API 329
8.5 實戰HBase之綜例 330
8.6 實戰HBase之使用MapReduce構建索引 332
8.6.1 索引表藍圖 332
8.6.2 HBase和MapReduce 333
8.6.3 實現索引 334
習題 336
參考文獻 337
|第9章| 記憶體型計算框架Spark 339
9.1 Spark簡介 340
9.1.1 基礎概念 340
9.1.2 體系架構 346
9.1.3 集群部署 358
9.1.4 計算模型 366
9.1.5 工作機制 374
9.1.6 其他特性 375
9.2 Spark介面 377
9.3 實戰Spark Shell 379
9.3.1 集群管理 379
9.3.2 任務管理 381
9.4 實戰Spark程式設計之RDD 383
9.4.1 RDD屬性 383
9.4.2 並行化證明RDD、調試RDD 386
9.4.3 RDD操作 389
9.5 實戰Spark之WordCount[3] 396
9.6 實戰Spark之MLLib 397
習題 398
參考文獻 398

|第10章| 資料流程即時處理系統Storm 399
10.1 Storm簡介 400
10.1.1 與Hadoop的關係 400
10.1.2 基礎概念 402
10.1.3 體系架構 408
10.1.4 集群部署[4] 412
10.1.5 計算模型 421
10.2 Storm介面 450
10.3 實戰Storm Shell 452
10.4 實戰Storm API之RollingTopWords 455
習題 457
參考文獻 458
|第11章| 資料倉庫工具Hive 459
11.1 Hive簡介 460
11.1.1 工作原理 460
11.1.2 體系架構 461
11.1.3 計算模型 462
11.1.4 集群部署 463
11.2 Hive介面 467
11.2.1 介面匯總 467
11.2.2 實戰Hive Web 467
11.3 實戰Hive Shell 468
11.3.1 DDL Operations 468
11.3.2 DML Operations 469
11.3.3 SQL Operations 470
11.4 實戰Hive之複雜語句 471
11.5 實戰Hive之綜合示例 473
11.6 實戰Hive API介面 474
11.6.1 UDF程式設計示例[3] 474
11.6.2 UDAF程式設計示例 475
習題 477
參考文獻 477
|第12章| 其他常見大資料元件 479
12.1 Pig 480
12.1.1 Pig簡介 480
12.1.2 實戰Pig 483
12.2 Oozie 483
12.2.1 Oozie簡介 483
12.2.2 實戰Oozie[4] 485
12.3 Flume 487
12.3.1 Flume簡介 487
12.3.2 Flume入門 489
12.4 Mahout 492
12.4.1 Mahout簡介 492
12.4.2 Mahout入門 492
習題 494
參考文獻 494
|附錄A| 手工部署Hadoop2.0 495
一、部署綜述 496
二、部署步驟 500

主題書展

主題書展

更多書展

本週66折

下班後1小時的極速學習攻略：職場進修達人不辭職，靠「偷時間」高效學語言、修課程，10年考取10張證照

摺紙幾何學：60種特殊摺紙

天台性具思想(平)

五十人：得到與失去，始終會成為一種平衡

非常印象非常美：莫內和他的水蓮世界(二版)

投資前一定要學會的獲利思維：如何避免決策偏誤與建立合理的常勝原則

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大，除封面破損、內頁脫落等較嚴重的狀態，其餘商品將正常出貨。

特別提醒：部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供，需以QR CODE 連結至當地網站註冊“並通過驗證程序”，方可下載使用。

無現貨庫存之簡體書，將向海外調貨：
海外有庫存之書籍，等候約45個工作天;
海外無庫存之書籍，平均作業時間約60個工作天，然不保證確定可調到貨，尚請見諒。

為了保護您的權益，「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨，請在商品鑑賞期內寄回，且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

實戰Hadoop 2.0從雲計算到大數據(第二版)全新升級版（簡體書）

商品簡介

目次

主題書展

主題書展

本週66折

您曾經瀏覽過的商品

購物須知

網路書店

復北店

重南店