TOP
0
0
魅麗。花火原創小說66折起
Spark快速數據處理(簡體書)
滿額折

Spark快速數據處理(簡體書)

人民幣定價:29 元
定  價:NT$ 174 元
優惠價:87151
領券後再享89折
無庫存,下單後進貨(採購期約45個工作天)
可得紅利積點:4 點
相關商品
商品簡介
作者簡介
名人/編輯推薦
目次
書摘/試閱

商品簡介

Spark是一個開源的通用並行分佈式計算框架,由加州大學伯克利分校的AMP實驗室開發,支持內存計算、多迭代批量處理、即席查詢、流處理和圖計算等多種範式。Spark內存計算框架適合各種迭代算法和交互式數據分析,能夠提升大數據處理的實時性和準確性,現已逐漸獲得很多企業的支持,如阿里巴巴、百度、網易、英特爾等公司。 本書系統講解Spark的使用方法,包括如何在多種機器上安裝Spark,如何配置一個Spark集群,如何在交互模式下運行第一個Spark作業,如何在Spark集群上構建一個生產級的脫機/獨立作業,如何與Spark集群建立連接和使用SparkContext,如何創建和保存RDD(彈性分佈式數據集),如何用Spark分佈式處理數據,如何設置Shark,將Hive查詢集成到你的Spark作業中來,如何測試Spark作業,以及如何提升Spark任務的性能。 Holden Karau資深軟件開發工程師,現就職於Databricks公司,之前曾就職於谷歌、亞馬遜、微軟和Foursquare等著名公司。他對開源情有獨鍾,參與了許多開源項目,如Linux內核無線驅動、Android程序監控、搜索引擎等,對存儲系統、推薦系統、搜索分類等都有深入研究。

作者簡介

名人/編輯推薦

Spark起源于2009年,是美國加州大學伯克利分校AMP實驗室的一個研究性項目,于2010年開源。隨著Spark社區的不斷成熟,它已被廣泛應用于阿里巴巴、百度、網易、英特爾等各大公司的生產環境中。
凱洛編寫的《Spark快速數據處理》系統講解Spark的使用方法。

目次

譯者序
作者簡介
前言
第1章 安裝Spark以及構建Spark集群 / 1
1.1 單機運行Spark / 4
1.2 在EC2上運行Spark / 5
1.3 在ElasticMapReduce上部署Spark / 11
1.4 用Chef(opscode)部署Spark / 12
1.5 在Mesos上部署Spark / 14
1.6 在Yarn上部署Spark / 15
1.7 通過SSH部署集群 / 16
1.8 鏈接和參考 / 21
1.9 小結 / 21
第2章 Spark shell的使用 / 23
2.1 加載一個簡單的text文件 / 24 譯者序作者簡介前言第1章 安裝Spark以及構建Spark集群 / 11.1 單機運行Spark / 41.2 在EC2上運行Spark / 51.3 在ElasticMapReduce上部署Spark / 111.4 用Chef(opscode)部署Spark / 121.5 在Mesos上部署Spark / 141.6 在Yarn上部署Spark / 151.7 通過SSH部署集群 / 161.8 鏈接和參考 / 211.9 小結 / 21第2章 Spark shell的使用 / 232.1 加載一個簡單的text文件 / 242.2 用Spark shell運行邏輯回歸 / 262.3 交互式地從S3加載數據 / 282.4 小結 / 30第3章 構建并運行Spark應用 / 313.1 用sbt構建Spark作業 / 323.2 用Maven構建Spark作業 / 363.3 用其他工具構建Spark作業 / 393.4 小結 / 39第4章 創建SparkContext / 414.1 Scala / 434.2 Java / 434.3 Java和Scala共享的API / 444.4 Python / 454.5 鏈接和參考 / 454.6 小結 / 46第5章 加載與保存數據 / 475.1 RDD / 485.2 加載數據到RDD中 / 495.3 保存數據 / 545.4 連接和參考 / 555.5 小結 / 55第6章 操作RDD / 576.1 用Scala和Java操作RDD / 586.2 用Python操作RDD / 796.3 鏈接和參考 / 836.4 小結 / 84第7章 Shark-Hive和Spark的綜合運用 / 857.1 為什么用Hive/Shark / 867.2 安裝Shark / 867.3 運行Shark / 887.4 加載數據 / 887.5 在Spark程序中運行HiveQL查詢 / 897.6 鏈接和參考 / 927.7 小結 / 93第8章 測試 / 958.1 用Java和Scala測試 / 968.2 用Python測試 / 1038.3 鏈接和參考 / 1048.4 小結 / 105第9章 技巧和竅門 / 1079.1 日志位置 / 1089.2 并發限制 / 1089.3 內存使用與垃圾回收 / 1099.4 序列化 / 1109.5 IDE集成環境 / 1119.6 Spark與其他語言 / 1129.7 安全提示 / 1139.8 郵件列表 / 1139.9 鏈接和參考 / 1139.10 小結 / 114

書摘/試閱

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 151
無庫存,下單後進貨
(採購期約45個工作天)

暢銷榜

客服中心

收藏

會員專區