TOP
0
0
魅麗。花火原創小說66折起
大數據技術導論(簡體書)
滿額折

大數據技術導論(簡體書)

人民幣定價:39 元
定  價:NT$ 234 元
優惠價:87204
領券後再享89折
無庫存,下單後進貨(採購期約45個工作天)
可得紅利積點:6 點
相關商品
商品簡介
目次

商品簡介

本書以面向應用、面向實戰為指導思想,緊扣企業技術人才培養的特點,在知識點講解和實驗中避免複雜的理論,使讀者能快速上手體驗、驗證大數據處理的魅力,以激發讀者的學習興趣。本書覆蓋了大數據生命週期中的主要技術要點,全書共8章,第1章介紹大數據的產生和特點及思維的變革,第2章瞭解大數據生態系統,第3~7章按照大數據的生命週期,分別討論大數據采集與預處理、大數據管理、大數據分析、大數據可視化、大數據應用的基本原理和方法,第8章討論大數據安全面臨的挑戰。本書可作為本科、高職院校大數據技術或數據科學課程的參考書或教材,也可供數據科學相關技術人員閱讀。

目次

目 錄前言第1章 概論11.1 揭秘大數據11.1.1 大數據產生歷史必然11.1.2 大數據概念和特徵21.1.3 大數據生命週期31.1.4 大數據與物聯網、雲計算、人工智能51.1.5 大數據時代的八個重大變革51.2 Linux系統概述71.2.1 Linux版本71.2.2 Linux系統目錄結構71.2.3 文本編輯器vi91.2.4 文件權限解讀101.2.5 Linux系統常用命令11習題112實驗報告1 Linux實驗13第2章 大數據生態系統152.1 認識Hadoop152.2 HDFS162.2.1 HDFS體系結構162.2.2 HDFS存儲原理172.2.3 HDFS常用操作202.3 MapReduce212.3.1 MapReduce邏輯結構212.3.2 MapReduce操作案例23*2.4 Zookeeper24習題225實驗報告2 Hadoop實驗27第3章 大數據采集與預處理293.1 數據293.1.1 數據是什麼293.1.2 數據分類293.1.3 度量和維度313.2 數據采集323.2.1 數據采集分類323.2.2 數據采集方法323.2.3 數據采集工具323.3 數據清洗343.3.1 數據清洗任務343.3.2 數據清洗過程343.4 數據變換353.4.1 規範化363.4.2 函數變換363.5 網絡爬蟲373.5.1 爬蟲簡介37*3.5.2 論壇爬蟲源代碼分析38習題340*實驗報告3 網絡爬蟲41第4章 大數據管理424.1 NoSQL424.1.1 NoSQL概述424.1.2 鍵值數據庫434.1.3 圖數據庫444.1.4 文檔數據庫454.1.5 列式數據庫474.1.6 雲數據庫474.2 HBase474.2.1 HBase模型474.2.2 HBase與傳統關系數據庫的對比分析494.2.3 HBase系統架構494.2.4 HBase常用Shell命令51習題452實驗報告4 HBase實驗53第5章 大數據分析545.1 大數據分析概述545.1.1 數據分析原則545.1.2 大數據分析特點545.1.3 大數據分析流程555.1.4 數據分析師基本技能和素質57*5.1.5 大數據分析難點58*5.2 業務理解595.2.1 什麼是業務理解595.2.2 如何理解業務605.2.3 數據業務化615.3 數據認知635.3.1 數據預處理635.3.2 概率分析63*5.3.3 對比分析67*5.3.4 細分分析68*5.3.5 交叉分析695.3.6 相關分析695.4 特徵工程725.4.1 特徵工程面臨的挑戰725.4.2 特徵選擇725.4.3 特徵提取725.4.4 指標設計735.5 數據建模765.5.1 模型分類765.5.2 決策樹775.5.3 關聯分析815.5.4 回歸分析825.5.5 聚類分析85*5.5.6 k-鄰近分類算法KNN86*5.6 通用計算引擎Spark865.6.1 Spark簡介865.6.2 Spark與Hadoop差異885.6.3 Spark適用場景885.6.4 Spark運行模式895.6.5 Spark常用術語895.7 大數據分析引擎Hive895.7.1 數據倉庫概念895.7.2 傳統數據倉庫的問題905.7.3 Hive特徵905.7.4 Hive系統架構905.7.5 Hive應用案例91習題595實驗報告5 Hive實驗101第6章 大數據可視化1026.1 數據可視化基本概念1026.1.1 為什麼要數據可視化1026.1.2 什麼是數據可視化1036.1.3 數據可視化的作用1046.1.4 數據可視化術語1046.1.5 數據可視化三要素1056.2 常用圖形1056.2.1 餅圖(扇形圖)1056.2.2 堆積柱形圖1066.2.3 風玫瑰圖1066.2.4 柱狀圖1076.2.5 直方圖1076.2.6 氣泡圖1086.2.7 散點圖矩陣1086.2.8 折線圖1096.2.9 面積圖1096.2.10 相關係數圖1106.2.11 雷達圖1106.2.12 箱線圖1106.3 數據可視化設計1116.3.1 數據可視化設計原則1116.3.2 數據可視化=數據+設計+故事1136.3.3 數據可視化圖形選擇建議1136.4 數據可視化工具1146.4.1 基本工具1146.4.2 進階工具1146.5 基於R語言可視化基礎1176.5.1 基本繪圖命令1176.5.2 ggplot2繪圖121習題6128*實驗報告6 可視化實驗129第7章 大數據應用1317.1 零售行業大數據1317.1.1 沃爾瑪的購物籃分析1317.1.2 農夫山泉用海量照片提升銷量1327.2 交通大數據1347.2.1 交通擁堵大數據分析1347.2.2 預測起飛時間1427.3 醫療大數據1437.3.1 移動醫療與個人健康1437.3.2 基因測序――精准治癌正在成為現實146第8章 大數據安全1508.1 大數據安全的重要意義1508.2 大數據面臨的挑戰1518.3 大數據的安全威脅1528.3.1 大數據基礎設施安全威脅1528.3.2 大數據存儲安全威脅1528.3.3 大數據的隱私洩露1538.3.4 大數據的其他安全威脅1558.4 大數據與網絡攻擊監測1558.5 大數據安全分析1558.6 大數據安全標準1578.6.1 基礎標準類1588.6.2 平臺和技術類1588.6.3 數據安全類1598.6.4 服務安全類1598.6.5 應用安全類160附錄 大數據軟件安裝161A.1 基礎環境準備161A.2 安裝JDK162A.3 安裝Hadoop162A.4 安裝Zookeeper167A.5 安裝HBase169A.6 安裝Hive170A.7 安裝Spark172參考文獻175

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 204
無庫存,下單後進貨
(採購期約45個工作天)

暢銷榜

客服中心

收藏

會員專區