TOP
紅利積點抵現金,消費購書更貼心
Python數據分析從入門到精通(簡體書)
滿額折

Python數據分析從入門到精通(簡體書)

商品資訊

人民幣定價:89.8 元
定價
:NT$ 539 元
優惠價
87469
海外經銷商無庫存,到貨日平均30天至45天
下單可得紅利積點 :14 點
商品簡介
作者簡介
名人/編輯推薦
目次

商品簡介

《Python數據分析從入門到精通》全面介紹了使用Python進行數據分析所必需的各項知識。全書共分為14章,包括了解數據分析、搭建Python數據分析環境、Pandas統計分析、Matplotlib可視化數據分析圖表、Seaborn可視化數據分析圖表、第三方可視化數據分析圖表Pyecharts、圖解數組計算模塊NumPy、數據統計分析案例、機器學習庫Scikit-Learn、注冊用戶分析(MySQL版)、電商銷售數據分析與預測、二手房房價分析與預測,以及客戶價值分析。
該書所有示例、案例和實戰項目都提供源碼,另外該書的服務網站提供了模塊庫、案例庫、題庫、素材庫、答疑服務,力求為讀者打造一本“基礎入門+應用開發+項目實戰”一體化的Python數據分析圖書。
《Python數據分析從入門到精通》內容詳盡,圖文豐富,非常適合作為數據分析人員的學習參考用書,也可作為想拓展數據分析技能的普通職場人員和Python開發人員學習參考用書。

作者簡介

明日科技,全稱是吉林省明日科技有限公司,是一家專業從事軟件開發、教育培訓以及軟件開發教育資源整合的高科技公司,其編寫的教材非常注重選取軟件開發中的必需、常用內容,同時也很注重內容的易學、方便性以及相關知識的拓展性,深受讀者喜愛。其教材多次榮獲“全行業優秀暢銷品種”“全國高校出版社優秀暢銷書”等獎項,多個品種長期位居同類圖書銷售排行榜的前列。

名人/編輯推薦

《Python數據分析從入門到精通》從零基礎開始,提供了從Python入門到成為數據分析高手所必需的各項知識。無論有沒有Python基礎,通過本書你都能最終成為數據分析高手。

(1)主流技術,全面解析。本書涵蓋數據分析三劍客Pandas、Matplotlib和Numpy,數據可視化三大圖表Matplotlib、Seaborn和Pyecharts,以及機器學習庫Scikit-Learn等技術,一本書教你掌握數據分析領域的主流核心技術。

(2)由淺入深,循序漸進。本書引領讀者按照基礎知識→核心技術→高級應用→項目實戰循序漸進地學習,符合認知規律。

(3)邊學邊練,學以致用。248個應用示例+20個綜合案例+4個行業項目案例+136集Python零基礎掃盲課,邊學邊練,在實踐中提升技能。

(4)精彩欄目,貼心提醒。本書設置了很多“注意”“說明”“知識膠囊”等小欄目,讓讀者在學習的過程中更輕松地理解相關知識點及概念,更快地掌握數據分析技能和應用技巧。

(5)在線解答,高效學習。在線答疑QQ及技術支持網站,不定期進行在線直播課程。


大數據、人工智能以及5G時代的到來,使得每個人都可以隨時隨地產生大量的真實數據。這些數據中隱藏著巨大商機,能否通過快捷、有效的數據分析,找到對管理者判斷、決策有價值的分析結果,決定著一個企業,甚至一個城市能否在發展中占得先機。可以說,未來人人都需要掌握一定的數據分析技能。
Python語言簡單易學,做數據處理快捷、高效、容易上手。而且,Python的第三方擴展庫一直在更新,因此未來其應用範圍會越來越廣。目前,Python在科學計算、數據分析、數學建模、數據挖掘等方面,占據著非常重要的地位。
本書將從零開始,詳細講解Python數據分析的相關知識。無論你有沒有Python基礎,通過本書你都能最終成為數據分析高手。
本書提供了從Python入門到成為數據分析高手所必需的各項知識,共分4篇。
第1篇:基礎篇。本篇首先介紹什麼是數據分析,然後帶領讀者搭建Python數據分析環境,並介紹了五大開發環境,包括Python自帶的IDLE、集成開發環境PyCharm、適合數據分析的標準環境Anaconda、Jupyter Notebook開發工具和Spyder開發工具。
第2篇:實踐篇。本篇以數據分析三劍客Pandas、Matplotlib和Numpy為主線,以數據分析的基本流程展開講解,詳細介紹了Pandas數據處理與數據分析,數據可視化三大圖表Matplotlib、Seaborn和第三方圖表Pyecharts,圖解數組計算模塊NumPy。最後,通過8個典型的數據統計分析案例,對前面所學的知識進行綜合應用,通過實際案例來檢驗學習成果。
第3篇:高級篇。本篇以機器學習庫Scikit-Learn為主,介紹了什麼是Scikit-Learn、線性模型、支持向量機和聚類。
第4篇:項目篇。本篇以項目實戰為主,側重提升讀者的實際數據分析能力。涉及四大領域,主要包括APP注冊用戶分析(MySQL版)、電商銷售數據分析與預測、二手房房價分析與預測,以及客戶價值分析。
本書特點
主流技術,全面覆蓋。本書內容豐富,涵蓋了數據分析三劍客Pandas、Matplotlib和Numpy,數據可視化三大圖表Matplotlib、Seaborn和Pyecharts,機器學習庫Scikit-Learn等,一本書可以掌握數據分析領域的所有主流核心技術。
由淺入深,循序漸進。本書在介紹晦澀難懂的專業術語時,給出了大量示意圖,並以現實生活中的場景為例講解,力求輕松、有趣、易懂,掃除專業壁壘,幫助讀者快速入門。
示例典型,輕松易學。通過例子學習是最好的學習方式,本書通過“一個知識點、一個例子、一個結果”的模式,透徹詳盡地講述了數據處理、數據分析、數據可視化、數組計算和機器學習的相關知識。另外,為了便於讀者閱讀程序代碼,快速掌握Python數據分析技能,書中幾乎每行代碼都給出了注釋。
應用實踐,隨時練習。書中提供了248個應用示例、20個綜合案例,4個項目案例,同時提供了大量的樣本數據,讀者可以隨時拿來操練,鞏固和提升自己的數據處理和分析能力。
精彩欄目,貼心提醒。本書根據需要在各章使用了很多“注意”“說明”“知識膠囊”等小欄目,讓讀者可以在學習的過程中更輕松地理解相關知識點及概念,更快地掌握數據分析技能和應用技巧。
讀者服務:本書附贈的各類學習資源,讀者可登錄清華大學出版社網站,在對應圖書頁面下獲取其下載方式。也可掃描圖書封底的“文泉云盤”二維碼,獲取其下載方式。
感謝您購買本書,希望本書能成為您編程路上的領航者。
“零門檻”編程,一切皆有可能。
祝讀書快樂!


目次

第1篇 基礎篇
第1章 了解數據分析 2
1.1 什麼是數據分析 2
1.2 數據分析的重要性 2
1.3 數據分析的基本流程 4
1.3.1 熟悉工具 4
1.3.2 明確目的 5
1.3.3 獲取數據 5
1.3.4 數據處理 5
1.3.5 數據分析 6
1.3.6 驗證結果 6
1.3.7 結果呈現 6
1.3.8 數據應用 7
1.4 數據分析常用工具 7
1.4.1 Excel工具 7
1.4.2 Python語言 7
1.5 小結 8
第2章 搭建Python數據分析環境 9
2.1 Python概述 9
2.1.1 Python簡介 9
2.1.2 Python的版本 10
2.2 搭建Python開發環境 10
2.2.1 什麼是IDLE 10
2.2.2 安裝Python 10
2.2.3 使用IDLE編寫“Hello World” 14
2.2.4 配置環境變量—解決“'python'不是內部或外部命令” 16
2.3 集成開發環境PyCharm 18
2.3.1 下載PyCharm 18
2.3.2 安裝PyCharm 20
2.3.3 運行PyCharm 21
2.3.4 創建工程目錄 22
2.3.5 第一個Python程序“Hello World” 24
2.4 數據分析標準環境Anaconda 26
2.4.1 為什麼安裝Anaconda 27
2.4.2 下載Anaconda 27
2.4.3 安裝Anaconda 29
2.5 Jupyter Notebook開發工具 31
2.5.1 認識Jupyter Notebook 31
2.5.2 新建一個Jupyter Notebook文件 32
2.5.3 在Jupyter Notebook中編寫“Hello World” 32
2.6 Spyder開發工具 34
2.6.1 初識Spyder 34
2.6.2 創建項目 35
2.6.3 新建/重命名.py文件 36
2.6.4 創建第一個程序—月銷量分析 37
2.6.5 設置圖表顯示方式 37
2.6.6 在Spyder中安裝和卸載第三方庫 38
2.7 開發工具比較與代碼共享 39
2.7.1 開發工具比較 39
2.7.2 代碼共享 40
2.8 小結 44
第2篇 實踐篇
第3章 Pandas統計分析(上) 46
3.1 初識Pandas 46
3.1.1 Pandas概述 46
3.1.2 安裝Pandas 47
3.1.3 小試牛刀—輕松導入Excel數據 49
3.2 Series物件 50
3.2.1 圖解Series物件 50
3.2.2 創建一個Series物件 51
3.2.3 手動設置Series索引 52
3.2.4 Series的索引 52
3.2.5 獲取Series索引和值 54
3.3 DataFrame物件 54
3.3.1 圖解DataFrame物件 54
3.3.2 創建一個DataFrame物件 55
3.3.3 DataFrame重要屬性和函數 57
3.4 導入外部數據 58
3.4.1 導入.xls或.xlsx文件 58
3.4.2 導入.csv文件 63
3.4.3 導入.txt文本文件 64
3.4.4 導入HTML網頁 65
3.5 數據抽取 67
3.5.1 抽取一行數據 67
3.5.2 抽取多行數據 68
3.5.3 抽取指定列數據 69
3.5.4 抽取指定行、列數據 70
3.5.5 按指定條件抽取數據 71
3.6 數據的增加、修改和刪除 72
3.6.1 增加數據 72
3.6.2 修改數據 75
3.6.3 刪除數據 77
3.7 數據清洗 78
3.7.1 缺失值查看與處理 78
3.7.2 重復值處理 81
3.7.3 異常值的檢測與處理 82
3.8 索引設置 83
3.8.1 索引的作用 83
3.8.2 重新設置索引 83
3.8.3 設置某列為行索引 85
3.8.4 數據清洗後重新設置連續的行索引 86
3.9 數據排序與排名 87
3.9.1 數據排序 87
3.9.2 數據排名 90
3.10 小結 92
第4章 Pandas統計分析(下) 93
4.1 數據計算 93
4.1.1 求和(sum()函數) 93
4.1.2 求均值(mean()函數) 94
4.1.3 求最大值(max()函數) 95
4.1.4 求最小值(min()函數) 96
4.1.5 求中位數(median()函數) 97
4.1.6 求眾數(mode()函數) 98
4.1.7 求方差(var()函數) 99
4.1.8 標準差(數據標準化std()函數) 101
4.1.9 求分位數(quantile()函數) 101
4.2 數據格式化 103
4.2.1 設置小數字數 103
4.2.2 設置百分比 104
4.2.3 設置千位分隔符 105
4.3 數據分組統計 106
4.3.1 分組統計groupby()函數 106
4.3.2 對分組數據進行迭代 108
4.3.3 對分組的某列或多列使用聚合函數(agg()函數) 109
4.3.4 通過字典和Series物件進行分組統計 111
4.4 數據移位 112
4.5 數據轉換 113
4.5.1 一列數據轉換為多列數據 113
4.5.2 行列轉換 116
4.5.3 DataFrame轉換為字典 118
4.5.4 DataFrame轉換為列表 119
4.5.5 DataFrame轉換為元組 119
4.5.6 Excel轉換為HTML網頁格式 120
4.6 數據合並 120
4.6.1 數據合並(merge()方法) 120
4.6.2 數據合並(concat()方法) 124
4.7 數據導出 126
4.7.1 導出為.xlsx文件 126
4.7.2 導出為.csv文件 128
4.7.3 導出多個Sheet 129
4.8 日期數據處理 129
4.8.1 DataFrame的日期數據轉換 129
4.8.2 dt物件的使用 131
4.8.3 獲取日期區間的數據 132
4.8.4 按不同時期統計並顯示數據 133
4.9 時間序列 135
4.9.1 重采樣(Resample()方法) 135
4.9.2 降采樣處理 137
4.9.3 升采樣處理 138
4.9.4 時間序列數據匯總(ohlc()函數) 139
4.9.5 移動窗口數據計算(rolling()函數) 140
4.10 綜合應用 142
4.10.1 案例1:Excel多表合並 142
4.10.2 案例2:股票行情數據分析 143
4.11 小結 144
第5章 Matplotlib可視化數據分析圖表 145
5.1 數據分析圖表的作用 145
5.2 如何選擇適合的圖表類型 146
5.3 圖表的基本組成 147
5.4 Matplotlib概述 148
5.4.1 Matplotlib簡介 148
5.4.2 安裝Matplotlib 150
5.4.3 Matplotlib圖表之初體驗 151
5.5 圖表的常用設置 152
5.5.1 基本繪圖plot()函數 152
5.5.2 設置畫布 155
5.5.3 設置坐標軸 156
5.5.4 添加文本標簽 159
5.5.5 設置標題和圖例 160
5.5.6 添加注釋 161
5.5.7 調整圖表與畫布邊緣間距 163
5.5.8 其他設置 164
5.6 常用圖表的繪制 164
5.6.1 繪制折線圖 164
5.6.2 繪制柱形圖 166
5.6.3 繪制直方圖 169
5.6.4 繪制餅形圖 170
5.6.5 繪制散點圖 174
5.6.6 繪制面積圖 176
5.6.7 繪制熱力圖 178
5.6.8 繪制箱形圖 180
5.6.9 繪制3D圖表 183
5.6.10 繪制多個子圖表 184
5.6.11 圖表的保存 189
5.7 綜合應用 189
5.7.1 案例1:雙y軸可視化數據分析圖表的實現 189
5.7.2 案例2:顏色漸變餅形圖的實現 190
5.7.3 案例3:等高線圖的實現 192
5.8 小結 193
第6章 Seaborn可視化數據分析圖表 194
6.1 Seaborn圖表概述 194
6.2 Seaborn圖表之初體驗 195
6.3 Seaborn圖表的基本設置 196
6.3.1 背景風格 196
6.3.2 邊框控制 197
6.4 常用圖表的繪制 197
6.4.1 繪制折線圖(relplot()函數) 197
6.4.2 繪制直方圖(displot()函數) 199
6.4.3 繪制條形圖(barplot()函數) 200
6.4.4 繪制散點圖(replot()函數) 200
6.4.5 繪制線性回歸模型(lmplot()函數) 202
6.4.6 繪制箱形圖(boxplot()函數) 202
6.4.7 繪制核密度圖(kdeplot()函數) 203
6.4.8 繪制提琴圖(violinplot()函數) 204
6.5 綜合應用 205
6.5.1 案例1:堆疊柱形圖可視化數據分析圖表的實現 205
6.5.2 案例2:統計雙色球中獎號碼熱力圖 206
6.6 小結 208
第7章 第三方可視化數據分析圖表Pyecharts 209
7.1 Pyecharts概述 209
7.1.1 Pyecharts簡介 209
7.1.2 安裝Pyecharts 210
7.1.3 繪制第一張圖表 211
7.2 Pyecharts圖表的組成 212
7.2.1 主題風格 212
7.2.2 圖表標題 214
7.2.3 圖例 216
7.2.4 提示框 218
7.2.5 視覺映射 220
7.2.6 工具箱 222
7.2.7 區域縮放 224
7.3 Pyecharts圖表的繪制 226
7.3.1 柱狀圖—Bar模塊 226
7.3.2 折線/面積圖—Line模塊 227
7.3.3 餅形圖—Pie模塊 229
7.3.4 箱形圖—Boxplot模塊 231
7.3.5 漣漪特效散點圖—EffectScatter模塊 232
7.3.6 詞云圖—WordCloud模塊 233
7.3.7 熱力圖—HeatMap模塊 235
7.3.8 水球圖—Liquid模塊 237
7.3.9 日歷圖—Calendar模塊 237
7.4 綜合應用 238
7.4.1 案例1:南丁格爾玫瑰圖 238
7.4.2 案例2:雙y軸可視化數據分析圖表的實現(柱形圖 折線圖) 240
7.4.3 案例3:餅形圖與環形圖組合圖表的實現 242
7.5 小結 244
第8章 圖解數組計算模塊NumPy 245
8.1 初識NumPy 245
8.1.1 NumPy概述 245
8.1.2 安裝NumPy模塊 246
8.1.3 數組相關概念 247
8.2 創建數組 248
8.2.1 創建簡單的數組 248
8.2.2 不同方式創建數組 250
8.2.3 從數值範圍創建數組 251
8.2.4 生成隨機數組 254
8.2.5 從已有的數組中創建數組 257
8.3 數組的基本操作 260
8.3.1 數據類型 260
8.3.2 數組運算 262
8.3.3 數組的索引和切片 265
8.3.4 數組重塑 269
8.3.5 數組的增、刪、改、查 271
8.4 NumPy矩陣的基本操作 274
8.4.1 創建矩陣 274
8.4.2 矩陣運算 277
8.4.3 矩陣轉換 279
8.5 NumPy常用統計分析函數 280
8.5.1 數學運算函數 280
8.5.2 統計分析函數 285
8.5.3 數組的排序 288
8.6 綜合應用 290
8.6.1 案例1:NumPy實現正態分布 290
8.6.2 案例2:NumPy用於圖像灰度處理 291
8.7 小結 292
第9章 數據統計分析案例 293
9.1 對比分析 293
9.1.1 什麼是對比分析 293
9.1.2 案例:對比分析各品牌銷量表現TOP10 293
9.2 同比、定比和環比分析 294
9.2.1 同比、定比和環比概述 295
9.2.2 案例1:京東電商單品銷量同比增長情況分析 295
9.2.3 案例2:單品銷量定比分析 297
9.2.4 案例3:單品銷量環比增長情況分析 298
9.3 貢獻度分析(帕累托法則) 300
9.3.1 什麼是貢獻度分析 300
9.3.2 案例:產品貢獻度分析 300
9.4 差異化分析 302
9.4.1 差異化概述 302
9.4.2 案例:學生成績性別差異分析 302
9.5 相關性分析 303
9.5.1 相關性概述 303
9.5.2 案例:廣告展現量與費用成本相關性分析 303
9.6 時間序列分析 306
9.6.1 時間序列概述 306
9.6.2 案例:年增長趨勢和季節性波動分析 306
9.7 小結 307
第3篇 高級篇
第10章 機器學習庫Scikit-Learn 310
10.1 Scikit-Learn簡介 310
10.2 安裝Scikit-Learn 310
10.3 線性模型 312
10.3.1 最小二乘法回歸 312
10.3.2 嶺回歸 313
10.4 支持向量機 314
10.5 聚類 316
10.5.1 什麼是聚類 316
10.5.2 聚類算法 317
10.5.3 聚類模塊 318
10.5.4 聚類數據生成器 319
10.6 小結 320
第4篇 項目篇
第11章 注冊用戶分析(MySQL版) 322
11.1 概述 322
11.2 項目效果預覽 322
11.3 項目準備 323
11.4 導入MySQL數據 323
11.4.1 Python操縱MySQL 323
11.4.2 Python連接MySQL數據庫 324
11.5 項目實現過程 325
11.5.1 數據準備 325
11.5.2 數據檢測 325
11.5.3 年度注冊用戶分析 326
11.5.4 新注冊用戶分析 328
11.6 小結 329
第12章 電商銷售數據分析與預測 330
12.1 概述 330
12.2 項目效果預覽 330
12.3 項目準備 331
12.4 分析方法 331
12.5 項目實現過程 332
12.5.1 數據處理 332
12.5.2 日期數據統計並顯示 332
12.5.3 銷售收入分析 333
12.5.4 銷售收入與廣告費相關性分析 334
12.5.5 銷售收入預測 337
12.5.6 預測評分 338
12.6 小結 339
第13章 二手房房價分析與預測 340
13.1 概述 340
13.2 項目效果預覽 340
13.3 項目準備 342
13.4 圖表工具模塊 342
13.4.1 繪制餅形圖 342
13.4.2 繪制折線圖 343
13.4.3 繪制條形圖 344
13.5 項目實現過程 345
13.5.1 數據清洗 345
13.5.2 區域二手房均價分析 346
13.5.3 區域二手房數據及占比分析 347
13.5.4 全市二手房裝修程度分析 348
13.5.5 熱門戶型均價分析 350
13.5.6 二手房房價預測 350
13.6 小結 354
第14章 客戶價值分析 355
14.1 概述 355
14.2 項目效果預覽 355
14.3 項目準備 356
14.4 分析方法 357
14.4.1 RFM模型 357
14.4.2 聚類 358
14.5 項目實現過程 358
14.5.1 準備工作 358
14.5.2 數據抽取 358
14.5.3 數據探索分析 358
14.5.4 計算RFM值 359
14.5.5 數據轉換 360
14.5.6 客戶聚類 360
14.5.7 標記客戶類別 362
14.6 客戶價值結果分析 363
14.7 小結 364


購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 469
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區