TOP
0
0
魅麗。花火原創小說66折起
Python數據分析從小白到專家(簡體書)
滿額折

Python數據分析從小白到專家(簡體書)

人民幣定價:88 元
定  價:NT$ 528 元
優惠價:87459
領券後再享89折
無庫存,下單後進貨(採購期約45個工作天)
可得紅利積點:13 點
相關商品
商品簡介
作者簡介
目次

商品簡介

本書共13章,主要內容涵蓋Python語法及資料分析方法。第1章主要介紹資料分析的概念,使讀者有一個大致的印象,並簡單介紹本書頻繁使用的Python的5個協力廠商庫。第2章主要做一些準備工作,手把手帶讀者搭建Python環境,包括Python 3.7.6的安裝和pip的安裝。第3章介紹Python程序設計基礎。第4章到第7章介紹使用Python進行簡單資料分析的基礎庫,包括NumPy、Pandas和Matplotlib庫,並介紹使用規則運算式處理資料的方法。第8章到第13章屬於進階內容,但也是Python資料分析的基礎,結合機器學習介紹一些常見的用於資料分析的機器學習算法及常用的數學模型。

作者簡介

田越:曾參加藍橋杯和ACM等算法競賽,以及微軟公司舉辦的創新杯競賽,對於資料分析技術有著執著的追求,善於在學習中發現自己的不足,並將其轉化為努力向前的動力。

前 言


Python最重要的應用領域之一就是資料分析,這主要得益於Python強大的協力廠商庫。Python的協力廠商庫為其提供了良好的生態環境,使得編碼更加方便,程序員不需要寫太多的資料結構和算法,因為Python的協力廠商庫提供的方法足夠用了。

在金融、銷售、供應鏈等各個領域,Python資料分析都有用武之地。為了方便讀者快速掌握資料分析方法,筆者特編寫了本書。

本書內容

本書共13章,主要內容涵蓋Python語法及資料分析方法。

第1章主要介紹資料分析的概念,使讀者有一個大致的印象,並簡單介紹本書頻繁使用的Python的5個協力廠商庫。

第2章主要做一些準備工作,手把手帶讀者搭建Python環境,包括Python 3.7.6的安裝和pip的安裝。

第3章介紹Python程序設計基礎。

第4章到第7章介紹使用Python進行簡單資料分析的基礎庫,包括NumPy、Pandas和Matplotlib庫,並介紹使用規則運算式處理資料的方法。

第8章到第13章屬於進階內容,但也是Python資料分析的基礎,結合機器學習介紹一些常見的用於資料分析的機器學習算法及常用的數學模型。

本書特色

(1)本書詳細講解NumPy、Pandas和Matplotlib庫,從開原始程式碼和官方文檔入手,結合相應的數學運算(矩陣運算、數理統計等),幫助讀者快速入門。

(2)本書並非空談理論、沒有實際的操作與代碼,而是通過公式定理及算法原理引出代碼,由淺入深,每個案例都有相應的代碼和講解。

(3)本書的案例使用較為真實的資料,而不是隨機生成一組數字進行分析。

(4)“紙上得來終覺淺”,讀者可以在筆者的博客和GitHub主頁上找到相應的代碼和資料材料,方便親自試驗與操作。

(5)本書圖文並茂,讀者可以通過將自己編寫的代碼的輸出與案例的輸出進行比較來判斷結果的正誤。

特別說明:由於本書是黑白印刷的,涉及的顏色無法在書中呈現,請讀者結合軟件接口進行辨識。

本書讀者物件

? 有一定Python基礎的讀者。

? 對資料分析和資料科學感興趣的學生。

? Python程序員及其他程序設計愛好者。

? 機器學習、人工智能相關從業人員。


目次

第1章 資料分析存在的意義 1
1.1 資料分析與Python 1
1.1.1 資料科學和資料分析的始末 1
1.1.2 為什麼使用Python作為腳本 2
1.2 本書的主要內容 3
1.2.1 資料分析基礎:NumPy、Pandas和Matplotlib庫概述 3
1.2.2 資料處理:NumPy庫簡介 4
1.2.3 資料處理:Pandas庫簡介 4
1.2.4 圖表繪製:Matplotlib庫簡介 5
1.2.5 中堅力量:Sklearn和Statsmodels庫簡介 5
第2章 開始前的準備 6
2.1 Python 3.7.6的安裝 6
2.1.1 Python3和Python2的區別 6
2.1.2 在Windows 10系統中下載並安裝Python 3.7.6 7
2.1.3 手動配置環境變數 10
2.2 pip的安裝 12
2.2.1 pip是什麼 12
2.2.2 在Windows系統中下載和安裝pip 12
2.2.3 使用pip命令下載和管理pip 14
第3章 Python程序設計基礎 17
3.1 Python程序設計初識 18
3.1.1 第一個Python程式 18
3.1.2 整型、浮點型、布林型與複數型 19
3.1.3 不同資料類型之間的運算法則 22
3.1.4 Python中的常用內建函數 25
3.2 Python程序設計常用類型 27
3.2.1 Python的列表 27
3.2.2 Python的元組 31
3.2.3 Python的字典 34
3.2.4 Python的字串 38
3.3 Python的條件、迴圈和分支語句以及異常處理 42
3.3.1 Python的程序設計風格 42
3.3.2 錯誤、異常和異常處理 43
3.3.3 條件陳述式:if、if-else和elif 45
3.3.4 迴圈語句:while和for 46
3.4 其他關於Python的重要知識點 49
3.4.1 匿名函數lambda 49
3.4.2 Python自訂類與打印函數 51
第4章 線性代數知識和協力廠商庫NumPy的使用 54
4.1 必要的線性代數知識 55
4.1.1 線性代數綜述 55
4.1.2 行列式 56
4.1.3 矩陣及矩陣的運算 60
4.1.4 矩陣的初等變換與秩、向量組與線性相關 65
4.1.5 相似矩陣 67
4.2 NumPy庫的基礎操作 69
4.2.1 NumPy庫的安裝和基本方法 69
4.2.2 創建一個陣列 70
4.2.3 索引、切片和反覆運算 73
4.2.4 拼合、劃分一個矩陣 79
4.2.5 深拷貝、淺拷貝與不拷貝 84
4.3 用NumPy庫實現矩陣運算 87
4.3.1 矩陣基本運算一(矩陣加法、矩陣減法、矩陣數乘) 87
4.3.2 矩陣基本運算二(矩陣相乘、逆矩陣、矩陣的特徵值和特徵向量) 88
第5章 使用規則運算式處理資料 91
5.1 RE模組簡述 91
5.1.1 規則運算式(RE)模組使用的符號 92
5.1.2 規則運算式的匹配規則 93
5.2 使用規則運算式模組 94
5.2.1 匹配物件方法group()和groups()的用法 95
5.2.2 使用管道符進行匹配 98
5.2.3 使用*、+、?、{}符號實現多個條件匹配 99
5.2.4 一些特殊格式的規則運算式匹配模式 100
第6章 使用Pandas庫處理資料 101
6.1 Pandas庫簡述 101
6.1.1 Pandas庫能做什麼 101
6.1.2 Pandas庫功能簡述 105
6.2 三種格式的檔尾碼簡述 108
6.2.1 什麼是CSV檔 108
6.2.2 Python自帶的CSV模組 109
6.2.3 為什麼要將TXT和Excel文件轉化為CSV文件 111
6.3 處理.csv格式的資料 111
6.3.1 用read_csv()和head()讀取CSV檔並顯示其行/列 112
6.3.2 查看列數、維度以及切片操作 112
6.3.3 讀取特定的列以及列的改值操作 113
6.3.4 求某一列的最大值、最小值、算術平均數以及資料的排序 114
6.3.5 Pandas庫的寫入操作――to_csv()方法 115
6.4 處理非.csv格式的資料 116
6.4.1 用Pandas庫讀取TXT文件 116
6.4.2 用Pandas庫讀取Excel檔 118
6.5 Pandas庫的其他常用操作 121
6.5.1 新增DataFrame資料結構的意義 121
6.5.2 創建與遍歷DataFrame資料結構 122
6.5.3 檢索已有的DataFrame資料結構 124
6.5.4 DataFrame資料結構的選擇操作 128
6.5.5 處理DataFrame資料結構中的缺失資料 134
第7章 使用Matplotlib庫實現資料可視化 136
7.1 Matplotlib庫簡述 136
7.1.1 Matplotlib庫的安裝 137
7.1.2 Matplotlib庫常見的問題 138
7.2 Matplotlib庫的基本方法 139
7.2.1 設定x軸與y軸的相關內容 139
7.2.2 “點”和“線”樣式的設定 144
7.3 使用Matplotlib庫繪製圖表 146
7.3.1 繪製柱狀圖 147
7.3.2 繪製長條圖 149
7.3.3 繪製散點圖 151
7.3.4 繪製餅狀圖 153
7.3.5 繪製折線圖 155
第8章 數學模型與數理統計 157
8.1 走進數學模型 158
8.1.1 什麼是數學模型 158
8.1.2 建立數學模型的一般步驟 160
8.1.3 數學模型示例 162
8.2 必要的數理統計知識 164
8.2.1 樣本、總體、個體、統計量 164
8.2.2 3個重要的分佈:χ2分佈、t分佈、f分佈 165
8.2.3 點估計、矩估計與區間估計 167
8.2.4 全概率公式和貝葉斯公式 168
8.2.5 依概率收斂與切比雪夫不等式 170
第9章 線性回歸 172
9.1 最小二乘法與切比雪夫準則 172
9.1.1 最小二乘法的數學原理 173
9.1.2 切比雪夫準則的數學原理 175
9.2 OLS回歸模型 175
9.2.1 OLS回歸模型的概念 176
9.2.2 如何生成測試資料 176
9.2.3 OLS回歸模型的代碼實現和可視化 179
9.3 LAD回歸模型 182
9.3.1 LAD回歸模型的概念 182
9.3.2 LAD回歸模型的代碼實現和可視化 183
9.4 OLS回歸模型與LAD回歸模型 186
9.4.1 比較OLS回歸模型與LAD回歸模型的擬合曲線 186
9.4.2 簡單的一元線性回歸分析的代碼展示 187
9.5 從極大似然估計再審視線性回歸 189
9.5.1 從傳統的數理統計到線性回歸 189
9.5.2 極大似然估計 190
9.5.3 假設檢驗基本概念 191
9.5.4 區間估計、置信區間和置信限 192
第10章 分類問題與邏輯回歸 197
10.1 邏輯回歸:從分類問題談起 197
10.1.1 從線性回歸到分類問題 198
10.1.2 邏輯回歸與Sigmoid函數 199
10.1.3 使用極大似然估計計算Sigmoid函數的損失函數 201
10.1.4 邏輯回歸模型求解的本質 202
10.2 從梯度上升法與梯度下降法到邏輯回歸 202
10.2.1 梯度上升法和梯度下降法的由來 202
10.2.2 梯度下降法及梯度上升法的數學原理 203
10.2.3 用Python實現邏輯回歸 206
10.2.4 題外話:從用Python實現邏輯回歸中看psutil庫 216
10.2.5 邏輯回歸可視化:繪製決策邊界 220
第11章 模型評估與模型改進 223
11.1 線性回歸模型的評估與改進 223
11.1.1 線性回歸模型的評估 224
11.1.2 模型改進:從一元線性回歸到多元線性回歸問題 231
11.1.3 模型改進:過度擬合與添加、設定懲罰項 238
11.2 邏輯回歸模型的評估與改進 239
11.2.1 分類模型的評估:查準率、查全率及F-score 239
11.2.2 分類模型的評估:ROC曲線、AUC指標 241
11.2.3 模型改進:隨機梯度下降法 242
11.2.4 邏輯回歸最終代碼展示(使用隨機梯度下降法) 245
第12章 聚類:K-means算法 248
12.1 K-means算法及相關內容的基本概念 248
12.1.1 聚類與機器學習的概念 249
12.1.2 聚類:K-means算法的原理 250
12.2 K-means算法的Python實現 253
12.2.1 樸素的K-means算法的Python實現 253
12.2.2 樸素的K-means算法的Python實現的具體解析 256
12.2.3 模型改進:使用不同顏色和形狀標記不同的簇 261
12.2.4 K-means算法改進:使用二分K-means算法 263


第13章 分類:KNN算法 271
13.1 KNN算法的基本概念 271
13.1.1 KNN算法的相關概念 271
13.1.2 KNN算法原理概述 272
13.2 KNN算法的Python實現 274
13.2.1 製作測試用例資料集 274
13.2.2 KKN算法的具體實現 279
13.2.3 KKN算法的完整代碼 282
13.3 結語:關於資料分析 285
13.3.1 決策樹之前:樹的概念 285
13.3.2 信息熵和決策樹 285
13.3.3 寫在最後的話:留給機器學習 286

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 459
無庫存,下單後進貨
(採購期約45個工作天)

暢銷榜

客服中心

收藏

會員專區