商品簡介
本書內容來自筆者在浙江某高校授課內容,主要介紹運用Python工具獲取電商平臺的頁面數據,並對數據做清洗和存儲。本書簡化了Python基礎部分,保證有足夠的篇幅來介紹爬蟲和數據清洗的內容,對於Python基礎,建議新手可以選購對應的基礎書籍配合本書一起學習。
作者簡介
零一沐垚科技創始人,電商自媒體,資深數據分析師,8年電商從業經驗,擅長Excel、PowerBI、R、Python等工具,主要研究數據化運營、商業智能和人工智能在電商領域的應用,專注數據+電商的新零售服務。出版《電商數據分析淘寶實戰》《美麗的電商運營日記》《ExcelBI之道:從零開始學Power工具應用》《淘寶、天貓電商數據分析與挖掘實戰》聯繫方式:公眾號:start_data個人號:haicheng1008郵箱:lingyi@muyaotech.com
序
前 言
Python 是軍刀型的開源工具,被廣泛應用于Web 開發、爬蟲、數據清洗、自然語言處理、機器
學習和人工智能等方面,而且Python 的語法簡潔易讀,這讓許多編程入門者不再望而卻步,因此
Python 在最近幾年非常受歡迎,各行各業的技術人員都開始使用Python。
本書內容來自筆者在高校授課的內容,主要介紹如何運用Python 工具獲取電商平臺的頁面數據,
並對數據進行清洗和存儲。本書簡化了Python 基礎部分,保證有足夠的篇幅來介紹爬蟲和數據清洗
的內容。
本書採用的版本是Python 3.6.2,是筆者寫書時的最新版本,而且筆者習慣用的操作平臺是
Windows 系統。雖然目前一些高校和開發者在使用Python 2.7,但是Python 團隊將在2020 年停止對
Python 2.7 的支持更新,Python 2.X 轉向Python 3.X 是大勢所趨。
本書第1 章簡單介紹Python 和相關的IDE,如果讀者完全沒有Python 基礎,那麼建議選購一本
基礎書作為輔助。第2~6 章介紹爬蟲的實例,實現從最簡單的爬蟲到相對比較複雜的爬蟲。鑒於實
例的限制,本書的爬蟲內容沒有涉及代理服務器和驗證碼處理等問題。第7 章介紹在Python 中如何
連接並操作數據庫。第8 章介紹了NumPy 及其用法。第9 章詳細介紹pandas 的功能,pandas 是Python
數據清洗和建模中非常重要的庫。第10 章用兩個完整案例展示了從爬蟲到建模的過程。第11 章介
紹Python 的可視化,選用的庫是matplotlib 和pyecharts,這裡詳細介紹了pyecharts。
鑒於作者的水平有限,不足之處請讀者不吝指教。
目次
第1章Python基礎.....................................................................................11.1安裝Python環境..............................................................................................................11.1.1Python3.6.2安裝與配置..........................................................................................11.1.2使用IDE工具――PyCharm....................................................................................41.1.3使用IDE工具――Anaconda...................................................................................41.2Python操作入門..............................................................................................................61.2.1編寫第一個Python代碼..........................................................................................61.2.2Python基本操作.......................................................................................................91.2