TOP
0
0
【簡體曬書區】 單本79折,5本7折,活動好評延長至5/31,趕緊把握這一波!
Python商業數據分析:零售和電子商務案例詳解(雙色)(簡體書)
滿額折

Python商業數據分析:零售和電子商務案例詳解(雙色)(簡體書)

人民幣定價:79 元
定價
:NT$ 474 元
優惠價
87412
領券後再享88折
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:12 點
相關商品
商品簡介
作者簡介
目次
書摘/試閱

商品簡介

本書以零售和電子商務為業務背景,使用Python工具解決業務場景中的數據分析需求。全書涵蓋數據采集、數據存儲、數據處理、數據分析、數據可視化和數據建模的內容。

本書適合零售和電子商務運營人員以及想要從事商業數據分析工作的人員閱讀,也可以作為高校和培訓機構相關課程的教材。


作者簡介

零一

原名陳海城。杭州沐垚科技有限公司總經理,具有11年電商數據分析從業經驗。代表作品有《Python數據爬蟲、清洗及可視化實戰》《淘寶、天貓電商數據分析與挖掘實戰》。


推薦序

我個人從事數據挖掘及大數據分析工作已經超過25 年。對於要如何成為一個好的數據科學家,我個人認為要具備以下三個特質:

第一是對數據的熱愛,見到數據就像見到心儀的人一樣,想去親近它,想去了解它。

第二是對相關數據分析工具的純熟運用,讓你能隨心所欲地駕馭數據。

第三是懂得如何將數據分析與行業領域知識相結合,讓數據分析能有效地協助領導做出適當的決策。

我所認識的零一就是具備這三項特質的一個人。聽到他要出書,我很高興,因為對於熱愛數據分析的工作者又有福了。

零一的這本書從數據挖掘及商業數據分析的基礎開始,循序漸進地引導讀者,熟悉相關的數據分析的概念及工具。之後用市場分析、店鋪數據化運營、數字營銷及銷售預測等案例,讓讀者了解如何將數據分析與零售和電子商務的實務進行完美的結合。本書的整體編排及架構我很喜歡,相信讀完此書的人也會有同樣的感受。

我們最近經常聽到一句話就是,機器及將取代人力,因此還嚇壞了許多人。其實從我的角度來說,要取代人的機器,還是人設計出來的。因此,解決這個問題的關鍵就是你自己。不僅僅機器需要深度學習,更需要深度學習的還是我們自己。零一的這本書就是大家開始深度學習的基礎,是值得推薦的一本好書。

李御璽(Yue-Shi Lee)

臺灣大學信息工程博士

銘傳大學信息工程學系教授

中華資料采礦協會理事

前言

Python 已經成為時下最熱門的計算機語言之一,應用範圍十分廣泛,甚至進入了小學課堂。目前許多書籍內容還是以學習如何使用Python 工具為主,在實際應用方面相對較少,特別是在零售分析方面的應用少之又少。大部分企業做數據分析還是以Excel 為主。在這個背景之下,筆者寫這本書是為了能把Python 帶入普通企業中。

Excel 能做的事情,Python 都可以完成,但是Python 能做的事情,Excel 未必可以做。

全書分為6 章。第1 章介紹Python 基礎;第2 章重點介紹數據采集、數據庫,以及常用的NumPy、Pandas、matplotlib 庫;第3 章重點介紹市場分析案例;第4 章重點介紹SEO、推廣方案和競品分析的案例;第5 章重點介紹數字營銷案例;第6章重點介紹銷售預測案例。

這本書對Python 零基礎的讀者較不友好,建議Python 零基礎的讀者配套基礎入門書籍學習。讀者如果具備Python 基礎,可以直接從第2 章讀起。考慮到數據的敏感性和難度,本書案例在數據上做了部分精簡,目前保留的案例數據集最大的只有500MB,從學習和掌握本書所述方法的角度,可以滿足需求。

最後,鑒於作者的水平有限,書中存在的不足之處請讀者諒解。

作者

2021 年5 月


目次

1 Python 基礎 1

1.1 安裝Python 環境 2

1.1.1 Python 3.6.2 安裝與配置 2

1.1.2 獲取PyCharm 4

1.1.3 獲取Anaconda 4

1.2 Python 操作入門 6

1.2.1 編寫第一段Python 代碼 6

1.2.2 Python 基本操作 9

1.2.3 Python 變量 11

1.2.4 Python 數據類型 11

1.2.5 Python 控制語句與函數 17

1.2.6 Python 自定義函數 20

2 Python 商業數據分析基礎 21

2.1 什麼是數據分析 22

2.1.1 理解數據分析 22

2.1.2 數據分析的兩個核心思維 23

2.1.3 數據分析的方法論 23

2.2 Python 在商業分析中的價值 32

2.2.1 人生苦短,我用Python 32

2.2.2 Python 在商業分析應用中的優勢 33

2.3 數據采集 33

2.3.1 采集數據前的準備工作 33

2.3.2 Requests 庫 40

2.4 數據庫操作及文件讀寫 48

2.4.1 MySQL 數據庫 48

2.4.2 數據庫操作 50

2.5 NumPy 數組處理 54

2.5.1 一維數組操作 54

2.5.2 多維數組操作 56

2.5.3 數組運算 60

2.6 Pandas 數據處理 61

2.6.1 數據導入與導出 61

2.6.2 數據描述性統計 62

2.6.3 數據透視匯總 63

2.7 商業分析可視化 65

2.7.1 柱狀圖 66

2.7.2 餅圖 68

2.7.3 線圖 69

2.7.4 散點圖 70

3 Python 與市場分析案例 73

3.1 案例:市場大盤容量分析 75

3.1.1 案例背景及數據理解 75

3.1.2 計算市場絕對規模 76

3.1.3 計算市場相對規模 78

3.1.4 繪制柱狀圖和餅圖 79

3.2 案例:市場趨勢分析 81

3.2.1 案例背景及數據理解 82

3.2.2 根據時間合並市場數據 83

3.2.3 補齊缺失月的數據 84

3.2.4 繪制趨勢圖 89

3.2.5 計算市場增量 94

3.2.6 繪制組合圖 94

3.3 案例:細分市場分析 95

3.3.1 案例背景及數據理解 96

3.3.2 類別的分布分析 96

3.3.3 識別潛力細分市場 99

3.3.4 潛力細分市場需求分析 104

3.3.5 消費者需求分析 106

4 Python 與店鋪數據化運營案例 115

4.1 案例:用Python 做SEO 116

4.1.1 案例背景及數據理解 116

4.1.2 關鍵詞詞根分詞與統計 117

4.1.3 可視化圖形 118

4.2 案例:用Python 做推廣方案 122

4.2.1 案例背景及數據理解 122

4.2.2 計算渠道投放預算的最優解 124

4.2.3 計算品類投放預算的最優解 126

4.2.4 計算各個品類在不同渠道的最優解 127

4.3 案例:用Python 分析競品 131

4.3.1 案例背景及數據理解 131

4.3.2 采集數據 131

4.3.3 競品調價預警 134

5 Python 與數字營銷案例 137

5.1 案例:基於關聯規則的產品推薦 138

5.1.1 算法原理及案例背景 138

5.1.2 創建商品項集 141

5.1.3 建立函數挑選最小支持度項集 143

5.1.4 訓練步驟項集函數 144

5.2 案例:基於聚類算法的商品推薦 147

5.2.1 算法原理及案例背景 147

5.2.2 消費者聚類 150

5.2.3 基於消費者聚類的推薦 167

5.3 案例:基於協同過濾算法的產品推薦 176

5.3.1 算法原理及案例背景 176

5.3.2 數據準備 178

5.3.3 推薦算法建模 179

5.4 案例:消費者輿情分析 183

5.4.1 案例背景及數據理解 183

5.4.2 案例實現 183

6 Python 與銷售預測案例 187

6.1 案例:基於業務邏輯的預測算法模型 188

6.1.1 案例背景及數據理解 188

6.1.2 案例實現 188

6.2 案例:基於時序算法預測庫存 189

6.2.1 算法原理及案例背景 189

6.2.2 數據及時序檢查 191

6.2.3 時間序列建模 198

6.2.4 循環迭代的ARIMA 模型 203

6.3 案例:電商的庫存預測算法建模 207

6.3.1 算法原理及案例背景 208

6.3.2 準備數據 209

6.3.3 計算補貨量 211

6.4 案例:用戶成單預測 212

6.4.1 算法原理及案例背景 212

6.4.2 數據準備 215

6.4.3 數據挖掘 243

6.5 案例:用戶流失預測 246

6.5.1 算法原理及案例背景 246

6.5.2 數據準備 249

6.5.3 數據挖掘 254


書摘/試閱

Python與市場分析案例

市場分析是運營過程中非常高頻的場景,在拓展市場或者做階段性戰略目標時都離不

開市場分析,市場分析的結果是給決策者最好的支撐。

市場分析是指應用統計學、計量經濟學等分析工具對特定市場的運行狀況、產品生產、銷售、消費、技術、市場競爭力、市場競爭格局、市場政策等市場要素進行深入的分析,從而發現市場運行的內在規律,進一步預測未來市場發展的趨勢。

市場分析是發現和掌握市場運行規律的必經之路,對指導市場內企業的經營規劃和發展具有決定性的意義。

1.市場分析的思路

市場分析是商業行為中非常重要的環節,是做策劃、定位的前道工序。決策者只有了解市場,才能做出準確有效的決策。市場分析需要2 ~ 3 年的歷史數據,如果歷史數據的年限太少,則難以全面且準確地對市場做出預判。

l 市場容量(market volume)分析:這裡分析的是市場相對規模。市場規模(market sizing)是難以估算的,根據統計學的方式估算的結果並不靠譜,因此用電商平臺的市場數據(抽樣)來分析電商的相對規模,給決策者提供有價值的參考依據。

l 市場趨勢(market trends)分析:這是對市場的自然規律進行探索,以及對未來的發展趨勢進行預測,讓決策者提前根據市場發展趨勢做出預判,並對經營策略進行調整。

l 市場細分(market segmentation)分析:市場細分是市場選擇的基礎,根據消費者群體將市場劃分成多個子市場,子市場之間的需求存在著明顯的差異。

2.市場數據的收集

市場分析的數據需要根據分析的物件確定收集範圍。如果是線下零售數據,則個人或企業都難以使用技術手段收集,線下數據需要使用傳感器等設備,並且拿到數據的授權才可以獲得這類數據;如果是在線零售數據,則較為簡單,可以通過購買電商平臺提供的數據,也可以自行采集公開的頁面數據。

(1)線下零售數據可在以下系統收集。

l 收銀系統,系統中有每一筆訂單的數據。

l CRM(客戶關係管理)系統,系統中有客戶的消費數據。

l 客流統計系統,系統中有商超或門店的客流量數據。

l ERP(企業資源計劃)系統,系統中有銷售的產品數據。

(2)在線零售數據可在以下渠道收集。

l 電商平臺官方提供的行業數據平臺。平臺中有行業的數據,具體字段則是隨提供數據的平臺的不同而不同,官方提供的數據以指數類數據為主。

l 電商平臺的公開頁面,需要自行采集累積原始資料,而且只有連續的數據才有價值。因為是原始資料,所以可以支持自由度最大的分析,但自行累積的時間花費較長。

l 第三方電商數據平臺。第三方都是采集公開的頁面數據後經過清洗、統計、匯總等環節提供給用戶的數據,雖然可以節省時間和成本,但是不能像自行采集累積那樣擁有原始資料。

3.1 案例:市場大盤容量分析

市場容量也稱為行業規模,是指某個市場在統計期間的需求總價值。市場容量分析是對行業規模的分析和判斷,市場規模決定了行業中企業發展的天花板。

3.1.1 案例背景及數據理解

1.案例背景

市場容量分析的是市場絕對規模和相對規模,通過規模可以掌握市場的大小以及瓶頸。

l 業務需求:某企業要拓展品類,需要了解市場的大小。

l 分析目的:將市場數據分類匯總,整理成柱狀圖或餅圖,以便於匯報。

2.數據說明

本節提供了驅蟲劑行業下7 個子行業3 年的交易額數據,每個子行業的數據都在一張表格中,表格的格式是XLSX。本節任務是將每個表格中3 年的交易額數據進行匯總,並將匯總後的結果放在一起。

數據字段如下。

l 時間:對應記錄統計的時間。

l 交易金額:統計時間內支付的交易金額。

3.案例實現思路

(1)將數據進行匯總,並計算絕對份額。

(2)計算相對份額。

(3)繪制柱狀圖和餅圖。

下面介紹案例實現過程。

3.1.2 計算市場絕對規模

加載Pandas 庫,代碼如下。

import pandas as pd

使用Pandas 庫導入數據,代碼如下。

# 文件路徑為python 文件位置下的相對路徑

dwx=pd.read_excel(" 電商案例數據及數據說明/ 驅蟲劑市場/ 電蚊香套裝市場近三年交易額.xlsx")

fmfz=pd.read_excel(" 電商案例數據及數據說明/ 驅蟲劑市場/ 防霉防蛀片市場近三年交易額.xlsx")

msmc=pd.read_excel(" 電商案例數據及數據說明/ 驅蟲劑市場/ 滅鼠殺蟲劑市場近三年交易額.xlsx")

mz=pd.read_excel(" 電商案例數據及數據說明/ 驅蟲劑市場/ 盤香滅蟑香蚊香盤市場近三年交易

額.xlsx")

wxq=pd.read_excel(" 電商案例數據及數據說明/ 驅蟲劑市場/ 蚊香加熱器市場近三年交易額.xlsx")

wxp=pd.read_excel(" 電商案例數據及數據說明/ 驅蟲劑市場/ 蚊香片市場近三年交易額.xlsx")

wxy=pd.read_excel(" 電商案例數據及數據說明/ 驅蟲劑市場/ 蚊香液市場近三年交易額.xlsx")

1.觀察數據

打印前5 行數據和後5 行數據(每個市場都要查看,此處僅以電蚊香市場為例)。使用head() 方法查看前5行數據,代碼如下。

print(dwx.head())

輸出結果

時間 交易金額

0 2018-10-01 106531.29 元

1 2018-09-01 105666.63 元

2 2018-08-01 201467.03 元

3 2018-07-01 438635.29 元

4 2018-06-01 953749.78 元

使用tail9() 方法查看後5 行數據,代碼如下。

print(dwx.tail())

輸出結果

時間 交易金額

31 2016-03-01 352013.31 元

32 2016-02-01 96979.48 元

33 2016-01-01 108412.71 元

34 2015-12-01 110068.83 元

35 2015-11-01 185094.22 元

2.查看數據的基本結構

使用info() 方法查看數據的字段及類型,代碼如下。

print(dwx.info())

輸出結果

RangeIndex: 36 entries, 0 to 35

Data columns (total 2 columns):

時間 36 non-null datetime64[ns]

交易金額 36 non-null float64

dtypes: datetime64[ns](1), float64(1)

通過對數據的探索與觀察,數據集是7 個子行業數據。每個子行業的數據中一共有兩列字段:時間和交易金額,其中時間的跨度是2015 年11 月至2018 年10 月。

用sum() 方法匯總數據,代碼如下。

dwx[' 交易金額'].sum() # 匯總單張表格數據

將7 張表格的數據匯總並形成一張表,代碼如下。

m_sum=pd.DataFrame(data=[dwx.sum().values,fmfz.sum().values,msmc.sum().values

,mz.sum().values,wxq.sum().values,wxp.sum().values,wxy.sum().values]

,columns=[' 銷售額']

,index=[' 電蚊香',' 防霉防蛀',' 滅鼠滅蟲',' 滅蟑',' 蚊香加熱器',' 蚊香片',' 蚊香液'])

print(m_sum)



您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 412
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區