數據可視化分析:基於R語言(第3版)(簡體書)
商品資訊
系列名:基於R應用的統計學叢書
ISBN13:9787300315331
出版社:中國人民大學出版社
作者:賈俊平
出版日:2023/04/26
裝訂/頁數:平裝/305頁
規格:24cm*17cm (高/寬)
版次:三版
商品簡介
不同的可視化視角。與其他可視化書籍不同,本書根據數據類型和可視化目的對圖形進行分類,有利於讀者根據所面對的數據類型和分析目的選擇圖形。
體現R可視化的強大功能及其多樣性和靈活性。全書精選400多幅圖。圖形繪製以ggplot2為主,結合使用傳統繪圖包graphics和繪圖代碼相對簡單的基於ggplot2開發的一些繪圖擴展包。
詳細的繪圖代碼。除少數示意圖外,每幅圖形均列出了相對獨立的繪製代碼,並標有詳細注釋,直接運行即可得到相應的圖形。
詳盡的圖形解讀。每幅圖形均結合實際數據給出了詳盡解讀,以幫助讀者更好地理解和應用。
作者簡介
賈俊平 中國人民大學統計學院副教授, 一直從事統計教學和研究工作。著有《統計學》《統計學—基於SPSS》《統計學—基於Excel》《統計學—基於R》《數據可視化分析—基於R語言》《統計學基礎》等多部統計學教材。所著教材曾榮獲首屆全國教材建設獎全國優秀教材、國家統計局優秀統計教材、北京高等教育精品教材等獎項。
目次
第 1 章 數據可視化與R語言
1.1 數據可視化概述
1.1.1 可視化及其分類
1.1.2 可視化的數據類型
1.1.3 可視化的實現工具
1.2 R軟件的初步使用
1.2.1 R和RStudio的下載與安裝
1.2.2 物件賦值與運行
1.2.3 編寫代碼腳本
1.2.4 包的安裝與加載
1.2.5 查看幫助文件
1.3 R的數據類型及其操作
1.3.1 向量、矩陣和數組
1.3.2 數據框
1.3.3 因子和列表
1.4 R語言數據處理
1.4.1 數據讀取和保存
1.4.2 數據抽樣和篩選
1.4.3 數據類型的轉換
1.4.4 生成頻數分布表
習題
第 2 章 R語言繪圖基礎
2.1 graphics簡介
2.1.1 基本繪圖函數
2.1.2 圖形參數
2.1.3 圖形顏色
2.1.4 頁面布局
2.1.5 打開多個繪圖窗口
2.2 ggplot2簡介
2.2.1 繪圖語法
2.2.2 圖形外觀
2.2.3 添加注釋
2.2.4 圖形分面
2.2.5 圖形組合
2.2.6 常用繪圖函數
習題
第 3 章 類別數據可視化
3.1 條形圖
3.1.1 單變量條形圖
3.1.2 多變量條形圖
3.1.3 添加推斷信息
3.2 瀑布圖和漏斗圖
3.2.1 瀑布圖
3.2.2 漏斗圖
3.3 極坐標條形圖和玫瑰圖
3.3.1 極坐標條形圖
3.3.2 玫瑰圖
3.4 馬賽克圖和關聯圖
3.4.1 馬賽克圖
3.4.2 關聯圖
3.5 樹狀圖和旭日圖
3.5.1 樹狀圖
3.5.2 旭日圖
3.6 克利夫蘭點圖
3.7 金字塔圖
3.8 點陣圖和熱圖
3.8.1 點陣圖
3.8.2 熱圖
3.9 餅圖及其變種
3.9.1 餅圖和扇形圖
3.9.2 環形圖和弧形圖
3.9.3 餅環圖
習題
第 4 章 數據分布可視化
4.1 直方圖與核密度圖
4.1.1 直方圖
4.1.2 核密度圖
4.2 箱線圖和小提琴圖
4.2.1 箱線圖
4.2.2 小提琴圖
4.2.3 展示檢驗信息
4.3 點圖
4.3.1 威爾金森點圖
4.3.2 蜂群圖
4.3.3 云雨圖
4.4 海盜圖和分布概要圖
4.4.1 海盜圖
4.4.2 分布概要圖
習題
第 5 章 變量間關係可視化
5.1 散點圖和分組散點圖
5.1.1 散點圖
5.1.2 分組散點圖
5.2 散點圖矩陣和相關係數矩陣
5.2.1 散點圖矩陣
5.2.2 相關係數矩陣
5.2.3 相關係數網狀圖
5.3 大數據集的散點圖
5.4 3D散點圖和氣泡圖
5.4.1 3D散點圖
5.4.2 氣泡圖
5.5 散點餅圖
習題
第 6 章 樣本相似性可視化
6.1 平行坐標圖和雷達圖
6.1.1 平行坐標圖
6.1.2 雷達圖
6.2 星圖和臉譜圖
6.2.1 星圖
6.2.2 臉譜圖
6.3 聚類圖和熱圖
6.3.1 聚類圖
6.3.2 熱圖
習題
第 7 章 時間序列可視化
7.1 折線圖和面積圖
7.1.1 折線圖
7.1.2 面積圖
7.2 風箏圖和流線圖
7.2.1 風箏圖
7.2.2 流線圖
7.3 地平線圖
7.4 雙坐標圖
7.5 日歷圖
7.6 隨機成分平滑曲線
7.7 時間序列動態交互圖
習題
第 8 章 概率分布可視化
8.1 二項分布可視化
8.2 正態分布可視化
8.2.1 正態分布曲線和概率
8.2.2 累積分布函數和經驗累積分布函數
8.2.3 正態概率圖
8.3 其他分布可視化
8.3.1 分布可視化
8.3.2 t分布可視化
8.3.3 F分布可視化
8.4 抽樣分布可視化
8.4.1 均值分
書摘/試閱
當你面對一個數據集時,如何用圖形將其展示出來,這就是可視化問題。簡單說,數據可視化是將數據用圖形展示出來的方法,它是數據分析的基礎,也是數據分析的重要組成部分。可視化本身既是對數據的展示過程,也是對數據信息的再提取過程,它不僅可以幫助我們理解數據,探索數據的特徵和模式,還可以提供從數據本身難以發現的額外信息。對使用者而言,可視化分析需要清楚數據類型、分析目的和實現工具三個基本問題。數據類型決定你可以畫出什麼圖形;分析目的決定你需要畫出什麼圖形;實現工具決定你能夠畫出什麼圖形。
本書以R語言為實現工具,以數據可視化分析為導向,結合實際數據介紹可視化方法。全書包括10章內容。第1章介紹數據可視化的基本問題以及R語言數據處理的基本方法,為可視化分析奠定基礎。第2章介紹R語言繪圖基礎,重點介紹R的傳統繪圖包graphics中的基本繪圖函數和ggplot2包的繪圖語法及其應用。第3章介紹類別數據的可視化方法,包括類別頻數和頻數百分比的可視化方法。第4章介紹數據分布的可視化方法,包括直方圖與核密度圖、箱線圖和小提琴圖、點圖等。第5章介紹變量間關係的可視化方法,包括散點圖、散點圖矩陣、相關係數矩陣等。第6章介紹樣本相似性的可視化方法,包括平行坐標圖和雷達圖、星圖和臉譜圖、聚類圖和熱圖等。第7章介紹時間序列的可視化方法,包括展示時間序列變化模式的圖形、隨機成分平滑曲線以及時間序列動態交互圖等。第8章介紹概率分布的可視化方法,包括二項分布、正態分布、分布、t分布和F分布的可視化以及抽樣分布的可視化方法。第9章介紹其他一些特殊的可視化圖形以及圖表組合的繪製方法。第10章介紹與可視化相關的一些基本問題和注意事項。
本書特色:
(1)不同的可視化視角。與其他可視化書籍不同,本書根據數據類型和可視化目的對圖形進行分類,如類別數據的頻數圖形、數值數據的分布圖形、變量間的關係圖形、樣本的相似性圖形、時間序列圖形等,有利於讀者根據所面對的數據類型和分析目的選擇圖形。
(2)體現R語言可視化的強大功能及其多樣性和靈活性。全書精選400多幅圖。圖形繪製以ggplot2為主,結合使用傳統繪圖包graphics和繪圖代碼相對簡單的基於ggplot2開發的一些繪圖包,如ggiraphExtra、ggpubr等。對於ggplot2不能繪製或代碼相對複雜的一些圖形,使用了其他一些包,如plotrix、vcd、 aplpack等。
(3)詳細的繪圖代碼。除少數示意圖外,每幅圖形均列出了相對獨立的繪製代碼,並標有詳細注釋,直接運行即可得到相應的圖形。
(4)詳盡的圖形解讀。每幅圖形均結合實際數據給出了詳盡解讀,以幫助讀者更好地理解和應用。
本書可作為高等院校各專業開設數據可視化分析課程的教材,也可作為數據分析工作者、R語言和可視化分析愛好者的參考書。閱讀本書需要具備一定的統計學基礎知識,如統計量的計算、概率分布、參數估計、假設檢驗、相關分析與回歸建模檢驗、時間序列預測等。
R語言是個永遠也挖不完的金礦,其中的更多資源還需要讀者自己挖掘。因作者水平有限,本書介紹的可視化圖形只是冰山一角,也難免存在不當之處。只要能起到拋磚引玉的作用,就達到了本書的目標。
主題書展
更多書展購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

