評論

滿額折

玩轉大數據：SAS+R+Stata+Python（簡體書）

ISBN13：9787302570677
出版社：清華大學出版社(大陸)
作者：孫江偉
出版日：2021/06/01
裝訂／頁數：平裝／621頁
規格：24cm*17cm (高/寬)
版次：一版
關鍵字：玩轉大數據：SAS+R+Stata+Python（簡體書）、玩轉、大數據、數據、 SAS+R+Stata+Python、簡體、清華大學出版社（大陸）、孫江偉、簡體書、工業技術、自動化技術、計算技術、數據處理、數據處理系統、

中國圖書館分類

：

數據處理、數據處理系統

人民幣定價：198 元

定價

：NT$ 1188 元

優惠價

： 87 折 1034 元

領券後再享88折起

領

海外經銷商無庫存，到貨日平均30天至45天

下單可得紅利積點：31 點

商品簡介

作者簡介

序

商品簡介

面對日漸複雜的大數據，科技工作者很難用單一的統計軟件高效、完美地完成從數據挖掘、數據清洗、統計分析到結果呈現的全部工作，因此需要熟悉和掌握多種統計工具，各取所長、整合使用。本書立足於大數據研究的現狀，基於實際醫療案例，介紹數學基礎知識和統計學基礎知識,SAS、R語言、Stata和Python這4款大數據常用分析工具的基礎編程知識及實踐操作。

本書主要面向在校本科生、研究生，以及要掌握SAS、R語言、Stata和Python的數據工作者，熟悉四個軟件的任意一個且想要在短時間內掌握其他軟件的讀者，也適合醫科學生、臨床醫生或藥企人員等醫療相關人員學習使用。

作者簡介

孫江偉

復旦大學流行病與衛生統計學專業碩士，曾在強生公司（Johnson &Johnson）任生物統計師，對國內醫藥臨床領域及國外醫療注冊系統等大數據的數據管理、數據清洗、研究設計及統計分析，有豐富的理論及實踐經驗，現於瑞典卡羅林斯卡醫學院進行衛生統計學方面的研究深造。在American Journal of Epidemiology、European Journal of Neurology等雜志發表相關領域SCI論文10篇。

序

前言

隨著計算機與信息技術的發展，互聯網、大數據、人工智能等現代信息技術不斷實現突破，逐漸滲透到人類生產生活的各個領域，以前所未有的方式將人們帶入一場劇烈的信息變革之中。隨著社會信息化程度的日益加深，醫療行業數據系統的信息容量也在不斷擴大，高效地挖掘和利用這些寶貴的醫學信息資源，為疾病的預防、診斷和治療提供科學的決策依據，促進醫學研究的進一步發展，具有非常重要的意義。與此同時，數據數量與日俱增，數據質量參差不齊，這使得醫療工作者和科研人員的工作難度不斷加大，對專業技術水平、數據分析方法和團隊科研協作都提出了更高的要求。

面對日漸複雜的大數據，科學工作者很難用單一的統計軟件高效、完美地完成從數據挖掘、數據清洗、統計分析到結果呈現的全部工作，因此需要熟悉和掌握多種統計工具，各取所長、整合使用。例如，SAS作為一個成熟度高、穩定性強的商業化系統，有強大的大數據管理及清洗的功能，在公司和企業中的應用非常廣泛，但是它在對大數據(如健康注冊系統)進行某些統計分析時，運行速度較慢。相對而言，Stata、R語言和Python卻可以非常快速地完成同樣的運算程序。此外，Stata是對初學者非常友好的軟件，命令簡單，運行速度快，是非常出色的統計軟件；R語言有極其靈活和強大的繪圖能力，可以更好地表現數據結果，大大提升數據分析的效率；Python以語言簡單、分析高效而著稱，尤其在機器學習、文本處理等領域表現突出。因此，如果能掌握幾種統計軟件的使用方法，並且能夠根據具體研究目的自由切換不同的統計軟件，則可以達到事半功倍的效果。

此外，大規模的項目通常需要跨單位、跨學科合作，科研團隊的國際化、多元化的趨勢越來越明顯。每個研究人員的背景不同，擅長的領域或使用的統計軟件也大相徑庭。為了更好地進行學術交流，促進彼此之間的合作，完成複雜的研究項目，熟悉和掌握多種統計軟件的基本操作就顯得非常重要。但是，學習任何一門技術都需要投入大量的時間和精力，若想同時掌握多種統計軟件的使用方法，需要付出更多的時間和努力。幸運的是，SAS、R語言、Stata和Python等軟件的數學和統計學基礎是相通的，主要區別在於它們采用不同的語言環境和編程方法。如果讀者已經掌握其中任何一個軟件的操作和使用方法，再去學習其他3種軟件，則會觸類旁通，大大提高學習效率。但是，目前還沒有相關的書籍介紹如何將SAS、R語言、Stata和Python這4種常用的統計軟件整合起來，用於大數據的管理和分析。

目前，市面上單獨介紹SAS、R語言、Stata和Python等統計軟件的書籍大多面面俱到地講解每個命令、每個選項、每個模塊，針對一種統計方法提供盡可能多的解決方案。的確，這樣可以幫助讀者全面、具體地了解各個軟件，但同時也可能使讀者花費很多時間學習了大量不實用的知識。此外，大多數介紹統計軟件的書籍往往止步於如何進行統計分析，而常常忽略了如何高效、準確地提取主要結果，如何生成可直接用於報告、交流或達到SCI發表要求的表格等方面。

因此，本書立足於大數據研究的現狀，首先介紹必須掌握的數學和統計學基礎知識；其次，根據真實的電子病歷及健康注冊系統的數據特徵，模擬出與其複雜程度和處理難度相當的模擬數據庫；最後，針對同一研究問題，在SAS、R語言、Stata和Python中進行同步處理，詳細講解如何在這4個統計軟件中實現從數據導入、數據清洗、統計分析、結果整理輸出(表格或圖)到結果解釋的全部過程，從而可完成軟件的對比學習，達到事半功倍的效果。以上3點也是本書的特色所在。

本書著眼於真實的醫學領域的數據處理問題，主要介紹在4個軟件中最常用、最高效的命令及編程方法，使數據工作者能夠在短時間內掌握每個軟件的精髓，並且能夠學以致用，切實應用到自己的研究項目中，解決相關問題。但本書不會過多地涉及諸如模型的比較和選擇等問題，因為這類問題通常是由研究課題或項目決定的，不存在“放之四海而皆準”的準則。對這類問題感興趣的讀者，請查閱相關書籍或文章。

本書可分為3部分: 第1部分包括第1、2章，介紹數學基礎知識和統計學基礎知識；第2部分包括第3～7章，在概要介紹統計軟件基礎知識之後，分別介紹SAS、R語言、Stata和Python的基礎編程知識；第3部分包括第8～12章，在概要說明本書軟件實踐的幾個重要問題之後，分別介紹SAS、R語言、Stata和Python的實踐內容。讀者可根據自己的興趣和時間自行選擇相應的章節學習。建議讀者在閱讀某軟件的基礎編程知識和實踐操作前，先閱讀第3章和第8章，從而了解本書的布局。

本書主要面向在校本科生、研究生,以及要掌握SAS、R語言、Stata和Python的數據工作者,熟悉4種軟件的任意一種且想要在短時間內掌握其他軟件的讀者,尤其適合醫科學生、臨床醫生或藥企人員等醫療相關人員學習使用。

筆者自2014年萌生編寫本書的想法，2017年動筆，2019年組建編寫團隊，到2020年春完成初稿，其間曾多次產生放棄的念頭，幸好堅持了下來。筆者一直堅信“二八定律”，即學習並掌握一個軟件的20%的基礎知識，將能使用戶理解80%的軟件功能，從而能順利完成80%的工作任務。盡管本書介紹的諸多方法看起來很容易理解和掌握，但要想真正用好這些軟件，仍需讀者仔細鉆研、刻苦練習。不過這些努力是值得付出的，假以時日，所有努力都會帶來豐厚的回報。

感謝Fang Fang教授、Yudi Pawitan教授給予筆者的大力支持；感謝鄧文江同學在R語言部分的付出；感謝編寫團隊成員在整個過程中的堅持和付出，從而使本書得以完成；最後，感謝清華大學出版社編輯給予本書的幫助和指導，從而使本書得以順利出版。書中難免存在疏漏和不足之處，懇請讀者不吝賜教，筆者將感激不盡。

孫江偉

2021年4月

主題書展

更多書展

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大，除封面破損、內頁脫落等較嚴重的狀態，其餘商品將正常出貨。

特別提醒：部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供，需以QR CODE 連結至當地網站註冊“並通過驗證程序”，方可下載使用。

無現貨庫存之簡體書，將向海外調貨：
海外有庫存之書籍，等候約45個工作天;
海外無庫存之書籍，平均作業時間約60個工作天，然不保證確定可調到貨，尚請見諒。

為了保護您的權益，「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨，請在商品鑑賞期內寄回，且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

熱搜：

抄寫英語的奇蹟02

菲菲在日本

國際布克獎臺灣漫遊錄

如果歷史是一群喵

劉必榮

皮卡丘的海洋尋寶記

沒有天空的救生員

玩轉大數據：SAS+R+Stata+Python（簡體書）

商品資訊

ISBN13：9787302570677

出版社：清華大學出版社(大陸)

作者：孫江偉

出版日：2021/06/01

裝訂／頁數：平裝／621頁

規格：24cm*17cm (高/寬)

版次：一版

中國圖書館分類

數據處理、數據處理系統

商品簡介

作者簡介

序

目次

主題書展

三民書局Line好友募集中

匯讀中外曬書展

三民月月讀書金

簡體每月選書

簡體熱門影劇書展

73週年慶

廖彩杏-用有聲書輕鬆聽出英語力 168本啟蒙經典完整書單

三民書局72周年慶本版書書展

三民書局73周年慶童書展

三民書局73周年慶原文書展

購物須知