TOP
月月讀書金,登入即領,滿600現折50!!
循序漸進學習商業分析:使用SAS與R語言(簡體書)
滿額折

循序漸進學習商業分析:使用SAS與R語言(簡體書)

商品資訊

人民幣定價:89 元
定價
:NT$ 534 元
優惠價
87465
海外經銷商無庫存,到貨日平均30天至45天
下單可得紅利積點 :13 點
商品簡介

商品簡介

《循序漸進學習商業分析:使用SAS與R語言》詳細闡述了與SAS和R語言商業分析相關的解決方案,主要內容包括了解SAS和R、使用SAS和R進行數據處理、使用SAS和R發現有關數據的基本信息、可視化、概率、樣本和抽樣分布、分析的置信區間和正確性等。此外,本書還提供了豐富的示例及代碼,以幫助讀者進一步理解相關方案的實現過程。

本書適合作為高等院校計算機及相關專業的教材和教學參考書,也可作為相關開發人員的自學教材和參考手冊。


前 言

在過去的10年中,分析和數據科學作為業務決策的支持功能而走在技術發展的前沿,業務分析師還是鮮為人知的職業選擇。隨著數據存儲成本的急劇下降和數據量的蓬勃增 長,首席經驗官(Chief eXperience Officer,CXO)和現代經理人都迫切需要掌握分析和數據科學,以便在企業經營的每個點上做出明智的決策。

如何開始分析和數據科學職業生涯?

本書將告訴你如何通過定義、收集、組織、可視化、分析和見解(DCOVA&I)過程執行數據分析並解決問題。這是一個非常完整而嚴密的過程,因此,即使數據非常新穎或你對問題不太熟悉,也可以通過使用逐步檢查表進行推論來解決問題。最後,為了實現分析輸出,需要以簡單的業務術語來理解結論或見解。

本書將介紹如何使用兩種流行的軟件工具SAS和R對業務數據進行分析,SAS是收費軟件,它是受監管部門(如銀行、臨床研究、保險等)數據分析領域的領導者。R是開源軟件,它在沒有監管機構的行業中很流行,如零售、技術(包括ITES)、商務流程外包(Business Process Outsourcing,BPO)等。因此,無論你從事哪個行業,本書都將為你提供更快地做出更好決策所需的知識和技能。

在閱讀本書時,不需要在兩個最受歡迎的軟件工具之間做出選擇,因為我們為這兩個軟件提供了一致的研究案例。

企業如何在合理時間內將自己的數據轉換為有用的信息?

這個問題對於成功開展業務至關重要。僅當信息在正確的時間可供管理層使用時,企業才能做出正確的決定。為此,需要進行業務分析(簡單地說,就是對大量數據進行統計),以得出有助於業務決策的結論和模型。

統計技術可分為描述統計、推斷統計、差異統計、關聯統計和預測統計5個主要類型。本書將著重於DCOVA&I過程在SAS和R中的應用,並介紹如何解釋與描述性、差異性和關聯性統計技術有關的統計信息。

內容介紹

本書共分為9章,內容如下:

第1章“分析的過程”,介紹數據分析的定義、簡單的分析示例、數據分析師的日常工作、從事該項工作應具備的一些特質以及分析和統計的歷史等。

第2章“了解SAS和R”,詳細說明了本書選擇SAS和R作為分析平臺的原因,並介紹這兩款軟件的安裝方式。

第3章“使用SAS和R進行數據處理”,提出DCOVA&I框架,並闡釋定義階段的重要意義、常見業務問題的基本理解、從ERP到業務分析SaaS的數據流、數據完整性檢查等。

第4章“使用SAS和R發現有關數據的基本信息”,介紹描述性統計的意義,並闡釋集中趨勢的度量、散布的度量、頻率分布、差異分析和方差等概念。

第5章“可視化”,介紹數據可視化技術,包括可視化的定義、進行可視化的理由、常見圖表類型和相關案例研究等。

第6章“概率”,解釋獨立事件的概率和條件事件的概率、貝葉斯定理、計算概率的頻率,並提供相應的SAS和R案例研究。

第7章“樣本和抽樣分布”,詳細介紹抽樣方法、抽樣分布類型、中心極限定理、大數定律、參數檢驗和非參數檢驗等。

第8章“分析的置信區間和正確性”,闡述置信區間和P值的概念,並討論假設檢驗中的錯誤。

第9章“結論和見解”,介紹描述統計、圖表、推斷統計、差異統計和見解生成之間的關係,了解這些有助於數據分析師解釋SAS和R生成的結果。

本書約定

在本書中有許多區分不同類型信息的文本樣式,以下是這些樣式的一些示例以及對它們的含義的解釋。

(1)在界面詞匯後面使用括號附加對應的中文含義,方便讀者對照查看。以下段落是一個示例:


要創建箱形圖,可以選擇Tasks(任務)| Graph(圖形)| Box Plot(箱形圖)命令,如 圖6-9所示。


(2)代碼塊顯示如下:


/* 刪除RESOLUTION TIME中的1個觀察值,因為它包含缺失值 */


DATA WORK.RESOLUTION;

SET WORK.RESOLUTION;

WHERE RESOLUTION_TIME NE.; RUN;


PROC MEANS DATA= WORK.RESOLUTION;

VAR RESOLUTION_TIME; RUN;


(3)新術語和重要單詞以中英文對照的形式表示,中文在前,如下所示:


當要查看連續變量(如時間、年齡、收入)出現的概率分布時,獲得的將是一條連續曲線,因為這些變量可以具有許多值,包括小數值。連續變量的分布稱為連續分布的概率密度(Continuous Distributions,Probability Densities)。當此概率密度曲線的形狀像鐘形時,稱為正態分布(Normal Distribution)。自然發生的現象遵循正態分布。

關於作者

Subhashini Sharma Tripathi是一位數據分析專家,在與GE Money、渣打銀行、Tata Motors Finance和Citi GDM合作10年後,於2012年開始從事教學、撰寫博客和提供咨詢等工作。在工作期間,她堅信數據科學和分析技術有助於減少對個體經驗的依賴。此外,她認為,這為現代經理人提供了一種決定性的方法,可以更快、更準確地解決許多現實問題。在這個不斷發展的業務環境中,它還有助於定義長期戰略並提供更好的選擇。換句話說,借助大數據分析,企業管理者可以獲得更有價值的經營指導。

Subhashini是pexitics.com的創始人,她的第一個產品是Pexitics Talent Score。該公司可提供有效的人力資源管理工具,並提供分析咨詢服務。

作者致謝

這是我的第一本書,寫作的經歷像是一次激動人心但又坎坷不平的旅行。本書的寫作過程也與pexitics.com的創建和發布緊密聯系在一起。

沒有家人和Apress編輯團隊的大力支持和鼓勵,尤其是Celestin Suresh John的幫助,本書的寫作旅程就不可能抵達終點。衷心感謝我的母親—M. Tripathi博士給予我的從語言到行動的無微不至的支持和幫助。

Mark L. Berenson、David M. Levine和Timothy C. Krehbiel所著的Basic Business Statistics(12th Edition)(《基礎商業統計(第12版)》)對我的思考過程和本書的寫作產生了重大影響。我在該書中學習了DCOVA流程。在處理該過程時,我添加了另一個階段,稱為見解生成(Insight Generation),現在我使用的就是DCOVA&I過程。

當我在2002年開始進行基於數字的決策時,缺乏結構化和系統性的指導,很多事情都是自我發現和自學的。我寫這本書的目的是讓從事分析和數據科學的有志之士能夠以結構化的方式充滿信心地解決實際業務問題,從而踏上成功之路。


購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 465
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區