鄧立國,東北大學計算機應用博士畢業。2005年開始在沈陽師範大學軟件學院、教育技術學院任教,主要研究方向:數據挖掘、知識工程、大數據處理、云計算、分布式計算等。以第一作者發表學術論文30多篇(26篇EI),主編教材 1 部,主持科研課題6項,經費10餘萬元,多次獲得校級科研優秀獎,作為九三社員提出的智能城市提案被市政府采納,研究成果被教育廳等單位采用。
前 言
在當今大數據驅動的時代,要想從事機器學習、人工智能、數據挖掘等前沿技術,離不開數據跟蹤與分析,通過NumPy、Pandas等進行數據科學計算,通過Seaborn、Matplotlib等進行數據可視化展示,從實戰的角度出發,讓你在數據科學領域邁出重要的一步,開啟數據分析與挖掘的開發之旅。目前數據分析與挖掘行業火爆,人才供不應求。機器學習、自然語言處理、數據可視化、數據探索、數據分析和數據挖掘,這些火熱的前沿技術都是數據科學體系的範疇,是信息時代的高薪領域。而Python是用於數據分析與挖掘的必備工具!
大數據時代是海量數據同完美計算能力相結合的產物,確切地說是移動互聯網、物聯網產生了海量的數據,大數據計算技術完全勝任海量數據的收集、存儲、計算、分析等問題。綜合來看,未來幾年大數據在商業智能、智能城市和精準營銷等領域的應用將發揮主導作用。
讀者需要了解的重要信息
本書作為數據分析與挖掘專業的圖書,介紹數據挖掘的算法流程、必備工具和實踐方法,案例采用Python3來實現。本書涵蓋從數據獲得到數據處理和結果展示輸出的全過程,以數據分析與挖掘五大環節(數據采集、數據預處理、探索分析、挖掘建模、模型評估)為軸線,理論與實踐相結合,所有案例均具有代表性,明確了數據分析與挖掘目標及完成效果。分析挖掘的基本任務是從數據中提取商業價值,具體涵蓋分類和預測、聚類分析、關聯規則、時序模式、偏差檢驗、智能推薦等。
本書以真實案例驅動,配以分析用的數據與源代碼,科學系統地介紹數據分析與挖掘建模領域的科學思維、必備知識、專業工具、完整流程以及編程技巧,讓你能夠快速勝任數據分析師崗位。
本書內容
本書整體分為15章,系統講解機器學習的典型算法,主要內容如下:
第1章簡要介紹大數據獲取,第2章是數據預處理,第3章是探索性數據分析,第4章是用Sklearn估計器分類,第5章是主流數據分析庫,第6章是大數據數據庫介紹,第7章是數據倉庫/商業智能,第8章是數據聚合與分組運算,第9章是數據挖掘工具,第10章是挖掘建模,第11章是模型評估,第12章是社會媒體挖掘,第13章是用圖挖掘分類,第14章是基於深度神經網絡的驗證碼識別,第15章是基於深度學習的文本分類挖掘實現。
源代碼和源數據下載
本書的例子都是在Python3集成開發環境Anaconda3中通過實際調試的典型案例。配套的示例源代碼和源數據可通過使用微信掃描下方的二維碼獲取(可通過下載頁面,把鏈接發到自己的郵箱中下載)。如果有任何疑問,請聯系,郵件主題為“Python數據分析與挖掘實戰”。
致謝
本書完成之際,要由衷感謝家人的支持,是他們的付出使筆者擁有近一年的時間來寫作,由於水平有限,書中難免有紕漏之處,還請讀者不吝賜教。本書寫作過程中參考的圖書均在參考文獻中列出,在此對相關作者表示感謝。
鄧立國
2021年2月
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。