數據清洗(簡體書)
商品資訊
系列名:大數據應用人才培養系列教材
ISBN13:9787302493273
出版社:清華大學出版社(大陸)
作者:李法平
出版日:2018/06/01
裝訂/頁數:平裝/238頁
規格:26cm*19cm (高/寬)
商品簡介
商品簡介
本書共分為8章: 第1章主要介紹數據清洗的概念、任務和流程, 數據標準化概念及數據倉庫技術等; 第2章主要介紹Windows和類UNIX操作系統下的數據常規格式、數據編碼及數據類型轉換; 第3章介紹ETL概念、數據清洗的技術路線、ETL工具及ETL子系統等; 第4章介紹Excel、Kettle、OpenRefine、Data Wrangler和Hawk的安裝及使用等; 第5章介紹Kettle下文本文件抽取、Web數據抽取、數據庫數據抽取等; 第6章介紹數據清洗步驟、數據檢驗、數據錯誤處理、數據質量評估及數據加載; 第7章介紹網頁結構, 利用網絡爬蟲技術進行數據采集, 利用JavaScript技術進行行為日誌數據采集等; 第8章介紹RDBMS的數據清洗方法和數據脫敏處理技術等。
主題書展
更多書展購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

