評論

滿額折

用Python寫網絡爬蟲（簡體書）

ISBN13：9787115431790
替代書名：Web Scraping with Python
出版社：人民郵電出版社
作者：(澳大利亞)理查‧勞森
譯者：李斌
裝訂／頁數：平裝／157頁
規格：26cm*19cm (高/寬)
版次：一版
出版日：2016/09/01
關鍵字：用Python寫網絡爬蟲（簡體書）、 Python、網絡、爬蟲、簡體、 Web、 Scraping、 with、人民郵電出版社、 (澳大利亞)理查‧勞森、簡體書、電腦〈計算機〉、電腦入門、

人民幣定價：45 元

定價：NT$ 270 元

優惠價：87 折 235 元

絕版無法訂購

相關商品

商品簡介

作者簡介

名人/編輯推薦

商品簡介

《用Python寫網路爬蟲》講解了如何使用Python來編寫網路爬蟲程式，內容包括網路爬蟲簡介，從頁面中抓取資料的三種方法，提取緩存中的資料，使用多個執行緒和進程來進行併發抓取，如何抓取動態頁面中的內容，與表單進行交互，處理頁面中的驗證碼問題，以及使用Scarpy和Portia來進行資料抓取，使用本書介紹的資料抓取技術對幾個真實的網站進行了抓取，旨在幫助讀者活學活用書中介紹的技術。
《用Python寫網路爬蟲》適合有一定Python程式設計經驗，而且對爬蟲技術感興趣的讀者閱讀。

作者簡介

作者:[澳]理查勞森（Richard Lawson）譯者:李斌

Richard Lawson來自澳大利亞，畢業于墨爾本大學電腦科學專業。畢業後，他創辦了一家專注於網路爬蟲的公司，為超過50個國家的業務提供遠端工作。他精通於世界語，可以使用漢語和韓語對話，並且積極投身於開源軟體。他目前在牛津大學攻讀研究生學位，並利用業餘時間研發自主無人機。

名人/編輯推薦

編輯推薦

作為一種便捷地收集網上資訊並從中抽取出可用資訊的方式，網路爬蟲技術變得越來越有用。使用Python這樣的簡單程式設計語言，你可以使用少量程式設計技能就可以爬取複雜的網站。

《用Python寫網路爬蟲》作為使用Python來爬取網路資料的傑出指南，講解了從靜態頁面爬取資料的方法以及使用緩存來管理伺服器負載的方法。此外，本書還介紹了如何使用AJAX URL和Firebug擴展來爬取資料，以及有關爬取技術的更多真相，比如使用流覽器渲染、管理cookie、通過提交表單從受驗證碼保護的複雜網站中抽取資料等。本書使用Scrapy創建了一個高級網路爬蟲，並對一些真實的網站進行了爬取。

《用Python寫網路爬蟲》介紹了如下內容：

通過跟蹤連結來爬取網站；

使用lxml從頁面中抽取資料；

構建執行緒爬蟲來並行爬取頁面；

將下載的內容進行緩存，以降低頻寬消耗；

解析依賴於JavaScript的網站；

與表單和會話進行交互；

解決受保護頁面的驗證碼問題；

對AJAX調用進行逆向工程；

使用Scrapy創建高級爬蟲。

本書讀者對象

本書是為想要構建可靠的資料爬取解決方案的開發人員寫作的，本書假定讀者具有一定的Python程式設計經驗。當然，具備其他程式設計語言開發經驗的讀者也可以閱讀本書，並理解書中涉及的概念和原理。

主題書展

主題書展

更多書展

本週66折

投資前一定要學會的獲利思維：如何避免決策偏誤與建立合理的常勝原則

非常印象非常美：莫內和他的水蓮世界(二版)

下班後1小時的極速學習攻略：職場進修達人不辭職，靠「偷時間」高效學語言、修課程，10年考取10張證照

天台性具思想(平)

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大，除封面破損、內頁脫落等較嚴重的狀態，其餘商品將正常出貨。

特別提醒：部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供，需以QR CODE 連結至當地網站註冊“並通過驗證程序”，方可下載使用。

無現貨庫存之簡體書，將向海外調貨：
海外有庫存之書籍，等候約45個工作天;
海外無庫存之書籍，平均作業時間約60個工作天，然不保證確定可調到貨，尚請見諒。

為了保護您的權益，「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨，請在商品鑑賞期內寄回，且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

用Python寫網絡爬蟲（簡體書）

商品簡介

作者簡介

名人/編輯推薦

目次

主題書展

主題書展

本週66折

您曾經瀏覽過的商品

購物須知

網路書店

復北店

重南店