玩轉Python網絡爬蟲(簡體書)
商品資訊
ISBN13:9787302503286
出版社:清華大學出版社(大陸)
作者:黃永祥
出版日:2018/08/01
裝訂/頁數:平裝/311頁
規格:26cm*19cm (高/寬)
版次:一版
商品簡介
相關商品
商品簡介
本書站在初學者的角度,從原理到實踐,循序漸進地講述了使用Python開發網絡爬蟲的核心技術。全書從邏輯上可分為基礎篇、實戰篇和爬蟲框架篇三部分。基礎篇主要介紹了編寫網絡爬蟲所需的基礎知識,分別是網站分析、數據抓取、數據清洗和數據入庫。網站分析講述如何使用Chrome和Fiddler抓包工具對網絡做全面分析;數據抓取介紹了Python爬蟲模塊Urllib和Requests的基礎知識;數據清洗主要介紹字符串操作、正則和Beautiful Soup的使用;數據入庫分別講述了MySQL和MongoDB的操作,通過ORM框架SQLAlchemy實現數據持久化,實現企業級開發。實戰篇深入講解了分布式爬蟲、爬蟲軟件開發與應用、12306搶票程序和微博爬取,所舉示例均來自于開發實踐,可幫助讀者快速提升技能,開發實際項目。框架篇主要講述Scrapy的基礎知識,並通過爬取QQ音樂為實例,讓讀者深層次瞭解Scrapy的使用。
本書內容豐富,注重實戰,適用於從零開始學習網絡爬蟲的初學者,或者是已經有一些網絡爬蟲編寫經驗,但希望更加全面、深入理解Python爬蟲的開發人員。
本書內容豐富,注重實戰,適用於從零開始學習網絡爬蟲的初學者,或者是已經有一些網絡爬蟲編寫經驗,但希望更加全面、深入理解Python爬蟲的開發人員。
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。