TOP
0
0
三民出版.新書搶先報|最速、最優惠的新鮮貨報給你知!
AI編程班:Python×ChatGPT網絡爬蟲從入門到精通(簡體書)
滿額折

AI編程班:Python×ChatGPT網絡爬蟲從入門到精通(簡體書)

商品資訊

人民幣定價:89 元
定價
:NT$ 534 元
優惠價
87465
庫存:1
下單可得紅利積點:13 點
商品簡介
目次
相關商品

商品簡介


網絡爬蟲是人們從互聯網中收集寶貴信息的重要工具之一。然而,許多人可能因為缺乏編程知識或技術難度而望而卻步。本書旨在解決這一問題,通過結合ChatGPT人工智能技術和爬蟲技巧,使得爬取網絡數據變得輕鬆易行。
本書以易於理解的語言,深入淺出地介紹了爬蟲和ChatGPT的相關基礎知識,以及如何將它結合起來,實現更智能、更精準的數據收集和處理。全書包含Python入門、ChatGPT基礎、網頁的初步分析、靜態網頁的爬取、動態網頁的爬取、爬蟲數據的處理和分析、爬蟲技術進階綜合實戰:財經數據爬取、綜合實戰:社交媒體數據爬取、綜合實戰:電商數據爬取、綜合實戰:人力資源數據爬取和綜合實戰:媒體文件下載共12個章節的內容。
無論是初學者還是有一定經驗的開發者,本書都提供了一個全面的指南,教會其如何藉助ChatGPT技術讓爬蟲在信息的海洋中遊刃有餘。

目次


第1章 Python入門
1.1 安裝Python編程環境
1.2 管理第三方模塊
1.3 在代碼中導入模塊
1.4 測試Python編程環境
1.5 變數的命名和賦值
1.6 Python的基本數據類型:數字、字元串
1.7 Python的基本數據類型:列表、字典
1.8 Python的運算符
1.9 Python的控制語句:if語句
1.10 Python的控制語句:for語句
1.11 Python的控制語句:while語句
1.12 Python的控制語句:try/except語句
1.13 Python控制語句的嵌套
1.14 Python的自定義函數
第2章 AI輔助編程基礎
2.1 初識AI工具
2.2 與AI工具對話的基本操作
2.3 設計提示詞的原則和技巧
2.4 利用AI工具解讀和修改代碼
2.5 利用AI工具分析報錯信息
2.6 利用AI工具閱讀技術文檔
第3章 網頁的初步分析
3.1 查看網頁源代碼:右鍵快捷菜單
3.2 查看網頁源代碼:開發者工具
3.3 認識常見的HTML標籤
3.4 剖析網頁的結構
3.5 判斷網頁的類型
第4章 靜態網頁的爬取
4.1 用Requests模塊獲取靜態網頁的源代碼
4.2 正則表達式的基礎知識
4.3 分析網頁源代碼並編寫正則表達式
4.4 用正則表達式從網頁源代碼中提取數據
4.5 CSS選擇器的基礎知識
4.6 分析網頁源代碼並編寫CSS選擇器
4.7 用BeautifulSoup模塊從網頁源代碼中提取數據
4.8 用Requests模塊下載文件
4.9 靜態網頁爬取實戰1:單頁爬取
4.10 靜態網頁爬取實戰2:多頁爬取
第5章 動態網頁的爬取
5.1 搭建Selenium模塊的運行環境
5.2 用Selenium模塊獲取網頁源代碼
5.3 操控瀏覽器:用XPath定位網頁元素
5.4 操控瀏覽器:用CSS選擇器定位網頁元素
5.5 操控瀏覽器:自動向下滾動頁面
5.6 操控瀏覽器:自動下載文件
5.7 操控瀏覽器:切換標籤頁
5.8 操控瀏覽器:切換至標籤中的子網頁
5.9 操控瀏覽器:啟用無界面模式
5.10 用Requests模塊獲取動態載入的數據
5.11 使用Cookie模擬登錄
5.12 動態網頁爬取實戰1:單頁爬取
5.13 動態網頁爬取實戰2:多頁爬取
第6章 爬蟲數據的處理和分析
6.1 pandas模塊的基本數據結構:Series
6.2 pandas模塊的基本數據結構:DataFrame
6.3 用pandas模塊讀寫數據文件
6.4 DataFrame的常用操作:選取數據
6.5 DataFrame的常用操作:數據的運算、排序和篩選

6.6 爬蟲數據清洗:處理缺失值和重複值

6.7 爬蟲數據清洗:刪除無用的字元

6.8 爬蟲數據清洗:轉換數據類型

6.9 爬蟲數據清洗:補全數據

6.10 爬蟲數據分析與可視化

第7章 Python爬蟲技術進階

7.1 用pandas模塊爬取網頁表格數據

7.2 用數據接口爬取數據

7.3 開髮帶圖形用戶界面的爬蟲程序

7.4 爬蟲程序的打包

7.5 爬蟲提速:優化Selenium模塊的等待方式

第8章 綜合實戰:財經數據爬取

8.1 爬取證券日報網的財經新聞

8.2 爬取搜狐的財經要聞

8.3 爬取東方財富網的財務報表

8.4 爬取新浪財經的上市公司盈利能力數據

8.5 批量下載上海證券交易所的問詢函

8.6 批量下載東方財富網的研報

第9章 綜合實戰:社交媒體數據爬取

9.1 爬取百度熱搜榜

9.2 爬取新浪微博熱搜榜

9.3 爬取好看視頻的數據

第10章 綜合實戰:電商數據爬取

10.1 爬取噹噹網的圖書暢銷榜數據

10.2 爬取京東的商品評價

第11章 綜合實戰:媒體文件下載

11.1 批量下載圖片

11.2 批量下載視頻


您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 465
庫存:1

暢銷榜

客服中心

收藏

會員專區