TOP
0
0
【簡體曬書區】 單本79折,5本7折,活動好評延長至5/31,趕緊把握這一波!
Python數據分析與挖掘實戰(簡體書)
滿額折

Python數據分析與挖掘實戰(簡體書)

人民幣定價:79 元
定  價:NT$ 474 元
優惠價:87412
領券後再享88折
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:12 點
相關商品
商品簡介
作者簡介
目次

商品簡介

《Python數據分析與挖掘實戰》涵蓋數據分析與數據挖掘的基礎知識、必備工具和有效實踐方法,能讓讀者充分掌握數據分析與數據挖掘的基本技能。
《Python數據分析與挖掘實戰》共分為15章,主要內容包括大數據獲取、數據預處理、探索性數據分析、用Sklearn估計器分類、主流數據分析庫、大數據的數據庫類型、數據倉庫/商業智能、數據聚合與分組運算、數據挖掘工具、挖掘建模、模型評估、社會媒體挖掘、圖挖掘分類、基於深度學習的驗證碼識別、基於深度學習的文本分類挖掘實現。
《Python數據分析與挖掘實戰》采用理論與實踐相結合的方式,利用Python語言的強大功能,既適合Python數據分析與數據挖掘初學者、大數據從業人員閱讀,也適合高等院校和培訓機構大數據與人工智能相關專業的師生教學參考。

作者簡介

鄧立國,東北大學計算機應用博士畢業。2005年開始在沈陽師範大學軟件學院、教育技術學院任教,主要研究方向:數據挖掘、知識工程、大數據處理、云計算、分布式計算等。以第一作者發表學術論文30多篇(26篇EI),主編教材 1 部,主持科研課題6項,經費10餘萬元,多次獲得校級科研優秀獎,作為九三社員提出的智能城市提案被市政府采納,研究成果被教育廳等單位采用。

前 言

在當今大數據驅動的時代,要想從事機器學習、人工智能、數據挖掘等前沿技術,離不開數據跟蹤與分析,通過NumPy、Pandas等進行數據科學計算,通過Seaborn、Matplotlib等進行數據可視化展示,從實戰的角度出發,讓你在數據科學領域邁出重要的一步,開啟數據分析與挖掘的開發之旅。目前數據分析與挖掘行業火爆,人才供不應求。機器學習、自然語言處理、數據可視化、數據探索、數據分析和數據挖掘,這些火熱的前沿技術都是數據科學體系的範疇,是信息時代的高薪領域。而Python是用於數據分析與挖掘的必備工具!

大數據時代是海量數據同完美計算能力相結合的產物,確切地說是移動互聯網、物聯網產生了海量的數據,大數據計算技術完全勝任海量數據的收集、存儲、計算、分析等問題。綜合來看,未來幾年大數據在商業智能、智能城市和精準營銷等領域的應用將發揮主導作用。

讀者需要了解的重要信息

本書作為數據分析與挖掘專業的圖書,介紹數據挖掘的算法流程、必備工具和實踐方法,案例采用Python3來實現。本書涵蓋從數據獲得到數據處理和結果展示輸出的全過程,以數據分析與挖掘五大環節(數據采集、數據預處理、探索分析、挖掘建模、模型評估)為軸線,理論與實踐相結合,所有案例均具有代表性,明確了數據分析與挖掘目標及完成效果。分析挖掘的基本任務是從數據中提取商業價值,具體涵蓋分類和預測、聚類分析、關聯規則、時序模式、偏差檢驗、智能推薦等。

本書以真實案例驅動,配以分析用的數據與源代碼,科學系統地介紹數據分析與挖掘建模領域的科學思維、必備知識、專業工具、完整流程以及編程技巧,讓你能夠快速勝任數據分析師崗位。

本書內容

本書整體分為15章,系統講解機器學習的典型算法,主要內容如下:

第1章簡要介紹大數據獲取,第2章是數據預處理,第3章是探索性數據分析,第4章是用Sklearn估計器分類,第5章是主流數據分析庫,第6章是大數據數據庫介紹,第7章是數據倉庫/商業智能,第8章是數據聚合與分組運算,第9章是數據挖掘工具,第10章是挖掘建模,第11章是模型評估,第12章是社會媒體挖掘,第13章是用圖挖掘分類,第14章是基於深度神經網絡的驗證碼識別,第15章是基於深度學習的文本分類挖掘實現。

源代碼和源數據下載

本書的例子都是在Python3集成開發環境Anaconda3中通過實際調試的典型案例。配套的示例源代碼和源數據可通過使用微信掃描下方的二維碼獲取(可通過下載頁面,把鏈接發到自己的郵箱中下載)。如果有任何疑問,請聯系,郵件主題為“Python數據分析與挖掘實戰”。

致謝

本書完成之際,要由衷感謝家人的支持,是他們的付出使筆者擁有近一年的時間來寫作,由於水平有限,書中難免有紕漏之處,還請讀者不吝賜教。本書寫作過程中參考的圖書均在參考文獻中列出,在此對相關作者表示感謝。



鄧立國

2021年2月


目次

第1章 大數據采集
1.1 大數據分類
1.2 大數據采集方法
1.3 Python爬蟲
1.3.1 審查元素
1.3.2 認識網頁結構
1.3.3 認識robots.txt的文檔
1.3.4 爬蟲的基本原理
1.3.5 Python爬蟲架構
1.3.6 用GET方式抓取數據
1.3.7 用POST方式抓取數據
1.3.8 用Beautiful Soup解析網頁
1.3.9 Python爬蟲案例
1.4 本章小結

第2章 數據預處理
2.1 數據清洗
2.1.1 缺失值處理
2.1.2 異常值處理
2.2 數據集成
2.3 數據轉換
2.4 數據規約
2.5 Python主要數據預處理函數
2.6 本章小結

第3章 探索性數據分析
3.1 異常值分析
3.2 缺失值分析
3.3 分布分析
3.4 相關性分析
3.5 對比分析
3.6 統計量分析
3.7 周期性分析
3.8 貢獻度分析
3.9 Python主要數據探索函數
3.10 本章小結

第4章 Sklearn估計器
4.1 Sklearn概述
4.2 使用Sklearn估計器分類
4.2.1 k近鄰算法
4.2.2 管道機制
4.2.3 Skleam比較分類器
4.3 本章小結

第5章 主流數據分析庫
5.1 NumPy
5.2 PandaS
5.2.1 Pandas系列
5.2.2 Pandas數據幀
5.2.3 Pandas面板
5.3 SciPy
5.4 Matplotlib
5.5 本章小結

第6章 大數據:數據庫類型
6.1 關係型數據庫
6.2 關係型數據庫與非關係型數據庫的關係
6.3 SQLite
6.3.1 SQLite安裝與配置
6.3.2 SQLite命令
6.3.3 SQLite語法
6.3.4 SQLite-Python
6.4 MySQL
6.4.1 MySQL安裝
6.4.2 MySQL管理
6.4.3 MySQLPHP語法
6.4.4 PHP腳本連接MySQL
6.4.5 Python操作MySQL數據庫
6.5 NoSQL數據庫
……
第7章 數據倉庫/商業智能
第8章 數據聚合與分組運算
第9章 數據挖掘工具
第10章 挖掘建模
第11章 模型評估
第12章 社會媒體挖掘
第13章 圖挖掘分類
第14章 基於深度學習的驗證碼識別
第15章 基於深度學習的文本分類挖掘實現
參考文獻

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 412
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區