TOP
0
0
【簡體曬書節】 單本79折,5本7折,優惠只到5/31,點擊此處看更多!
深入淺出R語言數據分析(簡體書)
滿額折

深入淺出R語言數據分析(簡體書)

商品資訊

人民幣定價:69 元
定價
:NT$ 414 元
優惠價
87360
領券後再享88折起
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:10 點
相關商品
商品簡介
作者簡介
名人/編輯推薦
目次

商品簡介

本書首先介紹數據分析的方法論,然後介紹數據分析的相關模型方法,並進一步通過數據分析案例,講解數據分析的思維、方法及模型實現過程。本書重點介紹R語言在數據分析方面的應用,讓讀者能夠快速地使用R語言進行數據分析、構建模型。
本書分為17章,內容包括:使用R語言獲取數據、數據分析中的數據處理與數據探索、生存分析、主成分分析、多維縮放、線性回歸模型、邏輯回歸模型、聚類模型、關聯規則、隨機森林、支持向量機、神經網絡、文本挖掘、社交網絡分析,以及關於R語言數據分析的兩個延伸內容:H2O機器學習和R語言爬蟲。

本書內容通俗易懂,案例豐富,實用性強,特別適合R語言的入門讀者和進階讀者閱讀,也適合數據分析人員、數據挖掘人員等其他數據科學從業者。另外,本書也適用於統計學、計算機、機器學習、數學等相關專業的本科生、研究生使用。

作者簡介

米霖,畢業於華中農業大學,本科數學專業,研究生統計學專業,8年R語言項目經驗,擅長機器學習、統計模型。曾開發了多門R語言相關課程,課程包括“Shiny初級教程”“R包開發”“H2O機器學習模型”“信用評分模型開發”“R語言文本挖掘”等,學員累計超過5000人。完成過很多數據分析項目,例如廣告虛假流量識別項目(通過虛假流量數據的挖掘幫助企業節省了上百萬元的營銷成本)、信貸中的信用評分項目、電商風控項目等。

名人/編輯推薦

8年實戰經驗,帶你搞定R語言數據分析,有理論,有應用,有技巧
系統:從數據讀取、網絡爬蟲,到數據分析方法,應有盡有
全面:介紹了*常用的12種數據分析方法
實戰:針對每種方法,都給出了實現代碼,拿來就用
圖解:提供了59張數據分析圖,方便讀者學習
免費提供配套學習視頻+源程序下載

目次

第1章 數據分析項目的流程
1.1 數據分析項目中的角色
1.2 數據分析項目的階段
1.2.1 制定目標
1.2.2 收集數據
1.2.3 數據處理和分析
1.2.4 構建模型
1.2.5 評估模型
1.2.6 展示結果
1.2.7 部署與維護模型
1.3 總結
第2章 數據的讀取
2.1 RData數據
2.2 readr高效讀取數據
2.3 讀取Excel數據
2.4 讀取SPSS、SAS、STATA數據
2.5 R語言操作數據庫
2.6 總結
第3章 數據探索
3.1 缺失值的識別與處理
3.1.1 缺失值的識別與描述性統計
3.1.2 缺失值的可視化展示
3.1.3 缺失值的處理方法
3.2 異常值
3.3 dlookr數據處理包
3.3.1 所有變量的一般性診斷
3.3.2 數值型變量的診斷
3.3.3 分類變量的診斷
3.3.4 異常值的診斷
3.3.5 創建診斷報告
3.3.6 數據處理
3.3.7 缺失值處理
3.3.8 異常值處理
3.3.9 數據轉換
3.3.10 數據分箱
3.3.11 創建數據轉換報告
3.4 數據相關性
3.5 自動化創建數據探索報告
3.6 總結
第4章 生存分析
4.1 生存分析的基本內容
4.2 使用R語言進行生存分析
4.3 非參數模型
4.3.1 使用Kaplan-Meier方法擬合數據
4.3.2 Kaplan-Meier方法的可視化
4.4 半參數模型生存分析方法
4.4.1 構建Cox模型
4.4.2 檢查假設
4.4.3 Coxph模型可視化
4.4.4 預測
4.4.5 分層
4.5 參數模型
4.6 隨機生存森林模型
4.7 總結
第5章 主成分分析
5.1 概述
5.1.1 維度相關的問題
5.1.2 檢測多重共線性
5.1.3 方差膨脹因子
5.2 主成分分析詳解
5.2.1 主成分分析的定義
5.2.2 主成分分析的簡單原理
5.2.3 主成分分析的算法
5.3 使用R語言進行主成分分析
5.3.1 主成分分析的實現
5.3.2 主成分分析案例
5.4 總結
第6章 多維縮放
6.1 MDS的工作原理
6.3 MDS的優點
6.2 在R語言中實現MDS
6.4 總結
第7章 線性回歸模型
7.1 線性回歸模型概述
7.2 在R語言中實現回歸模型
7.2.1 圖形分析
7.2.2 建立線性模型
7.2.3 回歸模型的圖形診斷
7.2.4 預測模型
7.2.5 抽樣方法
7.3 總結
第8章 邏輯回歸模型
8.1 邏輯回歸的原理
8.2 在R語言中實現邏輯回歸模型
8.2.1 數據探索
8.2.2 構建邏輯回歸模型
8.2.3 邏輯回歸預測
8.2.4 邏輯回歸模型評估
8.3 總結
第9章 聚類模型
9.1 概述
9.1.1 聚類算法
9.1.2 K均值聚類的原理
9.2 在R語言中實現聚類模型
9.2.1 K均值聚類
9.2.2 層次聚類
9.2.3 Medoids聚類(PAM)
9.3 總結
第10章 關聯規則
10.1 關聯規則概述
10.2 關聯規則的基本概念
10.3 在R語言中實現關聯規劃
10.3.1 訓練模型
10.3.2 模型的評估
10.3.3 提升關聯規則的效果
10.3.4 關聯規則的可視化
10.4 總結
第11章 隨機森林
11.1 隨機森林的基本概念
11.3 總結
11.2 在R語言中實現隨機森林
第12章 支持向量機
12.1 概述
12.3 總結
12.2 在R語言中實現支持向量機
第13章 神經網絡
13.2.2 評估模型效果
13.1 概述
13.2 在R語言中實現神經網絡
13.3 總結
13.2.1 構建神經網絡模型
第14章 文本挖掘
14.1 概述
14.2 text2vec背景及其基本原理
14.3 DTM與TFIDF的原理和實現
14.3.1 DTM和TFIDF的原理
14.3.2 DTM的實現
14.3.3 TFIDF的實現
14.4 情感分析
14.5 LDA主題模型及其實現
14.6 構建自動問答系統
14.7 總結
第15章 社交網絡分析
15.1 社交網絡概述
15.2 igraph簡介
15.2.1 準備工作
15.2.2 圖的指標計算
15.3 社交網絡的常見結構
15.4 社交網絡分析算法
IX
15.4.1 Girvan-Newman
15.4.2 基於傳播標簽的社區檢測
15.4.3 基於貪婪優化模塊的社區檢測
15.4.4 自旋轉玻璃社群
15.5 微博社交群體分析
15.5.1 自旋轉玻璃社群
15.5.2 社群檢測
15.6 總結
第16章 H2O機器學習
16.1 H2O機器學習平臺
16.2 在R語言中使用H2O
16.2.1 H2O的安裝
16.2.2 案例應用
16.2.3 H2O常用API
16.2.4 模型的通用參數
16.2.5 參數調整
16.3 H2OFlow
16.3.1 H2OFlow的安裝
16.3.2 H2OFlow的基本使用方法
16.4 總結
第17章 R語言爬蟲
17.1 快速爬取網頁數據
17.2 rvest簡介
17.2.1 rvestAPI
17.2.2 rvestAPI詳解
17.3 爬取BOSS直聘數據
17.4 模擬登錄

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 360
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區