TOP
0
0
【簡體曬書區】 單本79折,5本7折,活動好評延長至5/31,趕緊把握這一波!
Hadoop大數據挖掘從入門到進階實戰(視頻教學版)(簡體書)
滿額折

Hadoop大數據挖掘從入門到進階實戰(視頻教學版)(簡體書)

人民幣定價:99 元
定  價:NT$ 594 元
優惠價:87517
領券後再享88折
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:15 點
相關商品
商品簡介
作者簡介
目次

商品簡介

本書採用“理論+實戰”的形式編寫,全面介紹了Hadoop大數據挖掘的相關知識。本書共分為13章,涵蓋的主要內容有:集群及開發環境搭建;快速構建一個Hadoop項目並線上運行;Hadoop套件實戰;Hive編程――使用SQL提交MapReduce任務到Hadoop集群;遊戲玩家的用戶行為分析――特徵提取;Hadoop平臺管理與維護;Hadoop異常處理解決方案;初識Hadoop核心源碼;Hadoop通信機制和內部協議;Hadoop分布式文件系統剖析;ELK實戰案例――遊戲應用實時日誌分析平臺;Kafka實戰案例――實時處理遊戲用戶數據;Hadoop拓展――Kafka剖析。本書不但適合剛入門的初學者系統學習Hadoop的各種基礎語法和開發技巧,而且也適合有多年開發經驗的開發者進階提高。另外,本書也適合社會培訓機構和相關院校作為教材或者教學參考書。

作者簡介

鄧傑,博客園資深博主,資深大數據全棧開發者,極客學院大數據講師,開源愛好者。

目次

目錄
前言
第1章 集群及開發環境搭建1
1.1 環境準備1
1.1.1 基礎軟件下載1
1.1.2 準備Linux操作系統2
1.2 安裝Hadoop4
1.2.1 基礎環境配置4
1.2.2 Zookeeper部署7
1.2.3 Hadoop部署9
1.2.4 效果驗證21
1.2.5 集群架構詳解24
1.3 Hadoop版Hello World25
1.3.1 Hadoop Shell介紹25
1.3.2 WordCount初體驗27
1.4 開發環境28
1.4.1 搭建本地開發環境28
1.4.2 運行及調試預覽31
1.5 小結34
第2章 實戰:快速構建一個Hadoop項目並線上運行35
2.1 構建一個簡單的項目工程35
2.1.1 構建Java Project結構工程35
2.1.2 構建Maven結構工程36
2.2 操作分布式文件系統(HDFS)39
2.2.1 基本的應用接口操作39
2.2.2 在高可用平臺上的使用方法42
2.3 利用IDE提交MapReduce作業43
2.3.1 在單點上的操作43
2.3.2 在高可用平臺上的操作46
2.4 編譯應用程序並打包51
2.4.1 編譯Java Project工程並打包51
2.4.2 編譯Maven工程並打包55
2.5 部署與調度58
2.5.1 部署應用58
2.5.2 調度任務59
2.6 小結60
第3章 Hadoop套件實戰61
3.1 Sqoop――數據傳輸工具61
3.1.1 背景概述61
3.1.2 安裝及基本使用62
3.1.3 實戰:在關係型數據庫與分布式文件系統之間傳輸數據64
3.2 Flume――日誌收集工具66
3.2.1 背景概述67
3.2.2 安裝與基本使用67
3.2.3 實戰:收集系統日誌並上傳到分布式文件系統(HDFS)上72
3.3 HBase――分布式數據庫74
3.3.1 背景概述74
3.3.2 存儲架構介紹75
3.3.3 安裝與基本使用75
3.3.4 實戰:對HBase業務表進行增、刪、改、查操作79
3.4 Zeppelin――數據集分析工具85
3.4.1 背景概述85
3.4.2 安裝與基本使用85
3.4.3 實戰:使用解釋器操作不同的數據處理引擎88
3.5 Drill――低延時SQL查詢引擎92
3.5.1 背景概述93
3.5.2 安裝與基本使用93
3.5.3 實戰:對分布式文件系統(HDFS)使用SQL進行查詢95
3.5.4 實戰:使用SQL查詢HBase數據庫99
3.5.5 實戰:對數據倉庫(Hive)使用類實時統計、查詢操作101
3.6 Spark――實時流數據計算104
3.6.1 背景概述104
3.6.2 安裝部署及使用105
3.6.3 實戰:對接Kafka消息數據,消費、計算及落地108
3.7 小結114
第4章 Hive編程――使用SQL提交MapReduce任務到Hadoop集群115
4.1 環境準備與Hive初識115
4.1.1 背景介紹115
4.1.2 基礎環境準備116
4.1.3 Hive結構初識116
4.1.4 Hive與關係型數據庫(RDBMS)118
4.2 安裝與配置Hive118
4.2.1 Hive集群基礎架構119
4.2.2 利用HAProxy實現Hive Server負載均衡120
4.2.3 安裝分布式Hive集群123
4.3 可編程方式126
4.3.1 數據類型126
4.3.2 存儲格式128
4.3.3 基礎命令129
4.3.4 Java編程語言操作數據倉庫(Hive)131
4.3.5 實踐Hive Streaming134
4.4 運維和監控138
4.4.1 基礎命令138
4.4.2 監控工具Hive Cube140
4.5 小結143
第5章 遊戲玩家的用戶行為分析――特徵提取144
5.1 項目應用概述144
5.1.1 場景介紹144
5.1.2 平臺架構與數據采集145
5.1.3 準備系統環境和軟件147
5.2 分析與設計148
5.2.1 整體分析148
5.2.2 指標與數據源分析149
5.2.3 整體設計151
5.3 技術選型153
5.3.1 套件選取簡述154
5.3.2 套件使用簡述154
5.4 編碼實踐157
5.4.1 實現代碼157
5.4.2 統計結果處理163
5.4.3 應用調度169
5.5 小結174
第6章 Hadoop平臺管理與維護175
6.1 Hadoop分布式文件系統(HDFS)175
6.1.1 HDFS特性175
6.1.2 基礎命令詳解176
6.1.3 解讀NameNode Standby179
6.2 Hadoop平臺監控182
6.2.1 Hadoop日誌183
6.2.2 常用分布式監控工具187
6.3 平臺維護196
6.3.1 安全模式196
6.3.2 節點管理198
6.3.3 HDFS快照200
6.4 小結203
第7章 Hadoop異常處理解決方案204
7.1 定位異常204
7.1.1 跟蹤日誌204
7.1.2 分析異常信息208
7.1.3 閱讀開發業務代碼209
7.2 解決問題的方式210
7.2.1 搜索關鍵字211
7.2.2 查看Hadoop JIRA212
7.2.3 閱讀相關源碼213
7.3 實戰案例分析216
7.3.1 案例分析1:啟動HBase失敗216
7.3.2 案例分析2:HBase表查詢失敗219
7.3.3 案例分析3:Spark的臨時數據不自動清理222
7.4 小結223
第8章 初識Hadoop核心源碼224
8.1 基礎準備與源碼編譯224
8.1.1 準備環境224
8.1.2 加載源碼228
8.1.3 編譯源碼230
8.2 初識Hadoop 2233
8.2.1 Hadoop的起源233
8.2.2 Hadoop 2源碼結構圖234
8.2.3 Hadoop模塊包235
8.3 MapReduce框架剖析236
8.3.1 第一代MapReduce框架236
8.3.2 第二代MapReduce框架238
8.3.3 兩代MapReduce框架的區別239
8.3.4 第二代MapReduce框架的重構思路240
8.4 序列化241
8.4.1 序列化的由來242
8.4.2 Hadoop序列化243
8.4.3 Writable實現類245
8.5 小結247
第9章 Hadoop通信機制和內部協議248
9.1 Hadoop RPC概述248
9.1.1 通信模型248
9.1.2 Hadoop RPC特點250
9.2 Hadoop R

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 517
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區