Hive數據倉庫技術與應用(簡體書)
商品資訊
系列名:高等職業教育校企合作系列教材
ISBN13:9787113271947
出版社:中國鐵道出版社
作者:朱曉彥; 方明清; 李強
出版日:2020/09/01
裝訂/頁數:平裝/236頁
規格:24cm*17cm (高/寬)
商品簡介
作者簡介
名人/編輯推薦
目次
相關商品
商品簡介
本書是大數據技術與應用專業校企合作系列教材之一,採用模塊化的編寫思路,內容包括Hive概述、環境準備、Hadoop搭建和配置、安裝Hive的基礎操作、HiveQL的數據定義、HiveQL語句、Hive綜合應用7個單元和25個教學任務。每個單元通過學習目標引出單元的教學核心內容,明確教學任務。每個任務的編寫分為任務目標、知識學習、任務實施、同步訓練4個環節。最後通過單元小結回顧每個單元的學習重點。
本書適合作為高職院校軟件技術、大數據技術及應用專業,以及計算機類相關專業的教材,也可以作為Hive愛好者的參考用書。
本書適合作為高職院校軟件技術、大數據技術及應用專業,以及計算機類相關專業的教材,也可以作為Hive愛好者的參考用書。
作者簡介
朱曉彥,安徽工業經濟職業技術學院;
方明清,珠海城市職業技術學院;
李強,珠海城市職業技術學院
方明清,珠海城市職業技術學院;
李強,珠海城市職業技術學院
名人/編輯推薦
本書採用模塊化的編寫思路,通過25個任務,介紹Hive的相關技術。每個任務分為任務目標、知識學習、任務實施、同步訓練4個環節。
目次
單元1 Hive概述1
任務1.1 Hive的產生背景1
1 Hive的產生背景2
2 Hive的發展歷史和現狀4
3 Hive與Hadoop4
任務1.2 Hive的概念9
1 Hive的系統與部署架構9
2 Hive與RDBM對比12
3數據倉庫的理解12
4 Hive的數據模型15
5 HiveQL與數據存儲16
任務1.3 Hadoop生態與Hive20
1 Pig20
2 HBase21
單元小結25
單元2 環境準備26
任務2.1 VMware與SecureCRT Portable26
1 VMware簡介26
2 VMware的虛擬化27
任務2.2 JDK的配置37
1 JDK的簡介37
2 JDK的版本37
3上傳JDK的介質37
4 tar的解壓與壓縮37
任務2.3 免密登錄41
1 免密登錄用戶41
2免密登錄的優點42
單元小結46
單元3 Hadoop搭建和配置47
任務3.1 Hadoop搭建47
1上傳Hadoop的介質47
2解壓Hadoop壓縮包48
3配置Hadoop的環境變量48
4配置Hadoop環境變量48
5修改Hadoop的配置文件49
6啟動Hadoop服務51
7檢查Hadoop的成功52
任務3.2 Hadoop配置57
1 Hadoop簡介57
2 MapReduce綜述61
單元小結70
單元4 安裝Hive的基礎操作71
任務4.1 Hive的模式71
1本地模式72
2遠程模式72
3內嵌模式73
任務4.2 安裝Hive實驗88
1 Hive簡介88
2 Hive的定義88
3設計特徵88
4數據存儲89
任務4.3 Hive命令95
1創建表語句95
2加載數據96
3改變表98
4替換101
5刪除表102
6分區103
任務4.4 Hive命令行界面107
1 CLI選項107
2變量和屬性111
3在Hive內使用Hadoop的DFS命令112
任務4.5 數據類型和文件格式114
1基本數據類型114
2文件格式116
3壓縮編碼119
4集合數據類型121
任務4.6 Hive權限管理125
1開啟權限126
2權限操作128
任務4.7 Hive常用優化方法137
1控制Reducer數量137
2使用Map Join138
3使用distinct+union all 代替union139
4解決數據傾斜的通用方法140
單元小結141
單元5 HiveQL的數據定義143
任務5.1 HiveQL的數據定義143
1 HiveQL的數據定義143
2 HiveQL和SQL的區別146
任務5.2 Hive數據庫150
1 Hive的數據庫150
2修改數據庫屬性151
任務5.3 修改表157
1增加、修改和刪除表分區157
2表重命名157
3增加列157
4刪除或者替換列157
5修改表屬性158
6修改存儲屬性158
7修改表語句158
單元小結162
單元6 HiveQL語句163
任務6.1 SELECT、FROM語句的概念163
1使用正則表達式來指定列163
2使用列值進行計算165
3算術運算符165
4使用函數168
5 LIMIT語句169
6列的別名169
7 CASE、WHEN、THEN句式169
8嵌套SELECT語句172
任務6.2 GROUP BY178
任務6.3 抽樣查詢180
1數據塊抽樣180
2分桶表的輸入裁剪180
任務6.4 WHERE語句181
1謂語操作符182
2浮點數比較183
任務6.5 JOIN語句184
1 JOIN優化185
2 LEFT OUTER JOIN186
3 INNER JOIN187
4 FULL OUTER JOIN189
5 LEFT SEMIJOIN189
6 RIGHT OUTER JOIN190
7 OUTER JOIN190
8笛卡兒積JOIN191
9 mapsidejoin192
單元小結194
單元7 Hive綜合應用195
任務7.1 Hive和亞馬遜網絡服務系統(AWS)195
1彈性MapReduce的優點196
2注意事項196
3 EMR上的實例196
任務7.2 Hive綜合案例199
1 Hive操作演示199
2交易數據演示207
單元小結227
參考文獻228
任務1.1 Hive的產生背景1
1 Hive的產生背景2
2 Hive的發展歷史和現狀4
3 Hive與Hadoop4
任務1.2 Hive的概念9
1 Hive的系統與部署架構9
2 Hive與RDBM對比12
3數據倉庫的理解12
4 Hive的數據模型15
5 HiveQL與數據存儲16
任務1.3 Hadoop生態與Hive20
1 Pig20
2 HBase21
單元小結25
單元2 環境準備26
任務2.1 VMware與SecureCRT Portable26
1 VMware簡介26
2 VMware的虛擬化27
任務2.2 JDK的配置37
1 JDK的簡介37
2 JDK的版本37
3上傳JDK的介質37
4 tar的解壓與壓縮37
任務2.3 免密登錄41
1 免密登錄用戶41
2免密登錄的優點42
單元小結46
單元3 Hadoop搭建和配置47
任務3.1 Hadoop搭建47
1上傳Hadoop的介質47
2解壓Hadoop壓縮包48
3配置Hadoop的環境變量48
4配置Hadoop環境變量48
5修改Hadoop的配置文件49
6啟動Hadoop服務51
7檢查Hadoop的成功52
任務3.2 Hadoop配置57
1 Hadoop簡介57
2 MapReduce綜述61
單元小結70
單元4 安裝Hive的基礎操作71
任務4.1 Hive的模式71
1本地模式72
2遠程模式72
3內嵌模式73
任務4.2 安裝Hive實驗88
1 Hive簡介88
2 Hive的定義88
3設計特徵88
4數據存儲89
任務4.3 Hive命令95
1創建表語句95
2加載數據96
3改變表98
4替換101
5刪除表102
6分區103
任務4.4 Hive命令行界面107
1 CLI選項107
2變量和屬性111
3在Hive內使用Hadoop的DFS命令112
任務4.5 數據類型和文件格式114
1基本數據類型114
2文件格式116
3壓縮編碼119
4集合數據類型121
任務4.6 Hive權限管理125
1開啟權限126
2權限操作128
任務4.7 Hive常用優化方法137
1控制Reducer數量137
2使用Map Join138
3使用distinct+union all 代替union139
4解決數據傾斜的通用方法140
單元小結141
單元5 HiveQL的數據定義143
任務5.1 HiveQL的數據定義143
1 HiveQL的數據定義143
2 HiveQL和SQL的區別146
任務5.2 Hive數據庫150
1 Hive的數據庫150
2修改數據庫屬性151
任務5.3 修改表157
1增加、修改和刪除表分區157
2表重命名157
3增加列157
4刪除或者替換列157
5修改表屬性158
6修改存儲屬性158
7修改表語句158
單元小結162
單元6 HiveQL語句163
任務6.1 SELECT、FROM語句的概念163
1使用正則表達式來指定列163
2使用列值進行計算165
3算術運算符165
4使用函數168
5 LIMIT語句169
6列的別名169
7 CASE、WHEN、THEN句式169
8嵌套SELECT語句172
任務6.2 GROUP BY178
任務6.3 抽樣查詢180
1數據塊抽樣180
2分桶表的輸入裁剪180
任務6.4 WHERE語句181
1謂語操作符182
2浮點數比較183
任務6.5 JOIN語句184
1 JOIN優化185
2 LEFT OUTER JOIN186
3 INNER JOIN187
4 FULL OUTER JOIN189
5 LEFT SEMIJOIN189
6 RIGHT OUTER JOIN190
7 OUTER JOIN190
8笛卡兒積JOIN191
9 mapsidejoin192
單元小結194
單元7 Hive綜合應用195
任務7.1 Hive和亞馬遜網絡服務系統(AWS)195
1彈性MapReduce的優點196
2注意事項196
3 EMR上的實例196
任務7.2 Hive綜合案例199
1 Hive操作演示199
2交易數據演示207
單元小結227
參考文獻228
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。