TOP
0
0
三民出版.新書搶先報|最速、最優惠的新鮮貨報給你知!
ETL數據整合與處理(Kettle)(簡體書)
滿額折

ETL數據整合與處理(Kettle)(簡體書)

商品資訊

人民幣定價:49.8 元
定價
:NT$ 299 元
優惠價
87260
海外經銷商無庫存,到貨日平均30天至45天
下單可得紅利積點:7 點
商品簡介
作者簡介
名人/編輯推薦
目次
相關商品

商品簡介

本書以Kettle實現ETL流程為目標,將ETL知識點與任務相結合,配套真實案例,深入淺出地介紹了ETL數據整合與處理的相關內容。全書共8章,第1章介紹了ETL概念和ETL工具,讓讀者在瞭解ETL相關的概念後,立刻上手ETL工具Kettle;第2~6章介紹了Kettle工具轉換相關的組件,包括源數據獲取、記錄處理、字段處理、高級轉換、遷移和裝載等內容,內容與ETL流程匹配,能幫助讀者快速掌握ETL;第7章介紹了Kettle工具任務的相關組件,能夠幫助讀者串聯不同的任務,以及實現調度的功能;第8章介紹了無人售貨機ETL項目,通過項目案例的形式,幫助讀者將所學知識融會貫通。

作者簡介

王雪松,佛山職業技術學院,計算機應用專業,教授。主編規劃教材6部,發表專業學術論文30余篇。
張良均,廣東泰迪智能科技股份有限公司董事長,高級信息系統項目管理師,廣東省工業與應用數學學會常務理事,中國信訪大數據學術與應用研究聯盟副理事長,“泰迪杯”數據挖掘挑戰賽發起人。華南師範大學、中南財經政法大學、廣東工業大學、西安理工大學、廣西科技大學、重慶交通大學、湖北工程學院等兼職教授或兼職碩導。近5年,在國內外重要學術刊物上發表論文10余篇;主導編寫圖書專著26部,承擔***項目1項,省部級項目6項。獲得SAS、SPSS數據挖掘認證及Hadoop開發工程師證書,具有信訪、電力、電信、銀行、制造企業、電子商務和電子政務的項目經驗和行業背景。

名人/編輯推薦

本書采用了以任務為導向的教學模式,按照解決實際任務的工作流程路線,逐步展開介紹相關的理論知識點,推導生成可行的解決方案,最後落實在任務實現環節。
書中案例全部源於企業真實項目,可操作性強,引導讀者融會貫通,並提供源代碼等相關學習資源,幫助讀者快速掌握ETL數據整合與處理相關技能。

目次

第 1章 開啟ETL之旅 1
任務1.1 認識ETL 1
1.1.1 了解ETL 1
1.1.2 選擇ETL工具 4
任務1.2 配置Kettle運行環境 7
1.2.1 安裝JDK 8
1.2.2 安裝MySQL數據庫 9
1.2.3 配置Kettle 10
任務1.3 熟悉Kettle基本操作 11
1.3.1 認識Kettle界面 11
1.3.2 新建轉換與任務 17
1.3.3 運行與查看結果面板 20
小結 22
課後習題 22
第 2章 源數據獲取 23
任務2.1 創建數據庫連接 23
2.1.1 建立數據庫連接 23
2.1.2 設置參數 24
2.1.3 測試和瀏覽數據庫連接結果 26
2.1.4 建立/停止共享數據庫連接 27
任務2.2 表輸入 28
2.2.1 建立表輸入轉換工程 28
2.2.2 設置參數 29
2.2.3 預覽結果數據 32
任務2.3 CSV文件輸入 32
2.3.1 建立CSV文件輸入轉換工程 32
2.3.2 設置參數 33
2.3.3 預覽結果數據 35
任務2.4 Excel輸入 36
2.4.1 建立Excel輸入轉換工程 36
2.4.2 設置參數 37
2.4.3 預覽結果數據 44
任務2.5 生成記錄 44
2.5.1 建立生成記錄轉換工程 45
2.5.2 設置參數 45
2.5.3 預覽結果數據 47
任務2.6 生成隨機數 47
2.6.1 建立生成隨機數轉換工程 47
2.6.2 設置參數 48
2.6.3 預覽結果數據 49
任務2.7 獲取系統信息 49
2.7.1 建立獲取系統信息轉換工程 50
2.7.2 設置參數 50
2.7.3 預覽結果數據 51
小結 51
課後習題 52
第3章 記錄處理 53
任務3.1 排序記錄 53
3.1.1 建立排序記錄轉換工程 53
3.1.2 設置參數 54
3.1.3 預覽結果數據 56
任務3.2 去除重復記錄 56
3.2.1 建立去除重復記錄轉換工程 56
3.2.2 設置參數 57
3.2.3 預覽結果數據 59
任務3.3 替換NULL值 59
3.3.1 建立替換NULL值轉換工程 59
3.3.2 設置參數 60
3.3.3 預覽結果數據 62
任務3.4 過濾記錄 62
3.4.1 建立過濾記錄轉換工程 62
3.4.2 設置參數 63
3.4.3 預覽結果數據 67
任務3.5 值映射 67
3.5.1 建立值映射轉換工程 67
3.5.2 設置參數 68
3.5.3 預覽結果數據 69
任務3.6 字符串替換 70
3.6.1 建立字符串替換轉換工程 70
3.6.2 設置參數 70
3.6.3 預覽結果數據 72
任務3.7 字符串操作 72
3.7.1 建立字符串操作轉換工程 72
3.7.2 設置參數 73
3.7.3 預覽結果數據 74
任務3.8 分組 74
3.8.1 建立分組轉換工程 75
3.8.2 設置參數 76
3.8.3 預覽結果數據 78
小結 78
課後習題 79
第4章 字段處理 80
任務4.1 字段選擇 80
4.1.1 建立字段選擇轉換工程 80
4.1.2 設置參數 81
4.1.3 預覽結果數據 85
任務4.2 增加常量 86
4.2.1 建立增加常量轉換工程 86
4.2.2 設置參數 87
4.2.3 預覽結果數據 88
任務4.3 將字段值設置為常量 88
4.3.1 建立將字段值設置為常量轉換工程 89
4.3.2 設置參數 89
4.3.3 預覽結果數據 90
任務4.4 剪切字符串 91
4.4.1 建立剪切字符串轉換工程 91
4.4.2 設置參數 92
4.4.3 預覽結果數據 93
任務4.5 拆分字段 93
4.5.1 建立拆分字段轉換工程 93
4.5.2 設置參數 94
4.5.3 預覽結果數據 96
任務4.6 數值範圍 96
4.6.1 建立數值範圍轉換工程 97
4.6.2 設置參數 97
4.6.3 預覽結果數據 99
任務4.7 計算器 99
4.7.1 建立計算器轉換工程 99
4.7.2 設置參數 100
4.7.3 預覽結果數據 101
任務4.8 增加序列 102
4.8.1 建立增加序列轉換工程 102
4.8.2 設置參數 103
4.8.3 預覽結果數據 105
小結 105
課後習題 105
第5章 高級轉換 107
任務5.1 記錄集連接 107
5.1.1 建立記錄集連接轉換工程 107
5.1.2 設置參數 109
5.1.3 預覽結果數據 110
任務5.2 多路數據合並連接 111
5.2.1 建立多路數據合並連接轉換工程 111
5.2.2 設置參數 112
5.2.3 預覽結果數據 114
任務5.3 單變量統計 115
5.3.1 建立單變量統計轉換工程 115
5.3.2 設置參數 116
5.3.3 預覽結果數據 117
任務5.4 公式 118
5.4.1 建立公式轉換工程 118
5.4.2 設置參數 119
5.4.3 預覽結果數據 120
任務5.5 利用Janino計算Java表達式 120
5.5.1 建立利用Janino計算Java表達式轉換工程 121
5.5.2 設置參數 122
5.5.3 預覽結果數據 123
任務5.6 JavaScript代碼 123
5.6.1 建立JavaScript代碼轉換工程 123
5.6.2 設置參數 124
5.6.3 預覽結果數據 127
任務5.7 設置變量 128
5.7.1 建立設置變量轉換工程 128
5.7.2 設置參數 130
5.7.3 預覽結果數據 131
任務5.8 獲取變量 131
5.8.1 建立獲取變量轉換工程 131
5.8.2 設置參數 132
5.8.3 預覽結果數據 133
小結 133
課後習題 133
第6章 遷移和裝載 135
任務6.1 表輸出 135
6.1.1 建立表輸出轉換工程 135
6.1.2 設置參數 136
6.1.3 預覽結果數據 139
任務6.2 插入/更新 139
6.2.1 建立插入/更新轉換工程 140
6.2.2 設置參數 140
6.2.3 預覽結果數據 143
任務6.3 Excel輸出 143
6.3.1 建立Excel輸出轉換工程 143
6.3.2 設置參數 143
6.3.3 預覽結果數據 148
任務6.4 文本文件輸出 148
6.4.1 建立文本文件輸出轉換工程 148
6.4.2 設置參數 149
6.4.3 預覽結果數據 153
任務6.5 SQL文件輸出 153
6.5.1 建立SQL文件輸出轉換工程 153
6.5.2 設置參數 153
6.5.3 預覽結果數據 156
小結 156
課後習題 157
第7章 任務 158
任務7.1 開始 158
7.1.1 建立開始任務工程 158
7.1.2 設置參數 159
7.1.3 運行任務 160
任務7.2 轉換 161
7.2.1 建立轉換任務工程 162
7.2.2 設置參數 162
7.2.3 運行任務 166
任務7.3 添加文件到結果文件中 167
7.3.1 建立添加文件到結果文件中任務工程 167
7.3.2 設置參數 167
7.3.3 運行任務 168
任務7.4 發送郵件 169
7.4.1 建立發送郵件任務工程 169
7.4.2 設置參數 170
7.4.3 運行任務 174
任務7.5 成功 175
7.5.1 建立成功任務 175
7.5.2 設置參數 176
7.5.3 運行任務 176
任務7.6 檢查表是否存在 177
7.6.1 建立檢查表是否存在任務工程 177
7.6.2 設置參數 177
7.6.3 運行任務 178
任務7.7 SQL 179
7.7.1 建立SQL任務工程 179
7.7.2 設置參數 179
7.7.3 運行任務 180
任務7.8 檢查列是否存在 181
7.8.1 建立檢查列是否存在任務工程 181
7.8.2 設置參數 181
7.8.3 運行任務 183
任務7.9 檢查一個文件是否存在 183
7.9.1 建立檢查一個文件是否存在任務工程 183
7.9.2 設置參數 184
7.9.3 運行任務 184
任務7.10 檢查多個文件是否存在 185
7.10.1 建立檢查多個文件是否存在任務工程 185
7.10.2 設置參數 185
7.10.3 運行任務 186
小結 187
課後習題 187
第8章 無人售貨機項目實戰 188
任務8.1 了解無人售貨機項目背景與目標 188
8.1.1 了解項目背景 188
8.1.2 熟悉項目目標 189
8.1.3 熟悉數據字段 189
任務8.2 分組聚合客戶訂單 192
8.2.1 分析任務數據需求 192
8.2.2 熟悉任務流程 193
8.2.3 實現聚合客戶訂單 193
任務8.3 計算各商品銷售金額 197
8.3.1 分析任務數據需求 197
8.3.2 熟悉任務流程 197
8.3.3 實現各商品銷售金額計算 198
任務8.4 統計各售貨機日銷售金額 202
8.4.1 分析任務數據需求 202
8.4.2 熟悉任務流程 202
8.4.3 實現各售貨機銷售金額統計 203
任務8.5 整理各售貨機銷售情況 207
8.5.1 分析任務數據需求 208
8.5.2 熟悉任務流程 208
8.5.3 實現各售貨機銷售情況整理 209
小結 216
課後習題 216

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 260
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區