商品簡介
名人/編輯推薦
目次
書摘/試閱
相關商品
商品簡介
《高等院校本科應用型經管專業規劃教材:數據倉庫與數據挖掘導論》為數據倉庫與數據挖掘的基礎教程,是作者多年來從事數據倉庫與數據挖掘課程教學經驗的梳理和總結。為了增強內容的直觀性和可理解度,《高等院校本科應用型經管專業規劃教材:數據倉庫與數據挖掘導論》以大量圖、表、實例融入其中。全書共分為四篇14章。第一篇為導引,共分2章:用實例和實例分析引導學生理解數據倉庫與數據挖掘的概念內涵及其產生背景。第二篇為數據倉庫,共分5章:詳細介紹了數據倉庫的體系結構及其組成部分的功能;從商業需求的角度介紹了數據倉庫維度建模方法和聯機分析處理操作;介紹了元數據在數據倉庫建設中的重要性、分類方法與作用。第三篇為數據挖掘,共分4章:通過淺顯易懂的語言及實例,深入淺出地介紹了關聯分析方法、神經網絡算法、決策樹算法和聚類分析方法。第四篇為實驗與工具,共分3章:提供了數據倉庫實驗、神經網絡建模實驗、決策樹與關聯分析實驗,強化培養學生的應用能力。
名人/編輯推薦
《高等院校本科應用型經管專業規劃教材:數據倉庫與數據挖掘導論》的內容力求淺顯易懂,用實例詮釋基本概念和基本原理,并提供實驗及工具強化學生應用能力的培養。《高等院校本科應用型經管專業規劃教材:數據倉庫與數據挖掘導論》可作為普通高等院校計算機專業、軟件工程專業、信管專業等其他相關專業的教材,也可作為數據倉庫與數據挖掘方面的培訓教材,對于希望了解或學習數據倉庫與數據挖掘知識的自學人士,《高等院校本科應用型經管專業規劃教材:數據倉庫與數據挖掘導論》具有較強的可讀性。
目次
第一篇導引
第1章數據倉庫概念與內涵
1.1數據倉庫概念
1.1.1數據倉庫的產生
1.1.2數據倉庫應用實例:理解數據倉庫的應用目標與作用
1.2數據倉庫的四個基本特征
1.2.1數據倉庫的數據是面向主題的
1.2.2數據倉庫的數據是集成的
1.2.3數據倉庫的數據是不可更新的
1.2.4數據倉庫的數據是隨時間不斷變化的
1.3數據集市——部門級數據倉庫
1.3.1自上而下構建數據集市
1.3.2自下而上構建數據集市
1.3.3自上而下與自下而上結合構建數據集市
習題
討論題
第2章數據挖掘概念與內涵
2.1數據挖掘概念
2.1.1數據挖掘的產生
2.1.2數據挖掘應用實例:理解數據挖掘的應用目標與作用
2.1.3數據挖掘的定義
2.2數據倉庫與數據挖掘的關系
討論題
第二篇數據倉庫
第3章數據倉庫的體系結構及其組成部分
3.1數據倉庫的體系結構
3.2數據倉庫的組成部分及其功能
3.2.1源數據部分
3.2.2數據準備部分
3.2.3數據存儲部分
3.2.4信息傳遞部分
思考題
習題
討論題
第4章數據倉庫數據的商業需求分析
4.1收集商業需求數據碰到的問題
4.2商業數據維度化分析
4.3商業維度實例分析
思考題
習題
第5章數據倉庫的維度建模
5.1維度建模基礎
5.2星型模式及其查詢的鉆取
5.2.1星型模式維度表內容的特征
5.2.2星型模式事實表內容的特征
5.2.3星型模式的優勢
5.3雪花型模式:對維度表的再處理
5.4聚集事實表:對關鍵指標的再處理
5.4.1理解事實表的數據量
5.4.2理解聚集事實表的作用
5.4.3對事實表進行聚集的三種方法
5.4.4聚集過程中相關問題討論
思考題
習題
第6章數據倉庫中的聯機分析處理——OLAP
6.1OLAP的含義、規則與特征
6.1.1OLAP的含義
6.1.2OLAP的規則
6.1.3OLAP的特征
6.2OLAP的基本操作
6.2.1切片
6.2.2切塊
6.2.3上鉆與下鉆
6.2.4旋轉
6.3OLAP模型結構
6.3.1關系聯機分析處理(ROLAP)結構
6.3.2多維聯機分析處理(MOLAP)結構
6.3.3混合聯機分析處理(HOLAP)結構
6.3.4桌面聯機分析處理(DOLAP)結構
6.3.5客戶聯機分析處理(COLAP)結構
6.4典型OLAP模型的數據組織與應用
6.4.1ROLAP的數據組織與應用
6.4.2MOIAP的數據組織與應用
6.4.3ROLAP與MOLAP的數據組織與應用比較
思考題
習題
討論題
第7章元數據
7.1數據倉庫中元數據的重要性
7.1.1數據倉庫的用戶需要元數據
7.1.2數據倉庫的開發者需要元數據
7.1.3數據倉庫的管理員需要元數據
7.2關于數據倉庫元數據的概念界定
7.3元數據的幾種分類方法
7.3.1按用途對元數據進行分類
7.3.2按數據倉庫功能區域劃分的元數據分類
7.3.3按元數據的活動方式進行分類
7.4元數據的作用
7.5元數據管理的體系結構
7.5.1集中的方法
7.5.2分散的方法
7.5.3分布的方法
思考題
習題
討論題
第三篇數據挖掘
第8章關聯分析
8.1關聯規則概念
8.1.1關聯規則的支持度和置信度
8.1.2關聯規則分類
8.2關聯規則挖掘算法
8.2.1Apriori算法
8.2.2強關聯規則的有效性和可行性問題
習題
討論題
第9章神經網絡算法
9.1神經網絡概念
9.1.1神經網絡原理
9.1.2人工神經網絡
9.2人工神經網絡模型
9.2.1感知器
9.2.2帶隱層的人工神經網絡
9.3前饋神經網絡
9.3.1訓練神經網絡
9.3.2后向傳播如何工作
9.3.3后向傳播算法
9.4有關神經網絡研究中應該關注的幾個問題
9.4.1關于對神經網絡的理解問題
9.4.2關于神經網絡應用中數據準備的問題
9.4.3影響神經網絡模型性能的部分因素
9.4.4學習神經網絡,需要強調以下幾個問題
習題
討論題
第10章決策樹算法
10.1決策樹分類概述
10.1.1決策樹分類步驟
10.1.2決策樹分類舉例
10.2ID3算法
10.2.1信息論基本原理
10.2.2ID3算法的基本思想與實例
10.2.3ID3算法應用中應該關注的幾個問題
習題
討論題
第11章聚類分析
11.1聚類分析概述
11.1.1聚類分析中的數據類型
11.1.2聚類分析中相異度(相似性、差異度)測度方法
11.2聚類分析方法
11.2.1劃分聚類方法
11.2.2基于密度的聚類方法
11.2.3聚類分析在數據挖掘應用中有待進一步研究的問題
習題
討論題
第四篇實驗與工具
第12章數據倉庫實驗與工具應用
第13章神經網絡建模實驗與工具應用
第14章決策樹與關聯分析實驗與工具應用
參考文獻
第1章數據倉庫概念與內涵
1.1數據倉庫概念
1.1.1數據倉庫的產生
1.1.2數據倉庫應用實例:理解數據倉庫的應用目標與作用
1.2數據倉庫的四個基本特征
1.2.1數據倉庫的數據是面向主題的
1.2.2數據倉庫的數據是集成的
1.2.3數據倉庫的數據是不可更新的
1.2.4數據倉庫的數據是隨時間不斷變化的
1.3數據集市——部門級數據倉庫
1.3.1自上而下構建數據集市
1.3.2自下而上構建數據集市
1.3.3自上而下與自下而上結合構建數據集市
習題
討論題
第2章數據挖掘概念與內涵
2.1數據挖掘概念
2.1.1數據挖掘的產生
2.1.2數據挖掘應用實例:理解數據挖掘的應用目標與作用
2.1.3數據挖掘的定義
2.2數據倉庫與數據挖掘的關系
討論題
第二篇數據倉庫
第3章數據倉庫的體系結構及其組成部分
3.1數據倉庫的體系結構
3.2數據倉庫的組成部分及其功能
3.2.1源數據部分
3.2.2數據準備部分
3.2.3數據存儲部分
3.2.4信息傳遞部分
思考題
習題
討論題
第4章數據倉庫數據的商業需求分析
4.1收集商業需求數據碰到的問題
4.2商業數據維度化分析
4.3商業維度實例分析
思考題
習題
第5章數據倉庫的維度建模
5.1維度建模基礎
5.2星型模式及其查詢的鉆取
5.2.1星型模式維度表內容的特征
5.2.2星型模式事實表內容的特征
5.2.3星型模式的優勢
5.3雪花型模式:對維度表的再處理
5.4聚集事實表:對關鍵指標的再處理
5.4.1理解事實表的數據量
5.4.2理解聚集事實表的作用
5.4.3對事實表進行聚集的三種方法
5.4.4聚集過程中相關問題討論
思考題
習題
第6章數據倉庫中的聯機分析處理——OLAP
6.1OLAP的含義、規則與特征
6.1.1OLAP的含義
6.1.2OLAP的規則
6.1.3OLAP的特征
6.2OLAP的基本操作
6.2.1切片
6.2.2切塊
6.2.3上鉆與下鉆
6.2.4旋轉
6.3OLAP模型結構
6.3.1關系聯機分析處理(ROLAP)結構
6.3.2多維聯機分析處理(MOLAP)結構
6.3.3混合聯機分析處理(HOLAP)結構
6.3.4桌面聯機分析處理(DOLAP)結構
6.3.5客戶聯機分析處理(COLAP)結構
6.4典型OLAP模型的數據組織與應用
6.4.1ROLAP的數據組織與應用
6.4.2MOIAP的數據組織與應用
6.4.3ROLAP與MOLAP的數據組織與應用比較
思考題
習題
討論題
第7章元數據
7.1數據倉庫中元數據的重要性
7.1.1數據倉庫的用戶需要元數據
7.1.2數據倉庫的開發者需要元數據
7.1.3數據倉庫的管理員需要元數據
7.2關于數據倉庫元數據的概念界定
7.3元數據的幾種分類方法
7.3.1按用途對元數據進行分類
7.3.2按數據倉庫功能區域劃分的元數據分類
7.3.3按元數據的活動方式進行分類
7.4元數據的作用
7.5元數據管理的體系結構
7.5.1集中的方法
7.5.2分散的方法
7.5.3分布的方法
思考題
習題
討論題
第三篇數據挖掘
第8章關聯分析
8.1關聯規則概念
8.1.1關聯規則的支持度和置信度
8.1.2關聯規則分類
8.2關聯規則挖掘算法
8.2.1Apriori算法
8.2.2強關聯規則的有效性和可行性問題
習題
討論題
第9章神經網絡算法
9.1神經網絡概念
9.1.1神經網絡原理
9.1.2人工神經網絡
9.2人工神經網絡模型
9.2.1感知器
9.2.2帶隱層的人工神經網絡
9.3前饋神經網絡
9.3.1訓練神經網絡
9.3.2后向傳播如何工作
9.3.3后向傳播算法
9.4有關神經網絡研究中應該關注的幾個問題
9.4.1關于對神經網絡的理解問題
9.4.2關于神經網絡應用中數據準備的問題
9.4.3影響神經網絡模型性能的部分因素
9.4.4學習神經網絡,需要強調以下幾個問題
習題
討論題
第10章決策樹算法
10.1決策樹分類概述
10.1.1決策樹分類步驟
10.1.2決策樹分類舉例
10.2ID3算法
10.2.1信息論基本原理
10.2.2ID3算法的基本思想與實例
10.2.3ID3算法應用中應該關注的幾個問題
習題
討論題
第11章聚類分析
11.1聚類分析概述
11.1.1聚類分析中的數據類型
11.1.2聚類分析中相異度(相似性、差異度)測度方法
11.2聚類分析方法
11.2.1劃分聚類方法
11.2.2基于密度的聚類方法
11.2.3聚類分析在數據挖掘應用中有待進一步研究的問題
習題
討論題
第四篇實驗與工具
第12章數據倉庫實驗與工具應用
第13章神經網絡建模實驗與工具應用
第14章決策樹與關聯分析實驗與工具應用
參考文獻
書摘/試閱
選擇1:基于日期和時間標記的捕獲。每次創建或更新源記錄時,記錄都會有一個關于日期和時間的標記。時間標記為數據抽取時記錄的選擇提供依據,假如運行數據抽取程序的時間是在每天下午,那么每天都將抽取前一天午夜以后的日期和時間標記的數據。可以看到,在這里數據的捕獲會在以后的時間里發生,而不是在每一個源記錄創建或更新的時候發生。
應用分析:
①如果修改的工作量比較少,那么這項技術是可行的;
②這項技術應用的前提是假設所有的相關源記錄中包括了日期和時間標記;
③這個選擇可以在任何類型的源文件上執行:
④這項技術可以捕獲源數據的最新狀態,兩次數據抽取工作之間的任何中間狀態都會丟失;
⑤如果一個源記錄在兩次抽取之間被刪除了,關于刪除的信息就不會被發現。在這種情況下,可以首先給要刪除的源記錄做上標記,運行抽取程序,然后物理地刪除這項記錄。為了解決源記錄刪除帶來的這一特殊問題,必須在源應用程序中增加更多的邏輯。
選擇2:通過文件的比較來捕獲。例如,在對產品數據的變化進行今天的數據抽取工作時,可以將今天的產品數據副本和昨天的數據副本進行完全的比較,同時也要比較記錄鍵以發現是否有插入和刪除的操作,就可以捕獲這兩個數據副本之間的變化。這項技術也稱為快照微分技術,因為它是通過比較源數據的兩個快照進行工作的。
應用分析:
①選擇這項技術必須事先復制所有相關源數據;
②這項技術雖然簡單直接,但如果是在一個大型文件中對所有各條記錄進行比較,實施是比較困難的;
③對于一些沒有交易日志或時間標記的舊數據源來說,這可能是唯一可行的方法。
二、數據轉換
數據轉換有兩個目的:一是對不同源系統中抽取出來的數據進行標準化;二是使抽取出來用于數據倉庫的屬性對決策分析用戶來說可用,并且容易理解。由于以下幾方面主要原因,經抽取得到的數據不經過轉換處理不能直接應用于數據倉庫:
第一,不同數據源中描述同一問題用的是不同的屬性值;
第二,同一含義的屬性值屬性名不同;
第三,不同數據源數據常常存在度量單位的不統一性;
第四,不同國家或地區的分支機構源數據系統中日期/時間描述標準不同;
第五,源系統中的數據可能存在不完整性;
第六,數據倉庫需要匯總的數據。
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。
優惠價:87
183
海外經銷商無庫存,到貨日平均30天至45天