商品簡介
目次
書摘/試閱
相關商品
商品簡介
《高等學校計算機專業“十二五”規劃教材:數據挖掘原理、算法及應用》以各類數據挖掘算法為核心,以智能數據分析技術的發展為主線,結合作者自身的研究和應用經驗,闡述數據挖掘研究領域的主要理論和典型算法。全書共分8章:第1章為緒論;第2-5章分別介紹數據挖掘的主要技術、各類典型算法及其編程實現,包括數據預處理技術,關聯規則挖掘技術、分類技術,聚類技術等幾大類技術和其中包含的典型算法;第6-8章分別簡要介紹一些數據挖掘的應用專題,包括時間序列數據挖掘、Weh挖掘、空間數據挖掘等。
目次
第1章 緒論
1.1 數據挖掘的概念和定義
1.2 數據挖掘的歷史及發展
1.3 數據挖掘的研究內容及功能
1.4 數據挖掘的常用技術及工具
1.5 數據挖掘的應用熱點
1.6 小結
習題
第2章 數據預處理
2.1 數據預處理的目的
2.2 數據清理
2.3 數據集成和數據變換
2.4 數據歸約
2.5 數據離散化和概念分層
2.6 特征選擇與提取
2.7 小結
習題
第3章 關聯規則挖掘
3.1 基本概念
3.2 關聯規則挖掘算法
3.3 Apriori改進算法
3.4 不候選產生挖掘頻繁項集
3.5 使用垂直數據格式挖掘頻繁項集
3.6 挖掘閉頻繁項集
3.7 挖掘各種類型的關聯規則
3.8 相關分析
3.9 肇于約束的關聯規則
3.10 矢量空間數據庫中關聯規則的挖掘
3.11 小結
習題
第4章 分類和預測
4.1 分類和預測的基本概念和步驟
4.2 基于相似性的分類算法
4.3 決策樹分類算法
4.4 貝葉斯分類算法
4.5 人工神經網絡(ANN)
4.6 支持向量機
4.7 預測
4.8 預測和分類中的準確率
4.9 評估分類器或預測器的準確率
4.10 小結
習題
第5章 聚類方法
5.1 概述
5.2 劃分聚類方法
5.3 層次聚方法
5.4 密度聚類方法 聚類結構
5.5 基于網格聚類方法 變換聚類 聚類方法
5.6 神經網絡聚類方法:SOM
5.7 異常檢測
5.8 小結
習題
第6章 時間序列數據挖掘
6.1 概述
6.2 時間序列數據建模
6.3 時間序列預測
6.4 時間序列數據庫相似搜索
6.5 從時間序列數據中發現感興趣模式
6.6 小結
習題
第7章 Web挖掘
7.1 挖掘的分類及基數據來源
7.2 Web日志挖掘
7.3 Web內容挖掘
7.4 小結
習題
第8章 復雜類型數據挖掘
8.1 空間數據挖掘 空間OLAP
8.2 文本數據挖掘
8.3 多媒體數據挖掘 遙感影像分類
8.4小結
習題
參考文獻
1.1 數據挖掘的概念和定義
1.2 數據挖掘的歷史及發展
1.3 數據挖掘的研究內容及功能
1.4 數據挖掘的常用技術及工具
1.5 數據挖掘的應用熱點
1.6 小結
習題
第2章 數據預處理
2.1 數據預處理的目的
2.2 數據清理
2.3 數據集成和數據變換
2.4 數據歸約
2.5 數據離散化和概念分層
2.6 特征選擇與提取
2.7 小結
習題
第3章 關聯規則挖掘
3.1 基本概念
3.2 關聯規則挖掘算法
3.3 Apriori改進算法
3.4 不候選產生挖掘頻繁項集
3.5 使用垂直數據格式挖掘頻繁項集
3.6 挖掘閉頻繁項集
3.7 挖掘各種類型的關聯規則
3.8 相關分析
3.9 肇于約束的關聯規則
3.10 矢量空間數據庫中關聯規則的挖掘
3.11 小結
習題
第4章 分類和預測
4.1 分類和預測的基本概念和步驟
4.2 基于相似性的分類算法
4.3 決策樹分類算法
4.4 貝葉斯分類算法
4.5 人工神經網絡(ANN)
4.6 支持向量機
4.7 預測
4.8 預測和分類中的準確率
4.9 評估分類器或預測器的準確率
4.10 小結
習題
第5章 聚類方法
5.1 概述
5.2 劃分聚類方法
5.3 層次聚方法
5.4 密度聚類方法 聚類結構
5.5 基于網格聚類方法 變換聚類 聚類方法
5.6 神經網絡聚類方法:SOM
5.7 異常檢測
5.8 小結
習題
第6章 時間序列數據挖掘
6.1 概述
6.2 時間序列數據建模
6.3 時間序列預測
6.4 時間序列數據庫相似搜索
6.5 從時間序列數據中發現感興趣模式
6.6 小結
習題
第7章 Web挖掘
7.1 挖掘的分類及基數據來源
7.2 Web日志挖掘
7.3 Web內容挖掘
7.4 小結
習題
第8章 復雜類型數據挖掘
8.1 空間數據挖掘 空間OLAP
8.2 文本數據挖掘
8.3 多媒體數據挖掘 遙感影像分類
8.4小結
習題
參考文獻
書摘/試閱
第1章 緒 論
1.1 數據挖掘的概念和定義
數據挖掘(Date Mjjling)是近年來隨著人工智能和數據庫技術的發展而出現的一門新興技術。它是從大量的數據中篩選出有效的、可信的以及隱含信息的高級處理過程。
數據挖掘包含豐富的內涵,是一個多學科交叉的研究領域。僅從從事研究和開發的人員來說,其涉及范圍之廣是其他領域所難以企及的,既有大學里的專門研究人員.也有商業公司的專家和技術人員。研究背景的不同會使他們從不同的角度來看待數據挖掘的概念。因此,理解數據挖掘的概念不是簡單地下個定義就能解決的問題。
1.1.1 從商業角度看數據挖掘技術
數據挖掘是一種新的商業信息處理技術。數據挖掘技術把人們對數據的應用從低層次的聯機查詢操作提高到決策支持、分析預測等更高級的應用上。通過對特定數據進行微觀、中觀乃至宏觀的統計、分析、綜合和推理.發現數據間的關聯性、未來趨勢以及一般性的概括知識等,這些知識性的信息可以用來指導高級商務活動,如顧客分析、定向營銷、工作流管理、商店分布和欺詐監測等。
原始數據只是未被開采的礦山,需要挖掘和提煉才能獲得對商業目的有用的規律性知識。這正是數據挖掘這個名字的由來。因此,從商業角度看.數據挖掘就是按企業的業務目標,對大量的企業數據進行深層次分析,以揭示隱藏的、未知的規律并將其模型化,從而支持商業決策活動的技術。從商業應用角度刻畫數據挖掘,可以使人們更全面地了解數據挖掘的真正含義。
1.1.2數據挖掘的技術含義
談到數據挖掘,必須提到另外一個名詞:數據庫中的知識發現( Knowledge Discovery in Databases,KDD).即將來加工的數據轉換為有用信息的整個過程。KDD這個術語首次出現在1989年8月在美國底特律召開的第十一屆國際人工智能聯合會議的專題討論會上。
隨後,在近十年的發展過程中.KDD專題討論會逐漸發展壯大。19999年在美國聖地亞哥舉行的第五屆KDD國際學術大會,參加人數近千人,投稿280多篇,近年來的國際會議涉及的范圍更廣,如數據挖掘與知識發現(Data Mining and Knowledge Discovery,DMKD)的基礎理論、新的發現算法、數據挖掘與數據倉庫及OLAP的結合、可視化技術、知識表示方法、Web中的數據挖掘等。此外,IEEE、ACM、IFIS、VLDB、SIGMOD等其他學會、學刊也紛紛把DMKD列為會議議題或出版專刊,成為當前國際上的一個研究熱點。
關于KDD和Data Mining的關系,有許多不同的看法。我們可以從這些不同的觀點中了解數據挖掘的技術含義。
1)將KDD看成數據挖掘的例子之一
這一馬點在數據挖掘發展的早期比較流行,并且可以在許多文獻中看到這種說法,其主要觀點是數據庫中的知識發現僅是數據挖掘的一個方面,因為數據挖掘系統可以在關系數據庫存(Relational Database)、事務數據庫(Transactional Database)、數據倉庫(DataWarehouses Warehouses)、空間數據庫(Spatial Databade)、文本數據(Text Data)以及諸如Web等多種數據組織形式中挖掘知識。從這個意義上來說.數據挖掘就是從數據庫、數據倉庫以及其他數據存儲主式中挖掘有用知識的過程。
2)數據挖掘是KDD不可缺少的一部分
為了統一認識Fayyd、Piatetsky-Shapiro和Smyth在1996年出版的權威論文集《知識發現與數據進展》中給出了KDD和數據挖掘的最新定義:KDD是從數據中辨別有效的、新穎的、潛在有用的、最終可理解的模式的過程;數據挖掘是KDD中通過特定的算法在可接受的計算效率限制內生成特定模式的一個步驟。
這種觀點得到了大多數學者的認同。它將KDD看做是一個廣義的范疇,包括數據清理、數據集成、數據選擇、數據轉換、數據挖掘、模式牛成及評估等一系列步驟,這樣,我們可以把KDD看做是由一些基本功能構件組成的系統化協同工作系統.而數據挖掘則是這個系統中的一個關鍵的部分。源數據經過清理和轉換等步驟成為適合挖掘的數據集,數據挖掘在這種具有固定形式的數據集上完成知識的提煉,最後以合適的知識模式用于進一步的分析決策工作。將數據挖掘作為KDD的一個重要步驟看待,可以使我們更容易聚焦研究重點,有效解決問題。目前,人們對于數據挖掘算法的研究基本屬于這樣的范疇。
3) KDD與Data Mining的含義相同
有些人認為.KDD與Data Mining只是對同-個概念的不同叫法。事實上,在現今的許多文獻(如技術綜述等)中,這兩個術語仍然不加區分地使用著。有人說.KDD在人工智能界更流行,而Data Mining在數據庫界使用更多,也有人說,一般在研究領域稱之為KDD,在工程領域則稱之為數據挖掘。
實際上,數據挖掘的概念有廣義和狹義之分。廣義的定義址,數槲挖掘是從大型數據集(可能是不完全的、有噪聲的、不確定性的、各種存儲形式的)中,挖掘隱含在其中的、人們事先不知道的、對決策有用的知識的過程。狹義的定義址,數據挖掘是從特定形式的數據集中提煉知識的過程。
綜上所述,數據挖掘概念可以從不同的技術層面上來理解.但是其核心仍然是從數據中挖掘知識。所以,有人說叫知識挖掘更合適。本書也在不同的章節使用數掘挖掘的廣義或狹義概念,讀者要注意根據上下文加以區分。當然,在可能混淆的地方.我們將明確說明。
1.2 數據挖掘的歷史及發展
數據挖掘可以看做是信息技術悄然演化的結果。像其他新技術的發展歷程一樣,數據挖掘也必須經過概念提出、概念接受、廣泛研究和探索、逐步應用和大量應用等階段。從目前的現狀看,大部分學者認為數據挖掘的研究仍然處于廣泛研究和探索階段。
……
1.1 數據挖掘的概念和定義
數據挖掘(Date Mjjling)是近年來隨著人工智能和數據庫技術的發展而出現的一門新興技術。它是從大量的數據中篩選出有效的、可信的以及隱含信息的高級處理過程。
數據挖掘包含豐富的內涵,是一個多學科交叉的研究領域。僅從從事研究和開發的人員來說,其涉及范圍之廣是其他領域所難以企及的,既有大學里的專門研究人員.也有商業公司的專家和技術人員。研究背景的不同會使他們從不同的角度來看待數據挖掘的概念。因此,理解數據挖掘的概念不是簡單地下個定義就能解決的問題。
1.1.1 從商業角度看數據挖掘技術
數據挖掘是一種新的商業信息處理技術。數據挖掘技術把人們對數據的應用從低層次的聯機查詢操作提高到決策支持、分析預測等更高級的應用上。通過對特定數據進行微觀、中觀乃至宏觀的統計、分析、綜合和推理.發現數據間的關聯性、未來趨勢以及一般性的概括知識等,這些知識性的信息可以用來指導高級商務活動,如顧客分析、定向營銷、工作流管理、商店分布和欺詐監測等。
原始數據只是未被開采的礦山,需要挖掘和提煉才能獲得對商業目的有用的規律性知識。這正是數據挖掘這個名字的由來。因此,從商業角度看.數據挖掘就是按企業的業務目標,對大量的企業數據進行深層次分析,以揭示隱藏的、未知的規律并將其模型化,從而支持商業決策活動的技術。從商業應用角度刻畫數據挖掘,可以使人們更全面地了解數據挖掘的真正含義。
1.1.2數據挖掘的技術含義
談到數據挖掘,必須提到另外一個名詞:數據庫中的知識發現( Knowledge Discovery in Databases,KDD).即將來加工的數據轉換為有用信息的整個過程。KDD這個術語首次出現在1989年8月在美國底特律召開的第十一屆國際人工智能聯合會議的專題討論會上。
隨後,在近十年的發展過程中.KDD專題討論會逐漸發展壯大。19999年在美國聖地亞哥舉行的第五屆KDD國際學術大會,參加人數近千人,投稿280多篇,近年來的國際會議涉及的范圍更廣,如數據挖掘與知識發現(Data Mining and Knowledge Discovery,DMKD)的基礎理論、新的發現算法、數據挖掘與數據倉庫及OLAP的結合、可視化技術、知識表示方法、Web中的數據挖掘等。此外,IEEE、ACM、IFIS、VLDB、SIGMOD等其他學會、學刊也紛紛把DMKD列為會議議題或出版專刊,成為當前國際上的一個研究熱點。
關于KDD和Data Mining的關系,有許多不同的看法。我們可以從這些不同的觀點中了解數據挖掘的技術含義。
1)將KDD看成數據挖掘的例子之一
這一馬點在數據挖掘發展的早期比較流行,并且可以在許多文獻中看到這種說法,其主要觀點是數據庫中的知識發現僅是數據挖掘的一個方面,因為數據挖掘系統可以在關系數據庫存(Relational Database)、事務數據庫(Transactional Database)、數據倉庫(DataWarehouses Warehouses)、空間數據庫(Spatial Databade)、文本數據(Text Data)以及諸如Web等多種數據組織形式中挖掘知識。從這個意義上來說.數據挖掘就是從數據庫、數據倉庫以及其他數據存儲主式中挖掘有用知識的過程。
2)數據挖掘是KDD不可缺少的一部分
為了統一認識Fayyd、Piatetsky-Shapiro和Smyth在1996年出版的權威論文集《知識發現與數據進展》中給出了KDD和數據挖掘的最新定義:KDD是從數據中辨別有效的、新穎的、潛在有用的、最終可理解的模式的過程;數據挖掘是KDD中通過特定的算法在可接受的計算效率限制內生成特定模式的一個步驟。
這種觀點得到了大多數學者的認同。它將KDD看做是一個廣義的范疇,包括數據清理、數據集成、數據選擇、數據轉換、數據挖掘、模式牛成及評估等一系列步驟,這樣,我們可以把KDD看做是由一些基本功能構件組成的系統化協同工作系統.而數據挖掘則是這個系統中的一個關鍵的部分。源數據經過清理和轉換等步驟成為適合挖掘的數據集,數據挖掘在這種具有固定形式的數據集上完成知識的提煉,最後以合適的知識模式用于進一步的分析決策工作。將數據挖掘作為KDD的一個重要步驟看待,可以使我們更容易聚焦研究重點,有效解決問題。目前,人們對于數據挖掘算法的研究基本屬于這樣的范疇。
3) KDD與Data Mining的含義相同
有些人認為.KDD與Data Mining只是對同-個概念的不同叫法。事實上,在現今的許多文獻(如技術綜述等)中,這兩個術語仍然不加區分地使用著。有人說.KDD在人工智能界更流行,而Data Mining在數據庫界使用更多,也有人說,一般在研究領域稱之為KDD,在工程領域則稱之為數據挖掘。
實際上,數據挖掘的概念有廣義和狹義之分。廣義的定義址,數槲挖掘是從大型數據集(可能是不完全的、有噪聲的、不確定性的、各種存儲形式的)中,挖掘隱含在其中的、人們事先不知道的、對決策有用的知識的過程。狹義的定義址,數據挖掘是從特定形式的數據集中提煉知識的過程。
綜上所述,數據挖掘概念可以從不同的技術層面上來理解.但是其核心仍然是從數據中挖掘知識。所以,有人說叫知識挖掘更合適。本書也在不同的章節使用數掘挖掘的廣義或狹義概念,讀者要注意根據上下文加以區分。當然,在可能混淆的地方.我們將明確說明。
1.2 數據挖掘的歷史及發展
數據挖掘可以看做是信息技術悄然演化的結果。像其他新技術的發展歷程一樣,數據挖掘也必須經過概念提出、概念接受、廣泛研究和探索、逐步應用和大量應用等階段。從目前的現狀看,大部分學者認為數據挖掘的研究仍然處于廣泛研究和探索階段。
……
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。