商品簡介
作者簡介
名人/編輯推薦
目次
書摘/試閱
相關商品
商品簡介
《粒度計算在數據挖掘中的應用研究》對模糊粒度計算在文本軟聚類中的應用進行了深入研究,提出了一種基于模糊粒度計算的聚類方法,并且利用該聚類方法對K-means算法進行了優化。基于模糊粒度計算的聚類是通過歸一化的距離函數將聚類問題映射到距離空間,調節粒度產生對文本集合D的動態聚類劃分。
動態聚類既可以作為一個單獨的聚類結果,也可以作為其他算法的一個預處理步驟。K-means算法是一種經典的聚類算法,速度快、消耗資源小,但是算法對初始聚類中心點敏感,容易陷入局部最小值。《粒度計算在數據挖掘中的應用研究》將基于模糊粒度計算的聚類方法作為K-means算法的預處理步驟,實驗結果證明,這種預處理有效地消除了K-means算法的初始值敏感問題,優化了K-means算法。
動態聚類既可以作為一個單獨的聚類結果,也可以作為其他算法的一個預處理步驟。K-means算法是一種經典的聚類算法,速度快、消耗資源小,但是算法對初始聚類中心點敏感,容易陷入局部最小值。《粒度計算在數據挖掘中的應用研究》將基于模糊粒度計算的聚類方法作為K-means算法的預處理步驟,實驗結果證明,這種預處理有效地消除了K-means算法的初始值敏感問題,優化了K-means算法。
作者簡介
張霞,女,河北省石家莊市人。
曾先後于蘭州商學院經濟信息管理系獲得工學學士、北京科技大學信息工程學院獲得工學碩士。
2004年師從尹怡欣教授,就讀于北京科技大學信息工程學院控制理論與控制工程專業,并于2009年6月獲工學博士學位。自1998年至今,在河北經貿大學從事計算機教學的工作。曾主持河北省教育廳科研計劃項目、河北省科學技術研究與發展計劃項目:參與河北省科技支撐計劃項目、河北省教育廳教改課題以及河北省哲學社會科學規劃辦公室等多項課題;發表近20篇核心期刊學術論文,其中4篇為EI收錄論文。主要研究方向:數據挖掘、模式識別。
曾先後于蘭州商學院經濟信息管理系獲得工學學士、北京科技大學信息工程學院獲得工學碩士。
2004年師從尹怡欣教授,就讀于北京科技大學信息工程學院控制理論與控制工程專業,并于2009年6月獲工學博士學位。自1998年至今,在河北經貿大學從事計算機教學的工作。曾主持河北省教育廳科研計劃項目、河北省科學技術研究與發展計劃項目:參與河北省科技支撐計劃項目、河北省教育廳教改課題以及河北省哲學社會科學規劃辦公室等多項課題;發表近20篇核心期刊學術論文,其中4篇為EI收錄論文。主要研究方向:數據挖掘、模式識別。
名人/編輯推薦
《粒度計算在數據挖掘中的應用研究》是信息處理的一種新的概念和計算范式,覆蓋了所有和粒度相關的理論、方法、技術和工具的信息,主要用于描述和處理不確定的、模糊的、不完整的和海量的信息以及提供一種基于粒和粒間關系的問題求解方法。作為一個新興領域的研究,國內外相關研究人員提供了一些粒度計算的理論基礎,并且為檢驗知識發現過程的有效性、解決實際問題提供了一條可行途徑。
張霞的這本《粒度計算在數據挖掘中的應用研究》對模糊粒度計算在文本軟聚類中的應用進行了深入研究,提出了一種基于模糊粒度計算的聚類方法,并且利用該聚類方法對K-means算法進行了優化。
張霞的這本《粒度計算在數據挖掘中的應用研究》對模糊粒度計算在文本軟聚類中的應用進行了深入研究,提出了一種基于模糊粒度計算的聚類方法,并且利用該聚類方法對K-means算法進行了優化。
目次
1 緒論
1.1 課題背景和意義
1.2 課題研究內容
1.3 主要創新點
1.4 本書的邏輯結構
2 文獻綜述
2.1 數據挖掘概述
2.2 粒度計算在數據挖掘中的應用
2.3 粒度計算數據挖掘研究中需要進一步解決的問題
2.4 本書的研究內容及特點
2.5 小結
3 基于模糊粒度計算的聚類
3.1 引言
3.2 模糊聚類分析
3.3 模糊粒度聚類基礎
3.4 基于模糊粒度計算的文本聚類
3.5 基于模糊粒度計算的農業經濟劃分
3.6 基于模糊粒度計算的K-means優化算法
3.7 小結
4 基于粒網絡生成規則的文本分類
4.1 引言
4.2 基于集合論的粒度分類基礎
4.3 基于規則的機器學習
4.4 基于粒度計算的分類
4.5 基于粒網絡生成規則的分類模型
4.6 基于粒網絡生成規則的文本情感分類
4.7 小結
5 基于信息粒度的不完備系統遺漏值補齊
5.1 引言
5.2 粗糙集理論基本概念
5.3 知識發現中的不完備信息問題
5.4 不完備信息系統
5.5 不完備信息系統粒度模型構建
5.6 基于信息粒度的遺漏值補齊
5.7 決策規則的不確定性表示與度量
5.8 實驗結果和分析
5.9 小結
6 結論
參考文獻
附錄
後記
1.1 課題背景和意義
1.2 課題研究內容
1.3 主要創新點
1.4 本書的邏輯結構
2 文獻綜述
2.1 數據挖掘概述
2.2 粒度計算在數據挖掘中的應用
2.3 粒度計算數據挖掘研究中需要進一步解決的問題
2.4 本書的研究內容及特點
2.5 小結
3 基于模糊粒度計算的聚類
3.1 引言
3.2 模糊聚類分析
3.3 模糊粒度聚類基礎
3.4 基于模糊粒度計算的文本聚類
3.5 基于模糊粒度計算的農業經濟劃分
3.6 基于模糊粒度計算的K-means優化算法
3.7 小結
4 基于粒網絡生成規則的文本分類
4.1 引言
4.2 基于集合論的粒度分類基礎
4.3 基于規則的機器學習
4.4 基于粒度計算的分類
4.5 基于粒網絡生成規則的分類模型
4.6 基于粒網絡生成規則的文本情感分類
4.7 小結
5 基于信息粒度的不完備系統遺漏值補齊
5.1 引言
5.2 粗糙集理論基本概念
5.3 知識發現中的不完備信息問題
5.4 不完備信息系統
5.5 不完備信息系統粒度模型構建
5.6 基于信息粒度的遺漏值補齊
5.7 決策規則的不確定性表示與度量
5.8 實驗結果和分析
5.9 小結
6 結論
參考文獻
附錄
後記
書摘/試閱
概念歸納(Concept Induction)方法。這種方法來源于機器學習。我們知道,典型的示例學習把樣本分成正樣本和負樣本,學習的結果就是形成覆蓋所有正樣本但不覆蓋任何負樣本的概念描述。關于這類學習算法可以在經典的機器學習的教程中找到,這里不再贅述。但是,要把這種思想應用到數據挖掘中要解決兩個關鍵問題。第一,必須擴大樣本集的容量和范圍。傳統的機器學習希望是精練的小樣本集,而數據挖掘系統必須忠實于源數據,是面向大容量數據庫等存儲數據集的。所以,擴大後的樣本集可能難于有效地精確實現“覆蓋所有正樣本但不覆蓋任何負樣本”的概念歸納目標。要結合概率統計方法,在檢驗部分正樣本或負樣本情況下得到概念的描述。因此,最大限度地使用樣本進行歸納就是必須解決的關鍵問題之一。第二,對于數據挖掘系統來說,正樣本來自源數據庫,而負樣本是不可能在源數據庫中直接存儲的,但是缺乏對比類信息的概念歸納是不可靠的。因此,從源數據庫中形成負樣本(或區別性信息)以及相關的評價區別的度量方法等也是要解決的另一個重要問題。
?多維數據分析可以看做一種廣義知識挖掘的有效方法。數據分析的經常性工作是數據的聚集,諸如計數、求和、平均、最大值等。既然很多聚集函數需經常重復計算,而且這類操作的計算量一般又特別大,因此一種很自然的想法是,把這些匯總的操作結果預先計算并存儲起來,以便于高級數據分析使用。最流行的存儲匯集數據類的方法是多維數據庫(Multi-dimension Database)技術。多維數據庫總是提供不同抽象層次上的數據視圖。例如,可以存放每周的數據,也可在月底形成月數據,月數據又能形成年數據。關于多維數據模型的操作,已經被很好研究,許多文獻可能和數據倉庫、OLAP聯系起來。其實,這種模型,特別是它操作的完備性(如上鉆、下鉆等),可以成為廣義知識發現的基礎。
?多維數據分析可以看做一種廣義知識挖掘的有效方法。數據分析的經常性工作是數據的聚集,諸如計數、求和、平均、最大值等。既然很多聚集函數需經常重復計算,而且這類操作的計算量一般又特別大,因此一種很自然的想法是,把這些匯總的操作結果預先計算并存儲起來,以便于高級數據分析使用。最流行的存儲匯集數據類的方法是多維數據庫(Multi-dimension Database)技術。多維數據庫總是提供不同抽象層次上的數據視圖。例如,可以存放每周的數據,也可在月底形成月數據,月數據又能形成年數據。關于多維數據模型的操作,已經被很好研究,許多文獻可能和數據倉庫、OLAP聯系起來。其實,這種模型,特別是它操作的完備性(如上鉆、下鉆等),可以成為廣義知識發現的基礎。
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。