TOP
0
0
三民出版.新書搶先報|最速、最優惠的新鮮貨報給你知!
數據挖掘與R語言(簡體書)
滿額折

數據挖掘與R語言(簡體書)

商品資訊

人民幣定價:49 元
定價
:NT$ 294 元
優惠價
87256
絕版無法訂購
商品簡介
作者簡介
名人/編輯推薦
目次
相關商品

商品簡介

《計算機科學叢書:數據挖掘與R語言》首先簡要介紹了R軟件的基礎知識(安裝、R數據結構、R編程、R的輸入和輸出等)。然後通過四個數據挖掘的實際案例(藻類頻率的預測、證券趨勢預測和交易系統仿真、交易欺詐預測、微陣列數據分類)介紹數據挖掘技術。這四個案例基本覆蓋了常見的數據挖掘技術,從無監督的數據挖掘技術、有監督的數據挖掘技術到半監督的數據挖掘技術。全書以實際問題、解決方案和對解決方案的討論為主線來組織內容,脈絡清晰,並且各章自成體系。讀者可以從頭至尾逐章學習,也可以根據自己的需要進行學習,找到自己實際問題的解決方案。 《計算機科學叢書:數據挖掘與R語言》不需要讀者具備R和數據挖掘的基礎知識。不管是R初學者,還是熟練的R用戶都能從書中找到對自己有用的內容。讀者既可以把本書作為學習如何應用R的一本優秀教材,也可以作為數據挖掘的工具書。.

作者簡介

Luís Torgo,葡萄牙波爾圖大學計算機科學系副教授,現在在LIAAD實驗室從事研究工作。他是APPIA會員,同時還是OBEGEF的創辦會員。.

名人/編輯推薦

《計算機科學叢書:數據挖掘與R語言》的支持網站給出了案例研究的所有代碼、數據集以及R函數包,不要求讀者具有R、數據挖掘或統計技術的基礎知識。
《計算機科學叢書:數據挖掘與R語言》利用大量給出必要步驟、代碼和數據的具體案例,詳細描述了數據挖掘的主要過程和技術。

【前言】
Data Mining with R:Learning with Case Studies
本書的主要目的是向讀者介紹如何用R進行數據挖掘。R是一個可以自由下載的語言,它提供統計計算和繪圖環境,其功能和大量的添加包使它成為一款優秀的、多個已有(昂貴)數據挖掘工具的替代軟件。
數據挖掘的一個關鍵問題是數據量。典型的數據挖掘問題包括一個大的數據庫,需要從中提取有用的信息。在本書中,我們用MySQL作為核心數據庫管理系統。對多個計算機平臺,MySQL也是免費的。這意味著,我們可以不用付任何費用就可以進行“重要的”數據挖掘任務。同時,我們希望說明解決方案質量上并沒有任何損失。昂貴的工具并不意味著一定更好!只要你愿意花時間來學習如何應用它們,R和MySQL就是一對很難超越的工具。我們認為這是值得的,希望在讀完本書之后,你也相信這點。
本書的目的不是介紹數據挖掘的各個方面。許多已有的書籍覆蓋了數據挖掘領域。我們用幾個案例來向讀者介紹R的數據挖掘能力。顯然,這幾個案例不能代表我們在現實世界中碰到的所有數據挖掘問題。同時,我們給出的解決方案也不是最完全的方案。我們的目的是通過這些實際案例向讀者介紹如何用R進行數據挖掘。因此,我們案例分析的目的是展示用R進行信息提取的例子,而不是提供數據挖掘案例的完整分析報告。它們可以作為任何數據挖掘項目的可能思路,或者作為開發數據挖掘項目解決方案的基礎。盡管如此,我們盡力嘗試覆蓋多方面的問題,展示數據大小、不同數據類型、分析目標和進行分析所必需的工具所帶來的挑戰。然而,這里的實踐方式也是有代價的。實際上,作為具體案例研究的一種形式,為了讓讀者在自己的計算機上執行我們所描述的步驟,我們也做了某些妥協。也就是說,我們不能處理太大的問題,這些問題要求的計算機資源不是每個人都具備的。盡管這樣,我們認為本書涵蓋的問題也不算小,并對不同的數據類型和維度給出了解決方案。
這里并不要求讀者具有R的先驗知識。沒有學過R和數據挖掘的讀者應該可以學習書中的案例。書中的各個案例相互獨立,讀者可以從書中任何一個案例開始。在第一個簡單案例中,給出了一些基本的R知識。這意味著,如果你沒有學過R,至少應該從第一個案例開始學習。而且,第1章給出了R和MySQL的簡介,它可以幫助你理解后面的章節。我們也沒有假設你熟悉數據挖掘和統計技術。在每個案例的必要地方,都對不同的數據挖掘技術進行了介紹。本書的目的不是向讀者介紹這些技術的理論細節和全面知識,我們對這些工具的描述包括了它們的基本性質、缺點和分析目標。如果需要進一步了解技術細節,可以參考其他書籍。在某些節的末尾,我們提供了“參考資料”,如果需要,可以參考它們。總之,本書的讀者應該是數據分析工具的用戶,而不是研究人員或者開發人員。同時,我們希望后者把本書作為進入R和數據挖掘“世界”的一種方式,從而發現本書的用途。
本書有一個免費的R代碼集,可以從本書網站下載。其中含有案例研究中的所有代碼,這可以幫助你的實踐學習。我們強烈建議讀者在閱讀本書時安裝R并實驗書中的代碼。而且,我們創建了一個名為DMwR的R添加包,它包含本書用到的多個函數和以R格式保存的案例數據集。你應該按照本書的指示,安裝并加載該添加包(第1章給出了細節)。

目次

出版者的話推薦序中文版序譯者序前言致謝第1章 簡介1.1如何閱讀本書1.2R簡介1.2.1R起步1.2.2R對象1.2.3向量1.2.4向量化1.2.5因子1.2.6生成序列1.2.7數據子集1.2.8矩陣和數組1.2.9列表1.2.10數據框1.2.11構建新函數1.2.12對象、類和方法1.2.13管理R會話1.3MySQL簡介第2章 預測海藻數量2.1問題描述與目標2.2數據說明2.3數據加載到R2.4數據可視化和摘要2.5數據缺失2.5.1將缺失部分剔除2.5.2用最高頻率值來填補缺失值2.5.3通過變量的相關關係來填補缺失值2.5.4通過探索案例之間的相似性來填補缺失值2.6獲取預測模型2.6.1多元線性回歸2.6.2回歸樹2.7模型的評價和選擇2.8預測7類海藻的頻率2.9小結第3章 預測股票市場收益3.1問題描述與目標3.2可用的數據3.2.1在R中處理與時間有關的數據3.2.2從CSV文件讀取數據3.2.3從網站上獲取數據3.2.4從MySQL數據庫讀取數據3.3定義預測任務3.3.1預測什麼3.3.2預測變量是什麼3.3.3預測任務3.3.4模型評價準則3.4預測模型3.4.1如何應用訓練集數據來建模3.4.2建模工具3.5從預測到實踐3.5.1如何應用預測模型3.5.2與交易相關的評價準則3.5.3模型集成:仿真交易3.6模型評價和選擇3.6.1蒙特卡羅估計3.6.2實驗比較3.6.3結果分析3.7交易系統3.7.1評估最終測試數據3.7.2在線交易系統3.8小結第4章 偵測欺詐交易4.1問題描述與目標4.2可用的數據4.2.1加載數據至R4.2.2探索數據集4.2.3數據問題4.3定義數據挖掘任務4.3.1問題的不同解決方法4.3.2評價準則4.3.3實驗方法4.4計算離群值的排序4.4.1無監督方法4.4.2有監督方法4.4.3半監督方法4.5小結第5章 微陣列樣本分類5.1問題描述與目標5.1.1微陣列實驗背景簡介5.1.2數據集ALL5.2可用的數據5.3基因(特徵)選擇5.3.1基於分佈特徵的簡單過濾方法5.3.2ANOVA過濾5.3.3用隨機森林進行過濾5.3.4用特徵聚類的組合進行過濾5.4遺傳學異常的預測5.4.1定義預測任務5.4.2模型評價標準5.4.3實驗過程5.4.4建模技術5.4.5模型比較5.5小結參考文獻主題索引數據挖掘術語索引R函數索引.

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 256
絕版無法訂購

暢銷榜

客服中心

收藏

會員專區