TOP
0
0
三民出版.新書搶先報|最速、最優惠的新鮮貨報給你知!
時間序列與機器學習(簡體書)
滿額折

時間序列與機器學習(簡體書)

商品資訊

人民幣定價:100 元
定價
:NT$ 600 元
優惠價
87522
庫存:2
下單可得紅利積點:15 點
商品簡介
作者簡介
名人/編輯推薦
目次
相關商品

商品簡介

本書分為8 章,內容包括時間序列分析的基礎知識、時間序列預測的常用方法,以及神經網絡在時間序列預測中的應用;時間序列異常檢測算法的技術與框架,如何識別異常的時間點及多種異常檢測方法;時間序列的相似性度量方法、聚類算法;多維時間序列在廣告分析和業務運維領域的應用,利用OLAP 技術對多維時間序列進行有效處理,通過根因分析技術獲得導致故障的維度和元素;智能運維領域(AIOps)和金融領域的兩個應用場景。

作者簡介

張戎,新加坡國立大學數學博士,深圳孔雀計劃高層次人才,數學和機器學習領域科普作家,數學、科研和深度學習等話題的優秀自媒體工作者, 曾多次擔任行業技術大會講師。博士期間從事動力系統的研究工作,博士論文中解決了非正則吸引子的存在性問題。畢業之後在工業界從事人工智能的研發工作,涉及業務包括推薦系統、安全大數據和智能運維等內容。

羅齊,碩士畢業於香港中文大學(深圳),現就職於某互聯網公司,從事算法應用研究工作,研究方向為遊戲數據挖掘和智能運維,曾參與多款熱門遊戲的數據挖掘和智能運維工作。

名人/編輯推薦

時間序列的分析、預測及異常檢測方法。

時間序列的相似性度量方法與聚類算法。

多維時間序列及其在多個場景下的應用。

編寫背景

當今時代,數據無處不在,我們在互聯網、經濟、金融、氣象等諸多領域都能見到時間序列數據的身影。有效分析這些隨時間變化的數據樣本,提煉有價值的信息,不僅有助於企業和機構的決策優化,而且對科學研究和技術創新具有重要意義。近年來,由於數據量的增加、計算能力的提升、學習算法的成熟以及應用場景的多樣化,人工智能技術(如機器學習)逐漸普及並取得了顯著的成果,越來越多的人開始關注這個充滿潛力的研究領域。ChatGPT等大語言模型亦掀起一波新的人工智能熱潮。正因如此,我們決定著手編寫一本關於時間序列分析與機器學習的圖書,希望它能作為廣大讀者的理論指南和實踐參考。我們在騰訊工作期間相識,參與過許多一線機器學習項目,其中不少與時間序列相關,如異常檢測、預測、根因定位等。我們在工作之余總結了不少這方面的技術帖子,陸續發表在知乎(數學人生/曲奇)上,訪問量頗高。電子工業出版社的張爽老師聯繫到我們,希望能夠將帖子編寫成書,並給予了很多意見,在此感謝她的支持。盡管如此,我們仍然低估了編寫圖書所面臨的困難。一方面,機器學習和深度學習技術的發展非常迅速,我們的認知也在提升和更新,擔心寫作的內容是否已經過時。另一方面,由於日常工作相當繁重,我們很難抽出連續的時間全身心地專注於寫作。因此,本書的創作是頗為艱辛的。

國內外已出版了許多關於時間序列分析和機器學習的圖書,它們各自都支撐起一個龐大的學科,與諸多經典圖書比起來,本書顯得頗為拙劣。理想中,著書立說的前提是要構建起一個完整的知識體系,該體系能容納新老技術。我們希望能夠借助自身的經驗和專業知識,對這一領域進行系統的梳理和總結。寫作本書的過程也促使我們更加深入地理解時間序列分析和機器學習。

內容概要

本書內容由8 章組成。

第1 章“時間序列概述”:介紹時間序列分析的基礎知識、發展歷程、應用現狀、分類及其與其他領域(如自然語言處理、計算機視覺等)的關聯。

第2 章“時間序列的信息提取”:介紹特徵工程的核心概念及其在時間序列分析中的應用,比如對原始數據進行歸一化、缺失值填充等轉換;以及如何通過特徵工程從時間序列數據中提取有用的特徵,例如時間序列的統計特徵、熵特徵和降維特徵等,以及如何判斷時間序列的單調性。

第3 章“時間序列預測”:介紹常用的時間序列預測方法,包括自回歸模型、移動平均模型、自回歸差分移動平均模型、指數平滑方法、Prophet,以及神經網絡,例如循環神經網絡、長短期記憶網絡、Transformer、Informer 等。

第4 章“時間序列異常檢測”:介紹時間序列異常檢測算法的技術與框架,如何識別異常的時間點,包括基於概率密度的方法(如3-Sigma、核密度估計)、基於重構的方法(如變分自編碼器、Donut)、基於距離的方法(如孤立森林、RRCF)、基於有監督的方法和基於弱監督的方法等。

第5 章“時間序列的相似度與聚類”:介紹時間序列的相似性度量方法,如歐氏距離、動態時間規整算法等,用於衡量兩個或多個時間序列在形狀和模式上的相似程度;聚類算法,如K-Means、DBSCAN等,可以將相似的時間序列分組,以便進一步理解時間序列數據中的結構和模式。

第6 章“多維時間序列”:介紹多維時間序列在廣告分析和業務運維領域的應用,包括如何利用OLAP 技術對多維時間序列進行有效處理,以及如何通過根因分析技術獲得導致故障的維度和元素,包括基於時間序列異常檢測算法的根因分析、基於熵的根因分析、基於樹模型的根因分析、規則學習等。

第7 章“智能運維的應用場景”:介紹智能運維領域的應用,包括指標監控、容量預估、彈性伸縮、告警關聯、告警收斂和告警系統評估等,以及監控中出現的節假日效應、持續異常等實際情況。

第8 章“金融領域的應用場景”:介紹量化交易的概念、發展歷程,如何通過因子挖掘從時間序列數據中提取特徵並將其轉化為交易策略,以及機器學習在其他金融領域(包括資產定價、資產配置、波動率預測)的應用。

讀者定位

本書主要面向以下四類讀者群體。

  1. 機器學習領域的研究人員

針對機器學習領域的研究人員,本書將深入探討時間序列相關的各種技術。你將了解到如何將這些技術應用於實際問題中,並且能夠深入理解這些方法的工作原理和優劣之處。本書中還引用了大量的參考文獻,其中不少來自計算機領域頂級會議,適合作為擴展閱讀材料。

  1. 時間序列領域的研究人員

本書為時間序列領域的研究人員提供了一個全面的時間序列分析和預測的框架。你將找到最新的研究成果和趨勢,以及深入的理論分析。同時,你將看到如何將時間序列方法應用到各種真實場景中,如金融、運維等領域。

  1. 工業界從業者

針對工業界的從業者,本書將提供實用的工具和技術,以幫助你更好地處理時間序列數據。你將學習到如何使用不同的模型和算法來預測未來、檢測異常、進行聚類等。本書中包含大量的示例和案例研究,可以讓你快速地掌握這些技術,並將其應用到你的工作中。

  1. 未來想從事時間序列研究的高年級本科生和研究生

本書也適合想要進入時間序列研究領域的高年級本科生和研究生。本書從基礎概念開始學習,逐漸深入更複雜的主題,內容深入淺出,實例豐富,可以幫助你理解和掌握時間序列分析的基本技能,並激發你對這個領域的學習和研究興趣。

總的來說,無論你是初學者,還是有經驗的專業人士,本書都將為你提供有價值的知識。我們希望本書能夠激發你學習時間序列分析和機器學習的熱情,引導你探索這個充滿挑戰和機會的領域。

目次

第1 章時間序列概述 1
1.1 發展歷程 1
1.2 應用現狀 3
1.3 時間序列分類4
1.3.1 單維時間序列4
1.3.2 多維時間序列6
1.4 小結 8
第2 章時間序列的信息提取 9
2.1 特徵工程的入門知識9
2.1.1 特徵工程簡介9
2.1.2 數值型特徵 12
2.1.3 類別型特徵 17
2.1.4 交叉特徵 17
2.2 時間序列的預處理 18
2.2.1 時間序列的缺失值 18
2.2.2 時間序列的縮放 20
2.3 時間序列的特徵工程24
2.4 時間序列的統計特徵28
2.5 時間序列的熵特徵 32
2.6 時間序列的降維特徵38
2.6.1 分段聚合逼近38
2.6.2 分段線性逼近39
2.6.3 分段常數逼近41
2.6.4 符號逼近 42
2.6.5 最大三角形三桶算法43
2.6.6 用神經網絡自動生成特徵的算法 44
2.7 時間序列的單調性 53
2.7.1 線性擬合方法54
2.7.2 控制圖方法 55
2.7.3 均線方法 60
2.8 小結 63
第3 章時間序列預測 64
3.1 時間序列預測的統計方法 65
3.1.1 自回歸差分移動平均模型 65
3.1.2 指數平滑方法72
3.1.3 Prophet 75
3.2 時間序列預測的深度學習方法 83
3.2.1 循環神經網絡83
3.2.2 長短期記憶網絡 85
3.2.3 Transformer 90
3.2.4 Informer96
3.3 小結·100
第4 章時間序列異常檢測 101
4.1 異常類型及檢測方法分類 101
4.2 基於概率密度的方法 104
4.2.1 核密度估計原理 104
4.2.2 核密度估計方法 106
4.3 基於重構的方法 111
4.3.1 變分自編碼器 111
4.3.2 Donut 115
4.4 基於距離的方法 117
4.4.1 孤立森林 118
4.4.2 RRCF 121
4.5 基於有監督的方法 125
4.6 基於弱監督的方法 127
4.7 小結 129
第5 章時間序列的相似度與聚類 130
5.1 相似度函數 130
5.1.1 經典的相似度函數 131
5.1.2 基於分段聚合逼近的相似度函數 134
5.1.3 基於時間序列平滑的相似度函數 135
5.1.4 基於神經網絡的相似度算法 136
5.2 距離函數 137
5.2.1 歐氏距離 138
5.2.2 DTW 算法139
5.2.3 基於相似性的距離 140
5.2.4 基於符號特徵的距離 141
5.2.5 基於自相關性的距離 142
5.2.6 基於周期性的距離 143
5.2.7 基於模型的距離 144
5.3 基於特徵工程的聚類算法 145
5.4 基於距離和相似度的聚類算法 149
5.5 流式聚類算法 151
5.6 小結 154
第6 章多維時間序列 155
6.1 多維時間序列簡介155
6.2 單維時間序列與多維時間序列 156
6.2.1 廣告分析領域 156
6.2.2 業務運維領域 157
6.3 單維時間序列監控系統和多維時間序列監控系統的對比 159
6.4 根因分析 160
6.4.1 根因分析的基礎概念 160
6.4.2 人工執行根因分析的難度 163
6.4.3 OLAP 技術和方法 164
6.5 基於時間序列異常檢測算法的根因分析 165
6.5.1 時間序列異常檢測 165
6.5.2 根因分析的列表結構 170
6.5.3 根因分析的樹狀結構 172
6.6 基於熵的根因分析 173
6.6.1 熵的概念和性質 173
6.6.2 概率之間的距離 174
6.6.3 基於熵的根因分析方法 177
6.7 基於樹模型的根因分析 187
6.7.1 特徵工程和樣本 187
6.7.2 決策樹算法 187
6.8 規則學習 188
6.8.1 根因分析的列表結構 188
6.8.2 根因分析的樹狀結構 189
6.8.3 列表結構與樹狀結構的對比 191
6.8.4 規則的排序 192
6.9 小結 193
第7 章智能運維的應用場景 194
7.1 智能運維 194
7.1.1 智能運維的主要方向 195
7.1.2 智能運維的實施路徑 196
7.2 指標監控 197
7.2.1 硬件監控與軟件監控 198
7.2.2 業務監控 198
7.2.3 節假日效應 201
7.2.4 持續異常的情況 205
7.2.5 存在基線的情況 205
7.2.6 尋找基線的方法 206
7.3 容量預估和彈性伸縮 208
7.3.1 容量預估 208
7.3.2 彈性伸縮 209
7.4 告警系統 210
7.4.1 告警系統的定義與評估指標 210
7.4.2 告警關聯與收斂 212
7.4.3 基於相似性或聚類算法的告警關聯與收斂 214
7.4.4 基於告警屬性泛化層次的告警關聯與收斂 219
7.4.5 基於根因分析的告警關聯與收斂 224
7.5 小結 226
第8 章金融領域的應用場景 228
8.1 量化交易概述 229
8.1.1 數據230
8.1.2 因子 230
8.1.3 回測 231
8.2 因子特徵工程 231
8.3 資產定價 234
8.4 資產配置 241
8.5 波動率預測 243
8.6 小結 245
參考文獻 246

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 522
庫存:2

暢銷榜

客服中心

收藏

會員專區