TOP
0
0
【簡體曬書節】 單本79折,5本7折,優惠只到5/31,點擊此處看更多!
分層強化學習理論與方法(簡體書)
滿額折

分層強化學習理論與方法(簡體書)

商品資訊

人民幣定價:19 元
定價
:NT$ 114 元
優惠價
8799
絕版無法訂購
相關商品
商品簡介
目次

商品簡介

《分層強化學習理論與方法》可作為高等院校和科研機構從事計算機應用、人工智能和機器學習等相關專業和方向的教師、研究人員、研究生及高年級本科生參考使用。強化學習通過試錯與環境交互獲得策略的改進,其自學習和在線學習的特點使其成為機器學習研究的一個重要分支。但是,強化學習一直被維數災難所困擾,近年來,分層強化學習在克服維數災難方面取得了顯著進展。《分層強化學習理論與方法》系統地介紹了強化學習、分層強化學習的理論基礎和學習算法以及作者在分層強化學習領域的研究成果和該領域的最新研究進展。

目次

第1章 緒論
1.1 機器學習
1.1.1 機器學習的定義
1.1.2 機器學習的發展史
1.1.3 機器學習系統的基本模型
1.1.4 機器學習的主要策略
1.2 強化學習
1.2.1 強化學習的定義
1.2.2 強化學習的發展史
1.3 分層強化學習
1.3.1 分層強化學習的定義
1.3.2 研究現狀與發展趨勢

第2章 強化學習
2.1 強化學習的基本原理
2.2 強化學習的基本方法
2.3 部分可觀測馬氏過程

第3章 分層強化學習
3.1 半馬氏過程
3.2 分層與抽象
3.3 典型分層強化學習方法
3.3.1 Option分層強化學習方法
3.3.2 HAM分層強化學習方法
3.3.3 MAXQ分層強化學習方法
3.3.4 典型分層強化學習方法的比較分析
3.4 OMQ分層強化學習方法
3.4.1 測試用例描述
3.4.2 OMQ理論框架
3.4.3 OMQ學習算法
3.4.4 OMQ學習算法最優性分析
3.4.5 OMQ學習算法收斂性證明
3.4.6 OMQ學習算法實驗分析

第4章 動態分層強化學習
4.1 學習任務的自動分層
4.1.1 瓶頸和路標狀態法
4.1.2 共用子空間法
4.1.3 多維狀態法
4.1.4 馬氏空間法
4.1.5 其他有關方法
4.1.6 任務自動分層方法評價
4.2 基于免疫聚類的自動分層算法
4.2.1 免疫原理剖析
4.2.2 基于免疫聚類的Option自動生成算法
4.3 基于二次應答機制的動態分層算法
4.3.1 算法描述
4.3.2 實驗分析
4.4 未知動態環境中的分層強化學習方法
4.4.1 移動機器人路徑規劃問題
4.4.2 未知動態環境中的OMQ分層強化學習算法
4.4.3 實驗分析
4.4.4 與POMDP有關方法的比較

第5章 多智能體分層強化學習
5.1多智能體強化學習問題剖析
5.2 多智能體分層強化學習框架
5.3 多智能體分層強化學習算法
5.4 實驗分析
參考文獻

序言

強化學習通過試錯與環境交互獲得策略的改進,其自學習和在線學習的特點使其成為機器學習研究的一個重要分支。但是,強化學習一直被維數災難所困擾。近年來,分層強化學習在克服維數災難方面取得了顯著進展,典型的成果有Option,HAM和MAXQ等方法,其中Option和MAXQ方法在目前使用較為廣泛。Option方法便于自動劃分子任務(尤其分區或分段子任務),且子任務粒度易于控制,但利用先驗知識劃分子任務時,任務劃分結果表達不夠明晰,且子任務內部策略難于確定;MAXQ方法在線學習能力強,但自動分層能力較弱,且分層粒度不夠精細,難以對一些規模很大的子任務作出進一步的分解。本書在系統地介紹了強化學習、分層強化學習的理論基礎和學習算法之后,探討了一種集成Option和MAXQ的分層強化學習新方法-OMQ,并深入研究集成過程中所涉及的理論與計算問題,以及該方法在動態環境、多智能體環境中應用時需要進一步解決的問題。
本書得到了總裝備部預研基金及哈爾濱工程大學基礎研究基金(HEUFl07022,HEUFr05021,HEUFT05068)的資助,在編寫過程中,得到了哈爾濱工程大學計算機科學與技術學院顧國昌教授和張國印教授的悉心指導,以及劉海波博士的鼎力相助,張汝波教授審閱了本書初稿,提出了寶貴的意見,哈爾濱工程大學出版社的編輯老師付出了艱辛的勞動,在此一并表示感謝!

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 99
絕版無法訂購

暢銷榜

客服中心

收藏

會員專區