邊做邊學深度強化學習:PyTorch程序設計實踐(簡體書)
商品資訊
系列名:輕鬆上手IT技術日文譯叢
ISBN13:9787111650140
出版社:機械工業出版社
作者:(日)小川雄太郎
譯者:申富饒;于僡
出版日:2020/04/24
裝訂/頁數:平裝/215頁
規格:24cm*17cm (高/寬)
版次:一版
商品簡介
名人/編輯推薦
目次
相關商品
商品簡介
Pytorch是基於python且具備強大GPU加速的張量和動態神經網絡,更是Python中優先的深度學習框架,它使用強大的 GPU 能力,提供*大的靈活性和速度。本書指導讀者以Pytorch為工具在Python中學習深層強化學習(DQN)。主要內容包括:強化學習概述及分類、強化學習的算法和實施方法、在Pytorch中實施深度規劃與實現。、“實施深層強化學習DQN”、理解並實施新的深層強化學習方法(Double-DQN、Dueling Network、Prioritized Experience Replay、A3C、A2C)。
名人/編輯推薦
讀者只需要具備一些基本的編程經驗和基本的線性代數知識即可,指導讀者以PyTorch為工具實踐深度強化學習。
目次
譯者序
前言
第1章 強化學習概述1
1.1 機器學習的分類(監督學習、非監督學習、強化學習)1
1.2 強化學習、深度強化學習的歷史6
1.3 深度強化學習的應用實例11
參考文獻14
第2章 在走迷宮任務中實現強化學習16
2.1 Try Jupyter的使用方法16
2.2 迷宮和智能體的實現23
2.3 策略迭代法的實現31
2.4 價值迭代法的術語整理41
2.5 Sarsa的實現46
2.6 實現Q學習52
參考文獻57
第3章 在倒立擺任務中實現強化學習59
3.1 在本地PC上準備強化學習的實現和執行環境59
3.2 倒立擺任務“CartPole”64
3.3 由多變量連續值表示的狀態的表格表示69
3.4 Q學習的實現72
參考文獻80
第4章 使用PyTorch實現深度學習81
4.1 神經網絡和深度學習的歷史81
4.2 深度學習的計算方法89
4.3 使用PyTorch實現MNIST手寫數字分類任務94
參考文獻107
第5章 深度強化學習DQN的實現108
5.1 深度強化學習DQN(深度Q網絡)的說明108
5.2 實現DQN的四個要點111
5.3 實現DQN(上) 113
5.4 實現DQN(下) 123
參考文獻127
第6章 實現深度強化學習的改進版128
6.1 深度強化學習算法發展圖128
6.2 DDQN的實現132
6.3 Dueling Network的實現141
6.4 優先經驗回放的實現145
6.5 A2C的實現157
參考文獻168
第7章 在AWS GPU環境中實現消磚塊遊戲169
7.1 消磚塊遊戲“Breakout”的描述169
7.2 準備在AWS上使用GPU所需要的深度學習執行環境174
7.3 學習Breakout的四個關鍵思想187
7.4 A2C的實現(上) 193
7.5 A2C的實現(下) 203
參考文獻212
後記214
前言
第1章 強化學習概述1
1.1 機器學習的分類(監督學習、非監督學習、強化學習)1
1.2 強化學習、深度強化學習的歷史6
1.3 深度強化學習的應用實例11
參考文獻14
第2章 在走迷宮任務中實現強化學習16
2.1 Try Jupyter的使用方法16
2.2 迷宮和智能體的實現23
2.3 策略迭代法的實現31
2.4 價值迭代法的術語整理41
2.5 Sarsa的實現46
2.6 實現Q學習52
參考文獻57
第3章 在倒立擺任務中實現強化學習59
3.1 在本地PC上準備強化學習的實現和執行環境59
3.2 倒立擺任務“CartPole”64
3.3 由多變量連續值表示的狀態的表格表示69
3.4 Q學習的實現72
參考文獻80
第4章 使用PyTorch實現深度學習81
4.1 神經網絡和深度學習的歷史81
4.2 深度學習的計算方法89
4.3 使用PyTorch實現MNIST手寫數字分類任務94
參考文獻107
第5章 深度強化學習DQN的實現108
5.1 深度強化學習DQN(深度Q網絡)的說明108
5.2 實現DQN的四個要點111
5.3 實現DQN(上) 113
5.4 實現DQN(下) 123
參考文獻127
第6章 實現深度強化學習的改進版128
6.1 深度強化學習算法發展圖128
6.2 DDQN的實現132
6.3 Dueling Network的實現141
6.4 優先經驗回放的實現145
6.5 A2C的實現157
參考文獻168
第7章 在AWS GPU環境中實現消磚塊遊戲169
7.1 消磚塊遊戲“Breakout”的描述169
7.2 準備在AWS上使用GPU所需要的深度學習執行環境174
7.3 學習Breakout的四個關鍵思想187
7.4 A2C的實現(上) 193
7.5 A2C的實現(下) 203
參考文獻212
後記214
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。