TOP
0
0
即日起~7/10,三民書局週年慶暖身活動,簽到拿好禮!

縮小範圍


商品類型

簡體書 (3)
商品狀況

可訂購商品 (3)
庫存狀況

有庫存 (1)
無庫存 (2)
商品定價

$400~$599 (2)
$800以上 (1)
出版日期

2024年 (3)
裝訂方式

平裝 (3)
作者

(美)德梅萃‧P. 博塞克斯 (2)
(美)德梅萃‧P‧ 博塞克斯 (1)
出版社/品牌

清華大學出版社(大陸) (3)

三民網路書店 / 搜尋結果

3筆商品,1/1頁
強化學習與最優控制(簡體書)
79折
作者:(美)德梅萃‧P‧ 博塞克斯  出版社:清華大學出版社(大陸)  出版日:2024/04/23 裝訂:平裝
本書的目的是考慮大型且具有挑戰性的多階段決策問題,這些問題原則上可以通過動態規劃和**控制來解決,但它們的精確解決方案在計算上是難以處理的。本書討論依賴於近似的解決方法,以產生具有足夠性能的次優策略。這些方法統稱為增強學習,也可以叫做近似動態規劃和神經動態規劃等。 本書的主題產生於**控制和人工智能思想的相互作用。本書的目的之一是探索這兩個領域之間的共同邊界,並架設一座具有任一領域背景的專業人士都可以訪問的橋樑。
簡體新到貨
定價:834 元, 優惠價:79 658
庫存:4
阿爾法零對最優模型預測自適應控制的啟示(簡體書)
滿額折
作者:(美)德梅萃‧P. 博塞克斯  出版社:清華大學出版社(大陸)  出版日:2024/06/05 裝訂:平裝
第一章,從阿爾法零的卓越性能出發,深入解讀其背後著實不易的成長歷程,揭示其數學模型。第二章,從確定性和隨機動態規劃問題入手,介紹決策問題的數學模型。第三章,從抽象視角回顧紛繁複雜的強化學習算法,揭示值函數近似與滾動改進的重要作用。第四章,從經典的線性二次型**控制問題入手,分析從阿爾法零的成功中學到的經驗。第五章,分別從魯棒、自適應、模型預測控制等問題入手,分析值函數近似與滾動改進對算法性能的提升潛力。第六章,從離散優化的視角審視阿爾法零的成功經驗。第七章,總結全書。適合作為本領域研究者作為學術專著閱讀,也適合作為研究生和本科生作為參考書使用。
定價:414 元, 優惠價:87 360
海外經銷商無庫存,到貨日平均30天至45天
動態規劃與最優控制:近似動態規劃(第Ⅰ卷)(簡體書)
滿額折
作者:(美)德梅萃‧P. 博塞克斯  出版社:清華大學出版社(大陸)  出版日:2024/06/05 裝訂:平裝
本書系統性介紹動態規劃與**控制,包括動態規劃算法、確定性系統與隨機最短路問題、確定性連續時間**控制、狀態信息完整的問題、狀態信息缺失的問題、次優與適應控制、無窮階段問題等。
定價:594 元, 優惠價:87 517
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區