縮小範圍

商品類型

簡體書（3）

商品狀況

可訂購商品（3）

庫存狀況

有庫存（1）

無庫存（2）

商品定價

$400~$599 （2）

$800以上（1）

出版日期

2024年（3）

裝訂方式

平裝（3）

作者

(美)德梅萃‧P. 博塞克斯（2）

(美)德梅萃‧P‧ 博塞克斯（1）

出版社/品牌

清華大學出版社（大陸）（3）

三民網路書店 / 搜尋結果

搜尋條件

商品類型

商品狀況

庫存狀況

商品定價

出版日期

裝訂方式

作者

出版社/品牌

關閉

共3筆商品，1/1頁

79折

強化學習與最優控制（簡體書）

作者：(美)德梅萃‧P‧ 博塞克斯 出版社：清華大學出版社(大陸) 出版日：2024/04/23 裝訂：平裝

本書的目的是考慮大型且具有挑戰性的多階段決策問題，這些問題原則上可以通過動態規劃和**控制來解決，但它們的精確解決方案在計算上是難以處理的。本書討論依賴於近似的解決方法，以產生具有足夠性能的次優策略。這些方法統稱為增強學習，也可以叫做近似動態規劃和神經動態規劃等。本書的主題產生於**控制和人工智能思想的相互作用。本書的目的之一是探索這兩個領域之間的共同邊界，並架設一座具有任一領域背景的專業人士都可以訪問的橋樑。

簡體新到貨

定價：834 元，優惠價：79 658

庫存：4

滿額折

阿爾法零對最優模型預測自適應控制的啟示（簡體書）

作者：(美)德梅萃‧P. 博塞克斯 出版社：清華大學出版社(大陸) 出版日：2024/06/05 裝訂：平裝

第一章，從阿爾法零的卓越性能出發，深入解讀其背後著實不易的成長歷程，揭示其數學模型。第二章，從確定性和隨機動態規劃問題入手，介紹決策問題的數學模型。第三章，從抽象視角回顧紛繁複雜的強化學習算法，揭示值函數近似與滾動改進的重要作用。第四章，從經典的線性二次型**控制問題入手，分析從阿爾法零的成功中學到的經驗。第五章，分別從魯棒、自適應、模型預測控制等問題入手，分析值函數近似與滾動改進對算法性能的提升潛力。第六章，從離散優化的視角審視阿爾法零的成功經驗。第七章，總結全書。適合作為本領域研究者作為學術專著閱讀，也適合作為研究生和本科生作為參考書使用。

定價：414 元，優惠價：87 360

海外經銷商無庫存，到貨日平均30天至45天

滿額折

動態規劃與最優控制：近似動態規劃(第Ⅰ卷)（簡體書）

作者：(美)德梅萃‧P. 博塞克斯 出版社：清華大學出版社(大陸) 出版日：2024/06/05 裝訂：平裝

本書系統性介紹動態規劃與**控制，包括動態規劃算法、確定性系統與隨機最短路問題、確定性連續時間**控制、狀態信息完整的問題、狀態信息缺失的問題、次優與適應控制、無窮階段問題等。

定價：594 元，優惠價：87 517

海外經銷商無庫存，到貨日平均30天至45天

共3 筆
1 頁

熱搜：

簽到領好禮

「野蠻」的復權

我推的孩子 13

迷宮飯

86不存在的戰區13

島嶼裡的遠方

NG書-DogMan

佛法是科學的終極典範

許倬雲

漫畫少年學墨菲定律