第一章，從阿爾法零的卓越性能出發，深入解讀其背後著實不易的成長歷程，揭示其數學模型。第二章，從確定性和隨機動態規劃問題入手，介紹決策問題的數學模型。第三章，從抽象視角回顧紛繁複雜的強化學習算法，揭示值函數近似與滾動改進的重要作用。第四章，從經典的線性二次型**控制問題入手，分析從阿爾法零的成功中學到的經驗。第五章，分別從魯棒、自適應、模型預測控制等問題入手，分析值函數近似與滾動改進對算法性能的提升潛力。第六章，從離散優化的視角審視阿爾法零的成功經驗。第七章，總結全書。適合作為本領域研究者作為學術專著閱讀，也適合作為研究生和本科生作為參考書使用。

優惠價：87 360

無庫存

滿額折

動態規劃與最優控制：近似動態規劃(第Ⅰ卷)（簡體書）

出版日：2024/06/05 作者：(美)德梅萃‧P. 博塞克斯 出版社：清華大學出版社(大陸) 裝訂：平裝

本書系統性介紹動態規劃與最優控制，包括動態規劃算法、確定性系統與隨機最短路問題、確定性連續時間最優控制、狀態信息完整的問題、狀態信息缺失的問題、次優與適應控制、無窮階段問題等。

優惠價：87 517

無庫存

滿額折

強化學習與最優控制（簡體書）

出版日：2024/04/23 作者：(美)德梅萃‧P‧ 博塞克斯 出版社：清華大學出版社(大陸) 裝訂：平裝

本書的目的是考慮大型且具有挑戰性的多階段決策問題，這些問題原則上可以通過動態規劃和**控制來解決，但它們的精確解決方案在計算上是難以處理的。本書討論依賴於近似的解決方法，以產生具有足夠性能的次優策略。這些方法統稱為增強學習，也可以叫做近似動態規劃和神經動態規劃等。本書的主題產生於**控制和人工智能思想的相互作用。本書的目的之一是探索這兩個領域之間的共同邊界，並架設一座具有任一領域背景的專業人士都可以訪問的橋樑。

優惠價：87 726

無庫存

共 3筆

第 1 頁

熱搜：

漫談歐美史家(精)(限量刷金版)

蔣中正日記限量套書

香港聯合出版全面79折

忽必烈的挑戰

2026台北市政府日曆

世界上最透明的故事02

汪榮祖精選書展

聖誕節

信息技術和電氣工程學科國際知名教材中譯本系列

阿爾法零對最優模型預測自適應控制的啟示（簡體書）

動態規劃與最優控制：近似動態規劃(第Ⅰ卷)（簡體書）

強化學習與最優控制（簡體書）