TOP
紅利積點抵現金,消費購書更貼心
篩選商品
縮小範圍
商品類型
出版日期
裝訂方式
搜尋結果 /

信息技術和電氣工程學科國際知名教材中譯本系列

3
1 / 1
阿爾法零對最優模型預測自適應控制的啟示(簡體書)
滿額折
出版日:2024/06/05 作者:(美)德梅萃‧P.博塞克斯  出版社:清華大學出版社(大陸)  裝訂:平裝
第一章,從阿爾法零的卓越性能出發,深入解讀其背後著實不易的成長歷程,揭示其數學模型。第二章,從確定性和隨機動態規劃問題入手,介紹決策問題的數學模型。第三章,從抽象視角回顧紛繁複雜的強化學習算法,揭示值函數近似與滾動改進的重要作用。第四章,從經典的線性二次型**控制問題入手,分析從阿爾法零的成功中學到的經驗。第五章,分別從魯棒、自適應、模型預測控制等問題入手,分析值函數近似與滾動改進對算法性能的提升潛力。第六章,從離散優化的視角審視阿爾法零的成功經驗。第七章,總結全書。適合作為本領域研究者作為學術專著閱讀,也適合作為研究生和本科生作為參考書使用。
優惠價:87 360
無庫存
動態規劃與最優控制:近似動態規劃(第Ⅰ卷)(簡體書)
滿額折
出版日:2024/06/05 作者:(美)德梅萃‧P. 博塞克斯  出版社:清華大學出版社(大陸)  裝訂:平裝
本書系統性介紹動態規劃與最優控制,包括動態規劃算法、確定性系統與隨機最短路問題、確定性連續時間最優控制、狀態信息完整的問題、狀態信息缺失的問題、次優與適應控制、無窮階段問題等。
優惠價:87 517
無庫存
強化學習與最優控制(簡體書)
滿額折
出版日:2024/04/23 作者:(美)德梅萃‧P‧ 博塞克斯  出版社:清華大學出版社(大陸)  裝訂:平裝
本書的目的是考慮大型且具有挑戰性的多階段決策問題,這些問題原則上可以通過動態規劃和**控制來解決,但它們的精確解決方案在計算上是難以處理的。本書討論依賴於近似的解決方法,以產生具有足夠性能的次優策略。這些方法統稱為增強學習,也可以叫做近似動態規劃和神經動態規劃等。 本書的主題產生於**控制和人工智能思想的相互作用。本書的目的之一是探索這兩個領域之間的共同邊界,並架設一座具有任一領域背景的專業人士都可以訪問的橋樑。
優惠價:87 726
無庫存
  • 3
    1

暢銷榜

客服中心

收藏

會員專區