TOP
紅利積點抵現金,消費購書更貼心
控制系統與強化學習(簡體書)
滿額折

控制系統與強化學習(簡體書)

商品資訊

人民幣定價:149 元
定價
:NT$ 894 元
優惠價
87778
海外經銷商無庫存,到貨日平均30天至45天
下單可得紅利積點:23 點
商品簡介

商品簡介

一個高中生可以創建深度的Q-learning代碼來控制她的機器人,卻不瞭解 "深度 "或 "Q "的含義,也不知道為什麼代碼有時會失敗。本書旨在以具有微積分和矩陣代數背景的學生可以理解的方式,解釋強化學習和優化控制背後的科學。本書的一個獨特重點是算法設計,以獲得學習算法的快收斂速度,以及對強化學習有時失敗的原因的洞察。一開始就避開了高級隨機過程理論,用更直觀的確定性探測來代替學習的隨機探索。一旦理解了這些思想,掌握植根於隨機控制的技術就不難了。這些主題在本書的第二部分有所涉及,從馬爾科夫鏈理論開始,以對強化學習的行為者批評方法的全新審視結束。

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 778
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區