相關商品
商品簡介
商品簡介
本書詳細介紹了強化學習的理論推導、算法細節。全書共12章,包括強化學習概述、馬爾可夫決策過程、退化的強化學習問題、環境已知的強化學習問題、基於價值的強化學習算法、基於策略的強化學習算法、AC型算法、基於模型的強化學習算法等相關知識。本書系統性強、概念清晰,內容簡明通俗。除了側重於理論推導,本書還提供了許多便於讀者理解的例子,以及大量被實踐證明有效的算法技巧,旨在幫助讀者進一步瞭解強化學習領域的相關知識,提升其現實中的工程能力。本書可作為高等院校數學、計算機、人工智能等相關專業的強化學習教材,但需要有機器學習、深度學習等前置課程作為基礎。
主題書展
更多書展本週66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。