強化學習基礎、原理與應用(簡體書)
商品資訊
ISBN13:9787302685913
出版社:清華大學出版社(大陸)
作者:張百珂
出版日:2025/05/01
裝訂/頁數:平裝/404頁
規格:24cm*17cm (高/寬)
版次:一版
商品簡介
商品簡介
《強化學習基礎、原理與應用》循序漸進地講解了使用Python語言實現強化學習的核心算法開發的知識,內容涵蓋了數據處理、算法、大模型等知識,並通過具體實例的實現過程演練了各個知識點的使用方法和使用流程。《強化學習基礎、原理與應用》共分為17章,主要內容包括強化學習基礎、馬爾可夫決策過程、蒙特卡洛方法、Q-learning與貝爾曼方程、時序差分學習和SARSA算法、DQN算法、DDQN算法、競爭DQN算法、REINFORCE算法、Actor-Critic算法、PPO算法、TRPO算法、連續動作空間的強化學習、值分布式算法、基於模型的強化學習、多智能體強化學習實戰:Predator-Prey 遊戲及自動駕駛系統。本書內容簡潔而不失技術深度,以極簡的文字介紹了複雜的案例,易於閱讀和理解。《強化學習基礎、原理與應用》適用於已經瞭解Python語言基礎語法的讀者,想進一步學習強化學習、機器學習、深度學習及相關技術的讀者,還可作為大專院校相關專業的師生用書和培訓機構的教材使用。
主題書展
更多書展購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。













