相關商品
商品簡介
商品簡介
本書從模型的結構和數據基礎兩個方面解構大語言模型,以便幫助讀者理解和搭建類似ChatGPT的系統。在模型的結構方面,大語言模型屬深度神經網絡,其設計核心是注意力機制,因此,本書涵蓋了多層感知器、卷積神經網絡和循環神經網絡等經典模型。在模型的數據基礎方面,本書既涉及模型訓練的工程基礎,如反向傳播,又涉及數據的使用方式,如遷移學習、強化學習,以及傳統的監督學習和無監督學習。此外,本書還闡述了如何從計量經濟學和經典機器學習模型中汲取靈感,以提高模型的穩定性和可解釋性。本書既適用於希望深入瞭解大語言模型、通過人工智能技術解決實際問題的讀者,也適合作為高等院校計算機及相關專業的師生參考用書。
主題書展
更多書展本週66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。