DeepSeek大模型高性能核心技術與多模態融合開發(簡體書)
商品資訊
系列名:人工智能技術叢書
ISBN13:9787302684893
出版社:清華大學出版社(大陸)
作者:王曉華
出版日:2025/03/01
裝訂/頁數:平裝/346頁
規格:26cm*18.5cm (高/寬)
版次:一版
商品簡介
商品簡介
《DeepSeek大模型高性能核心技術與多模態融合開發》深入剖析國產之光DeepSeek多模態大模型的核心技術,從高性能注意力機制切入,深入揭示DeepSeek的技術精髓與獨特優勢,詳細闡述其在人工智能領域成功的技術秘訣。《DeepSeek大模型高性能核心技術與多模態融合開發》循序漸進地講解深度學習注意力機制的演進,從經典的多頭注意力(MHA)逐步深入DeepSeek的核心技術—多頭潛在注意力(MLA)與混合專家模型(MoE)。此外,《DeepSeek大模型高性能核心技術與多模態融合開發》還將詳細探討DeepSeek中的多模態融合策略、技術及應用實例,為讀者提供全面的理論指導與應用實踐。《DeepSeek大模型高性能核心技術與多模態融合開發》配套所有示例源碼、PPT課件、配圖PDF文件與讀者微信技術交流群。《DeepSeek大模型高性能核心技術與多模態融合開發》共分15章,內容涵蓋高性能注意力與多模態融合概述、PyTorch深度學習環境搭建、DeepSeek注意力機制詳解(包括基礎篇、進階篇、高級篇及調優篇)、在線與本地部署的DeepSeek實戰(如旅遊特種兵迪士尼大作戰、廣告文案撰寫與微調、智能客服等),以及多模態融合技術與實戰應用(如Diffusion可控圖像生成、多模態圖文理解與問答、交叉注意力語音轉換、端到端視頻分類等)。《DeepSeek大模型高性能核心技術與多模態融合開發》既適合DeepSeek核心技術初學者、注意力機制初學者、大模型應用開發人員、多模態融合開發人員、大模型研究人員,也適合高等院校及高職高專院校人工智能大模型方向的師生。
主題書展
更多書展購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。















