商品簡介
商品簡介
本書深入探討深度學習模型訓練和推理加速的前沿技術,尤其是在 NVIDIA CUDA(Compute Unified Device Architecture)平臺上的應用與優化。本書從大模型訓練的挑戰和分散式訓練,到 CUDA 加速推理技術,再到端側推理的優化部署,系統地介紹如何利用 CUDA 平臺加速大模型的訓練與推理過程,並結合具體案例深入講解資料並行、模型並行、任務調度、負載均衡等技術。本書共 10 章,首先介紹大模型訓練面臨的計算複雜性、記憶體頻寬和資料傳輸瓶頸等問題,並講解基於NCCL(NVIDIA Collective Communications Library)的優化方法;然後,通過深入淺出的講解,展示如何使用 TensorRT 進行推理加速,並探討多模型並行推理架構、混合精度訓練與推理等優化策略;最後,詳細闡述端側推理加速,特別是在移動設備和邊緣設備中的應用,強調模型量化、裁剪等技術在推理加速中的重要作用。
主題書展
更多書展購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

