評論

滿額折

語音識別服務實戰（簡體書）

ISBN13：9787121425905
出版社：電子工業出版社
作者：楊學銳
出版日：2022/03/01
裝訂／頁數：平裝／354頁
規格：24cm*17cm (高/寬)
版次：一版
關鍵字：語音識別服務實戰（簡體書）、語音、識別、服務、務實、實戰、簡體、電子工業出版社、楊學銳、簡體書、工業技術、無線電電子學、電訊技術、語音識別與設備、

中國圖書館分類

：

語音識別與設備

人民幣定價：128 元

定價

：NT$ 768 元

優惠價

： 87 折 668 元

領券後再享88折起

領

海外經銷商無庫存，到貨日平均30天至45天

下單可得紅利積點：20 點

商品簡介

作者簡介

序

商品簡介

隨著語音算法技術的不斷發展與完善，如何進行工程落地成為語音商業應用中普遍面臨的問題。工程落地不僅要考慮模型效果，還要考慮資源占用、模塊聯調且整個架構要具有可靠性、可擴展性和可維護性。

本書圍繞如何從零構建一個完整的語音識別系統，深入淺出地介紹了語音識別前端算法、語音識別算法及說話人日志算法原理；基於Kaldi的模型訓練；語音識別工程落地和服務搭建。

本書適合作為語音技術研究人員及對語音技術感興趣的開發人員的參考用書。

作者簡介

楊學銳

大疆創新語音交互算法負責人，復旦大學及Turku大學碩士，長期從事語音算法、深度學習、人工智能等領域的研究與商業落地，在相關領域發表多篇論文及專利。

晏超

北京郵電大學碩士，曾任職於HP Labs, Cisco, Technicolor等公司。現為云從科技語音算法負責人，從事語音識別、聲紋識別、說話人日志、語音合成等方向的算法研發工作，構建了云從科技整套語音算法引擎與應用服務平臺。

劉雪松

OPPO音頻算法專家，復旦大學碩士，曾任職於美國國家儀器、聲網、云從科技等公司。在信號處理、音頻算法和語音算法等領域有豐富的實戰經驗，在相關領域發表多篇論文及專利。

序

前言

近年來，隨著深度學習技術的不斷發展，語音識別準確率得到了大幅提升，由此帶來了基於語音交互應用的豐富想象力，這些技術越來越多地影響著人們生產和生活的方方面面。其中，消費級應用包括智能音箱、手機語音助理、車載智能座艙、語音輸入法與翻譯機等；企業級應用包括智能客服、語音質檢、智能教育、智能醫療等。各類智能語音應用的蓬勃發展使得越來越多的人加入語音領域的研究和落地，共同推動整個語音產業的發展。

得益於語音識別技術的蓬勃發展和識別率的節節攀升，業界涌現出眾多優秀的端到端語音工具包，如Wenet，ESPNet，SpeechBrain等。盡管如此，2009年約翰霍普金斯大學夏季研討會孵化出的Kaldi工具箱，以其穩定的算法效果，活躍的社區氛圍，得到了廣泛應用，極大地降低了語音識別的上手門檻，也培養了大量的相關人才。目前，仍然有很多公司在使用基於Kaldi的工程方案。

由於語音交互技術涉及的算法與技術鏈條較長，因此已有的語音算法相關圖書主要集中在各類語音算法的原理與訓練上，缺乏從語音交互角度出發，介紹語音交互所需的語音前後端各項算法和整體解決方案的相關圖書。在語音應用的落地上，學術界也缺乏產業界的工程應用落地經驗。本書將致力於拉進學術界與產業界的距離，在系統地介紹語音交互流程中涉及的語音前端處理、語音識別和說話人日志等算法原理的同時，詳細介紹如何基於WebRTC，Kaldi和gRPC，從零構建產業界穩定、高性能、可商用的語音服務。

在前端算法的相關章節中，本書系統地介紹了語音活動檢測、語音降噪、回聲消除、波束形成等常用的語音前端處理算法的原理，還針對各種算法在實際場景中的工程實現方法，提供了大量的經驗總結。除了介紹傳統信號的處理方法，本書還介紹了深度學習方法在語音前端領域中的發展和應用現狀。

在語音後端算法方面，本書詳細介紹了語音識別中的特徵提取、聲學模型、語言模型、解碼器和端到端語音識別，以及說話人日志中的聲紋Embedding提取和聚類算法。同時，還介紹了如何基於Kaldi訓練語音識別及說話人日志模型。針對訓練模型時的很多細節問題，提供了詳細的解釋。

在語音算法工程化方面，本書介紹了如何利用WebRTC和Kaldi優化處理流程，形成語音算法SDK。基於流行的用於微服務構建的RPC遠程調用框架和SDK，進一步介紹了如何實現一套方便用戶快捷接入的語音算法的微服務。

本書由楊學銳、晏超、劉雪松合作撰寫。三位作者長期在一線從事語音算法工作，書中內容匯集了他們在產業界模型訓練和應用落地的思考與經驗總結，希望能給學術界的研究人員與產業界的從業人員帶來一絲啟發和幫助。其中楊學銳負責第1、4、5章的撰寫及全書內容的審核校對，晏超負責第6、7、8章的撰寫及工程代碼的實現調試，劉雪松負責第2、3章及第1章部分內容的撰寫和校對。

最後，感謝電子工業出版社李淑麗老師的辛苦工作，感謝吳伯庸和王金超對本書的貢獻，感謝陳勇的審稿與校對，感謝成書過程中給予過幫助的所有相關人士。

由於作者水平有限，書中如有任何錯誤與不足，懇請廣大讀者批評指正並提出寶貴意見。

作者

2021年11日於上海

主題書展

更多書展

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大，除封面破損、內頁脫落等較嚴重的狀態，其餘商品將正常出貨。

特別提醒：部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供，需以QR CODE 連結至當地網站註冊“並通過驗證程序”，方可下載使用。

無現貨庫存之簡體書，將向海外調貨：
海外有庫存之書籍，等候約45個工作天;
海外無庫存之書籍，平均作業時間約60個工作天，然不保證確定可調到貨，尚請見諒。

為了保護您的權益，「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨，請在商品鑑賞期內寄回，且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

熱搜：

判處勇者刑

伊朗史

新年書單

年度暢銷

原文書1折起

蔣中正日記

周杰倫

麵包小偷06

Julia Donaldson 套書

明亮燦爛的你

台積電

語音識別服務實戰（簡體書）

商品資訊

ISBN13：9787121425905

出版社：電子工業出版社

作者：楊學銳

出版日：2022/03/01

裝訂／頁數：平裝／354頁

規格：24cm*17cm (高/寬)

版次：一版

中國圖書館分類

語音識別與設備

商品簡介

作者簡介

序

目次

主題書展

2025三民年度暢銷書展

三民月月讀書金

簡體每月選書

簡體曬書節

簡體熱門影劇書展

麻醫媽媽精選繪本展

13號悅讀日

2026新年書展

三民AI國寫小助手

春節必備好物推薦

購物須知