TOP
紅利積點抵現金,消費購書更貼心
篩選商品
縮小範圍
裝訂方式
搜尋結果 /

语音识别服务实战

2
1 / 1
Hey Siri及Ok Google原理:AI語音辨識專案真應用開發
滿額折
出版日:2025/05/19 作者:楊學銳; 晏超; 劉雪松  出版社:深智數位  裝訂:平裝
\\好評再版//★語音前端處理,語音辨識★語者自動分段標記演算法原理★基於WebRTC,Kaldi和gRPC,從零建構穩定、高性能、可商用的語音服務★前端演算法完整介紹★語音活動檢測、語音降噪、回聲消除、波束形成★WebRTC和Kaldi最佳化處理流程★形成語音演算法SDK★微服務建構的RPC遠端呼叫框架和SDK【內容簡介】本書從語音辨識的概要談起,並且介紹了目前市場概況及常用的工具包括WebRTC及技術人最愛的Kaldi。接下來說明了語音訊號的聲學基和數位化、時頻變換的原理。語音技術中最重要的演算法也有說明,包括了各種VAD、單通道降噪、回聲消除等濾波器、波束形成的介紹。重點部分包括了語音辨識中最重要的特徵提取和聲學模型,如傳統及神經網路基礎的實作法。在了解原理之後,即開始建立真正專案,包括使用Kaldi實作一個國語的模型。最近流行的語者自動分段標記在本書中也有實作,大量應用了深度學習的模型及音訊庫、函數庫等。如使用了CNCeleb的聲紋資料當作訓練集。在Kaldi的進階應用方面,也實作了其SDK的音訊特徵提取及WebRTC的語音活動檢測。本書的收尾之作就是使用了gRPC進行一個完整的語音識別服務實作,使用了現在最好用的ProtoBuf的協定進行運作,完成了伺服器/客戶端應用開發,可以說是目前市面上最完整的語音辨識中文圖書。
優惠價:9 792
庫存:4
<em>語音識別服務實戰</em>(簡體書)
滿額折
出版日:2022/03/01 作者:楊學銳  出版社:電子工業出版社  裝訂:平裝
隨著語音算法技術的不斷發展與完善,如何進行工程落地成為語音商業應用中普遍面臨的問題。工程落地不僅要考慮模型效果,還要考慮資源占用、模塊聯調且整個架構要具有可靠性、可擴展性和可維護性。 本書圍繞如何從零構建一個完整的語音識別系統,深入淺出地介紹了語音識別前端算法、語音識別算法及說話人日志算法原理;基於Kaldi的模型訓練;語音識別工程落地和服務搭建。 本書適合作為語音技術研究人員及對語音技術感興趣的開發人員的參考用書。
優惠價:87 668
無庫存
  • 2
    1

暢銷榜

客服中心

收藏

會員專區