TOP
紅利積點抵現金,消費購書更貼心
篩選商品
縮小範圍
商品類型
商品定價
出版日期
裝訂方式
出版社/品牌
搜尋結果 /

语音识别服务实战

1
1 / 1
Hey Siri及Ok Google原理:AI語音辨識專案真應用開發
滿額折
出版日:2025/05/19 作者:楊學銳; 晏超; 劉雪松  出版社:深智數位  裝訂:平裝
\\好評再版//★語音前端處理,語音辨識★語者自動分段標記演算法原理★基於WebRTC,Kaldi和gRPC,從零建構穩定、高性能、可商用的語音服務★前端演算法完整介紹★語音活動檢測、語音降噪、回聲消除、波束形成★WebRTC和Kaldi最佳化處理流程★形成語音演算法SDK★微服務建構的RPC遠端呼叫框架和SDK【內容簡介】本書從語音辨識的概要談起,並且介紹了目前市場概況及常用的工具包括WebRTC及技術人最愛的Kaldi。接下來說明了語音訊號的聲學基和數位化、時頻變換的原理。語音技術中最重要的演算法也有說明,包括了各種VAD、單通道降噪、回聲消除等濾波器、波束形成的介紹。重點部分包括了語音辨識中最重要的特徵提取和聲學模型,如傳統及神經網路基礎的實作法。在了解原理之後,即開始建立真正專案,包括使用Kaldi實作一個國語的模型。最近流行的語者自動分段標記在本書中也有實作,大量應用了深度學習的模型及音訊庫、函數庫等。如使用了CNCeleb的聲紋資料當作訓練集。在Kaldi的進階應用方面,也實作了其SDK的音訊特徵提取及WebRTC的語音活動檢測。本書的收尾之作就是使用了gRPC進行一個完整的語音識別服務實作,使用了現在最好用的ProtoBuf的協定進行運作,完成了伺服器/客戶端應用開發,可以說是目前市面上最完整的語音辨識中文圖書。
優惠價:9 792
庫存:4
  • 1
    1

暢銷榜

客服中心

收藏

會員專區