AI源碼解讀:數字圖像處理案例(PYTHON版)(簡體書)
商品資訊
系列名:人工智能科學與技術叢書
ISBN13:9787302571582
出版社:清華大學出版社(大陸)
作者:李永華
出版日:2021/11/01
裝訂/頁數:平裝/476頁
規格:24cm*17cm (高/寬)
版次:一版
商品簡介
本書根據當前人工智能RNN深度學習的發展成果,具體設計基於RNN的模型算法,並給出了具體實現,z新算法流程及Python代碼實現。其主要內容包括:基於深度學習的圖像處理的20個案例,基於Python的具體實現,本書圖文並茂,豐富實用,深入淺出,易學易用。本書根據當前人工智能RNN深度學習的發展成果,具體設計基於RNN的模型算法,並給出了具體實現,z新算法流程及Python代碼實現。其主要內容包括:基於深度學習的圖像處理的20個案例,基於Python的具體實現,本書圖文並茂,豐富實用,深入淺出,易學易用。
作者簡介
李永華:北京郵電大學,教授,擁有超過10年的軟硬件開發經驗,長期致力於物聯網、云計算與人工智能的研究工作。在教學中以興趣為導向,激發學生的創造性;以素質為基礎,提高自身教學水平;以科研為手段,促進教學理念的轉變,在教學與科研實踐中指導學生實現300余個創新案例。主持30余項國j級與企事業單位課題的研究工作,在國內外學術期刊及會議發表論文100余篇,申請專利50余項,出版圖書20余部。
名人/編輯推薦
融匯科研與教學經驗,案例可二次開發利用!阿裡巴巴|字節跳動|訊飛智元|騰訊|百度|微軟
專家聯袂推薦!配套程序代碼、工程文件、附贈案例!
關注“人工智能科學與技術”微信公眾號,在 “知識”→“資源下載”→“配書資源”菜單獲取下載鏈接(或到清華大學出版社網站本書頁面下載)。
序
前言
Python作為人工智能和大數據領域的主要開發語言,具有靈活性強、擴展性好、應用面廣、可移植、可擴展、可嵌入等特點,近年來發展迅速,熱度不減,人才需求量逐年攀升,已經成為高等院校的專業課程。
為適應當前教學改革的要求,更好地踐行人工智能模型與算法的應用,本書以實踐教學與創新能力培養為目標,采取了創新方式,從不同難度、不同類型、不同算法,融合了同類教材的優點,將實際智能應用案例進行總結,希望起到拋磚引玉的作用。
本書的主要內容和素材來自開源網站的人工智能經典模型算法、信息工程專業創新課程內容及作者所在學校近幾年承擔的科研項目成果、作者指導學生完成的創新項目。通過這些創新項目學生不僅學到了知識,提高了能力,而且為本書提供了第一手素材和相關資料。
本書內容由總述到分述、先理論後實踐,采用系統整體架構、系統流程與代碼實現相結合的方式,對於從事人工智能開發、機器學習和算法實現的專業技術人員可作為技術參考書,提高其工程創新能力;也可作為信息通信工程及相關專業本科生的參考書,為機器學習模型分析、算法設計和實現提供幫助。
本書的編寫得到了教育部電子信息類專業教學指導委員會、信息工程專業國家第一類特色專業建設項目、信息工程專業國家第二類特色專業建設項目、教育部CDIO工程教育模式研究與實踐項目、教育部本科教學工程項目、信息工程專業北京市特色專業建設、北京市教育教學改革項目、北京郵電大學教育教學改革項目(2020JC03)的大力支持,在此表示感謝!
由於作者水平有限,書中疏漏之處在所難免,衷心地希望各位讀者多提寶貴意見,以便作者進一步修改和完善。
編者2021年7月
目次
項目1基於插幀和超分辨率的視頻增強應用
1.1總體設計
1.1.1系統整體結構
1.1.2系統流程
1.2運行環境
1.2.1Python環境
1.2.2PyTorch環境
1.2.3FFmpeg使用
1.2.4百度AI Studio使用
1.3模塊實現
1.3.1視頻處理模塊
1.3.2超分辨率模塊
1.3.3插幀模塊
1.3.4GUI模塊
1.4系統測試
1.4.1算法訓練
1.4.2GUI界面效果
1.4.3輸出效果展示
項目2基於Pix2Pix的快速圖像風格遷移
2.1總體設計
2.1.1系統整體結構
2.1.2系統流程
2.2運行環境
2.2.1Python環境
2.2.2TensorFlow環境
2.2.3Flask環境
2.2.4微信小程序環境
2.3模塊實現
2.3.1數據預處理
2.3.2創建模型與編譯
2.3.3模型訓練及保存
2.3.4構建Pix2Pix數據集
2.3.5Pix2Pix模型構建
2.3.6Pix2Pix模型訓練及保存
2.3.7後端搭建
2.4系統測試
2.4.1訓練效果
2.4.2測試效果
2.4.3模型應用
項目3常見花卉識別
3.1總體設計
3.1.1系統整體結構
3.1.2系統流程
3.2運行環境
3.2.1Python環境
3.2.2TensorFlow環境
3.2.3Android環境
3.3模塊實現
3.3.1數據預處理
3.3.2創建模型並編譯
3.3.3模型訓練及保存
3.3.4模型生成
3.4系統測試
3.4.1訓練準確率
3.4.2測試效果
3.4.3模型應用
項目4基於Keras的狗狗分類與人臉相似檢測器
4.1總體設計
4.1.1系統整體結構
4.1.2系統流程
4.2運行環境
4.2.1Python環境
4.2.2TensorFlow環境
4.2.3Keras環境
4.2.4安裝庫
4.3模塊實現
4.3.1數據預處理
4.3.2模型編譯主體
4.3.3圖像檢測
4.3.4文本數據翻譯與爬蟲
4.3.5模型訓練評估與生成
4.3.6前端界面
4.4系統測試
4.4.1前端界面展示
4.4.2程序功能介紹
4.4.3識別狗狗效果展示
4.4.4識別人臉效果展示
項目5貓貓相機
5.1總體設計
5.1.1系統整體結構
5.1.2系統流程
5.2運行環境
5.2.1Python環境
5.2.2mxnet環境
5.2.3OpenCV環境
5.3模塊實現
5.3.1數據預處理
5.3.2創建模型並編譯
5.3.3模型訓練及保存
5.3.4模型測試
5.4系統測試
5.4.1訓練準確率
5.4.2測試效果
5.4.3模型應用
項目6基於Mask RCNN的動物識別分割及渲染
6.1總體設計
6.1.1系統整體結構
6.1.2系統流程
6.2運行環境
6.2.1Python環境
6.2.2TensorFlowGPU環境
6.2.3Keras環境
6.2.4pycocotools 2.0環境
6.2.5其他依賴庫
6.3模塊實現
6.3.1數據預處理
6.3.2數據集處理
6.3.3模型訓練及保存
6.3.4渲染效果實現
6.3.5GUI設計
6.4系統測試
6.4.1模型評估
6.4.2測試效果
6.4.3模型應用
項目7新冠肺炎輔助診斷系統
7.1總體設計
7.1.1系統整體結構
7.1.2系統流程
7.2運行環境
7.2.1Python環境
7.2.2PaddlePaddle環境
7.2.3在線運行
7.3模塊實現
7.3.1定義待測數據
7.3.2加載預訓練模型
7.3.3數據預處理
7.3.4可視化操作
7.4系統測試
7.4.1DICOM圖像
7.4.2預處理後的圖像
7.4.3肺部分割
7.4.4病灶分割
7.4.5分割結果
7.4.6統計輸出結果
項目8StrokeControllable快速風格遷移在網頁端應用
8.1總體設計
8.1.1系統整體結構
8.1.2系統流程
8.2運行環境
8.2.1Python環境
8.2.2TensorFlow環境
8.2.3Linux環境
8.2.4網頁配置環境
8.3模塊實現
8.3.1數據預處理
8.3.2模型構建
8.3.3模型訓練及保存
8.3.4模型測試
8.4系統測試
8.4.1訓練準確率
8.4.2測試效果
8.4.3模型應用
項目9SRGAN網絡在網站默認頭像生成中的應用
9.1總體設計
9.1.1系統整體結構
9.1.2系統流程
9.2運行環境
9.2.1TensorFlow環境
9.2.2網頁服務器開發環境
9.3模塊實現
9.3.1數據預處理
9.3.2模型構建
9.3.3模型訓練及保存
9.3.4網站搭建
9.4系統測試
項目10亂序成語驗證碼識別
10.1總體設計
10.1.1系統整體結構
10.1.2系統流程
10.2運行環境
10.2.1Python環境
10.2.2TensorFlow環境
10.2.3安裝所需的包
10.3模塊實現
10.3.1數據預處理
10.3.2模型一的構建和訓練
10.3.3模型二的構建和訓練
10.3.4亂序成語驗證碼識別
10.3.5可視化界面的實現
10.4系統測試
10.4.1訓練準確率
10.4.2測試效果
10.4.3可視化界面應用
項目11基於CNN的SNEAKERS識別
11.1總體設計
11.1.1系統整體結構
11.1.2系統流程
11.2運行環境
11.2.1Python環境與Flask框架
11.2.2環境配置與工具包
11.2.3微信小程序環境
11.3模塊實現
11.3.1數據製作
11.3.2數據構建
11.3.3模型訓練及保存
11.3.4模型測試
11.3.5前端與後臺搭建
11.4系統測試
11.4.1訓練準確率
11.4.2測試效果
11.4.3模型應用
項目12基於SRGAN的單圖像超分辨率
12.1總體設計
12.1.1系統整體結構
12.1.2系統流程
12.2運行環境
12.2.1Python環境
12.2.2PyTorch環境
12.2.3網頁端Flask框架
12.2.4PyQt環境配置
12.3模塊實現
12.3.1數據預處理
12.3.2數據導入
12.3.3定義模型
12.3.4定義損失函數
12.3.5模型訓練及保存
12.3.6服務器端架構
12.3.7本地單機程序
12.4系統測試
項目13濾鏡復制
13.1總體設計
13.1.1系統整體結構
13.1.2系統流程
13.2運行環境
13.2.1Anaconda環境
13.2.2TensorFlow環境
13.2.3Keras環境
13.3模塊實現
13.3.1模式選擇
13.3.2任意風格模式
13.3.3固定風格模式
13.4系統測試
13.4.1任意風格模式測試結果
13.4.2固定風格模式測試結果
項目14基於PyTorch的快速風格遷移
14.1總體設計
14.1.1系統整體結構
14.1.2系統流程
14.2運行環境
14.2.1Python環境
14.2.2PyTorch環境
14.2.3PyQt5環境
14.3模塊實現
14.3.1數據預處理
14.3.2模型構建
14.3.3模型訓練及保存
14.3.4界面化及應用
14.4系統測試
14.4.1訓練準確率
14.4.2測試效果
14.4.3程序應用
項目15CASIAHWDB手寫漢字識別
15.1總體設計
15.1.1系統整體結構
15.1.2系統流程
15.2運行環境
15.2.1Python環境
15.2.2TensorFlow環境
15.2.3wxPython和OpenCV環境
15.2.4pyttsx3環境
15.3模塊實現
15.3.1數據預處理
15.3.2模型構建
15.3.3模型訓練及保存
15.3.4前端界面
15.4系統測試
15.4.1測試效果
15.4.2模型應用
項目16圖像智能修復
16.1總體設計
16.1.1系統整體結構
16.1.2系統流程
16.2運行環境
16.2.1Python環境
16.2.2TensorFlow環境
16.2.3OpenFace環境
16.3模塊實現
16.3.1數據預處理
16.3.2模型構建
16.3.3模型訓練
16.3.4程序實現
16.3.5GUI設計
16.3.6程序打包
16.4系統測試
16.4.1GAN網絡損失變化
16.4.2測試效果
項目17黑白圖像自動著色
17.1總體設計
17.1.1系統整體結構
17.1.2系統流程
17.2運行環境
17.3模塊實現
17.3.1數據預處理
17.3.2模型構建與訓練
17.3.3模型調用與結果優化
17.3.4結果展示
17.4系統測試
項目18深度神經網絡壓縮與加速技術在風格遷移中的應用
18.1總體設計
18.1.1系統整體結構
18.1.2系統流程
18.2運行環境
18.2.1Python環境
18.2.2GPU環境
18.3模塊實現
18.3.1數據預處理
18.3.2創建模型
18.3.3模型訓練及保存
18.3.4模型測試
18.4系統測試
18.4.1風格遷移效果
18.4.2網絡的加速與壓縮
項目19遷移學習的狗狗分類器
19.1總體設計
19.1.1系統整體結構
19.1.2系統流程
19.2運行環境
19.2.1Python環境
19.2.2TensorFlow環境
19.2.3Keras環境
19.2.4wxPython的安裝
19.3模塊實現
19.3.1數據預處理
19.3.2模型構建
19.3.3模型訓練
19.3.4API調用
19.3.5模型生成
19.4系統測試
19.4.1訓練準確率
19.4.2測試效果
19.4.3模型應用
項目20基於TensorFlow的人臉檢測及追蹤
20.1總體設計
20.1.1系統整體結構
20.1.2系統流程
20.2運行環境
20.2.1Python環境
20.2.2TensorFlow環境
20.2.3models環境
20.3模塊實現
20.3.1數據預處理
20.3.2模型構建
20.3.3模型訓練及保存
20.4系統測試
主題書展
更多書展購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

