王曉華,計算機專業講師,長期講授面向物件程序設計、數據結構、Hadoop程序設計等研究生和本科生相關課程;主要研究方向為云計算、數據挖掘。曾主持和參與多項國家和省級科研課題,獨立科研項目獲省級成果認定,發表過多篇論文,擁有一項國家專利。著有《Spark MLlib機器學習實踐》《TensorFlow深度學習應用實踐》《OpenCV+TensorFlow深度學習與計算機視覺實戰》《TensorFlow 2.0卷積神經網絡實戰》《TensorFlow+Keras自然語言處理實戰》等圖書。
前 言
在新冠疫情肆虐時,國家認可的健康寶(我們常說的綠碼)遍地開花,而這離不開人臉識別,人臉就是我們的通行證。
人臉識別技術就是基於人的臉部特征信息進行身份識別的一種生物識別技術,是用多種測量方法和手段來掃描人臉,包括熱成像、3D人臉地圖、獨特特征(也稱為地標)分類等分析面部特征的幾何比例、關鍵面部特征之間的映射距離、皮膚表面紋理。
長期以來,由於技術手段的落後和人臉的復雜,人臉技術一直沒有被大規模應用。究其原因,還是當時的人臉識別技術對人的頭部位置、面部表情以及年齡的易變性辨識度非常低,難以準確地判斷目標,不能給出一個準確度較高的結論,從而制約了這項技術的發展。
隨著深度學習的興起,人們發現使用深度學習技術能夠較好地進行人臉識別。深度學習方法的主要優勢是可以用非常大型的數據集進行訓練,學習到表征這些數據的最佳特征,從而在要求的準確度下實現人臉識別的目標。
本書以全新的TensorFlow 2版本為基礎進行編寫,教會讀者如何運用深度學習框架實現人臉識別。從TensorFlow 2的基礎語法開始講解,到介紹如何使用TensorFlow 2進行深度學習程序的設計,以及如何在實戰中設計出人臉識別模型。
本書對TensorFlow 2的核心內容進行深入分析,重要內容均結合代碼進行講解,圍繞深度學習原理介紹了大量實戰案例,讀者通過這些案例可以將TensorFlow 2運用於自己的實際開發工作和項目中。
本書是一本面向初級和中級讀者的翔實教程。通過本書的學習,讀者能夠掌握深度學習的核心內容和在TensorFlow框架下實現人臉識別的知識要點,以及掌握從模型構建到應用程序編寫的整套技巧。
本書特色
1. 版本新,易入門
本書詳細介紹TensorFlow 2的安裝和使用、TensorFlow的默認API以及官方推薦的Keras編程方法與技巧等。
2. 作者經驗豐富,代碼編寫細膩
作者是長期奮戰在科研和工業界的一線算法設計和程序編寫人員,實戰經驗豐富,對代碼中可能會出現的各種問題和“坑”有豐富的處理經驗,使得讀者能夠少走很多彎路。
3. 理論扎實,深入淺出
在代碼設計的基礎上,本書還深入淺出地介紹需要掌握的深度學習的一些基本理論知識,作者通過大量的公式與圖示結合的方式對理論進行闡述,是一本難得的好書。
4. 對比多種應用方案,實戰案例豐富
本書采用大量的實例,同時也提供一些實現同類功能的其他解決方案,覆蓋使用TensorFlow進行深度學習開發中常用的知識。
本書內容及知識體系
本書是基於TensorFlow 2.1版本的新架構模式和框架來完整介紹TensorFlow 2使用方法的進階教程,主要內容如下:
第1、2章是本書的起始部分,詳細介紹人類視覺的生理解釋和人臉識別的發展歷程、使用過的傳統技術和方法以及缺陷和不足,並且介紹使用深度學習進行人臉識別的通用流程和一些可以獲取到的數據集,供讀者在後期學習中使用。
第3章是有關深度學習框架TensorFlow的使用。本章詳細介紹TensorFlow 2.1版本的安裝方法以及對應的運行環境的安裝,並且通過一個簡單的例子驗證TensorFlow 2的安裝效果。還將介紹TensorFlow硬件的采購,使用一塊能夠運行TensorFlow GPU版本的顯卡能讓我們的學習事半功倍。
第4章是本書的重點,從MODEL的設計開始,循序漸進地介紹TensorFlow 2的編程方法和步驟,包括結合Keras進行TensorFlow 2模型設計的完整步驟,以及自定義層的方法。第4章的內容看起來很簡單,但卻是本書的核心,讀者一定要反復閱讀,掌握所有內容和代碼的編寫。
第5章是深度學習的理論部分,介紹反饋神經網絡的實現和核心的兩個算法,作者通過圖示並結合理論公式的方式詳細介紹理論和原理,並手動實現了一個反饋神經網絡。
第6章詳細介紹卷積神經網絡的原理和各個模型的使用和自定義內容,講解借助卷積神經網絡算法構建一個簡單的CNN模型進行MNIST數字識別。使用卷積神經網絡識別物體是深度學習的一個經典內容,也是人臉識別的基礎內容。因而本章也是本書的重點內容,能夠極大地加強讀者掌握對TensorFlow框架的使用和程序的編寫。
第7章介紹TensorFlow新版本的數據讀寫和訓練過程的可視化部分,內容包括使用TensorFlow 2自帶的Datasets API對數據的序列化存儲,通過簡單的想法將數據重新讀取和調用的程序編寫方法,以及訓練過程可視化的一個非常重要的工具TensorBoard。
第8章介紹ResNet的基本思想和內容。ResNet是一個具有裡程碑性質的框架,標志著粗獷的卷積神經網絡設計向著精確化和模塊化的方向轉化。ResNet本身的程序編寫非常簡單,但是其中蘊含的設計思想卻是跨越性的。
第9章講解人臉識別的一個重要模塊。首先向讀者介紹使用Python封裝好的類庫實現人臉的檢測,並在此基礎上教會讀者使用已有的程序自制所需要的人臉檢測數據集。之後詳細介紹MTCNN這個經典的人臉檢測模型的使用方法。
第10章介紹使用多種深度學習模型實現人臉識別模型,從基於卷積神經到使用孿生網絡的單機版模型,進而引申到為了解決人臉識別不易遷移而誕生的TripletModel。本書為這一系列的人臉識別模型均提供了實現代碼,並對這些實現代碼進行了講解,旨在幫助讀者解決使用人臉識別模型實戰時可能遇到的各種問題。
源碼、數據集、開發環境與技術支持
本書配套資源請用微信掃描右邊的二維碼下載,也可按頁面提示把鏈接轉發到自己的郵箱中下載。
如果有疑問,可發送郵件至booksaga@163.com,郵件主題為“TensorFlow人臉識別實戰”。技術支持信息請查看下載資源中的相關文件。
適合閱讀本書的讀者
? 人工智能初學者。
? 深度學習初學者。
? 人臉識別初學讀者。
? 高等院校人工智能相關專業的師生。
? 培訓機構的師生。
? 其他對智能化、自動化感興趣的研發人員。
勘誤和支持
由於筆者的水平有限,加之編寫時間跨度較長,同時TensorFlow的演進較快,在編寫此書的過程中難免會出現不夠準確的地方,懇請讀者批評指正。
感謝出版社所有編輯在本書編寫中提供的無私幫助和寶貴建議,正是由於編輯的耐心和支持才讓本書得以出版。感謝我的家人的支持和理解,這些都給了我莫大的動力,讓我的努力更加有意義。
著者
2021年1月
目 錄
第1章 Hello World——從計算機視覺與人類視覺談起 1
1.1 視覺的發展簡史 1
1.1.1 人類視覺神經的啟迪 1
1.1.2 計算機視覺的難點與人工神經網絡 3
1.1.3 應用深度學習解決計算機視覺問題 3
1.2 計算機視覺學習的基礎與研究方向 5
1.2.1 學習計算機視覺結構圖 5
1.2.2 計算機視覺的學習方式和未來趨勢 6
1.3 本章小結 7
第2章 眾裡尋她千百度——人臉識別的前世今生 8
2.1 人臉識別簡介 9
2.1.1 人臉識別的發展歷程 9
2.1.2 人臉識別的一般方法 10
2.1.3 人臉識別的通用流程 11
2.2 基於深度學習的人臉識別 13
2.2.1 基於深度學習的人臉識別簡介 14
2.2.2 用於深度學習的人臉識別數據集 16
2.3 本章小結 19
第3章 TensorFlow的安裝 20
3.1 搭建環境1:安裝Python 20
3.1.1 Anaconda的下載與安裝 20
3.1.2 Python編譯器PyCharm的安裝 24
3.1.3 使用Python計算softmax函數 27
3.2 搭建環境2:安裝TensorFlow 2 28
3.2.1 安裝TensorFlow 2的CPU版本 28
3.2.2 安裝TensorFlow 2的GPU版本 29
3.2.3 練習——Hello TensorFlow 32
3.3 本章小結 32
第4章 Hello TensorFlow & Keras 33
4.1 TensorFlow & Keras 33
4.1.1 模型 34
4.1.2 使用Keras API實現鳶尾花分類的例子(順序模式) 35
4.1.3 使用Keras函數式編程實現鳶尾花分類的例子(重點) 37
4.1.4 使用保存的Keras模式對模型進行復用 40
4.1.5 使用TensorFlow標準化編譯對Iris模型進行擬合 41
4.1.6 多輸入單輸出TensorFlow編譯方法(選學) 45
4.1.7 多輸入多輸出TensorFlow編譯方法(選學) 48
4.2 全連接層詳解 50
4.2.1 全連接層的定義與實現 50
4.2.2 使用TensorFlow自帶的API實現全連接層 51
4.2.3 打印顯示已設計的模型結構和參數 54
4.3 懶人的福音——Keras模型庫 56
4.3.1 ResNet50模型和參數的載入 57
4.3.2 使用ResNet50作為特征提取層建立模型 58
4.4 本章小結 61
第5章 深度學習的理論基礎 62
5.1 BP神經網絡簡介 62
5.2 BP神經網絡兩個基礎算法詳解 66
5.2.1 最小二乘法詳解 66
5.2.2 道士下山的故事——梯度下降算法 68
5.2.3 最小二乘法的梯度下降算法以及Python實現 71
5.3 反饋神經網絡反向傳播算法 77
5.3.1 深度學習基礎 78
5.3.2 鏈式求導法則 79
5.3.3 反饋神經網絡原理與公式推導 80
5.3.4 反饋神經網絡原理的激活函數 85
5.3.5 反饋神經網絡原理的Python實現 87
5.4 本章小結 91
第6章 卷積層與MNIST實戰 92
6.1 卷積運算的基本概念 92
6.1.1 卷積運算 93
6.1.2 TensorFlow中卷積函數的實現 95
6.1.3 池化運算 97
6.1.4 softmax激活函數 98
6.1.5 卷積神經網絡原理 99
6.2 編程實戰:MNIST手寫體識別 101
6.2.1 MNIST數據集 101
6.2.2 MNIST數據集的特征和標簽 103
6.2.3 TensorFlow 2編程實戰:MNIST數據集 106
6.2.4 使用自定義的卷積層實現MNIST識別 110
6.3 激活、分類以及池化函數簡介(選學) 113
6.3.1 別偷懶——激活函數是分割器 113
6.3.2 太多了,我只要一個——池化運算 116
6.3.3 全連接層詳解 117
6.3.4 最終的裁判——分類函數 119
6.3.5 隨機失活層 121
6.4 本章小結 121
第7章 TensorFlow Datasets和TensorBoard詳解 122
7.1 TensorFlow Datasets簡介 122
7.1.1 Datasets數據集的安裝 124
7.1.2 Datasets數據集的使用 124
7.2 Datasets數據集的使用——FashionMNIST 126
7.2.1 FashionMNIST數據集下載與展示 127
7.2.2 模型的建立與訓練 129
7.3 使用Keras對FashionMNIST數據集進行處理 131
7.3.1 獲取數據集 131
7.3.2 數據集的調整 132
7.3.3 使用Python類函數建立模型 132
7.3.4 模型的查看和參數打印 134
7.3.5 模型的訓練和評估 135
7.4 使用TensorBoard可視化訓練過程 137
7.4.1 TensorBoard文件夾的設置 138
7.4.2 TensorBoard的顯式調用 138
7.4.3 TensorBoard的使用 141
7.5 本章小結 145
第8章 從冠軍開始:ResNet 146
8.1 ResNet的基礎原理與程序設計基礎 147
8.1.1 ResNet誕生的背景 147
8.1.2 模塊工具的TensorFlow實現 150
8.1.3 TensorFlow高級模塊layers的用法 151
8.2 ResNet實戰:CIFAR-100數據集分類 158
8.2.1 CIFAR-100數據集簡介 158
8.2.2 ResNet殘差模塊的實現 161
8.2.3 ResNet網絡的實現 163
8.2.4 使用ResNet對CIFAR-100數據集進行分類 166
8.3 ResNet的兄弟——ResNeXt 168
8.3.1 ResNeXt誕生的背景 168
8.3.2 ResNeXt殘差模塊的實現 169
8.3.3 ResNeXt網絡的實現 171
8.3.4 ResNeXt和ResNet的比較 172
8.4 本章小結 173
第9章 人臉檢測實戰 174
9.1 使用Python庫進行人臉檢測 175
9.1.1 LFW數據集簡介 175
9.1.2 Dlib庫簡介 176
9.1.3 OpenCV簡介 177
9.1.4 使用Dlib實現圖像中的人臉檢測 177
9.1.5 使用Dlib和OpenCV建立人臉檢測數據集 181
9.2 基於深度學習MTCNN模型的人臉檢測 183
9.2.1 MTCNN模型簡介 183
9.2.2 MTCNN模型的使用 186
9.2.3 MTCNN模型中的一些細節 193
9.3 本章小結 195
第10章 人臉識別模型 196
10.1 基於深度學習的人臉識別模型 196
10.1.1 人臉識別的基本模型SiameseModel(孿生模型) 197
10.1.2 SiameseModel的實現 199
10.1.3 人臉識別數據集的準備 201
10.2 基於相似度計算的人臉識別模型 202
10.2.1 一種新的損失函數Triplet Loss 202
10.2.2 基於TripletSemiHardLoss的MNIST模型 205
10.2.3 基於TripletSemiHardLoss和SENET的人臉識別模型 211
10.3 本章小結 216
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。