TOP
0
0
即日起~6/30,暑期閱讀書展,好書7折起
神經網絡與深度學習(簡體書)
滿額折

神經網絡與深度學習(簡體書)

商品資訊

人民幣定價:149 元
定價
:NT$ 894 元
優惠價
87778
領券後再享88折起
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:23 點
相關商品
商品簡介
作者簡介
名人/編輯推薦
目次

商品簡介

本書是深度學習領域的入門教材,系統地整理了深度學習的知識體系,並由淺入深地闡述了深度學習的原理、模型以及方法,使得讀者能全面地掌握深度學習的相關知識,並提高以深度學習技術來解決實際問題的能力。
全書共15章,分為三個部分。

·第一部分為機器學習基礎:第1章是緒論,介紹人工智能、機器學習、深度學習的概要,使讀者全面了解相關知識;第2~3章介紹機器學習的基礎知識。

·第二部分是基礎模型:第4~6章分別講述三種主要的神經網絡模型:前饋神經網絡、卷積神經網絡和循環神經網絡;第7章介紹神經網絡的優化與正則化方法;第8章介紹神經網絡中的注意力機制和外部記憶;第9章簡要介紹一些無監督學習方法;第10章介紹一些模型獨立的機器學習方法,包括集成學習、自訓練、協同訓練、多任務學習、遷移學習、終身學習、元學習等。

·第三部分是進階模型:第11章介紹概率圖模型的基本概念,為後面的章節進行鋪墊;第12章介紹兩種早期的深度學習模型:玻爾茲曼機和深度信念網絡;第13章介紹深度生成模型,包括變分自編碼器和生成對抗網絡;第14章介紹深度強化學習;第15章介紹應用十分廣泛的序列生成模型。

本書可作為高等院校人工智能、計算機、自動化、電子和通信等相關專業的研究生或本科生教材,也可供相關領域的研究人員和工程技術人員參考。

 

作者簡介

邱錫鵬

復旦大學計算機科學技術學院教授、博士生導師,於復旦大學獲得理學學士和博士學位。主要研究領域包括自然語言處理、機器學習、深度學習等,在相關領域的權威國際期刊、會議上發表學術論文60餘篇,獲得計算語言學國際會議ACL 2017傑出論文獎、全國計算語言學會議CCL 2019最佳論文獎,2015年入選首屆中國科協青年人才托舉工程,2018年獲得中國中文信息學會“錢偉長中文信息處理科學技術獎青年創新一等獎”,入選由“清華—中國工程院知識智能聯合研究中心和清華大學人工智能研究院”聯合發布的2020年人工智能(AI)全球具影響力學者提名。該排名參考過去十年人工智能各子領域最有影響力的會議和期刊發表論文的引用情況,排名前10的學者當選該領域當年影響力學者獎,排名前100的其他學者獲影響力學者提名獎。作為項目負責人開源發布了兩個自然語言處理開源系統FudanNLP和FastNLP,獲得了學術界和產業界的廣泛使用。目前擔任中國中文信息學會青年工作委員會執行委員、計算語言學專委會委員、語言與知識計算專委會委員,中國人工智能學會青年工作委員會常務委員、自然語言理解專委會委員。

名人/編輯推薦

近十年來,得益於深度學習技術的重大突破,人工智能領域得到迅猛發展,取得了許多令人驚嘆的成果。邱錫鵬教授撰寫的《神經網絡和深度學習》是國內出版的第一部關於深度學習的專著。邱教授在自然語言處理、深度學習領域做出了許多業界領先的工作,他所講授的同名課程深受學生們的好評,該課程的講義也在網上廣為流傳。本書是基於他多年來研究、教學第一線的豐富經驗撰寫而成,內容詳盡,敘述嚴謹,圖文並茂,通俗易懂。確信一定會得到廣大讀者的喜愛。強烈推薦!

—— 李航(字節跳動AI Lab Director,ACL Fellow,IEEE Fellow)

 

邱錫鵬博士是自然語言處理領域的優秀青年學者,對近年來廣為使用的神經網絡與深度學習技術有深入鑽研。這本書是他認真寫就,對該領域初學者大有裨益。

—— 周志華(南京大學計算機系主任、人工智能學院院長,歐洲科學院外籍院士)

 

◆ 推薦序◆

很高興為邱錫鵬教授的《神經網絡與深度學習》一書寫序.

近年來由於阿爾法圍棋戰勝人類頂級高手新聞的轟動效應,讓人工智能一下子進入了尋常百姓家,成為家喻戶曉的熱詞.阿爾法圍棋能取得如此成功的關鍵技術之一,正是所謂的深度學習.而其實在阿爾法圍棋出現之前,以深度學習為代表的人工智能技術已經在模式識別、計算機視覺、語音識別與生成、自然語言處理、機器翻譯等方面取得了重要的進步.也因此,2018年有計算機領域諾貝爾獎之稱的圖靈獎頒給了對深度學習作出重要貢獻的三位科學家:YoshuaBengio、GeoffeyHinton和YannLeCun.

邱錫鵬教授的《神經網絡與深度學習》一書較全面地介紹了神經網絡、機器學習和深度學習的基本概念、模型和方法,同時也涉及深度學習中許多最新進展.書後還提供了相關數學分支的簡要介紹,以供讀者需要時參考.

本書電子版已在GitHub上開放共享,得到廣泛好評,相信此書的出版可以給有意了解或進入這一頗有前途領域的讀者提供一本很好的參考書.基本的深度學習相當於函數逼近問題,即函數或曲面的擬合,所不同的是,這裡用作基函數的是非線性的神經網絡函數,而原來數學中用的則是多項式、三角多項式、B -spline、一般spline以及小波函數等的線性組合.

由於神經網絡的非線性和復雜性(要用許多結構參數和連接權值來描述),它有更強的表達能力,即從給定的神經網絡函數族中可能找到對特定數據集擬合得更好的神經網絡.相信這正是深度學習方法能得到一系列很好結果的重要原因.直觀上很清楚,當你有更多的選擇時,你有可能作出更好的選擇.當然,要從非常非常多的選擇中找到那個更好的選擇並不容易.

這裡既涉及設計合適的神經網絡類型,也涉及從該類型的神經網絡中找出好的(即擬合誤差小的)特定神經網絡的方法.後者正是數學中最優化分支所研究的問題.從數學角度看,目前深度學習中所用的優化算法還是屬於比較簡單的梯度下降法.許多數學中已有的更複雜的算法,由於高維數問題都還沒有得到應用.本書中對這兩方面都有很好的介紹.相信隨著研究的不斷發展,今後一定會提出更多新的神經網絡和新的優化算法.

所謂成也蕭何敗也蕭何,神經網絡的非線性和復雜性(即要用大量參數來描述,在深度網絡場合其個數動輒上萬、百萬甚至更多)使得雖然通過大量的標註數據經過深度學習可以得到一個結果誤差很小的神經網絡,但要用它來進行解釋卻十分困難.其實這也是長期困擾神經網絡方法的一個問題,使用深度神經網絡的深度學習方法也概莫能外.

難於解釋相當於知其然不知其所以然.這對有些應用而言是可以的,但對有些可能造成嚴重後果的應用而言則有很大問題.一般而言,人們除了希望知其然,也會希望能知其所以然.

近來也有學者發現,一個精度很高的神經網絡,去改變它的幾個(甚至一個)參數,就會使該網絡的性能下降許多.換言之,深度學習方法的魯棒性也有待研究.

總之,本書介紹的基於神經網絡的深度學習方法是近年來經過大量實踐並取得很好成果的一種很通用的方法,也是近年來人工智能領域中最活躍的分支之一.相信無論在方法本身的發展上,抑或在新領域應用的研發上,都會呈現出一派欣欣向榮的氣象.

吳立德

於上海·復旦大學

2019年8月17日

◆ 前言◆

近年來,以機器學習、知識圖譜為代表的人工智能技術逐漸變得普及.從車牌識別、人臉識別、語音識別、智能助手、推薦系統到自動駕駛,人們在日常生活中都可能有意無意地用到了人工智能技術.這些技術的背後都離不開人工智能領域研究者的長期努力.特別是最近這幾年,得益於數據的增多、計算能力的增強、學習算法的成熟以及應用場景的豐富,越來越多的人開始關注這個“嶄新”的研究領域:深度學習.深度學習以神經網絡為主要模型,一開始用來解決機器學習中的表示學習問題.但是由於其強大的能力,深度學習越來越多地用來解決一些通用人工智能問題,比如推理、決策等.目前,深度學習技術在學術界和工業界取得了廣泛的成功,受到高度重視,並掀起新一輪的人工智能熱潮.

然而,我們也應充分意識到目前以深度學習為核心的各種人工智能技術和“人類智能”還不能相提並論.深度學習需要大量的標註數據,和人類的學習方式差異性很大.雖然深度學習取得了很大的成功,但是深度學習還不是一種可以解決一系列複雜問題的通用智能技術,而是可以解決單個問題的一系列技術.比如可以打敗人類的AlphaGo只能下圍棋,而不會做簡單的算術運算.想要達到通用人工智能依然困難重重.

本書的寫作目的是使得讀者能夠掌握神經網絡與深度學習技術的基本原理,知其然還要知其所以然.全書共15章.第1章是緒論,概要介紹人工智能、機器學習和深度學習,使讀者全面了解相關知識.第2、3章介紹機器學習的基礎知識.第4~6章分別講述三種主要的神經網絡模型:前饋神經網絡、卷積神經網絡和循環神經網絡.第7章介紹神經網絡的優化與正則化方法.第8章介紹神經網絡中的注意力機制和外部記憶.第9章簡要介紹一些無監督學習方法.第10章介紹一些模型獨立的機器學習方法:集成學習、自訓練和協同訓練、多任務學習、遷移學習、終身學習、元學習等,這些都是目前深度學習的難點和熱點問題.第11章介紹概率圖模型的基本概念,為後面的章節進行鋪墊.第12章介紹兩種早期的深度學習模型:玻爾茲曼機和深度信念網絡.第13章介紹最近兩年發展十分迅速的深度生成模型:變分自編碼器和生成對抗網絡.第14章介紹深度強化學習的知識.第15章介紹應用十分廣泛的序列生成模型.

2015年復旦大學計算機學院開設了“神經網絡與深度學習”課程.講好深度學習課程並不是一件容易的事,當時還沒有關於深度學習的系統介紹,而且課程涉及的知識點非常多並且比較雜亂,和實踐結合也十分緊密.作為任課教師,我嘗試梳理了深度學習的知識體系,並寫了一本講義放在網絡上.雖然現在看起來當時對深度學習的理解仍然十分粗淺,且講義存在很多錯誤,但依然受到了很多熱心網友的鼓勵.2016年年初,機械工業出版社華章公司的姚蕾編輯多次拜訪並希望我能將這個講義整理成書.我一方面被姚蕾編輯的誠意打動,另一方面也確實感到應該有一本面向在校學生和相關從業人員的關於深度學習的專門書籍,因此最終有了正式出版的意願.但我依然低估了寫書的難度,一方面是深度學習的發展十分迅速,而自己關於深度學習的認知也在不斷變化,導致已寫好的內容經常需要修改;另一方面是平時的科研工作十分繁忙,很難抽出大段的時間來靜心寫作,因此斷斷續續的寫作一直拖延至今.

我理想中著書立說的境界是在某一個領域有自己的理論體系,將各式各樣的方法都統一到自己的體系下,並可以容納大多數技術,從新的角度來重新解釋這些技術.本書顯然還達不到這樣的水平,但希望能結合自身的經驗,對神經網絡和深度學習的相關知識進行梳理、總結,通過寫書這一途徑,也促使自己能夠更加深入地理解深度學習這一領域,提高自身的理論水平.

本書能夠完成,首先感謝我的導師吳立德教授,他對深度學習的獨到見解和深入淺出的講授,使得我對深度學習有了更深層次的認識,也感謝復旦大學計算機學院的黃萱菁教授和薛向陽教授的支持和幫助.本書在寫作時將書稿放在網絡上,也得到很多網友的幫助,特別感謝王利鋒、林同茂、張鈞瑞、李浩、胡可鑫、韋鵬輝、徐國海、侯宇蓬、任強、王少敬、肖耀、李鵬等人指出了本書初稿的錯誤或提出了富有建設性的意見.此外,本書在寫作過程中參考了互聯網上大量的優秀資料,如維基百科、知乎、Quora等網站.

另外,我也特別感謝我的家人.本書的寫作佔用了大量的業餘時間,沒有家人的理解和支持,這本書不可能完成.

最後,因為個人能力有限,書中難免有不當和錯誤之處,還望讀者海涵和指正,不勝感激.

邱錫鵬

於上海·復旦大學

2020年3月31日

目次

前言

常用符號表

第1章緒論3

1.1人工智能...............................4

1.2機器學習...............................7

1.3表示學習...............................8

1.4深度學習...............................11

1.5神經網絡...............................13

1.6本書的知識體系...........................17

1.7常用的深度學習框架.........................18

1.8總結和深入閱讀...........................20

第2章機器學習概述23

2.1基本概念...............................24

2.2機器學習的三個基本要素......................26

2.3機器學習的簡單示例——線性回歸.................33

2.4偏差-方差分解............................38

2.5機器學習算法的類型.........................41

2.6數據的特徵表示...........................43

2.7評價指標...............................46

2.8理論和定理..............................49

2.9總結和深入閱讀...........................51

第3章線性模型

3.1線性判別函數和決策邊界......................56

3.2Logistic回歸.............................59

3.3Softmax回歸.............................61

3.4感知器.................................64

3.5支持向量機..............................71

3.6損失函數對比.............................75

3.7總結和深入閱讀...........................76

第二部分基礎模型

第4章前饋神經網絡81

4.1神經元.................................82

4.1.1Sigmoid型函數.......................83

4.1.2ReLU函數..........................86

4.1.3Swish函數..........................88

4.1.4GELU函數..........................89

4.1.5Maxout單元.........................89

4.2網絡結構...............................90

4.3前饋神經網絡.............................91

4.4反向傳播算法.............................95

4.5自動梯度計算.............................98

4.6優化問題...............................103

4.7總結和深入閱讀...........................104

第5章卷積神經網絡109

5.1卷積..................................110

5.2卷積神經網絡.............................115

5.3參數學習...............................120

5.4幾種典型的捲積神經網絡......................121

5.5其他卷積方式.............................127

5.6總結和深入閱讀...........................130

第6章循環神經網絡133

6.1給網絡增加記憶能力.........................134

6.2簡單循環網絡.............................135

6.3應用到機器學習...........................138

6.4參數學習...............................140

6.5長程依賴問題.............................143

6.5.1改進方案...........................144

6.6基於門控的循環神經網絡......................145

6.7深層循環神經網絡..........................149

6.8擴展到圖結構.............................151

6.9總結和深入閱讀...........................153

第7章網絡優化與正則化157

7.1網絡優化...............................157

7.2優化算法...............................160

7.3參數初始化..............................171

7.4數據預處理..............................176

7.5逐層歸一化..............................178

7.6超參數優化..............................183

7.7網絡正則化..............................186

7.8總結和深入閱讀...........................192

第8章註意力機制與外部記憶197

8.1認知神經學中的注意力.......................198

8.2注意力機制..............................199

8.3自註意力模型.............................203

8.4人腦中的記憶.............................205

8.5記憶增強神經網絡..........................207

8.6基於神經動力學的聯想記憶.....................211

8.6.1Hopfiel網絡........................212

8.7總結和深入閱讀...........................215

第9章無監督學習219

9.1無監督特徵學習...........................220

9.2概率密度估計.............................227

9.3總結和深入閱讀...........................232

第10章模型獨立的學習方式235

10.1集成學習...............................235

10.1.1AdaBoost算法........................237

10.2自訓練和協同訓練..........................240

10.3多任務學習..............................242

10.4遷移學習...............................245

10.5終身學習...............................249

10.6元學習.................................252

10.7總結和深入閱讀...........................255

第三部分進階模型

第11章概率圖模型261

11.1模型表示...............................262

11.2學習..................................271

11.3推斷..................................279

11.4變分推斷...............................283

11.5基於採樣法的近似推斷.......................285

11.6總結和深入閱讀...........................292

第12章深度信念網絡297

12.1玻爾茲曼機..............................297

12.2受限玻爾茲曼機...........................304

12.3深度信念網絡.............................309

12.4總結和深入閱讀...........................313

第13章深度生成模型317

13.1概率生成模型.............................318

13.2變分自編碼器.............................319

13.3生成對抗網絡.............................327

13.3.1顯式密度模型和隱式密度模型...............327

13.3.2網絡分解...........................327

13.3.3訓練..............................329

13.3.4一個生成對抗網絡的具體實現:DCGAN..........330

13.3.5模型分析...........................330

13.3.6改進模型...........................333

13.4總結和深入閱讀...........................336

第14章深度強化學習339

14.1強化學習問題.............................340

14.1.1典型例子...........................340

14.1.2強化學習定義........................340

14.1.3馬爾可夫決策過程......................341

14.1.4強化學習的目標函數....................343

14.1.5值函數............................344

14.1.6深度強化學習........................345

14.2基於值函數的學習方法.......................346

14.2.1動態規划算法........................346

14.2.2蒙特卡羅方法........................349

14.2.3時序差分學習方法......................350

14.2.4深度Q網絡..........................353

14.3基於策略函數的學習方法......................354

14.3.1REINFORCE算法......................356

14.3.2帶基準線的REINFORCE算法...............356

14.4演員-評論員算法...........................358

14.5總結和深入閱讀...........................360

第15章序列生成模型365

15.1序列概率模型.............................366

15.1.1序列生成...........................367

15.2N元統計模型.............................368

15.3深度序列模型.............................370

15.3.1模型結構...........................370

15.3.2參數學習...........................373

15.4評價方法...............................373

15.4.1困惑度............................373

15.4.2BLEU算法..........................374

15.4.3ROUGE算法.........................375

15.5序列生成模型中的學習問題.....................375

15.5.1曝光偏差問題........................376

15.5.2訓練目標不一致問題....................377

15.5.3計算效率問題........................377

15.6序列到序列模型...........................385

15.6.1基於循環神經網絡的序列到序列模型...........386

15.6.2基於注意力的序列到序列模型...............387

15.6.3基於自註意力的序列到序列模型..............388

15.7總結和深入閱讀...........................390

附錄數學基礎393

附錄A 線性代數394

附錄B 微積分404

附錄C 數學優化413

附錄D 概率論420

附錄E 信息論433

索引439

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 778
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區