深度學習案例精粹:基於TensorFlow與Keras(簡體書)
商品資訊
系列名:人工智慧技術叢書
ISBN13:9787302596516
出版社:清華大學出版社(大陸)
作者:王曉華
出版日:2022/01/01
裝訂/頁數:平裝/204頁
規格:24cm*17cm (高/寬)
版次:一版
商品簡介
本書以實戰為主,通過豐富的實戰案例向讀者介紹深度學習可應用和落地的項目,書中所有案例都基於Python+TensorFlow 2.5+Keras技術,可用於深度學習課程的實戰訓練。本書配套示例源碼、PPT課件、思維導圖、數據集、開發環境與答疑服務。
全書共分11章。第1章講解深度學習的概念、流程、應用場景、模型分類和框架選擇,第2~11章列舉深度學習的項目實戰案例,包括手寫體識別、數據集分類、情感分類、文本情感分類、編碼器、漢字拼音轉換、中文文本分類、多標簽文本分類、人臉檢測、人臉識別、語音漢字轉換。
本書內容詳盡、案例豐富,是深度學習初學者必備的參考書,適合有基礎、亟待提升自己技術水平的人工智能從業人員,也可作為高等院校和培訓機構人工智能及相關專業的教材使用。
名人/編輯推薦
本書通過豐富的深度學習實戰案例,向讀者介紹深度學習可應用和落地的項目,包括手寫體識別、數據集分類、情感分類、文本情感分類、編碼器、漢字拼音轉換、中文文本分類、多標簽文本分類、人臉檢測、人臉識別、語音漢字轉換等。所有案例都基於Python+TensorFlow 2.5+Keras技術,可配套用於深度學習的實戰訓練。
序
前 言
TensorFlow從誕生之初即為全球人工智能領域最受用戶歡迎的人工智能開源框架,其見證了人工智能在全球的興起,同時引領了全行業的研究方向,改變了人類處理問題、解決問題的方法和認知,帶動了深度學習和人工智能領域的全面發展和成長壯大。TensorFlow的出現使得深度學習的學習門檻大大降低,不僅僅是數據專家,就連普通的程序設計人員,甚至於相關專業的學生,都可以用其來開發新的AI程序,而不需要深厚的算法理論和編程功底。
隨著深度學習在各個領域獲得巨大的成功,科研人員和從業者嘗試使用深度學習去解決各種任務。但是由於種種原因,可能在某個應用領域有較高能力的人員,在使用TensorFlow解決其他項目問題時,需要一個示範性的解決方案;或者一個初學深度學習的學生,需要一個能夠具有引導性的、可直接運行的深度學習代碼去引導其入門。
本書就是基於上述想法,選用TensorFlow 2.5作為深度學習的框架,提供了多個Python深度學習項目代碼供讀者上機練習,通過分析實例代碼、實現模型改進等形式,全面向讀者介紹使用TensorFlow 2進行深度學習實戰的核心技術和各方面涉及的相關知識,內容全面而翔實。
本書並不是一個簡單的實戰“例題”性書籍,本書在講解和演示實例代碼的過程中,對TensorFlow 2核心技術進行深入分析,重要內容均結合代碼進行實戰講解,圍繞深度學習基本原理也做了介紹。讀者通過這些實例可以深入掌握深度學習和TensorFlow 2的相關內容,並能進一步提高使用深度學習技術解決問題的能力。
本書面向深度學習的初級和中級讀者。通過本書的學習,讀者能夠掌握使用深度學習的基本體系和在TensorFlow 2框架下進行神經網絡設計的技術要點,以及從模型的構建到應用程序的編寫一整套的應用技巧。
本書特色
(1)重實踐,講原理。本書基於深度學習案例,先講解理論基礎,再逐步給出案例代碼,從而幫助讀者在學會理論的基礎上實踐代碼。
(2)作者經驗豐富,代碼編寫細膩。作者是長期奮戰在科研和工業界的一線算法設計和程序編寫人員,實戰經驗豐富,對代碼中可能會出現的各種問題和“坑”有豐富的處理經驗,使得讀者能夠少走彎路。
(3)對比多種應用方案,實戰案例豐富。本書采用大量的實例,同時也提供了一些實現同類功能的其他解決方案,覆蓋了使用TensorFlow 2進行深度學習開發中常用的知識。
示例源碼、PPT課件、思維導圖、數據集、開發環境下載與答疑服務
本書配套示例源碼、PPT課件、思維導圖、數據集、開發環境,需要使用微信掃描下面二維碼下載,可按頁面提示,把鏈接轉發到自己的郵箱中下載。答疑郵箱參見下載資源。如果發現問題,請直接發送郵件,郵件主題務必寫上“深度學習案例精粹”。
本書內容及知識體系
本書的所有案例都基於Python+TensorFlow 2.5+Keras來實現,主要內容如下:
第1章詳細介紹深度學習的基本內容以及主流框架的選擇,並通過一個文本情感分類的示例介紹深度學習的基本過程和步驟,從而引導讀者進入深度學習的大門。
第2章是深度學習的基礎性實例。使用卷積神經網絡去識別物體是深度學習一個經典內容,本章案例借助卷積神經網絡算法,構建一個簡單的CNN模型以進行MNIST數字識別。
第3章介紹ResNet的基本思想和內容,ResNet是一個具有裡程碑性質的框架,它的出現標志著粗獷的卷積神經網絡設計向著精確化和模塊化的方向轉化。ResNet本身的程序編寫非常簡單,但是其中蘊含的設計思想卻是跨越性的。本章使用ResNet實現了CIFAR-100數據集的分類。
第4~7章是自然語言處理方面的案例,其中包括循環神經網絡、圖卷積模型以及預訓練模型的使用。自然語言處理是深度學習在認知領域的一系列突破,通過不同示例代碼的講解,可以很好地引導讀者在自然語言處理領域中應用深度學習技術。
第8章向讀者介紹一個多標簽文本分類的實例,目的是將前期所學的深度學習和自然語言處理的內容進行一個歸納和復習,加強讀者對此部分的理解。
第9~10章是人臉識別案例。人臉識別是現代深度學習一個應用重點和趨勢,通過分別介紹人臉檢測和人臉識別的案例,拋磚引玉地介紹人臉識別的模型和理論。
第11章的語音識別是下一個深度學習應用的風口和方向。本章著重介紹語音識別的應用理論和實現方法,並帶領讀者完整實現一個語音文字轉換的實戰案例。此案例程可以作為學習示例使用,也可以作為實際應用的程序進行移植。
適合閱讀本書的讀者
Python編程人員
AI初學者
知識圖譜初學者
深度學習初學者
自然語言處理初學者
高等院校人工智能及相關專業的師生
培訓機構人工智能算法的學員
其他對智能化、自動化感興趣的開發者
勘誤和鳴謝
由於筆者的水平有限,加上TensorFlow版本的演進較快、編寫時間跨度較長,在編寫此書的過程中難免會出現疏漏的地方,懇請讀者來信批評指正。
感謝出版社的所有編輯在本書編寫和出版過程中提供的無私幫助和寶貴建議,正是由於他們的耐心和支持才讓本書得以出版。感謝家人對筆者的支持和理解,這些給予筆者莫大的動力,讓自己的努力更加有意義。
王曉華
2021年10月
目次
目 錄
第1章 深度學習與應用框架 1
1.1 深度學習的概念 1
1.1.1 何為深度學習 1
1.1.2 與傳統的“淺層學習”的區別 3
1.2 案例實戰:文本的情感分類 3
1.2.1 第一步:數據的準備 4
1.2.2 第二步:數據的處理 4
1.2.3 第三步:模型的設計 5
1.2.4 第四步:模型的訓練 5
1.2.5 第五步:模型的結果和展示 6
1.3 深度學習的流程、應用場景和模型分類 7
1.3.1 深度學習的流程與應用場景 7
1.3.2 深度學習的模型分類 8
1.4 主流深度學習的框架對比 9
1.4.1 深度學習框架的選擇 10
1.4.2 本書選擇:Keras與TensorFlow 10
1.5 本章小結 11
第2章 實戰卷積神經網絡—手寫體識別 12
2.1 卷積神經網絡理論基礎 12
2.1.1 卷積運算 12
2.1.2 TensorFlow中的卷積函數 14
2.1.3 池化運算 16
2.1.4 softmax激活函數 18
2.1.5 卷積神經網絡原理 19
2.2 案例實戰:MNIST手寫體識別 21
2.2.1 MNIST數據集的解析 21
2.2.2 MNIST數據集的特徵和標簽 23
2.2.3 TensorFlow 2.X編碼實現 25
2.2.4 使用自定義的卷積層實現MNIST識別 29
2.3 本章小結 32
第3章 實戰ResNet—CIFAR-100數據集分類 33
3.1 ResNet理論基礎 33
3.1.1 ResNet誕生的背景 34
3.1.2 模塊工具的TensorFlow實現 37
3.1.3 TensorFlow高級模塊layers 37
3.2 案例實戰:CIFAR-100數據集分類 44
3.2.1 CIFAR-100數據集的獲取 44
3.2.2 ResNet殘差模塊的實現 47
3.2.3 ResNet網絡的實現 49
3.2.4 使用ResNet對CIFAR-100數據集進行分類 52
3.3 本章小結 53
第4章 實戰循環神經網絡GRU—情感分類 54
4.1 情感分類理論基礎 54
4.1.1 復習簡單的情感分類 54
4.1.2 什麼是GRU 55
4.1.3 TensorFlow中的GRU層 57
4.1.4 雙向GRU 58
4.2 案例實戰:情感分類 59
4.2.1 使用TensorFlow自帶的模型來實現分類 59
4.2.2 使用自定義的DPCNN來實現分類 63
4.3 本章小結 67
第5章 實戰圖卷積—文本情感分類 68
5.1 圖卷積理論基礎 69
5.1.1 “節點”“鄰接矩陣”和“度矩陣”的物理意義 69
5.1.2 圖卷積的理論計算 71
5.1.3 圖卷積神經網絡的傳播規則 74
5.2 案例實戰:Cora數據集文本分類 75
5.2.1 Cora數據集簡介 75
5.2.2 Cora數據集的讀取與數據處理 77
5.2.3 圖卷積模型的設計與實現 78
5.2.4 圖卷積模型的訓練與改進 79
5.3 案例實戰:基於圖卷積的情感分類(圖卷積前沿內容) 83
5.3.1 文本結構化處理的思路與實現 83
5.3.2 使用圖卷積對文本進行分類實戰 89
5.3.3 圖卷積模型的改進 93
5.4 本章小結 95
第6章 實戰自然語言處理—編碼器 96
6.1 編碼器理論基礎 96
6.1.1 輸入層—初始詞向量層和位置編碼器層 97
6.1.2 自注意力層 99
6.1.3 ticks和LayerNormalization 104
6.1.4 多頭自注意力 105
6.2 案例實戰:簡單的編碼器 108
6.2.1 前饋層的實現 108
6.2.2 編碼器的實現 109
6.3 案例實戰:漢字拼音轉化模型 113
6.3.1 漢字拼音數據集處理 113
6.3.2 漢字拼音轉化模型的確定 115
6.3.3 模型訓練部分的編寫 119
6.3.4 推斷函數的編寫 120
6.4 本章小結 121
第7章 實戰BERT—中文文本分類 122
7.1 BERT理論基礎 122
7.1.1 BERT基本架構與應用 123
7.1.2 BERT預訓練任務與Fine-Tuning 124
7.2 案例實戰:中文文本分類 127
7.2.1 使用Hugging Face獲取BERT預訓練模型 127
7.2.2 BERT實戰文本分類 128
7.3 拓展:更多的預訓練模型 133
7.4 本章小結 136
第8章 實戰自然語言處理—多標簽文本分類 137
8.1 多標簽分類理論基礎 137
8.1.1 多標簽分類不等於多分類 137
8.1.2 多標簽分類的激活函數—sigmoid 138
8.2 案例實戰:多標簽文本分類 139
8.2.1 第一步:數據的獲取與處理 139
8.2.2 第二步:選擇特徵抽取模型 143
8.2.3 第三步:訓練模型的建立 144
8.2.4 第四步:多標簽文本分類的訓練與預測 145
8.3 本章小結 148
第9章 實戰MTCNN—人臉檢測 149
9.1 人臉檢測基礎 150
9.1.1 LFW數據集簡介 150
9.1.2 Dlib庫簡介 151
9.1.3 OpenCV簡介 152
9.1.4 使用Dlib做出圖像中的人臉檢測 152
9.1.5 使用Dlib和OpenCV建立人臉檢測數據集 156
9.2 案例實戰:基於MTCNN模型的人臉檢測 157
9.2.1 MTCNN模型簡介 158
9.2.2 MTCNN模型的使用 160
9.2.3 MTCNN模型中的一些細節 167
9.3 本章小結 168
第10章 實戰SiameseModel—人臉識別 169
10.1 基於深度學習的人臉識別模型 169
10.1.1 人臉識別的基本模型SiameseModel 170
10.1.2 SiameseModel的實現 171
10.1.3 人臉識別數據集的準備 173
10.2 案例實戰:基於相似度計算的人臉識別模型 175
10.2.1 一種新的損失函數Triplet Loss 175
10.2.2 基於TripletSemiHardLoss的MNIST模型 178
10.2.3 基於TripletSemiHardLoss和SENET的人臉識別模型 184
10.3 本章小結 187
第11章 實戰MFCC和CTC—語音轉換 188
11.1 MFCC理論基礎 188
11.1.1 MFCC 188
11.1.2 CTC 194
11.2 案例實戰:語音漢字轉換 197
11.2.1 第一步:數據集THCHS-30簡介 197
11.2.2 第二步:數據集的提取與轉化 198
11.3 本章小結 204
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。