商品簡介
作者簡介
目次
相關商品
商品簡介
全書分為5章,通過介紹完整的神經網絡模型(包括循環神經網絡、長短期記憶網絡以及序列到序列模型)實例,向讀者闡釋用於自然語言處理(NLP)的深度學習概念。前三章介紹NLP和深度學習的基礎知識、詞向量表示和高級算法,後兩章集中介紹實現過程,並使用Python工具TensorFlow和Keras來處理複雜的架構,比如RNN、LSTM和seq2seq。本書遵循循序漸進的方法,*後集合全部知識構建一個問答式聊天機器人系統。
作者簡介
Palash Goyal, 是一名高級數據科學家,目前從事將數據科學和深度學習用於在線營銷領域的工作。他曾在印度理工學院(IIT)的Guwahati分校學習數學和計算機科學,畢業後他開始在快節奏環境中工作。他在電子商務、旅遊、保險和銀行等行業擁有豐富的經驗,熱衷於數學和金融。他利用深度學習和強化學習技術進行價格預測與投資組合管理,在業餘時間管理他的多種加密貨幣和首次代幣發行(ICO)。他追蹤數據科學領域的趨勢,並在博客http://madoverdata.com上分享這些趨勢。他還會在空閒時發表與智慧農業相關的文章。
Sumit Pandey, 畢業於印度理工學院(IIT)的Kharagpur分校,曾在AXA Business Services工作了大約一年,擔任數據科學顧問。他目前正在創辦自己的企業。
Karan Jain, 是Sigtuple公司的一名產品分析師,他在那裡研究尖端的AI驅動診斷產品。此前,他曾在醫療保健解決方案公司Vitrana擔任數據科學家。他喜歡在快節奏的數據初創公司工作。在閒暇時間,Karan深入涉獵基因組學、BCI接口和光遺傳學。最近,他對用於便攜式診斷的POC設備和納米技術產生了興趣。Karan在LinkedIn上有3000多名粉絲。
Sumit Pandey, 畢業於印度理工學院(IIT)的Kharagpur分校,曾在AXA Business Services工作了大約一年,擔任數據科學顧問。他目前正在創辦自己的企業。
Karan Jain, 是Sigtuple公司的一名產品分析師,他在那裡研究尖端的AI驅動診斷產品。此前,他曾在醫療保健解決方案公司Vitrana擔任數據科學家。他喜歡在快節奏的數據初創公司工作。在閒暇時間,Karan深入涉獵基因組學、BCI接口和光遺傳學。最近,他對用於便攜式診斷的POC設備和納米技術產生了興趣。Karan在LinkedIn上有3000多名粉絲。
目次
譯者序
前言
致謝
關於作者
關於技術審校人員
第1章 自然語言處理和深度學習概述 1
1.1 Python包 2
1.1.1 NumPy 2
1.1.2 Pandas 6
1.1.3 SciPy 9
1.2 自然語言處理簡介 11
1.2.1 什麼是自然語言處理 11
1.2.2 如何理解人類的語言 11
1.2.3 自然語言處理的難度是什麼 11
1.2.4 我們想通過自然語言處理獲得什麼 13
1.2.5 語言處理中的常用術語 13
1.3 自然語言處理庫 14
1.3.1 NLTK 14
1.3.2 TextBlob 15
1.3.3 SpaCy 17
1.3.4 Gensim 19
1.3.5 Pattern 20
1.3.6 Stanford CoreNLP 21
1.4 NLP入門 21
1.4.1 使用正則表達式進行文本搜索 21
1.4.2 將文本轉換為列表 21
1.4.3 文本預處理 22
1.4.4 從網頁中獲取文本 22
1.4.5 移除停止詞 23
1.4.6 計數向量化 23
1.4.7 TF-IDF分數 24
1.4.8 文本分類器 25
1.5 深度學習簡介 25
1.6 什麼是神經網絡 27
1.7 神經網絡的基本結構 29
1.8 神經網絡的類型 32
1.8.1 前饋神經網絡 33
1.8.2 卷積神經網絡 33
1.8.3 循環神經網絡 33
1.8.4 編碼器-解碼器網絡 34
1.8.5 遞歸神經網絡 35
1.9 多層感知器 35
1.10 隨機梯度下降 37
1.11 反向傳播 40
1.12 深度學習庫 42
1.12.1 Theano 42
1.12.2 Theano安裝 43
1.12.3 Theano示例 44
1.12.4 TensorFlow 45
1.12.5 數據流圖 46
1.12.6 TensorFlow安裝 47
1.12.7 TensorFlow示例 47
1.12.8 Keras 49
1.13 下一步 52
第2章 詞向量表示 53
2.1 詞嵌入簡介 53
2.2 word2vec 56
2.2.1 skip-gram模型 58
2.2.2 模型成分:架構 58
2.2.3 模型成分:隱藏層 58
2.2.4 模型成分:輸出層 60
2.2.5 CBOW模型 61
2.3 頻繁詞二次採樣 61
2.4 word2vec代碼 64
2.5 skip-gram代碼 67
2.6 CBOW代碼 75
2.7 下一步 83
第3章 展開循環神經網絡 85
3.1 循環神經網絡 86
3.1.1 什麼是循環 86
3.1.2 前饋神經網絡和循環神經網絡之間的差異 87
3.1.3 RNN基礎 88
3.1.4 自然語言處理和RNN 91
3.1.5 RNN的機制 93
3.1.6 訓練RNN 96
3.1.7 RNN中隱藏狀態的元意義 98
3.1.8 調整RNN 99
3.1.9 LSTM網絡 99
3.1.10 序列到序列模型 105
3.1.11 高級seq2seq模型 109
3.1.12 序列到序列用例 113
3.2 下一步 122
第4章 開發聊天機器人 123
4.1 聊天機器人簡介 123
4.1.1 聊天機器人的起源 124
4.1.2 聊天機器人如何工作 125
4.1.3 為什麼聊天機器人擁有如此大的商機 125
4.1.4 開發聊天機器人聽起來令人生畏 126
4.2 對話型機器人 127
4.3 聊天機器人:自動文本生成 141
4.4 下一步 170
第5章 實現研究論文:情感分類 171
5.1 基於自注意力機制的句子嵌入 172
5.1.1 提出的方法 173
5.1.2 可視化 178
5.1.3 研究發現 181
5.2 實現情感分類 181
5.3 情感分類代碼 182
5.4 模型結果 191
5.5 可提升空間 196
5.6 下一步 196
前言
致謝
關於作者
關於技術審校人員
第1章 自然語言處理和深度學習概述 1
1.1 Python包 2
1.1.1 NumPy 2
1.1.2 Pandas 6
1.1.3 SciPy 9
1.2 自然語言處理簡介 11
1.2.1 什麼是自然語言處理 11
1.2.2 如何理解人類的語言 11
1.2.3 自然語言處理的難度是什麼 11
1.2.4 我們想通過自然語言處理獲得什麼 13
1.2.5 語言處理中的常用術語 13
1.3 自然語言處理庫 14
1.3.1 NLTK 14
1.3.2 TextBlob 15
1.3.3 SpaCy 17
1.3.4 Gensim 19
1.3.5 Pattern 20
1.3.6 Stanford CoreNLP 21
1.4 NLP入門 21
1.4.1 使用正則表達式進行文本搜索 21
1.4.2 將文本轉換為列表 21
1.4.3 文本預處理 22
1.4.4 從網頁中獲取文本 22
1.4.5 移除停止詞 23
1.4.6 計數向量化 23
1.4.7 TF-IDF分數 24
1.4.8 文本分類器 25
1.5 深度學習簡介 25
1.6 什麼是神經網絡 27
1.7 神經網絡的基本結構 29
1.8 神經網絡的類型 32
1.8.1 前饋神經網絡 33
1.8.2 卷積神經網絡 33
1.8.3 循環神經網絡 33
1.8.4 編碼器-解碼器網絡 34
1.8.5 遞歸神經網絡 35
1.9 多層感知器 35
1.10 隨機梯度下降 37
1.11 反向傳播 40
1.12 深度學習庫 42
1.12.1 Theano 42
1.12.2 Theano安裝 43
1.12.3 Theano示例 44
1.12.4 TensorFlow 45
1.12.5 數據流圖 46
1.12.6 TensorFlow安裝 47
1.12.7 TensorFlow示例 47
1.12.8 Keras 49
1.13 下一步 52
第2章 詞向量表示 53
2.1 詞嵌入簡介 53
2.2 word2vec 56
2.2.1 skip-gram模型 58
2.2.2 模型成分:架構 58
2.2.3 模型成分:隱藏層 58
2.2.4 模型成分:輸出層 60
2.2.5 CBOW模型 61
2.3 頻繁詞二次採樣 61
2.4 word2vec代碼 64
2.5 skip-gram代碼 67
2.6 CBOW代碼 75
2.7 下一步 83
第3章 展開循環神經網絡 85
3.1 循環神經網絡 86
3.1.1 什麼是循環 86
3.1.2 前饋神經網絡和循環神經網絡之間的差異 87
3.1.3 RNN基礎 88
3.1.4 自然語言處理和RNN 91
3.1.5 RNN的機制 93
3.1.6 訓練RNN 96
3.1.7 RNN中隱藏狀態的元意義 98
3.1.8 調整RNN 99
3.1.9 LSTM網絡 99
3.1.10 序列到序列模型 105
3.1.11 高級seq2seq模型 109
3.1.12 序列到序列用例 113
3.2 下一步 122
第4章 開發聊天機器人 123
4.1 聊天機器人簡介 123
4.1.1 聊天機器人的起源 124
4.1.2 聊天機器人如何工作 125
4.1.3 為什麼聊天機器人擁有如此大的商機 125
4.1.4 開發聊天機器人聽起來令人生畏 126
4.2 對話型機器人 127
4.3 聊天機器人:自動文本生成 141
4.4 下一步 170
第5章 實現研究論文:情感分類 171
5.1 基於自注意力機制的句子嵌入 172
5.1.1 提出的方法 173
5.1.2 可視化 178
5.1.3 研究發現 181
5.2 實現情感分類 181
5.3 情感分類代碼 182
5.4 模型結果 191
5.5 可提升空間 196
5.6 下一步 196
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。