人工智能語音測試原理與實踐(簡體書)
商品資訊
ISBN13:9787302621423
出版社:清華大學出版社(大陸)
作者:張偉
出版日:2022/12/01
裝訂/頁數:平裝/268頁
規格:26cm*18.5cm (高/寬)
版次:一版
商品簡介
本書主要介紹關於人工智能語音測試的各方面知識點和實戰技術。全書共分為9章,第1章和第2章詳細介紹人工智能語音測試各種知識點和人工智能語音交互原理;第3章和第4章介紹人工智能語音產品需求和評價指標及其相對應的驗收標準;第5章介紹如何準備語音數據,包括準備方案和具體方法;第6~9章介紹人工智能語音測試涉及的4大模塊,即黑盒測試、自動化測試、算法測試、性能測試。
作者簡介
張 偉
高級軟件測試工程師,從事人工智能語音測試7年,先後供職於科大訊飛和上海健康科技公司,主要研究人工智能語音測試,擔任AI語音測試負責人,搭建公司級的AI語音測試解決方案和培養相對應的技術人才,對AI語音自動化測試和算法測試都有較深入的研究。
序
人工智能(AI)是當前最熱門的領域,也是未來社會發展的方向。如同第一次工業革命的蒸汽機、第二次工業革命的發電機、第三次工業革命的計算機和互聯網,人工智能絕對是推動第四次工業革命的決定性力量。人工智能不僅能夠解放人力提高工作效率,推動社會生產力的發展,而且能夠降低人為錯誤,提供更加智能的解決方案。
人工智能的研究方向和應用主要包括兩個方面,即語音和圖像,本文主要講解的就是人工智能語音方面的知識。人工智能語音主要包括3大語音技術:一是語音識別技術,這是人工智能語音的核心技術,是機器自動將人的語音轉成文字的技術;二是自然語言處理技術,相當於人的“大腦”主抓思考學習任務,是機器分析、理解和處理自然語言的技術;三是語音合成技術,相當於人的“嘴巴”主要負責說話,是機器將任意文字信息轉化為語音並播報的技術。
人工智能語音測試主要就是針對這3大語音技術的測試,本書根據不同的知識結構將內容劃分為9章,分別為人工智能語音測試介紹、AI語音交互原理介紹、AI語音產品需求和適用場景、AI語音產品評價指標和行業標準、語音數據準備、AI語音產品黑盒測試、AI語音產品自動化測試、AI語音算法測試、AI語音性能測試。
第1章是人工智能語音測試入門篇,主要介紹什麼是人工智能、人工智能語音、人工智能語音測試,詳細講解人工智能發展歷程以及演變歷史。
第2章主要介紹AI語音交互原理,以及AI語音交互的流程,詳細講解從語音收集開始,經過語音識別技術、自然語言處理技術,最後通過語音合成技術完成整個AI語音交互。
第3章是講解AI語音當前落地的產品和應用方案,並且詳細介紹這些AI語音產品的具體需求和適用場景,方便測試人員分析了解AI語音產品。
第4章介紹AI語音產品的評價指標和行業標準,主要針對AI語音技術,即語音喚醒技術、語音識別技術、自然語言處理技術、語音合成技術等。
第5章重點講解語音數據準備。工欲善其事,必先利其器,要想進行AI語音測試,首先需要準備“語音數據文本”。本章詳細介紹如何準備語音數據,以及準備語音數據需要注意的各項知識。
第6章主要介紹AI語音產品黑盒測試,這是AI語音測試的重點之一,包含AI語音效果測試、AI語音基礎功能測試、AI語音特性功能測試等。
第7章是講解AI語音測試的另一個重點“自動化測試”,主要針對AI語音交互涉及的3大語音技術進行自動化測試,包括語音喚醒自動化測試、語音識別自動化測試、自然語言處理自動化 測試。
第8章主要介紹AI語音算法測試,這是人工智能語音測試的核心,也是難點。本章詳細講解AI語音算法測試的應用、分類、方法以及方案,並以NLP分類算法模型為例介紹AI語音算法測試的各個環節和重點步驟。
第9章是本書的最後一章,主要介紹AI語音測試的最後一個重點內容“性能測試”,主要從AI語音應用和AI語音服務兩個方面詳細講解如何進行性能測試、各種性能測試方法以及性能測試的各項重點和注意事項。
為方便讀者學習本書,本書提供了源代碼,可以掃描以下二維碼下載:
如果下載有問題,請發送電子郵件到booksaga@126.com,郵件主題為“人工智能語音測試原理與實踐”。
本書既適合從事測試工作的讀者,也適合產品人員、開發人員和愛好人工智能語音測試的人員使用。
限於筆者水平,書中內容難免存在不足和疏漏之處,懇請業界高手與專家批評指正。
張偉
2022.6.5
目次
第1章 人工智能語音測試介紹 1
1.1 語音簡介 1
1.1.1 語音的基本概念 1
1.1.2 語音的產生原理 4
1.1.3 語音交互流程 5
1.2 人工智能簡介 5
1.2.1 機器學習簡介 6
1.2.2 深度學習簡介 7
1.3 AI語音簡介 9
1.3.1 AI語音技術簡介 9
1.3.2 AI語音交互簡介 10
1.4 AI語音測試簡介 10
1.4.1 AI語音測試的價值 10
1.4.2 AI語音測試的應用 11
1.5 本章小結 11
第2章 AI語音交互原理介紹 12
2.1 AI語音交互 12
2.2 語音采集 13
2.2.1 語音采集流程 13
2.2.2 影響語音采集水平的因素 15
2.3 語音識別技術 17
2.3.1 自動語音識別簡介 17
2.3.2 近場語音識別 17
2.3.3 遠場語音識別 18
2.3.4 語音識別流程 19
2.3.5 語音預處理(語音增強) 21
2.3.6 傳統語音識別-編碼(聲學
特徵提取) 24
2.3.7 傳統語音識別-解碼 27
2.3.8 深度學習語音識別 31
2.4 語音喚醒技術 32
2.4.1 語音喚醒簡介 32
2.4.2 語音喚醒流程 32
2.5 自然語言處理技術 33
2.5.1 自然語言處理簡介 33
2.5.2 自然語言處理流程 33
2.5.3 自然語言理解 34
2.5.4 對話管理 44
2.5.5 自然語言生成 46
2.6 語音合成技術 49
2.6.1 語音合成簡介 49
2.6.2 語音合成的流程 49
2.6.3 揚聲器發聲 51
2.7 本章小結 51
第3章 AI語音產品需求和適用場景 52
3.1 AI語音產品需求 52
3.1.1 AI語音產品基礎功能需求 52
3.1.2 AI語音產品特性功能需求 56
3.1.3 AI語音產品性能需求 62
3.2 AI語音產品分類和應用場景 62
3.2.1 封閉域識別產品 63
3.2.2 開放域識別產品 63
3.2.3 靜態環境產品 66
3.2.4 動態環境產品 66
3.3 本章小結 66
第4章 AI語音產品評價指標和行業
標準 67
4.1 語音喚醒技術評價指標與行業標準 67
4.1.1 評價指標 67
4.1.2 行業標準 68
4.2 語音識別技術評價指標與行業標準 70
4.2.1 評價指標 70
4.2.2 行業標準 72
4.3 自然語言處理技術評價指標與行業
標準 74
4.3.1 評價指標 74
4.3.2 行業標準 75
4.4 語音合成技術評價指標與行業標準 76
4.4.1 評價指標 76
4.4.2 行業標準 76
4.5 本章小結 77
第5章 語音數據準備 78
5.1 語音音頻文本準備 78
5.1.1 語音音頻文本準備方式 78
5.1.2 語音音頻文本準備方案 79
5.2 語音合成工具 80
5.2.1 批量語音合成工具 81
5.2.2 語音合成工具源代碼 83
5.3 噪音源音頻文本準備 89
5.3.1 噪音源音頻文本準備方式 89
5.3.2 噪音源音頻文本準備方案 90
5.4 本章小結 90
第6章 AI語音產品的黑盒測試 91
6.1 AI語音產品的黑盒測試簡介 91
6.1.1 AI語音效果測試簡介 91
6.1.2 AI語音功能測試簡介 92
6.2 AI語音喚醒效果測試 92
6.2.1 喚醒率測試
(靜態環境產品) 92
6.2.2 打斷喚醒率測試
(靜態環境產品) 96
6.2.3 誤喚醒率測試
(靜態環境產品) 99
6.2.4 喚醒率測試
(動態環境產品) 102
6.2.5 打斷喚醒率測試
(動態環境產品) 106
6.2.6 誤喚醒率測試
(動態環境產品) 110
6.3 AI語音識別效果測試 112
6.3.1 識別率測試
(靜態環境產品) 112
6.3.2 打斷識別率測試
(靜態環境產品) 117
6.3.3 識別率測試
(動態環境產品) 121
6.3.4 打斷識別率測試
(動態環境產品) 126
6.4 AI語音基礎功能測試 131
6.4.1 語音喚醒功能測試 131
6.4.2 語音識別功能測試 133
6.4.3 自然語言處理功能測試 135
6.4.4 語音TTS合成功能測試 140
6.5 AI語音特性功能測試 140
6.5.1 全雙工打斷 140
6.5.2 跨場景交互 141
6.5.3 可見即可說 142
6.5.4 自定義喚醒詞 143
6.5.5 上下文理解 145
6.5.6 非全時免喚醒 146
6.5.7 聲源定位 148
6.5.8 聲紋認證 149
6.5.9 快捷詞免喚醒 150
6.5.10 自定義TTS播報 151
6.6 本章小結 152
第7章 AI語音產品自動化測試 153
7.1 AI語音產品自動化測試簡介 153
7.1.1 AI語音產品自動化測試的
價值 153
7.1.2 AI語音產品自動化測試
應用 154
7.2 語音喚醒自動化測試 154
7.2.1 語音喚醒自動化工具框架 154
7.2.2 語音喚醒自動化測試方案 155
7.2.3 語音喚醒自動化工具說明 158
7.2.4 語音喚醒自動化工具操作
實戰 160
7.2.5 語音喚醒自動化工具源碼 161
7.3 語音識別自動化測試 169
7.3.1 語音識別自動化工具框架 169
7.3.2 語音識別自動化測試方案 171
7.3.3 語音識別結果獲取工具說明 175
7.3.4 語音識別結果分析工具說明 177
7.3.5 文本轉MLF文件工具說明 185
7.3.6 語音識別自動化工具操作
實戰 186
7.3.7 語音識別自動化工具源碼 190
7.4 自然語言處理自動化測試 201
7.4.1 自然語言處理自動化腳本
框架 201
7.4.2 自然語言處理自動化測試
方案 202
7.4.3 自然語言處理自動化腳本
說明 204
7.4.4 自然語言處理自動化腳本
操作實戰 205
7.4.5 自然語言處理自動化工具
源碼 205
7.5 本章小結 215
第8章 AI語音算法測試 216
8.1 AI語音算法測試簡介 216
8.1.1 AI語音算法應用全流程 216
8.1.2 AI語音算法測試簡介 218
8.1.3 AI語音算法測試的目的 218
8.1.4 AI語音算法測試應用 218
8.2 算法模型測試種類 219
8.2.1 算法模型評估測試 219
8.2.2 算法模型魯棒性測試 225
8.2.3 算法模型安全測試 226
8.3 AI語音算法測試方案 226
8.4 數據集簡介 229
8.4.1 數據集搭建 229
8.4.2 數據集劃分 231
8.4.3 數據標注 234
8.4.4 測試集設計 235
8.5 AI語音算法測試操作實戰 237
8.5.1 算法模型評估測試實戰 238
8.5.2 算法模型魯棒性測試 241
8.6 AI語音算法測試源碼 241
8.7 本章小結 243
第9章 AI語音性能測試 244
9.1 AI語音性能測試簡介 244
9.2 AI語音性能測試的目的 244
9.3 AI語音應用性能測試 244
9.3.1 CPU占用 245
9.3.2 內存占用 247
9.3.3 響應時間 249
9.4 NLP接口性能測試 251
9.4.1 NLP接口性能測試簡介 251
9.4.2 NLP接口性能測試術語
解釋 252
9.4.3 NLP接口測試方案 252
9.5 本章小結 258
參考文獻 259
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。