OpenCV 4計算機視覺項目實戰(原書第2版)(簡體書)
商品資訊
系列名:智能系統與技術叢書
ISBN13:9787111631644
出版社:機械工業出版社
作者:(西)大衛‧米蘭‧埃斯克里瓦
譯者:冀臻
出版日:2019/07/01
裝訂/頁數:平裝/208頁
規格:26cm*19cm (高/寬)
版次:一版
人民幣定價:79 元
定價
:NT$ 474 元優惠價
:87 折 412 元
絕版無法訂購
商品簡介
作者簡介
目次
相關商品
商品簡介
本書通過實例和項目講解OpenCV概念及其算法。首先介紹OpenCV的安裝和圖像處理的基礎知識。然後,覆蓋用戶界面並深入講解圖像處理,讀者將學到複雜的計算機視覺算法,並探索機器學習和人臉檢測。之後,本書將介紹如何在複雜場景中創建光流視頻分析和背景減除,還將講解文本分割和識別,以及新的和改進的深度學習模塊的基礎知識。最後,本書介紹了OpenCV的基礎知識,例如矩陣運算、濾波器和直方圖,幫讀者掌握常用的計算機視覺技術,從頭開始構建OpenCV項目。
作者簡介
大衛·米蘭·埃斯克裡瓦,(David Millán Escrivá)8歲時用BASIC語言在8086 PC上編寫了他的個程序。他在瓦倫西亞政治大學(Universitat Politécnica de Valencia)完成了他的IT學習,並在由使用OpenCV(v0.96)的計算機視覺技術所支持的人機交互領域取得了優異的成績。他擁有人工智能、計算機圖形學和模式識別碩士學位,專注於模式識別和計算機視覺。他還擁有超過9年的計算機視覺、計算機圖形和模式識別經驗。他是Damiles Blog的作者,在上面發表關於OpenCV、計算機視覺和光學字符識別算法的文章與教程。
我要感謝我的妻子Izaskun、女兒Eider和兒子Pau,他們始終保持無限的耐心並堅定地支持我。他們改變了我的生活,讓我的每一天都變得很棒。我愛你們。
我要感謝OpenCV團隊和社區給予我們這個精彩的庫。我還要感謝我的合著者,感謝Packt出版社支持並幫助我完成本書。
維尼休斯·G.門東薩,(Vinícius G. Mendon是巴拉那天主教大學(PUCPR)的計算機圖形專業教授。他於1998年開始使用C++進行編程,並於2006年進入計算機遊戲和計算機圖形領域。他目前是巴西Apple開發者學院(Apple Developer Academy)的導師,從事用於移動設備的金屬、機器學習和計算機視覺方面的教學工作。他曾擔任其他Packt圖書的審校者,包括《OpenNI Cookbook》和《Mastering OpenCV and Computer Vision with OpenCV 3 and Qt5》。在他的研究中,使用了Kinect、OpenNI和OpenCV來識別巴西手語手勢。他感興趣的領域包括移動電話、OpenGL、圖像處理、計算機視覺和項目管理。
我要感謝我的妻子Thais A. L. Mendon
普拉蒂克·喬希,(Prateek Joshi)是一位人工智能研究員、8本書的作者,還是一位TEDx演講者。他的著作曾入選Forbes 30 Under 30、CNBC、TechCrunch、Silicon Valley Business Journal等多部出版物。他是Pluto AI的創始人,Pluto AI是一家由風投資助的矽谷初創公司,為水利設施建立智能平臺。他畢業于南加州大學,獲得人工智能專業碩士學位。他之前曾就職於NVIDIA和Microsoft Research。
我要感謝我的妻子Izaskun、女兒Eider和兒子Pau,他們始終保持無限的耐心並堅定地支持我。他們改變了我的生活,讓我的每一天都變得很棒。我愛你們。
我要感謝OpenCV團隊和社區給予我們這個精彩的庫。我還要感謝我的合著者,感謝Packt出版社支持並幫助我完成本書。
維尼休斯·G.門東薩,(Vinícius G. Mendon是巴拉那天主教大學(PUCPR)的計算機圖形專業教授。他於1998年開始使用C++進行編程,並於2006年進入計算機遊戲和計算機圖形領域。他目前是巴西Apple開發者學院(Apple Developer Academy)的導師,從事用於移動設備的金屬、機器學習和計算機視覺方面的教學工作。他曾擔任其他Packt圖書的審校者,包括《OpenNI Cookbook》和《Mastering OpenCV and Computer Vision with OpenCV 3 and Qt5》。在他的研究中,使用了Kinect、OpenNI和OpenCV來識別巴西手語手勢。他感興趣的領域包括移動電話、OpenGL、圖像處理、計算機視覺和項目管理。
我要感謝我的妻子Thais A. L. Mendon
普拉蒂克·喬希,(Prateek Joshi)是一位人工智能研究員、8本書的作者,還是一位TEDx演講者。他的著作曾入選Forbes 30 Under 30、CNBC、TechCrunch、Silicon Valley Business Journal等多部出版物。他是Pluto AI的創始人,Pluto AI是一家由風投資助的矽谷初創公司,為水利設施建立智能平臺。他畢業于南加州大學,獲得人工智能專業碩士學位。他之前曾就職於NVIDIA和Microsoft Research。
目次
前言
作者簡介
審校者簡介
第1章 OpenCV入門1
1.1 瞭解人類視覺系統1
1.2 人類如何理解圖像內容3
1.3 你能用OpenCV做什麼4
1.3.1 內置數據結構和輸入/輸出4
1.3.2 圖像處理操作5
1.3.3 GUI5
1.3.4 視頻分析6
1.3.5 3D重建6
1.3.6 特徵提取7
1.3.7 對象檢測7
1.3.8 機器學習8
1.3.9 計算攝影8
1.3.10 形狀分析9
1.3.11 光流算法9
1.3.12 人臉和對象識別9
1.3.13 表面匹配10
1.3.14 文本檢測和識別10
1.3.15 深度學習10
1.4 安裝OpenCV10
1.4.1 Windows11
1.4.2 Mac OS X11
1.4.3 Linux13
1.5 總結14
第2章 OpenCV基礎知識導論15
2.1 技術要求15
2.2 基本CMake配置文件16
2.3 創建一個庫16
2.4 管理依賴項17
2.5 讓腳本更複雜18
2.6 圖像和矩陣20
2.7 讀/寫圖像22
2.8 讀取視頻和攝像頭25
2.9 其他基本對象類型27
2.9.1 Vec對象類型27
2.9.2 Scalar對象類型28
2.9.3 Point對象類型28
2.9.4 Size對象類型29
2.9.5 Rect對象類型29
2.9.6 RotatedRect對象類型29
2.10 基本矩陣運算30
2.11 基本數據存儲32
2.12 總結34
第3章 學習圖形用戶界面35
3.1 技術要求35
3.2 OpenCV用戶界面介紹36
3.3 OpenCV的基本圖形用戶界面36
3.4 Qt圖形用戶界面44
3.5 OpenGL支持50
3.6 總結54
第4章 深入研究直方圖和濾波器55
4.1 技術要求56
4.2 生成CMake腳本文件56
4.3 創建圖形用戶界面57
4.4 繪製直方圖59
4.5 圖像顏色均衡62
4.6 Lomography效果64
4.7 卡通效果68
4.8 總結72
第5章 自動光學檢查、對象分割和檢測73
5.1 技術要求73
5.2 隔離場景中的對象74
5.3 為AOI創建應用程序76
5.4 預處理輸入圖像78
5.4.1 噪聲消除78
5.4.2 用光模式移除背景進行分割79
5.4.3 閾值84
5.5 分割輸入圖像85
5.5.1 連通組件算法85
5.5.2 findContours算法90
5.6 總結92
第6章 學習對象分類94
6.1 技術要求94
6.2 機器學習概念介紹95
6.3 計算機視覺和機器學習工作流程98
6.4 自動對象檢查分類示例100
6.4.1 特徵提取102
6.4.2 訓練SVM模型105
6.4.3 輸入圖像預測109
6.5 總結111
第7章 檢測面部部位與覆蓋面具112
7.1 技術要求112
7.2 瞭解Haar級聯112
7.3 什麼是積分圖像114
7.4 在實時視頻中覆蓋面具115
7.5 戴上太陽鏡118
7.6 跟蹤鼻子、嘴巴和耳朵121
7.7 總結122
第8章 視頻監控、背景建模和形態學操作123
8.1 技術要求123
8.2 理解背景減除124
8.3 直接的背景減除124
8.4 幀差分128
8.5 高斯混合方法131
8.6 形態學圖像處理133
8.7 使形狀變細134
8.8 使形狀變粗135
8.9 其他形態運算符136
8.9.1 形態開口136
8.9.2 形態閉合137
8.9.3 繪製邊界138
8.9.4 禮帽變換139
8.9.5 黑帽變換140
8.10 總結140
第9章 學習對象跟蹤141
9.1 技術要求141
9.2 跟蹤特定顏色的對象141
9.3 構建交互式對象跟蹤器143
9.4 用Harris角點檢測器檢測點148
9.5 用於跟蹤的好特徵151
9.6 基於特徵的跟蹤153
9.6.1 Lucas-Kanade方法153
9.6.2 Farneback算法157
9.7 總結161
第10章 開發用於文本識別的分割算法162
10.1 技術要求162
10.2 光學字符識別介紹162
10.3 預處理階段164
10.3.1 對圖像進行閾值處理164
10.3.2 文本分割165
10.4 在你的操作系統上安裝Tesseract OCR172
10.4.1 在Windows上安裝Tesseract172
10.4.2 在Mac上安裝Tesseract173
10.5 使用Tesseract OCR庫173
10.6 總結177
第11章 用Tesseract進行文本識別178
11.1 技術要求178
11.2 文本API的工作原理179
11.2.1 場景檢測問題179
11.2.2 極值區域180
11.2.3 極值區域過濾181
11.3 使用文本API182
11.3.1 文本檢測182
11.3.2 文本提取187
11.3.3 文本識別189
11.4 總結193
第12章 使用OpenCV進行深度學習194
12.1 技術要求194
12.2 深度學習簡介195
12.2.1 什麼是神經網絡,我們如何從數據中學習195
12.2.2 卷積神經網絡197
12.3 OpenCV中的深度學習198
12.4 YOLO用於實時對象檢測199
12.4.1 YOLO v3深度學習模型架構200
12.4.2 YOLO數據集、詞匯表和模型200
12.4.3 將YOLO導入OpenCV201
12.5 用SSD進行人臉檢測204
12.5.1 SSD模型架構204
12.5.2 將SSD人臉檢測導入OpenCV204
12.6 總結208
作者簡介
審校者簡介
第1章 OpenCV入門1
1.1 瞭解人類視覺系統1
1.2 人類如何理解圖像內容3
1.3 你能用OpenCV做什麼4
1.3.1 內置數據結構和輸入/輸出4
1.3.2 圖像處理操作5
1.3.3 GUI5
1.3.4 視頻分析6
1.3.5 3D重建6
1.3.6 特徵提取7
1.3.7 對象檢測7
1.3.8 機器學習8
1.3.9 計算攝影8
1.3.10 形狀分析9
1.3.11 光流算法9
1.3.12 人臉和對象識別9
1.3.13 表面匹配10
1.3.14 文本檢測和識別10
1.3.15 深度學習10
1.4 安裝OpenCV10
1.4.1 Windows11
1.4.2 Mac OS X11
1.4.3 Linux13
1.5 總結14
第2章 OpenCV基礎知識導論15
2.1 技術要求15
2.2 基本CMake配置文件16
2.3 創建一個庫16
2.4 管理依賴項17
2.5 讓腳本更複雜18
2.6 圖像和矩陣20
2.7 讀/寫圖像22
2.8 讀取視頻和攝像頭25
2.9 其他基本對象類型27
2.9.1 Vec對象類型27
2.9.2 Scalar對象類型28
2.9.3 Point對象類型28
2.9.4 Size對象類型29
2.9.5 Rect對象類型29
2.9.6 RotatedRect對象類型29
2.10 基本矩陣運算30
2.11 基本數據存儲32
2.12 總結34
第3章 學習圖形用戶界面35
3.1 技術要求35
3.2 OpenCV用戶界面介紹36
3.3 OpenCV的基本圖形用戶界面36
3.4 Qt圖形用戶界面44
3.5 OpenGL支持50
3.6 總結54
第4章 深入研究直方圖和濾波器55
4.1 技術要求56
4.2 生成CMake腳本文件56
4.3 創建圖形用戶界面57
4.4 繪製直方圖59
4.5 圖像顏色均衡62
4.6 Lomography效果64
4.7 卡通效果68
4.8 總結72
第5章 自動光學檢查、對象分割和檢測73
5.1 技術要求73
5.2 隔離場景中的對象74
5.3 為AOI創建應用程序76
5.4 預處理輸入圖像78
5.4.1 噪聲消除78
5.4.2 用光模式移除背景進行分割79
5.4.3 閾值84
5.5 分割輸入圖像85
5.5.1 連通組件算法85
5.5.2 findContours算法90
5.6 總結92
第6章 學習對象分類94
6.1 技術要求94
6.2 機器學習概念介紹95
6.3 計算機視覺和機器學習工作流程98
6.4 自動對象檢查分類示例100
6.4.1 特徵提取102
6.4.2 訓練SVM模型105
6.4.3 輸入圖像預測109
6.5 總結111
第7章 檢測面部部位與覆蓋面具112
7.1 技術要求112
7.2 瞭解Haar級聯112
7.3 什麼是積分圖像114
7.4 在實時視頻中覆蓋面具115
7.5 戴上太陽鏡118
7.6 跟蹤鼻子、嘴巴和耳朵121
7.7 總結122
第8章 視頻監控、背景建模和形態學操作123
8.1 技術要求123
8.2 理解背景減除124
8.3 直接的背景減除124
8.4 幀差分128
8.5 高斯混合方法131
8.6 形態學圖像處理133
8.7 使形狀變細134
8.8 使形狀變粗135
8.9 其他形態運算符136
8.9.1 形態開口136
8.9.2 形態閉合137
8.9.3 繪製邊界138
8.9.4 禮帽變換139
8.9.5 黑帽變換140
8.10 總結140
第9章 學習對象跟蹤141
9.1 技術要求141
9.2 跟蹤特定顏色的對象141
9.3 構建交互式對象跟蹤器143
9.4 用Harris角點檢測器檢測點148
9.5 用於跟蹤的好特徵151
9.6 基於特徵的跟蹤153
9.6.1 Lucas-Kanade方法153
9.6.2 Farneback算法157
9.7 總結161
第10章 開發用於文本識別的分割算法162
10.1 技術要求162
10.2 光學字符識別介紹162
10.3 預處理階段164
10.3.1 對圖像進行閾值處理164
10.3.2 文本分割165
10.4 在你的操作系統上安裝Tesseract OCR172
10.4.1 在Windows上安裝Tesseract172
10.4.2 在Mac上安裝Tesseract173
10.5 使用Tesseract OCR庫173
10.6 總結177
第11章 用Tesseract進行文本識別178
11.1 技術要求178
11.2 文本API的工作原理179
11.2.1 場景檢測問題179
11.2.2 極值區域180
11.2.3 極值區域過濾181
11.3 使用文本API182
11.3.1 文本檢測182
11.3.2 文本提取187
11.3.3 文本識別189
11.4 總結193
第12章 使用OpenCV進行深度學習194
12.1 技術要求194
12.2 深度學習簡介195
12.2.1 什麼是神經網絡,我們如何從數據中學習195
12.2.2 卷積神經網絡197
12.3 OpenCV中的深度學習198
12.4 YOLO用於實時對象檢測199
12.4.1 YOLO v3深度學習模型架構200
12.4.2 YOLO數據集、詞匯表和模型200
12.4.3 將YOLO導入OpenCV201
12.5 用SSD進行人臉檢測204
12.5.1 SSD模型架構204
12.5.2 將SSD人臉檢測導入OpenCV204
12.6 總結208
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。