Python與語言研究(簡體書)
商品資訊
系列名:普通高等教育人工智能與大數據系列教材
ISBN13:9787111672371
出版社:機械工業出版社
作者:李文平
出版日:2021/02/22
裝訂/頁數:平裝/156頁
規格:24cm*17cm (高/寬)
商品簡介
名人/編輯推薦
目次
相關商品
商品簡介
本書是一本為人文社會科學方向的老師和學生量身打造的Python入門書。大數據時代人文社會科學的研究者應該充分利用數據資源,分析數據背後隱藏的一般規律和特徵。
本書以解決語言研究中常見的問題為主線,涉及中、英、日三種語言。以具體的問題為導向,講解快速、高效處理這些問題的方法,對每種方法都配有全部代碼及其詳細說明。將這些代碼與第10章的批處理方法相結合,可以大大提高工作效率及準確性。本書每章都配有習題,便於加深理解和應用拓展。
本書適合作為自學Python的參考書,亦可作為語料庫語言學、計量語言學、計量風格學等課程的教材。
本書以解決語言研究中常見的問題為主線,涉及中、英、日三種語言。以具體的問題為導向,講解快速、高效處理這些問題的方法,對每種方法都配有全部代碼及其詳細說明。將這些代碼與第10章的批處理方法相結合,可以大大提高工作效率及準確性。本書每章都配有習題,便於加深理解和應用拓展。
本書適合作為自學Python的參考書,亦可作為語料庫語言學、計量語言學、計量風格學等課程的教材。
名人/編輯推薦
本書是一本為人文社會科學方向的老師和學生量身打造的Python入門書。大數據時代人文社會科學的研究者應該充分利用數據資源,分析數據背後隱藏的一般規律和特徵。
目次
目 錄
前 言
第1篇 準備工作與文本
第1章 語言研究與編程3
1.1 學習編程的理由3
1.1.1 大數據語言研究3
1.1.2 新增功能4
1.1.3 注意事項5
1.2 編程難點6
1.3 本書構成6
1.3.1 內容構成6
1.3.2 樣本文件和相關軟件6
1.4 本章小結6
習題6
第2章 文本數據7
2.1 文本文件的優點7
2.2 文本文件的使用8
2.2.1 文本編輯器8
2.2.2 文本編輯器的安裝8
2.2.3 單文本檢索9
2.2.4 多文本檢索11
2.2.5 文本編輯器替換實例12
2.3 字符編碼與換行編碼13
2.3.1 字符編碼13
2.3.2 字符編碼的判斷13
2.3.3 字符編碼的轉換15
2.3.4 換行編碼15
2.4 本章小結16
習題16
第3章 正則表達式17
3.1 正則表達式的定義17
3.2 文本查找17
3.2.1 符號“?”的用法18
3.2.2 符號“.”的用法18
3.2.3 符號“+”的用法20
3.2.4 符號“*”的用法20
3.2.5 符號“[ ]”的用法20
3.2.6 符號“|”的用法22
3.2.7 符號“^”與“$”的用法23
3.2.8 後方引用23
3.2.9 元字符組合24
3.3 文本替換25
3.4 本章小結28
習題28
第2篇 Python的基礎知識
第4章 Python入門31
4.1 選擇Python的理由31
4.2 Python的安裝31
4.3 Python的運行33
4.4 Python的計算34
4.4.1 Python的計算器功能34
4.4.2 變量34
4.5 字符串35
4.5.1 字符串顯示36
4.5.2 字符串長度:len( )函數37
4.5.3 數值與字符串37
4.5.4 數值轉字符串:str( )函數38
4.5.5 字符串轉數值:int( )函數38
4.6 本章小結39
習題39
第5章 使用Python讀取文件40
5.1 保存並運行Python程序40
5.1.1 程序編寫41
5.1.2 準備工作41
5.1.3 程序運行43
5.1.4 錯誤處理43
5.2 添加注釋45
5.3 結果保存46
5.4 程序分析46
5.5 本章小結47
習題48
第6章 Python的檢索49
6.1 if語句49
6.2 字符串語句51
6.2.1 運算符in51
6.2.2 startswith( )函數與endswith( )
函數51
6.3 not,and,or52
6.3.1 否定:not52
6.3.2 與關係:and52
6.3.3 或關係:or53
6.4 else與elif53
6.5 if實例54
6.5.1 特定行輸出54
6.5.2 字母大小寫55
6.5.3 刪除空行56
6.6 本章小結56
習題56
第7章 for循環58
7.1 循環的基礎知識58
7.2 循環控制語句60
7.2.1 跳過當前循環:continue60
7.2.2 循環中止:break61
7.3 循環應用62
7.3.1 添加行號62
7.3.2 部分文件的輸出63
7.3.3 關鍵詞標記64
7.3.4 空標記65
7.4 本章小結66
習題66
第8章 單詞一覽表:列表68
8.1 列表68
8.1.1 列表的索引與切片69
8.1.2 列表元素的添加70
8.1.3 列表排序71
8.2 列表與循環72
8.3 文件排序73
8.4 單詞一覽表74
8.4.1 字符串與列表轉換:split( )和
join( )74
8.4.2 單詞一覽表程序75
8.4.3 符號處理77
8.5 表格數據處理77
8.6 本章小結80
習題80
第9章 單詞頻度表:字典81
9.1 字典的基礎知識81
9.2 單詞頻度表83
9.3 頻度表排序85
9.4 字典的導入86
9.5 本章小結88
習題88
第10章 文件操作89
10.1 文件的輸入與輸出89
10.1.1 操作對象89
10.1.2 文件的輸出91
10.1.3 關鍵詞91
10.2 批處理92
10.2.1 文件一覽表92
10.2.2 文件內容的輸出93
10.2.3 文件名的輸出94
10.2.4 文件檢索95
10.2.5 文件替換95
10.3 本章小結97
習題97
第11章 Python中的正則
表達式98
11.1 正則表達式檢索98
11.1.1 匹配99
11.1.2 匹配行輸出99
11.1.3 匹配單詞統計100
11.1.4 匹配單詞列表102
11.2 替換102
11.3 本章小結103
習題103
第3篇 Python應用:以漢語文本為中心
第12章 漢語詞性標注基礎及
常用工具107
12.1 漢語詞性標注107
12.2 漢語詞性標注工具108
12.2.1 NLPIR108
12.2.2 Python jieba110
12.3 本章小結112
習題112
第13章 日語形態素解析工具113
13.1 形態素解析113
13.2 形態素解析工具簡介114
13.2.1 軟件下載114
13.2.2 軟件安裝115
13.3 形態素解析工具的使用方法118
13.3.1 數據的選擇119
13.3.2 輸出選項120
13.4 形態素解析的注意事項123
13.4.1 解析精度123
13.4.2 解析單位124
13.5 本章小結125
習題126
第14章 Python處理漢語文本127
14.1 文本的讀寫127
14.2 漢語單詞頻度表128
14.3 動詞頻度表132
14.4 本章小結134
習題134
第15章 KWIC檢索135
15.1 KWIC135
15.2 KWIC檢索程序136
15.2.1 讀入數據136
15.2.2 range( )函數138
15.2.3 前後語境140
15.2.4 KWIC檢索程序代碼141
15.3 本章小結143
習題143
第16章 詞語搭配檢索144
16.1 詞語搭配檢索程序144
16.2 程序的改進147
16.2.1 批處理148
16.2.2 複雜匹配150
16.3 程序的拓展154
16.3.1 語境範圍154
16.3.2 檢索條件155
16.4 本章小結155
習題155
參考文獻156
前 言
第1篇 準備工作與文本
第1章 語言研究與編程3
1.1 學習編程的理由3
1.1.1 大數據語言研究3
1.1.2 新增功能4
1.1.3 注意事項5
1.2 編程難點6
1.3 本書構成6
1.3.1 內容構成6
1.3.2 樣本文件和相關軟件6
1.4 本章小結6
習題6
第2章 文本數據7
2.1 文本文件的優點7
2.2 文本文件的使用8
2.2.1 文本編輯器8
2.2.2 文本編輯器的安裝8
2.2.3 單文本檢索9
2.2.4 多文本檢索11
2.2.5 文本編輯器替換實例12
2.3 字符編碼與換行編碼13
2.3.1 字符編碼13
2.3.2 字符編碼的判斷13
2.3.3 字符編碼的轉換15
2.3.4 換行編碼15
2.4 本章小結16
習題16
第3章 正則表達式17
3.1 正則表達式的定義17
3.2 文本查找17
3.2.1 符號“?”的用法18
3.2.2 符號“.”的用法18
3.2.3 符號“+”的用法20
3.2.4 符號“*”的用法20
3.2.5 符號“[ ]”的用法20
3.2.6 符號“|”的用法22
3.2.7 符號“^”與“$”的用法23
3.2.8 後方引用23
3.2.9 元字符組合24
3.3 文本替換25
3.4 本章小結28
習題28
第2篇 Python的基礎知識
第4章 Python入門31
4.1 選擇Python的理由31
4.2 Python的安裝31
4.3 Python的運行33
4.4 Python的計算34
4.4.1 Python的計算器功能34
4.4.2 變量34
4.5 字符串35
4.5.1 字符串顯示36
4.5.2 字符串長度:len( )函數37
4.5.3 數值與字符串37
4.5.4 數值轉字符串:str( )函數38
4.5.5 字符串轉數值:int( )函數38
4.6 本章小結39
習題39
第5章 使用Python讀取文件40
5.1 保存並運行Python程序40
5.1.1 程序編寫41
5.1.2 準備工作41
5.1.3 程序運行43
5.1.4 錯誤處理43
5.2 添加注釋45
5.3 結果保存46
5.4 程序分析46
5.5 本章小結47
習題48
第6章 Python的檢索49
6.1 if語句49
6.2 字符串語句51
6.2.1 運算符in51
6.2.2 startswith( )函數與endswith( )
函數51
6.3 not,and,or52
6.3.1 否定:not52
6.3.2 與關係:and52
6.3.3 或關係:or53
6.4 else與elif53
6.5 if實例54
6.5.1 特定行輸出54
6.5.2 字母大小寫55
6.5.3 刪除空行56
6.6 本章小結56
習題56
第7章 for循環58
7.1 循環的基礎知識58
7.2 循環控制語句60
7.2.1 跳過當前循環:continue60
7.2.2 循環中止:break61
7.3 循環應用62
7.3.1 添加行號62
7.3.2 部分文件的輸出63
7.3.3 關鍵詞標記64
7.3.4 空標記65
7.4 本章小結66
習題66
第8章 單詞一覽表:列表68
8.1 列表68
8.1.1 列表的索引與切片69
8.1.2 列表元素的添加70
8.1.3 列表排序71
8.2 列表與循環72
8.3 文件排序73
8.4 單詞一覽表74
8.4.1 字符串與列表轉換:split( )和
join( )74
8.4.2 單詞一覽表程序75
8.4.3 符號處理77
8.5 表格數據處理77
8.6 本章小結80
習題80
第9章 單詞頻度表:字典81
9.1 字典的基礎知識81
9.2 單詞頻度表83
9.3 頻度表排序85
9.4 字典的導入86
9.5 本章小結88
習題88
第10章 文件操作89
10.1 文件的輸入與輸出89
10.1.1 操作對象89
10.1.2 文件的輸出91
10.1.3 關鍵詞91
10.2 批處理92
10.2.1 文件一覽表92
10.2.2 文件內容的輸出93
10.2.3 文件名的輸出94
10.2.4 文件檢索95
10.2.5 文件替換95
10.3 本章小結97
習題97
第11章 Python中的正則
表達式98
11.1 正則表達式檢索98
11.1.1 匹配99
11.1.2 匹配行輸出99
11.1.3 匹配單詞統計100
11.1.4 匹配單詞列表102
11.2 替換102
11.3 本章小結103
習題103
第3篇 Python應用:以漢語文本為中心
第12章 漢語詞性標注基礎及
常用工具107
12.1 漢語詞性標注107
12.2 漢語詞性標注工具108
12.2.1 NLPIR108
12.2.2 Python jieba110
12.3 本章小結112
習題112
第13章 日語形態素解析工具113
13.1 形態素解析113
13.2 形態素解析工具簡介114
13.2.1 軟件下載114
13.2.2 軟件安裝115
13.3 形態素解析工具的使用方法118
13.3.1 數據的選擇119
13.3.2 輸出選項120
13.4 形態素解析的注意事項123
13.4.1 解析精度123
13.4.2 解析單位124
13.5 本章小結125
習題126
第14章 Python處理漢語文本127
14.1 文本的讀寫127
14.2 漢語單詞頻度表128
14.3 動詞頻度表132
14.4 本章小結134
習題134
第15章 KWIC檢索135
15.1 KWIC135
15.2 KWIC檢索程序136
15.2.1 讀入數據136
15.2.2 range( )函數138
15.2.3 前後語境140
15.2.4 KWIC檢索程序代碼141
15.3 本章小結143
習題143
第16章 詞語搭配檢索144
16.1 詞語搭配檢索程序144
16.2 程序的改進147
16.2.1 批處理148
16.2.2 複雜匹配150
16.3 程序的拓展154
16.3.1 語境範圍154
16.3.2 檢索條件155
16.4 本章小結155
習題155
參考文獻156
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。