中文信息處理教程(簡體書)
商品資訊
系列名:普通高等教育十一五國家級規劃教材
ISBN13:9787040318968
出版社:高等教育出版社
作者:宋繼華; 楊爾弘; 王強軍
出版日:2011/06/01
裝訂/頁數:平裝/283頁
規格:23.5cm*16.8cm (高/寬)
版次:一版
商品簡介
名人/編輯推薦
目次
相關商品
商品簡介
《中文信息處理教程》是普通高等教育“十一五”國家級規劃教材,
是編者依據自身的教學實踐,在學習、吸收、借鑒前輩經驗的基礎上歸納
、提煉而成的中文信息處理教材。書中比較系統地介紹了本學科領域的基
本原理、方法和應用技術。
本書共8章,按中文信息處理的語言單位層級——漢字、詞語、句子、
篇章依次展開。內容包括:導論、漢字的信息處理、詞的信息處理、句子
的信息處理、句子語義表達與分析。中文信息處理的基礎資源、文本分析
與處理、中文信息處理評測。
本書的特色是簡明、實用,邏輯性強,可讀性好,注重引導學生動手
解決實際問題。每章都附有習題,并給出了大部分習題的參考答案。
《中文信息處理教程》可作為高等學校計算機、信息管理等專業本科
生和研究生的教材,也可供從事中文信息處理研究和應用的科技工作者參
考。本書由宋繼華等編著。
是編者依據自身的教學實踐,在學習、吸收、借鑒前輩經驗的基礎上歸納
、提煉而成的中文信息處理教材。書中比較系統地介紹了本學科領域的基
本原理、方法和應用技術。
本書共8章,按中文信息處理的語言單位層級——漢字、詞語、句子、
篇章依次展開。內容包括:導論、漢字的信息處理、詞的信息處理、句子
的信息處理、句子語義表達與分析。中文信息處理的基礎資源、文本分析
與處理、中文信息處理評測。
本書的特色是簡明、實用,邏輯性強,可讀性好,注重引導學生動手
解決實際問題。每章都附有習題,并給出了大部分習題的參考答案。
《中文信息處理教程》可作為高等學校計算機、信息管理等專業本科
生和研究生的教材,也可供從事中文信息處理研究和應用的科技工作者參
考。本書由宋繼華等編著。
名人/編輯推薦
《中文信息處理教程》共8章,按中文信息處理的語言單位層級——漢字、詞語、句子、篇章依次展開。內容包括:導論、漢字的信息處理、詞的信息處理、句子的信息處理、句子語義表達與分析。中文信息處理的基礎資源、文本分析與處理、中文信息處理評測。本書的特色是簡明、實用,邏輯性強,可讀性好,注重引導學生動手解決實際問題。每章都附有習題,并給出了大部分習題的參考答案。本書由宋繼華等編著。
目次
第1章 導論
本章概覽
知識結構圖
1.1 基本概念
1.1.1 學科由來
1.1.2 學科定位
1.2 研究內容
1.3 難點分析
1.3.1 歧義
1.3.2 語法
1.4 研究路線
1.5 習題
第2章 漢字的信息處理
本章概覽
知識結構圖
2.1 基礎知識
2.1.1 漢字的形、音、義
2.1.2 漢字的字頻和字量
2.1.3 漢字的編碼
2.2 交換碼和內碼
2.2.1 ASCⅡ
2.2.2 編碼框架:ISO/IEC2022
2.2.3 GB2312
2.2.4 BIG5
2.2.5 ISO/IECl0646和Unicode
2.2.6 GBK
2.2.7 GBL8030
2.2.8 編程務實
2.3 漢字的輸入
2.3.1 鍵盤輸入
2.3.2 字形識別
2.3.3 語音識別
2.4 漢字的輸出
2.5 中文編碼的前沿課題
2.5.1 古籍數字化
2.5.2 《通用規范漢字表》
2.5.3 少數民族文字
2.6 習題
第3章 詞的信息處理
本章概覽
知識結構圖
3.1 基礎知識
3.1.1 概率論基礎
3.1.2 信息論基礎
3.1.3 n元語法模型
3.1.4 語法模型的性能評價
3.2 自動分詞
3.2.1 漢語詞的界定
3.2.2 自動分詞方法
3.2.3 未登錄詞的識別
3.3 詞性標注
3.3.1 詞性標注概述
3.3.2 基于統計的詞性標注方法
3.3.3 基于規則的詞性標注方法
3.4 命名實體識別
3.4.1 命名實體識別介紹
3.4.2 中文命名實體的定義和標準
3.4.3 中文命名實體識別方法
3.5 習題
第4章 句子的信息處理
本章概覽
知識結構圖
4.1 形式語言基礎
4.1.1 形式語言理論
4.1.2 自動機理論
4.2 短語結構語法
4.2.1 漢語短語結構語法
4.2.2 分析算法
4.2.3 實用策略
4.3 依存語法
4.3.1 依存句法理論
4.3.2 分析算法
4.4 句法理論探索
4.4.1 Chomsky語法理論
4.4.2 廣義短語結構語法
4.4.3 鏈語法
4.4.4 范疇語法
4.5 習題
第5章 句子語義表達與分析
本章概覽
知識結構圖
5.1 格語法
5.1.1 基本思想
5.1.2 格的分類
5.1.3 格的判斷
5.1.4 用格語法生成句子
5.1.5 漢語格語法
5.2 概念依存理論
5.2.1 基本模型
5.2.2 語義推理
5.2.3 腳本法
5.3 概念層次網絡(HNC)
5.4 語義本體
5.5 習題
第6章 中文信息處理的基礎資源
本章概覽
知識結構圖
6.1 語料庫概述
6.1.1 語料庫發展歷史
6.1.2 語料庫屬性
6.2 典型中文語科庫介紹
6.2.1 北京大學計算語言學研究所《人民日報》標注語料庫
6.2.2 清華大學漢語樹庫
6.2.3 哈爾濱工業大學漢語依存樹庫
6.2.4 中國臺灣“中央研究院”語料庫
6.2.5 國家語言文字工作委員會語料庫
6.2.6 山西大學語料庫
6.3 典型中文語言知識庫資源介紹
6.3.1 北京大學計算語言學研究所綜合型語言知識庫
6.3.2 知網
6.3.3 中國臺灣“中央研究院”中文詞匯網絡
6.3.4 概念層次網絡
6.3.5 漢語框架網知識庫
6.4 中文語言資源聯盟
6.5 習題
第7章 文本分析與處理
本章概覽
知識結構圖
7.1 文本分類
7.1.1 文本表示
7.1.2 文本分類算法
7.2 信息檢索
7.2.1 常用的檢索模型
7.2.2 搜索引擎
7.3 問答系統
7.3.1 問答系統概述
7.3.2 系統構成
7.3.3 典型問答系統介紹
7.4 信息抽取
7.4.1 信息抽取概述
7.4.2 系統的基本構成及關鍵技術
7.5 自動文摘
7.5.1 自動文摘概述
7.5.2 基于統計的機械文摘
7.5.3 基于意義的理解文摘
7.6 習題
第8章 中文信息處理評測
本章概覽
知識結構圖
8.1 評測概述
8.1.1 評測的意義
8.1.2 評測的過程
8.2 系列評測介紹
8.2.1 NIST系列評測
8.2.2 ACL-SIGHAN系列評測
8.2.3 863技術測評
8.2.4 中文信息學會評測
8.3 各領域技術評測介紹
8.3.1 中文分詞和詞性標注評測
8.3.2 詞義消歧評測
8.3.3 句法分析評測
8.3.4 文本分類器性能評估
8.3.5 信息檢索系統的評測
8.3.6 問答系統評測
8.3.7 信息抽取評測
8.3.8 自動文摘評測
8.4 習題
部分習題參考答案
參考文獻
本章概覽
知識結構圖
1.1 基本概念
1.1.1 學科由來
1.1.2 學科定位
1.2 研究內容
1.3 難點分析
1.3.1 歧義
1.3.2 語法
1.4 研究路線
1.5 習題
第2章 漢字的信息處理
本章概覽
知識結構圖
2.1 基礎知識
2.1.1 漢字的形、音、義
2.1.2 漢字的字頻和字量
2.1.3 漢字的編碼
2.2 交換碼和內碼
2.2.1 ASCⅡ
2.2.2 編碼框架:ISO/IEC2022
2.2.3 GB2312
2.2.4 BIG5
2.2.5 ISO/IECl0646和Unicode
2.2.6 GBK
2.2.7 GBL8030
2.2.8 編程務實
2.3 漢字的輸入
2.3.1 鍵盤輸入
2.3.2 字形識別
2.3.3 語音識別
2.4 漢字的輸出
2.5 中文編碼的前沿課題
2.5.1 古籍數字化
2.5.2 《通用規范漢字表》
2.5.3 少數民族文字
2.6 習題
第3章 詞的信息處理
本章概覽
知識結構圖
3.1 基礎知識
3.1.1 概率論基礎
3.1.2 信息論基礎
3.1.3 n元語法模型
3.1.4 語法模型的性能評價
3.2 自動分詞
3.2.1 漢語詞的界定
3.2.2 自動分詞方法
3.2.3 未登錄詞的識別
3.3 詞性標注
3.3.1 詞性標注概述
3.3.2 基于統計的詞性標注方法
3.3.3 基于規則的詞性標注方法
3.4 命名實體識別
3.4.1 命名實體識別介紹
3.4.2 中文命名實體的定義和標準
3.4.3 中文命名實體識別方法
3.5 習題
第4章 句子的信息處理
本章概覽
知識結構圖
4.1 形式語言基礎
4.1.1 形式語言理論
4.1.2 自動機理論
4.2 短語結構語法
4.2.1 漢語短語結構語法
4.2.2 分析算法
4.2.3 實用策略
4.3 依存語法
4.3.1 依存句法理論
4.3.2 分析算法
4.4 句法理論探索
4.4.1 Chomsky語法理論
4.4.2 廣義短語結構語法
4.4.3 鏈語法
4.4.4 范疇語法
4.5 習題
第5章 句子語義表達與分析
本章概覽
知識結構圖
5.1 格語法
5.1.1 基本思想
5.1.2 格的分類
5.1.3 格的判斷
5.1.4 用格語法生成句子
5.1.5 漢語格語法
5.2 概念依存理論
5.2.1 基本模型
5.2.2 語義推理
5.2.3 腳本法
5.3 概念層次網絡(HNC)
5.4 語義本體
5.5 習題
第6章 中文信息處理的基礎資源
本章概覽
知識結構圖
6.1 語料庫概述
6.1.1 語料庫發展歷史
6.1.2 語料庫屬性
6.2 典型中文語科庫介紹
6.2.1 北京大學計算語言學研究所《人民日報》標注語料庫
6.2.2 清華大學漢語樹庫
6.2.3 哈爾濱工業大學漢語依存樹庫
6.2.4 中國臺灣“中央研究院”語料庫
6.2.5 國家語言文字工作委員會語料庫
6.2.6 山西大學語料庫
6.3 典型中文語言知識庫資源介紹
6.3.1 北京大學計算語言學研究所綜合型語言知識庫
6.3.2 知網
6.3.3 中國臺灣“中央研究院”中文詞匯網絡
6.3.4 概念層次網絡
6.3.5 漢語框架網知識庫
6.4 中文語言資源聯盟
6.5 習題
第7章 文本分析與處理
本章概覽
知識結構圖
7.1 文本分類
7.1.1 文本表示
7.1.2 文本分類算法
7.2 信息檢索
7.2.1 常用的檢索模型
7.2.2 搜索引擎
7.3 問答系統
7.3.1 問答系統概述
7.3.2 系統構成
7.3.3 典型問答系統介紹
7.4 信息抽取
7.4.1 信息抽取概述
7.4.2 系統的基本構成及關鍵技術
7.5 自動文摘
7.5.1 自動文摘概述
7.5.2 基于統計的機械文摘
7.5.3 基于意義的理解文摘
7.6 習題
第8章 中文信息處理評測
本章概覽
知識結構圖
8.1 評測概述
8.1.1 評測的意義
8.1.2 評測的過程
8.2 系列評測介紹
8.2.1 NIST系列評測
8.2.2 ACL-SIGHAN系列評測
8.2.3 863技術測評
8.2.4 中文信息學會評測
8.3 各領域技術評測介紹
8.3.1 中文分詞和詞性標注評測
8.3.2 詞義消歧評測
8.3.3 句法分析評測
8.3.4 文本分類器性能評估
8.3.5 信息檢索系統的評測
8.3.6 問答系統評測
8.3.7 信息抽取評測
8.3.8 自動文摘評測
8.4 習題
部分習題參考答案
參考文獻
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。