先秦文獻信息處理(簡體書)
商品資訊
系列名:計算機語言學研究系列
ISBN13:9787510056611
出版社:世界圖書(北京)出版公司
作者:陳小荷
出版日:2013/01/01
裝訂:平裝
規格:23.5cm*16.8cm (高/寬)
版次:1
商品簡介
作者簡介
名人/編輯推薦
目次
書摘/試閱
相關商品
商品簡介
本書研究先秦文獻的信息處理,包括詞匯和歷史知識的處理與智能檢索。先秦漢語是漢語可以溯及的源頭,對先秦文獻做詞匯處理,目的在於追本溯源,瞭解先秦漢語詞匯的基本面貌。用計算語言學方法梳理這一時期的歷史事件、人名、地名等知識,有助於更好地理解先秦文獻。與現當代中文文獻相比,先秦傳世文獻規模很小,但相關的注疏文獻十分豐富。因此該書採用了與一般中文信息處理不同的方法——基於注疏文獻的方法。對比實驗表明,這種方法在先秦文獻信息處理中具有顯著的優勢。
作者簡介
陳小荷,江西豐城人。北京大學現代漢語專業文學博士。現任南京師范大學文學院語言科學及技術系教授、博士生導師,兼中國中文信息學會理事、 《中文信息學報》編委。主要研究方向為中文信息處理、漢語語法學。代表作有《現代漢語自動分析——ViSual C++實現》 《漢語口語里表示“……再說”的語素“著”》等。主持國家社會科學基金項目1項,江蘇省高校社科重點研究基地重大項目1項,參與國家社會科學基金重大項目1項。
名人/編輯推薦
《先秦文獻信息處理》由世界圖書出版公司北京公司出版。
目次
第一章 緒 論
第一節 先秦文獻
第二節 先秦文獻信息處理
第三節 先秦文獻信息處理的特點
第四節 基于注疏文獻的處理方法
第二章 注疏文獻處理
第一節 注疏文獻的選取
第二節 注疏文獻的內容分析
第三節 先秦文獻與其注疏文獻的句子對齊和注釋對齊
第三章 詞語切分
第一節 先秦漢語分詞規范
第二節 基于統計模型的自動分詞方法
第三節 利用注疏文獻的自動分詞方法
第四章 詞性標注
第一節 詞類體系
第二節 基于統計的分詞標注一體化方法
第三節 基于注疏文獻的詞性校正
第五章 古今字、通假字資源建設
第一節 古今字、通假字研究現狀
第二節 古今字、通假字數據庫的構建
第三節 通假字標注實驗
第四節 實驗結果及其分析
第六章 詞匯概貌
第一節 語料來源和說明
第二節 先秦文獻的漢字統計
第三節 先秦文獻的詞匯統計
第四節 計算每種文獻的特色詞
第五節 成語來源統計
第七章 詞義消歧
第一節 古代漢語詞義特點和消歧難點
第二節 義項區分的顆粒度
第三節 基于CRF模型的消歧實驗
第四節 分類器集成的消歧實驗
第八章 專名標注
第一節 關于“專名”和“命名實體”的辨析
第二節 先秦時期的人名與地名
第三節 基于統計的專名識別
第四節 基于注疏文獻的專名識別
第五節 人名所指歧義消解
第六節 基于專名標注的事件劃分
第九章 版本異文發現
第一節 異文和版本異文
第二節 個案和研究方法
第三節 基于相似度計算的句珠配對
第四節 基于同文排除的異文配對
第五節 基于雙序列比對的一體化處理
第六節 實驗結果及其分析
第十章 《左傳》中的春秋社會網絡分析
第一節 社會網絡分析的基本方法和軟件
第二節 社會關系數據的獲取和網絡的定義
第三節 人物一事件網絡分析
第四節 人物關系網絡分析
第五節 人物關系網絡的深入分析
后 記
第一節 先秦文獻
第二節 先秦文獻信息處理
第三節 先秦文獻信息處理的特點
第四節 基于注疏文獻的處理方法
第二章 注疏文獻處理
第一節 注疏文獻的選取
第二節 注疏文獻的內容分析
第三節 先秦文獻與其注疏文獻的句子對齊和注釋對齊
第三章 詞語切分
第一節 先秦漢語分詞規范
第二節 基于統計模型的自動分詞方法
第三節 利用注疏文獻的自動分詞方法
第四章 詞性標注
第一節 詞類體系
第二節 基于統計的分詞標注一體化方法
第三節 基于注疏文獻的詞性校正
第五章 古今字、通假字資源建設
第一節 古今字、通假字研究現狀
第二節 古今字、通假字數據庫的構建
第三節 通假字標注實驗
第四節 實驗結果及其分析
第六章 詞匯概貌
第一節 語料來源和說明
第二節 先秦文獻的漢字統計
第三節 先秦文獻的詞匯統計
第四節 計算每種文獻的特色詞
第五節 成語來源統計
第七章 詞義消歧
第一節 古代漢語詞義特點和消歧難點
第二節 義項區分的顆粒度
第三節 基于CRF模型的消歧實驗
第四節 分類器集成的消歧實驗
第八章 專名標注
第一節 關于“專名”和“命名實體”的辨析
第二節 先秦時期的人名與地名
第三節 基于統計的專名識別
第四節 基于注疏文獻的專名識別
第五節 人名所指歧義消解
第六節 基于專名標注的事件劃分
第九章 版本異文發現
第一節 異文和版本異文
第二節 個案和研究方法
第三節 基于相似度計算的句珠配對
第四節 基于同文排除的異文配對
第五節 基于雙序列比對的一體化處理
第六節 實驗結果及其分析
第十章 《左傳》中的春秋社會網絡分析
第一節 社會網絡分析的基本方法和軟件
第二節 社會關系數據的獲取和網絡的定義
第三節 人物一事件網絡分析
第四節 人物關系網絡分析
第五節 人物關系網絡的深入分析
后 記
書摘/試閱
例如:沒有為今讀yo的第一人稱代詞造字,而是借用同音的“予”、“余”來表示。沒有為今讀wéi的句首句中語氣詞造字,而是借用同音的“唯”、“惟”、“維”來表示,這就是通用。在通假字中,通用較少,假借居多。因此,本研究的通假字標注,不再細分二者,主要針對假借字標注。
《漢語大字典》在《編寫細則·釋義·通假現象的處理》中說:“通假是指古漢語書面語言中音同音近而意義原無關聯的字通用。‘甲’通‘乙, 的條件必須是: (1)甲乙二字同時并存; (2) 甲乙二字音同音近; (3)甲乙二字意義原無聯系。”可見,通假字的特點之一是借音不借義,重視的是它們之間的語音聯系,如,《管子。問》:“授事以能,則人上功。”中“上”通“尚”。借用甲字的聲音表示乙字的意義,甲字的意義并不參與其中,但這并不等于說甲字和乙字意義上毫無聯系,不能把這作為識別通假字的標準之一。
通假字的另一個特點是,通假字和正字同時并存。通假的產生。必須以通假的兩個字同時存在為前提,二者是共時的關系。通假的雙方,失去任何一方,也就無所謂通假了。這也是通假字區別于古今字的一個重要特點。古今字的古字和今字在時間上有明顯的先后關系。古人在寫通假字的時候,并不注意它的形體結構所表示的意義,而只是把它當作一個語音符號。古今字則是借助于漢字的表意功能,通常是在原有的形體上增加或者改變意符,從而減輕原來字形表示的意義太多的負擔,以便從視覺上把今字和古字區別開來。也就是說,今字分擔了古字的全部或部分意義。此外,文字通假現象是利用現有的文字根據音同音近的原則進行替代,并不意味著漢字的數量的增加,而古今字多數情況下,今字產生,古字不廢,漢字的數量有所增加。通假字和古今字的根本區別是共時和歷時。但是,共時和歷時是相對的,古今字和通假字也不是絕對對立的。當今字產生之后,如果有人再用古字,那就不應該視為古今關系,而應視為通假關系了。但在具體實踐中,要弄清每一個字產生的時代,區分通假字和古今字并非易事。即使據現有資料,可以說某個字在某個時代就有了,但是也不敢說,這個字就產生于那個時代。一旦有新材料出土,這個字的產生時間就可能提前。
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。