漢英平行語料庫的平行處理(簡體書)
商品資訊
系列名:計算機語言學研究系列
ISBN13:9787510041105
出版社:世界圖書(北京)出版公司
作者:馮敏萱
出版日:2011/11/01
裝訂:平裝
規格:19cm*13cm (高/寬)
人民幣定價:25 元
定價
:NT$ 150 元優惠價
:87 折 131 元
絕版無法訂購
商品簡介
作者簡介
目次
書摘/試閱
相關商品
商品簡介
漢英語料的平行處理技術,旨在利用雙語信息以解決歧義現象。本課題研究了漢英平行語料中的未登錄詞識別、詞性標注、詞義標注及句法分析等層面的平行處理技術及其有效性,實現了漢一英雙向平行處理。在詞匯未對齊平行語料中,采用了基于個性規則的詞性、詞義消歧方法。精加工1000句對的漢英平行語料,可作為加工大規模平行語料的資源。平行處理技術可以有效解決單語處理時的一系列困難,有助于漢英機器翻譯知識的自動獲取。
作者簡介
馮敏萱,江蘇南京人。語言學及應用語言學專業文學博士。現任南京師范大學文學院語言科技系講師,獲校第八屆青年教師教學大賽“教學十佳”稱號。主要研究方向為中文信息處理、語料庫語言學。發表論文20篇,代表作有《帶後綴“者”的派生詞識別》、《英語人名的漢譯名平行識別》和Parallel Processing Strategy for Segmentation Ambiguity。現主持江蘇省社會科學基金項目1項,參與國家社會科學基金項目等4項。
目次
第一章 引言
第一節 平行語料庫的現狀
第二節 本課題的研究意義及價值
第三節 本課題的研究內容及方法
第二章 平行語料庫概述
第一節 平行語料庫的建設與發展
第二節 平行語料庫的加工與利用
第三節 平行語料庫與其他相關研究
第四節 本章小結
第三章 詞匯分析的平行處理
第一節 詞匯分析研究的現狀及難點
第二節 平行處理實驗的設計
第三節 平行處理實驗結果的分析
第四節 本章小結
第四章 詞性標注的平行處理
第一節 詞性標注研究的現狀及難點
第二節 平行處理實驗的設計
第三節 平行處理實驗結果的分析
第四節 本章小結
第五章 詞義標注的平行處理
第一節 詞義標注研究的現狀及難點
第二節 平行處理實驗的設計
第三節 平行處理實驗結果的分析
第四節 本章小結
第六章 句法結構的平行處理
第一節 句法結構研究的現狀及難點
第二節 平行處理實驗的設計
第三節 平行處理實驗結果的分析
第四節 本章小結
結語
參考文獻
附錄
附錄一 PCCE1000觀察語料示例
附錄二 PCCE1000統計數據總表
附錄三 術語索引
附錄四圖表索引
後記
第一節 平行語料庫的現狀
第二節 本課題的研究意義及價值
第三節 本課題的研究內容及方法
第二章 平行語料庫概述
第一節 平行語料庫的建設與發展
第二節 平行語料庫的加工與利用
第三節 平行語料庫與其他相關研究
第四節 本章小結
第三章 詞匯分析的平行處理
第一節 詞匯分析研究的現狀及難點
第二節 平行處理實驗的設計
第三節 平行處理實驗結果的分析
第四節 本章小結
第四章 詞性標注的平行處理
第一節 詞性標注研究的現狀及難點
第二節 平行處理實驗的設計
第三節 平行處理實驗結果的分析
第四節 本章小結
第五章 詞義標注的平行處理
第一節 詞義標注研究的現狀及難點
第二節 平行處理實驗的設計
第三節 平行處理實驗結果的分析
第四節 本章小結
第六章 句法結構的平行處理
第一節 句法結構研究的現狀及難點
第二節 平行處理實驗的設計
第三節 平行處理實驗結果的分析
第四節 本章小結
結語
參考文獻
附錄
附錄一 PCCE1000觀察語料示例
附錄二 PCCE1000統計數據總表
附錄三 術語索引
附錄四圖表索引
後記
書摘/試閱
機器翻譯的實質在于輸入的源語與目標語通過後臺平行語料庫建立對應關系,包括詞匯和結構的對應。從這個角度看,決定機器翻譯質量最重要的兩個因素是:一、後臺語料庫內容的豐富與否。簡單地說,就是語料庫里有沒有源語與目標語的對應,這將決定機器能否順利翻譯。二、在後臺的若干對應中,能不能選擇出合適的對應,這個因素決定了翻譯是否正確、到位。因此,從原理上來講,應該建立大型的雙語平行語料庫,使得需要翻譯的句子在語料庫中能夠檢索到相同或相近的句子并自動生成翻譯產品或翻譯的粗產品(余國良,2009)。
在這方面,已經有學者開始考慮同時利用兩種語言的信息來進行研究,穗志方等(1998)提出,基于實例的漢英機器翻譯系統,應該在比較兩句整體結構相似的基礎上進行語句相似度計算,除了利用骨架依存分析法,識別漢語謂詞中心詞,還根據漢英例句集中英語例句的謂語中心詞來識別相應的漢語例句的謂語中心詞,實驗對3000個漢語單句進行謂語中心詞的自動識別,正確率達到87.3%。
但是,隨著研究的深入,人們發現基于平行語料庫的翻譯信息獲取,對于機器翻譯等有以下的不足:(1)獲取的翻譯信息的質量一定程度上依賴于平行語料的質量,即譯文的質量;(2)新出現的詞往往超前于平行語料庫,從平行語料庫中難以獲取新詞及其譯詞,而對于新詞(未登錄詞)的處理能力對機器翻譯卻十分重要,尤其在專業領域,單詞術語和多詞術語的獲取對機器翻譯尤其重要。
……
在這方面,已經有學者開始考慮同時利用兩種語言的信息來進行研究,穗志方等(1998)提出,基于實例的漢英機器翻譯系統,應該在比較兩句整體結構相似的基礎上進行語句相似度計算,除了利用骨架依存分析法,識別漢語謂詞中心詞,還根據漢英例句集中英語例句的謂語中心詞來識別相應的漢語例句的謂語中心詞,實驗對3000個漢語單句進行謂語中心詞的自動識別,正確率達到87.3%。
但是,隨著研究的深入,人們發現基于平行語料庫的翻譯信息獲取,對于機器翻譯等有以下的不足:(1)獲取的翻譯信息的質量一定程度上依賴于平行語料的質量,即譯文的質量;(2)新出現的詞往往超前于平行語料庫,從平行語料庫中難以獲取新詞及其譯詞,而對于新詞(未登錄詞)的處理能力對機器翻譯卻十分重要,尤其在專業領域,單詞術語和多詞術語的獲取對機器翻譯尤其重要。
……
主題書展
更多
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。