相關商品
商品簡介
作者簡介
名人/編輯推薦
序
目次
商品簡介
為了幫助廣大愛好自然語言處理(NaturalLanguageProcessing,NLP)技術的讀者朋友入門此領域,本書闡述了自然語言處理概況、領域應用、相關處理工具包、相關的機器學習及深度學習模型、文本預處理及文本表征等基礎知識,以及具體的自然語言處理任務,包括文本分類、關係抽取、知識圖譜、文本摘要、序列標注、機器翻譯和聊天系統,同時介紹了自然語言處理技術在學術界以及工業界的發展、應用現狀,並為讀者們提供了部分面試參考題目。
本書適合有一定的編程及機器學習基礎,想入門自然語言處理,以及想系統了解或準備求職自然語言處理初級崗位的讀者閱讀。
本書適合有一定的編程及機器學習基礎,想入門自然語言處理,以及想系統了解或準備求職自然語言處理初級崗位的讀者閱讀。
作者簡介
胡盼盼自然語言處理工程師,斯特拉斯堡大學計算機語言學碩士,曾任法國科學院(CNRS,Centre National de la Recherche Scientifique)算法研究員,負責過醫療知識圖譜、聊天機器人、智能律師系統、文本生成系統等企業級核心項目。
名人/編輯推薦
本書特色
1內容安排實用實在、詳略得當,符合初學者的認知規律
本書內容涵蓋了從自然語言數據處理、基礎任務(如分詞、詞性標注、命名實體識別等)到實戰性任務(如文本分類、文本摘要、聊天系統等)所必須掌握的知識,從內容結構上非常注重知識的實用性和可操作性。必須掌握的細節處不吝筆墨,輔以圖表以及代碼加深讀者印象;對僅需要大致了解處簡要介紹一些相關理論及前沿動態。這樣的安排使得初學者能夠掌握必備知識,了解並思考學術前沿及行業應用,符合初學者對自然語言處理知識的認知規律。
2行文簡單直白,以實例引導理論,特別適合初學者閱讀
本書行文簡單直白,全程都有相應的實例作為引導,對於比較難的內容盡量以舉例的形式幫助讀者理解。在介紹這些知識時,並不是教條式的,填鴨式的講解,而是盡量以平實化的語言講解相關理論,猶如幫助一位老朋友,一步步地成為初級自然語言處理工程師。
3設置思考題以及項目代碼,激發初學者的熱情與興趣
本書的每一章都設置有相應的思考題,並在附錄中提供了相關參考答案;讀者可以自測對章節內容的學習的掌握程度。此外,本書章節介紹的代碼實例,相關的電子版本會隨書贈予,使讀者能夠進行實踐操作,更加深入地理解知識。這些實踐內容是學習自然語言處理過程中必不可少的環節,通過思考題以及代碼的操作練習,能夠使讀者朋友快速地入門自然語言處理。
1內容安排實用實在、詳略得當,符合初學者的認知規律
本書內容涵蓋了從自然語言數據處理、基礎任務(如分詞、詞性標注、命名實體識別等)到實戰性任務(如文本分類、文本摘要、聊天系統等)所必須掌握的知識,從內容結構上非常注重知識的實用性和可操作性。必須掌握的細節處不吝筆墨,輔以圖表以及代碼加深讀者印象;對僅需要大致了解處簡要介紹一些相關理論及前沿動態。這樣的安排使得初學者能夠掌握必備知識,了解並思考學術前沿及行業應用,符合初學者對自然語言處理知識的認知規律。
2行文簡單直白,以實例引導理論,特別適合初學者閱讀
本書行文簡單直白,全程都有相應的實例作為引導,對於比較難的內容盡量以舉例的形式幫助讀者理解。在介紹這些知識時,並不是教條式的,填鴨式的講解,而是盡量以平實化的語言講解相關理論,猶如幫助一位老朋友,一步步地成為初級自然語言處理工程師。
3設置思考題以及項目代碼,激發初學者的熱情與興趣
本書的每一章都設置有相應的思考題,並在附錄中提供了相關參考答案;讀者可以自測對章節內容的學習的掌握程度。此外,本書章節介紹的代碼實例,相關的電子版本會隨書贈予,使讀者能夠進行實踐操作,更加深入地理解知識。這些實踐內容是學習自然語言處理過程中必不可少的環節,通過思考題以及代碼的操作練習,能夠使讀者朋友快速地入門自然語言處理。
序
雖說自然語言處理(Natural Language Processing, NLP)技術的歷史並不悠久,卻有著自身成熟的理論體系,覆蓋多門學科,比如數學、計算機科學、語言學、認知心理學等基礎知識,同時它又是一門應用性極強的技術,在很多領域都具備落地性。這種理論加實際操作能力的要求對初學者形成了雙重困難。通俗地闡述基本的、必備的理論知識,克服困難,使讀者能夠快速從容地上手實際項目,成為一名初級自然語言處理工程師,這是本書的目標。
本書濃縮編者多年的知識積累和實務工作經驗奉獻於讀者朋友。書中采用大量的圖示與代碼案例分析,將枯燥復雜的理論知識用平實的語言娓娓道來,讓讀者在熟悉的場景中能夠動態地理解專業知識。在具體內容安排上,拋開深奧的理論化條文,除了必備的基礎理論、知識介紹外,不貪多求全,強調實務操作、快速上手——從如何對文本數據進行預處理、基礎分析到實用的自然語言處理實踐任務如文本摘要生成、聊天系統等,讓讀者循序漸進地入門系統的自然語言處理技術。隨著本書的講解,讀者的自然語言處理學習之旅一定會成為一番難忘的快樂體驗。
本書特色
1內容安排實用實在、詳略得當,符合初學者的認知規律
本書內容涵蓋了從自然語言數據處理、基礎任務(如分詞、詞性標注、命名實體識別等)到實戰性任務(如文本分類、文本摘要、聊天系統等)所必須掌握的知識,從內容結構上非常注重知識的實用性和可操作性。必須掌握的細節處不吝筆墨,輔以圖表以及代碼加深讀者印象;對僅需要大致了解處簡要介紹一些相關理論及前沿動態。這樣的安排使得初學者能夠掌握必備知識,了解並思考學術前沿及行業應用,符合初學者對自然語言處理知識的認知規律。
2行文簡單直白,以實例引導理論,特別適合初學者閱讀
本書行文簡單直白,全程都有相應的實例作為引導,對於比較難的內容盡量以舉例的形式幫助讀者理解。在介紹這些知識時,並不是教條式的,填鴨式的講解,而是盡量以平實化的語言講解相關理論,猶如幫助一位老朋友,一步步地成為初級自然語言處理工程師。
3設置思考題以及項目代碼,激發初學者的熱情與興趣
本書的每一章都設置有相應的思考題,並在附錄中提供了相關參考答案;讀者可以自測對章節內容的學習的掌握程度。此外,本書章節介紹的代碼實例,相關的電子版本會隨書贈予,使讀者能夠進行實踐操作,更加深入地理解知識。這些實踐內容是學習自然語言處理過程中必不可少的環節,通過思考題以及代碼的操作練習,能夠使讀者朋友快速地入門自然語言處理。
自然語言處理從入門到實戰
本書內容及體系結構
第一部分自然語言處理核心技術
第1章自然語言處理初探
本章主要為讀者朋友介紹,在這短短不到一百年的時間裡,自然語言處理早期的發展歷程,近些年突飛猛進的發展,以及自然語言處理的基本任務,在各行各業中的應用和基本的工具框架。
第2章自然語言處理與機器學習
本章主要介紹一些常見機器學習模型的原理、對比分析各類機器學習模型的優缺點以及機器學習工具庫的使用。
第3章自然語言處理與神經網絡
本章將為大家揭開深度學習的神秘面紗,主要介紹神經網絡的基本結構以及一些常見的訓練過程中的優化方案。
第二部分自然語言處理基本任務
第4章文本預處理
本章主要介紹文本預處理的基礎項目以及相關工具、關鍵詞提取的一些常用的方法以及數據不平衡的處理方法。
第5章文本的表示技術
本章將縱向梳理文本表示技術的發展脈絡,分析各類表示方法的優缺點。
第6章序列標注
本章將為大家介紹一些常見的序列標注場景以及不同場景下的應用模型。
第7章關係抽取
本章主要講解關係抽取的主要方法、前沿研究以及相關的應用框架。
第三部分自然語言處理高級任務
第8章知識圖譜
本章主要介紹知識圖譜的相關概念、技術、應用等。
第9章文本分類
本章主要介紹基本的文本分類方法以及相關工具的應用。
第10章文本摘要
本章主要介紹自動文本摘要中的兩大類型,抽取式(extractive)摘要和生成式(abstractive)摘要,並且通過代碼搭建演示兩個簡單版本的抽取式摘要生成器。
第11章機器翻譯
本章主要介紹機器翻譯的歷史、相關技術原理、現狀與不足等,通過本章的學習,讀者將了解機器翻譯的源起、統計機器翻譯的原理、神經機器翻譯的原理以及常見的改進版本的神經機器翻譯模型。
第12章聊天系統
本章節主要介紹聊天系統的基本類型及應用、關鍵技術,並且用代碼演示開發一款簡單的閑聊系統。
第四部分自然語言處理求職
第13章自然語言處理技術的現在、未來及擇業
最後一章為有志於入門或從事自然語言處理的讀者提供更多的、與自然語言處理相關的常識性及實用性內容,比如學術界、工業界等方面的研究現狀、未來發展熱點、如何準備面試等。
本書讀者物件
有一定的編程及機器學習基礎,想入門自然語言處理的讀者
因為興趣,想系統性地了解自然語言處理的讀者
準備求職自然語言處理初級崗位的讀者
雖說自然語言處理(Natural Language Processing, NLP)技術的歷史並不悠久,卻有著自身成熟的理論體系,覆蓋多門學科,比如數學、計算機科學、語言學、認知心理學等基礎知識,同時它又是一門應用性極強的技術,在很多領域都具備落地性。這種理論加實際操作能力的要求對初學者形成了雙重困難。通俗地闡述基本的、必備的理論知識,克服困難,使讀者能夠快速從容地上手實際項目,成為一名初級自然語言處理工程師,這是本書的目標。
本書濃縮編者多年的知識積累和實務工作經驗奉獻於讀者朋友。書中采用大量的圖示與代碼案例分析,將枯燥復雜的理論知識用平實的語言娓娓道來,讓讀者在熟悉的場景中能夠動態地理解專業知識。在具體內容安排上,拋開深奧的理論化條文,除了必備的基礎理論、知識介紹外,不貪多求全,強調實務操作、快速上手——從如何對文本數據進行預處理、基礎分析到實用的自然語言處理實踐任務如文本摘要生成、聊天系統等,讓讀者循序漸進地入門系統的自然語言處理技術。隨著本書的講解,讀者的自然語言處理學習之旅一定會成為一番難忘的快樂體驗。
本書特色
1內容安排實用實在、詳略得當,符合初學者的認知規律
本書內容涵蓋了從自然語言數據處理、基礎任務(如分詞、詞性標注、命名實體識別等)到實戰性任務(如文本分類、文本摘要、聊天系統等)所必須掌握的知識,從內容結構上非常注重知識的實用性和可操作性。必須掌握的細節處不吝筆墨,輔以圖表以及代碼加深讀者印象;對僅需要大致了解處簡要介紹一些相關理論及前沿動態。這樣的安排使得初學者能夠掌握必備知識,了解並思考學術前沿及行業應用,符合初學者對自然語言處理知識的認知規律。
2行文簡單直白,以實例引導理論,特別適合初學者閱讀
本書行文簡單直白,全程都有相應的實例作為引導,對於比較難的內容盡量以舉例的形式幫助讀者理解。在介紹這些知識時,並不是教條式的,填鴨式的講解,而是盡量以平實化的語言講解相關理論,猶如幫助一位老朋友,一步步地成為初級自然語言處理工程師。
3設置思考題以及項目代碼,激發初學者的熱情與興趣
本書的每一章都設置有相應的思考題,並在附錄中提供了相關參考答案;讀者可以自測對章節內容的學習的掌握程度。此外,本書章節介紹的代碼實例,相關的電子版本會隨書贈予,使讀者能夠進行實踐操作,更加深入地理解知識。這些實踐內容是學習自然語言處理過程中必不可少的環節,通過思考題以及代碼的操作練習,能夠使讀者朋友快速地入門自然語言處理。
自然語言處理從入門到實戰
前言
本書內容及體系結構
第一部分自然語言處理核心技術
第1章自然語言處理初探
本章主要為讀者朋友介紹,在這短短不到一百年的時間裡,自然語言處理早期的發展歷程,近些年突飛猛進的發展,以及自然語言處理的基本任務,在各行各業中的應用和基本的工具框架。
第2章自然語言處理與機器學習
本章主要介紹一些常見機器學習模型的原理、對比分析各類機器學習模型的優缺點以及機器學習工具庫的使用。
第3章自然語言處理與神經網絡
本章將為大家揭開深度學習的神秘面紗,主要介紹神經網絡的基本結構以及一些常見的訓練過程中的優化方案。
第二部分自然語言處理基本任務
第4章文本預處理
本章主要介紹文本預處理的基礎項目以及相關工具、關鍵詞提取的一些常用的方法以及數據不平衡的處理方法。
第5章文本的表示技術
本章將縱向梳理文本表示技術的發展脈絡,分析各類表示方法的優缺點。
第6章序列標注
本章將為大家介紹一些常見的序列標注場景以及不同場景下的應用模型。
第7章關係抽取
本章主要講解關係抽取的主要方法、前沿研究以及相關的應用框架。
第三部分自然語言處理高級任務
第8章知識圖譜
本章主要介紹知識圖譜的相關概念、技術、應用等。
第9章文本分類
本章主要介紹基本的文本分類方法以及相關工具的應用。
第10章文本摘要
本章主要介紹自動文本摘要中的兩大類型,抽取式(extractive)摘要和生成式(abstractive)摘要,並且通過代碼搭建演示兩個簡單版本的抽取式摘要生成器。
第11章機器翻譯
本章主要介紹機器翻譯的歷史、相關技術原理、現狀與不足等,通過本章的學習,讀者將了解機器翻譯的源起、統計機器翻譯的原理、神經機器翻譯的原理以及常見的改進版本的神經機器翻譯模型。
第12章聊天系統
本章節主要介紹聊天系統的基本類型及應用、關鍵技術,並且用代碼演示開發一款簡單的閑聊系統。
第四部分自然語言處理求職
第13章自然語言處理技術的現在、未來及擇業
最後一章為有志於入門或從事自然語言處理的讀者提供更多的、與自然語言處理相關的常識性及實用性內容,比如學術界、工業界等方面的研究現狀、未來發展熱點、如何準備面試等。
本書讀者物件
有一定的編程及機器學習基礎,想入門自然語言處理的讀者
因為興趣,想系統性地了解自然語言處理的讀者
準備求職自然語言處理初級崗位的讀者
本書濃縮編者多年的知識積累和實務工作經驗奉獻於讀者朋友。書中采用大量的圖示與代碼案例分析,將枯燥復雜的理論知識用平實的語言娓娓道來,讓讀者在熟悉的場景中能夠動態地理解專業知識。在具體內容安排上,拋開深奧的理論化條文,除了必備的基礎理論、知識介紹外,不貪多求全,強調實務操作、快速上手——從如何對文本數據進行預處理、基礎分析到實用的自然語言處理實踐任務如文本摘要生成、聊天系統等,讓讀者循序漸進地入門系統的自然語言處理技術。隨著本書的講解,讀者的自然語言處理學習之旅一定會成為一番難忘的快樂體驗。
本書特色
1內容安排實用實在、詳略得當,符合初學者的認知規律
本書內容涵蓋了從自然語言數據處理、基礎任務(如分詞、詞性標注、命名實體識別等)到實戰性任務(如文本分類、文本摘要、聊天系統等)所必須掌握的知識,從內容結構上非常注重知識的實用性和可操作性。必須掌握的細節處不吝筆墨,輔以圖表以及代碼加深讀者印象;對僅需要大致了解處簡要介紹一些相關理論及前沿動態。這樣的安排使得初學者能夠掌握必備知識,了解並思考學術前沿及行業應用,符合初學者對自然語言處理知識的認知規律。
2行文簡單直白,以實例引導理論,特別適合初學者閱讀
本書行文簡單直白,全程都有相應的實例作為引導,對於比較難的內容盡量以舉例的形式幫助讀者理解。在介紹這些知識時,並不是教條式的,填鴨式的講解,而是盡量以平實化的語言講解相關理論,猶如幫助一位老朋友,一步步地成為初級自然語言處理工程師。
3設置思考題以及項目代碼,激發初學者的熱情與興趣
本書的每一章都設置有相應的思考題,並在附錄中提供了相關參考答案;讀者可以自測對章節內容的學習的掌握程度。此外,本書章節介紹的代碼實例,相關的電子版本會隨書贈予,使讀者能夠進行實踐操作,更加深入地理解知識。這些實踐內容是學習自然語言處理過程中必不可少的環節,通過思考題以及代碼的操作練習,能夠使讀者朋友快速地入門自然語言處理。
自然語言處理從入門到實戰
本書內容及體系結構
第一部分自然語言處理核心技術
第1章自然語言處理初探
本章主要為讀者朋友介紹,在這短短不到一百年的時間裡,自然語言處理早期的發展歷程,近些年突飛猛進的發展,以及自然語言處理的基本任務,在各行各業中的應用和基本的工具框架。
第2章自然語言處理與機器學習
本章主要介紹一些常見機器學習模型的原理、對比分析各類機器學習模型的優缺點以及機器學習工具庫的使用。
第3章自然語言處理與神經網絡
本章將為大家揭開深度學習的神秘面紗,主要介紹神經網絡的基本結構以及一些常見的訓練過程中的優化方案。
第二部分自然語言處理基本任務
第4章文本預處理
本章主要介紹文本預處理的基礎項目以及相關工具、關鍵詞提取的一些常用的方法以及數據不平衡的處理方法。
第5章文本的表示技術
本章將縱向梳理文本表示技術的發展脈絡,分析各類表示方法的優缺點。
第6章序列標注
本章將為大家介紹一些常見的序列標注場景以及不同場景下的應用模型。
第7章關係抽取
本章主要講解關係抽取的主要方法、前沿研究以及相關的應用框架。
第三部分自然語言處理高級任務
第8章知識圖譜
本章主要介紹知識圖譜的相關概念、技術、應用等。
第9章文本分類
本章主要介紹基本的文本分類方法以及相關工具的應用。
第10章文本摘要
本章主要介紹自動文本摘要中的兩大類型,抽取式(extractive)摘要和生成式(abstractive)摘要,並且通過代碼搭建演示兩個簡單版本的抽取式摘要生成器。
第11章機器翻譯
本章主要介紹機器翻譯的歷史、相關技術原理、現狀與不足等,通過本章的學習,讀者將了解機器翻譯的源起、統計機器翻譯的原理、神經機器翻譯的原理以及常見的改進版本的神經機器翻譯模型。
第12章聊天系統
本章節主要介紹聊天系統的基本類型及應用、關鍵技術,並且用代碼演示開發一款簡單的閑聊系統。
第四部分自然語言處理求職
第13章自然語言處理技術的現在、未來及擇業
最後一章為有志於入門或從事自然語言處理的讀者提供更多的、與自然語言處理相關的常識性及實用性內容,比如學術界、工業界等方面的研究現狀、未來發展熱點、如何準備面試等。
本書讀者物件
有一定的編程及機器學習基礎,想入門自然語言處理的讀者
因為興趣,想系統性地了解自然語言處理的讀者
準備求職自然語言處理初級崗位的讀者
雖說自然語言處理(Natural Language Processing, NLP)技術的歷史並不悠久,卻有著自身成熟的理論體系,覆蓋多門學科,比如數學、計算機科學、語言學、認知心理學等基礎知識,同時它又是一門應用性極強的技術,在很多領域都具備落地性。這種理論加實際操作能力的要求對初學者形成了雙重困難。通俗地闡述基本的、必備的理論知識,克服困難,使讀者能夠快速從容地上手實際項目,成為一名初級自然語言處理工程師,這是本書的目標。
本書濃縮編者多年的知識積累和實務工作經驗奉獻於讀者朋友。書中采用大量的圖示與代碼案例分析,將枯燥復雜的理論知識用平實的語言娓娓道來,讓讀者在熟悉的場景中能夠動態地理解專業知識。在具體內容安排上,拋開深奧的理論化條文,除了必備的基礎理論、知識介紹外,不貪多求全,強調實務操作、快速上手——從如何對文本數據進行預處理、基礎分析到實用的自然語言處理實踐任務如文本摘要生成、聊天系統等,讓讀者循序漸進地入門系統的自然語言處理技術。隨著本書的講解,讀者的自然語言處理學習之旅一定會成為一番難忘的快樂體驗。
本書特色
1內容安排實用實在、詳略得當,符合初學者的認知規律
本書內容涵蓋了從自然語言數據處理、基礎任務(如分詞、詞性標注、命名實體識別等)到實戰性任務(如文本分類、文本摘要、聊天系統等)所必須掌握的知識,從內容結構上非常注重知識的實用性和可操作性。必須掌握的細節處不吝筆墨,輔以圖表以及代碼加深讀者印象;對僅需要大致了解處簡要介紹一些相關理論及前沿動態。這樣的安排使得初學者能夠掌握必備知識,了解並思考學術前沿及行業應用,符合初學者對自然語言處理知識的認知規律。
2行文簡單直白,以實例引導理論,特別適合初學者閱讀
本書行文簡單直白,全程都有相應的實例作為引導,對於比較難的內容盡量以舉例的形式幫助讀者理解。在介紹這些知識時,並不是教條式的,填鴨式的講解,而是盡量以平實化的語言講解相關理論,猶如幫助一位老朋友,一步步地成為初級自然語言處理工程師。
3設置思考題以及項目代碼,激發初學者的熱情與興趣
本書的每一章都設置有相應的思考題,並在附錄中提供了相關參考答案;讀者可以自測對章節內容的學習的掌握程度。此外,本書章節介紹的代碼實例,相關的電子版本會隨書贈予,使讀者能夠進行實踐操作,更加深入地理解知識。這些實踐內容是學習自然語言處理過程中必不可少的環節,通過思考題以及代碼的操作練習,能夠使讀者朋友快速地入門自然語言處理。
自然語言處理從入門到實戰
前言
本書內容及體系結構
第一部分自然語言處理核心技術
第1章自然語言處理初探
本章主要為讀者朋友介紹,在這短短不到一百年的時間裡,自然語言處理早期的發展歷程,近些年突飛猛進的發展,以及自然語言處理的基本任務,在各行各業中的應用和基本的工具框架。
第2章自然語言處理與機器學習
本章主要介紹一些常見機器學習模型的原理、對比分析各類機器學習模型的優缺點以及機器學習工具庫的使用。
第3章自然語言處理與神經網絡
本章將為大家揭開深度學習的神秘面紗,主要介紹神經網絡的基本結構以及一些常見的訓練過程中的優化方案。
第二部分自然語言處理基本任務
第4章文本預處理
本章主要介紹文本預處理的基礎項目以及相關工具、關鍵詞提取的一些常用的方法以及數據不平衡的處理方法。
第5章文本的表示技術
本章將縱向梳理文本表示技術的發展脈絡,分析各類表示方法的優缺點。
第6章序列標注
本章將為大家介紹一些常見的序列標注場景以及不同場景下的應用模型。
第7章關係抽取
本章主要講解關係抽取的主要方法、前沿研究以及相關的應用框架。
第三部分自然語言處理高級任務
第8章知識圖譜
本章主要介紹知識圖譜的相關概念、技術、應用等。
第9章文本分類
本章主要介紹基本的文本分類方法以及相關工具的應用。
第10章文本摘要
本章主要介紹自動文本摘要中的兩大類型,抽取式(extractive)摘要和生成式(abstractive)摘要,並且通過代碼搭建演示兩個簡單版本的抽取式摘要生成器。
第11章機器翻譯
本章主要介紹機器翻譯的歷史、相關技術原理、現狀與不足等,通過本章的學習,讀者將了解機器翻譯的源起、統計機器翻譯的原理、神經機器翻譯的原理以及常見的改進版本的神經機器翻譯模型。
第12章聊天系統
本章節主要介紹聊天系統的基本類型及應用、關鍵技術,並且用代碼演示開發一款簡單的閑聊系統。
第四部分自然語言處理求職
第13章自然語言處理技術的現在、未來及擇業
最後一章為有志於入門或從事自然語言處理的讀者提供更多的、與自然語言處理相關的常識性及實用性內容,比如學術界、工業界等方面的研究現狀、未來發展熱點、如何準備面試等。
本書讀者物件
有一定的編程及機器學習基礎,想入門自然語言處理的讀者
因為興趣,想系統性地了解自然語言處理的讀者
準備求職自然語言處理初級崗位的讀者
目次
目錄
第一部分了解自然語言處理
第1章自然語言處理初探
11自然語言處理概述
111自然語言處理早期發展史
112新世紀的裡程碑事件
12自然語言處理的挑戰
121詞義消歧
122指代消解
123上下文理解
124語義與語用的不對等
13自然語言處理的應用領域
131醫療
132教育
133媒體
134金融
135法律
14自然語言處理的常見工具
141基礎任務工具包
142科學計算及機器學習框架
143深度學習框架
本章小結
思考題
第二部分自然語言處理核心技術
第2章自然語言處理與機器學習
21邏輯回歸
211邏輯回歸基本原理
212邏輯回歸在實踐中的注意要點
213邏輯回歸的優勢與不足
22樸素貝葉斯
221樸素貝葉斯基本原理
222樸素貝葉斯的類型
223樸素貝葉斯的優勢與不足
23Kmeans算法
231Kmeans算法基本原理
232Kmeans算法實踐
233Kmeans算法的優勢與不足
24決策樹
241決策樹的屬性劃分
242隨機森林的基本原理
243隨機森林在應用中的注意細節
25主成分分析
251梯度上升法解PCA
252協方差矩陣解PCA
253實戰PCA
本章小結
思考題
第3章自然語言處理與神經網絡
31神經網絡初探
311神經元結構
312常見的激活函數
313誤差反向傳播算法
32常見的神經網絡結構
321多層感知機
322循環神經網絡的基本原理
323卷積神經網絡的基本原理
324神經網絡的優勢與不足
33神經網絡算法的改進與提升
331防止過擬合的方法
332訓練速度與精度的提高方法
333注意力機制
本章小結
思考題
第三部分自然語言處理基本任務
第4章文本預處理
41文本預處理的基礎項目
411文本規範化
412語義分析
413分詞
414文本糾錯
42關鍵詞提取
421基於特征統計
422基於主題模型
423基於圖模型
43數據不平衡的處理
431常見方法
432數據不平衡問題實戰
本章小結
思考題
第5章文本的表示技術
51詞袋模型
511基於頻次的詞袋模型
512基於TFIDF的詞袋模型
513相關工具的使用
52Word2Vec詞向量
521Word2Vec的基本原理
522Word2Vec模型細節及代碼演示
523應用工具訓練Word2Vec
53改進後的詞表征
531GloVe模型
532FastText模型
533ELMo模型
54句向量
541基於詞向量的平均
542沿用Word2Vec思想
543有監督方式
本章小結
思考題
第6章序列標注
61序列標注基礎
611序列標注的應用場景
612基線方式
613序列標注任務的難點
62基於概率圖的模型
621隱馬爾科夫模型(HMM)
622最大熵馬爾科夫模型(MEMM)
623條件隨機場模型(CRF)
624天氣預測實例
63基於深度學習的方式
631數據表征形式
632序列處理模型
本章小結
思考題
第7章關係抽取
71關係抽取基礎
711關係抽取概述
712關係抽取的主要方法
713深度學習與關係抽取
714強化學習與關係抽取
72基於半監督的關係抽取模式:Snowball系統
721Patterns及Tuples的生成
722Patterns及Tuples的評估
723Snowball的實現細節
73關係抽取工具——DeepDive
731DeepDive概述
732DeepDive工作流程
733概率推斷與因子圖
本章小結
思考題
第四部分自然語言處理高級任務
第8章知識圖譜
81知識圖譜基本概念
811從語義網絡到知識圖譜
812知識的結構化、存儲及查詢
813幾個開源的知識圖譜
82知識圖譜的關鍵構建技術
821本體匹配
822實體鏈接
823知識推理
83知識圖譜應用
831反欺詐
832個性化推薦
833知識庫問答
本章小結
思考題
第9章文本分類
91文本分類的常見方法
911機器學習
912模型融合
913深度學習
92文本分類的不同應用場景
921二分類
922多分類
923多標簽多分類
93案例:搭建一款新聞主題分類器
931數據預處理
932訓練與預測
933改進
本章小結
思考題
第10章文本摘要
101抽取式摘要
1011傳統方法
1012基於深度學習的方法
1013抽取式摘要的訓練數據問題
102生成式摘要
1021基礎模型
1022前沿模型中的技巧
1023強化學習與生成式摘要
103案例:搭建網球新聞摘要生成器
1031基於詞頻統計的摘要生成器
1032基於圖模型的摘要生成器
1033結果分析
本章小結
思考題
第11章機器翻譯
111傳統機器翻譯
1111源起
1112基於規則
1113基於大規模語料
112統計機器翻譯
1121相關流派
1122基於信源信道的統計機器翻譯
1123案例:外星語的翻譯實戰
113神經機器翻譯
1131基本原理
1132改進機制
1133前沿與挑戰
本章小結
思考題
第12章聊天系統
121聊天系統的類型
1211閑聊式機器人
1212知識問答型機器人
1213任務型聊天機器人
122聊天系統的關鍵技術
1221檢索技術
1222意圖識別和詞槽填充
1223對話管理
1224強化學習與多輪對話
123案例:閑聊機器人實戰
1231技術概要
1232基本配置及數據預處理
1233閑聊機器人模型的搭建
1234模型訓練、預測以及優化
本章小結
思考題
第五部分自然語言處理求職
第13章自然語言處理技術的現在、未來及擇業
131自然語言處理組織及人才需求介紹
1311學術界
1312工業界
1313人才需求現狀
132未來與自然語言處理
1321自然語言處理熱點技術方向
1322自然語言處理的應用暢想
1323自然語言處理帶來的行業衝擊
133面試題
1331數據結構與算法
1332數學基礎
1333機器學習與深度學習
1334自然語言處理專業
1335實際問題解決及技術領域見解
本章小結
思考題
附錄A思考題參考答案
附錄B面試題答案目錄
第一部分了解自然語言處理
第1章自然語言處理初探
11自然語言處理概述
111自然語言處理早期發展史
112新世紀的裡程碑事件
12自然語言處理的挑戰
121詞義消歧
122指代消解
123上下文理解
124語義與語用的不對等
13自然語言處理的應用領域
131醫療
132教育
133媒體
134金融
135法律
14自然語言處理的常見工具
141基礎任務工具包
142科學計算及機器學習框架
143深度學習框架
本章小結
思考題
第二部分自然語言處理核心技術
第2章自然語言處理與機器學習
21邏輯回歸
211邏輯回歸基本原理
212邏輯回歸在實踐中的注意要點
213邏輯回歸的優勢與不足
22樸素貝葉斯
221樸素貝葉斯基本原理
222樸素貝葉斯的類型
223樸素貝葉斯的優勢與不足
23Kmeans算法
231Kmeans算法基本原理
232Kmeans算法實踐
233Kmeans算法的優勢與不足
24決策樹
241決策樹的屬性劃分
242隨機森林的基本原理
243隨機森林在應用中的注意細節
25主成分分析
251梯度上升法解PCA
252協方差矩陣解PCA
253實戰PCA
本章小結
思考題
第3章自然語言處理與神經網絡
31神經網絡初探
311神經元結構
312常見的激活函數
313誤差反向傳播算法
32常見的神經網絡結構
321多層感知機
322循環神經網絡的基本原理
323卷積神經網絡的基本原理
324神經網絡的優勢與不足
33神經網絡算法的改進與提升
331防止過擬合的方法
332訓練速度與精度的提高方法
333注意力機制
本章小結
思考題
第三部分自然語言處理基本任務
第4章文本預處理
41文本預處理的基礎項目
411文本規範化
412語義分析
413分詞
414文本糾錯
42關鍵詞提取
421基於特征統計
422基於主題模型
423基於圖模型
43數據不平衡的處理
431常見方法
432數據不平衡問題實戰
本章小結
思考題
第5章文本的表示技術
51詞袋模型
511基於頻次的詞袋模型
512基於TFIDF的詞袋模型
513相關工具的使用
52Word2Vec詞向量
521Word2Vec的基本原理
522Word2Vec模型細節及代碼演示
523應用工具訓練Word2Vec
53改進後的詞表征
531GloVe模型
532FastText模型
533ELMo模型
54句向量
541基於詞向量的平均
542沿用Word2Vec思想
543有監督方式
本章小結
思考題
第6章序列標注
61序列標注基礎
611序列標注的應用場景
612基線方式
613序列標注任務的難點
62基於概率圖的模型
621隱馬爾科夫模型(HMM)
622最大熵馬爾科夫模型(MEMM)
623條件隨機場模型(CRF)
624天氣預測實例
63基於深度學習的方式
631數據表征形式
632序列處理模型
本章小結
思考題
第7章關係抽取
71關係抽取基礎
711關係抽取概述
712關係抽取的主要方法
713深度學習與關係抽取
714強化學習與關係抽取
72基於半監督的關係抽取模式:Snowball系統
721Patterns及Tuples的生成
722Patterns及Tuples的評估
723Snowball的實現細節
73關係抽取工具——DeepDive
731DeepDive概述
732DeepDive工作流程
733概率推斷與因子圖
本章小結
思考題
第四部分自然語言處理高級任務
第8章知識圖譜
81知識圖譜基本概念
811從語義網絡到知識圖譜
812知識的結構化、存儲及查詢
813幾個開源的知識圖譜
82知識圖譜的關鍵構建技術
821本體匹配
822實體鏈接
823知識推理
83知識圖譜應用
831反欺詐
832個性化推薦
833知識庫問答
本章小結
思考題
第9章文本分類
91文本分類的常見方法
911機器學習
912模型融合
913深度學習
92文本分類的不同應用場景
921二分類
922多分類
923多標簽多分類
93案例:搭建一款新聞主題分類器
931數據預處理
932訓練與預測
933改進
本章小結
思考題
第10章文本摘要
101抽取式摘要
1011傳統方法
1012基於深度學習的方法
1013抽取式摘要的訓練數據問題
102生成式摘要
1021基礎模型
1022前沿模型中的技巧
1023強化學習與生成式摘要
103案例:搭建網球新聞摘要生成器
1031基於詞頻統計的摘要生成器
1032基於圖模型的摘要生成器
1033結果分析
本章小結
思考題
第11章機器翻譯
111傳統機器翻譯
1111源起
1112基於規則
1113基於大規模語料
112統計機器翻譯
1121相關流派
1122基於信源信道的統計機器翻譯
1123案例:外星語的翻譯實戰
113神經機器翻譯
1131基本原理
1132改進機制
1133前沿與挑戰
本章小結
思考題
第12章聊天系統
121聊天系統的類型
1211閑聊式機器人
1212知識問答型機器人
1213任務型聊天機器人
122聊天系統的關鍵技術
1221檢索技術
1222意圖識別和詞槽填充
1223對話管理
1224強化學習與多輪對話
123案例:閑聊機器人實戰
1231技術概要
1232基本配置及數據預處理
1233閑聊機器人模型的搭建
1234模型訓練、預測以及優化
本章小結
思考題
第五部分自然語言處理求職
第13章自然語言處理技術的現在、未來及擇業
131自然語言處理組織及人才需求介紹
1311學術界
1312工業界
1313人才需求現狀
132未來與自然語言處理
1321自然語言處理熱點技術方向
1322自然語言處理的應用暢想
1323自然語言處理帶來的行業衝擊
133面試題
1331數據結構與算法
1332數學基礎
1333機器學習與深度學習
1334自然語言處理專業
1335實際問題解決及技術領域見解
本章小結
思考題
附錄A思考題參考答案
附錄B面試題答案
第一部分了解自然語言處理
第1章自然語言處理初探
11自然語言處理概述
111自然語言處理早期發展史
112新世紀的裡程碑事件
12自然語言處理的挑戰
121詞義消歧
122指代消解
123上下文理解
124語義與語用的不對等
13自然語言處理的應用領域
131醫療
132教育
133媒體
134金融
135法律
14自然語言處理的常見工具
141基礎任務工具包
142科學計算及機器學習框架
143深度學習框架
本章小結
思考題
第二部分自然語言處理核心技術
第2章自然語言處理與機器學習
21邏輯回歸
211邏輯回歸基本原理
212邏輯回歸在實踐中的注意要點
213邏輯回歸的優勢與不足
22樸素貝葉斯
221樸素貝葉斯基本原理
222樸素貝葉斯的類型
223樸素貝葉斯的優勢與不足
23Kmeans算法
231Kmeans算法基本原理
232Kmeans算法實踐
233Kmeans算法的優勢與不足
24決策樹
241決策樹的屬性劃分
242隨機森林的基本原理
243隨機森林在應用中的注意細節
25主成分分析
251梯度上升法解PCA
252協方差矩陣解PCA
253實戰PCA
本章小結
思考題
第3章自然語言處理與神經網絡
31神經網絡初探
311神經元結構
312常見的激活函數
313誤差反向傳播算法
32常見的神經網絡結構
321多層感知機
322循環神經網絡的基本原理
323卷積神經網絡的基本原理
324神經網絡的優勢與不足
33神經網絡算法的改進與提升
331防止過擬合的方法
332訓練速度與精度的提高方法
333注意力機制
本章小結
思考題
第三部分自然語言處理基本任務
第4章文本預處理
41文本預處理的基礎項目
411文本規範化
412語義分析
413分詞
414文本糾錯
42關鍵詞提取
421基於特征統計
422基於主題模型
423基於圖模型
43數據不平衡的處理
431常見方法
432數據不平衡問題實戰
本章小結
思考題
第5章文本的表示技術
51詞袋模型
511基於頻次的詞袋模型
512基於TFIDF的詞袋模型
513相關工具的使用
52Word2Vec詞向量
521Word2Vec的基本原理
522Word2Vec模型細節及代碼演示
523應用工具訓練Word2Vec
53改進後的詞表征
531GloVe模型
532FastText模型
533ELMo模型
54句向量
541基於詞向量的平均
542沿用Word2Vec思想
543有監督方式
本章小結
思考題
第6章序列標注
61序列標注基礎
611序列標注的應用場景
612基線方式
613序列標注任務的難點
62基於概率圖的模型
621隱馬爾科夫模型(HMM)
622最大熵馬爾科夫模型(MEMM)
623條件隨機場模型(CRF)
624天氣預測實例
63基於深度學習的方式
631數據表征形式
632序列處理模型
本章小結
思考題
第7章關係抽取
71關係抽取基礎
711關係抽取概述
712關係抽取的主要方法
713深度學習與關係抽取
714強化學習與關係抽取
72基於半監督的關係抽取模式:Snowball系統
721Patterns及Tuples的生成
722Patterns及Tuples的評估
723Snowball的實現細節
73關係抽取工具——DeepDive
731DeepDive概述
732DeepDive工作流程
733概率推斷與因子圖
本章小結
思考題
第四部分自然語言處理高級任務
第8章知識圖譜
81知識圖譜基本概念
811從語義網絡到知識圖譜
812知識的結構化、存儲及查詢
813幾個開源的知識圖譜
82知識圖譜的關鍵構建技術
821本體匹配
822實體鏈接
823知識推理
83知識圖譜應用
831反欺詐
832個性化推薦
833知識庫問答
本章小結
思考題
第9章文本分類
91文本分類的常見方法
911機器學習
912模型融合
913深度學習
92文本分類的不同應用場景
921二分類
922多分類
923多標簽多分類
93案例:搭建一款新聞主題分類器
931數據預處理
932訓練與預測
933改進
本章小結
思考題
第10章文本摘要
101抽取式摘要
1011傳統方法
1012基於深度學習的方法
1013抽取式摘要的訓練數據問題
102生成式摘要
1021基礎模型
1022前沿模型中的技巧
1023強化學習與生成式摘要
103案例:搭建網球新聞摘要生成器
1031基於詞頻統計的摘要生成器
1032基於圖模型的摘要生成器
1033結果分析
本章小結
思考題
第11章機器翻譯
111傳統機器翻譯
1111源起
1112基於規則
1113基於大規模語料
112統計機器翻譯
1121相關流派
1122基於信源信道的統計機器翻譯
1123案例:外星語的翻譯實戰
113神經機器翻譯
1131基本原理
1132改進機制
1133前沿與挑戰
本章小結
思考題
第12章聊天系統
121聊天系統的類型
1211閑聊式機器人
1212知識問答型機器人
1213任務型聊天機器人
122聊天系統的關鍵技術
1221檢索技術
1222意圖識別和詞槽填充
1223對話管理
1224強化學習與多輪對話
123案例:閑聊機器人實戰
1231技術概要
1232基本配置及數據預處理
1233閑聊機器人模型的搭建
1234模型訓練、預測以及優化
本章小結
思考題
第五部分自然語言處理求職
第13章自然語言處理技術的現在、未來及擇業
131自然語言處理組織及人才需求介紹
1311學術界
1312工業界
1313人才需求現狀
132未來與自然語言處理
1321自然語言處理熱點技術方向
1322自然語言處理的應用暢想
1323自然語言處理帶來的行業衝擊
133面試題
1331數據結構與算法
1332數學基礎
1333機器學習與深度學習
1334自然語言處理專業
1335實際問題解決及技術領域見解
本章小結
思考題
附錄A思考題參考答案
附錄B面試題答案目錄
第一部分了解自然語言處理
第1章自然語言處理初探
11自然語言處理概述
111自然語言處理早期發展史
112新世紀的裡程碑事件
12自然語言處理的挑戰
121詞義消歧
122指代消解
123上下文理解
124語義與語用的不對等
13自然語言處理的應用領域
131醫療
132教育
133媒體
134金融
135法律
14自然語言處理的常見工具
141基礎任務工具包
142科學計算及機器學習框架
143深度學習框架
本章小結
思考題
第二部分自然語言處理核心技術
第2章自然語言處理與機器學習
21邏輯回歸
211邏輯回歸基本原理
212邏輯回歸在實踐中的注意要點
213邏輯回歸的優勢與不足
22樸素貝葉斯
221樸素貝葉斯基本原理
222樸素貝葉斯的類型
223樸素貝葉斯的優勢與不足
23Kmeans算法
231Kmeans算法基本原理
232Kmeans算法實踐
233Kmeans算法的優勢與不足
24決策樹
241決策樹的屬性劃分
242隨機森林的基本原理
243隨機森林在應用中的注意細節
25主成分分析
251梯度上升法解PCA
252協方差矩陣解PCA
253實戰PCA
本章小結
思考題
第3章自然語言處理與神經網絡
31神經網絡初探
311神經元結構
312常見的激活函數
313誤差反向傳播算法
32常見的神經網絡結構
321多層感知機
322循環神經網絡的基本原理
323卷積神經網絡的基本原理
324神經網絡的優勢與不足
33神經網絡算法的改進與提升
331防止過擬合的方法
332訓練速度與精度的提高方法
333注意力機制
本章小結
思考題
第三部分自然語言處理基本任務
第4章文本預處理
41文本預處理的基礎項目
411文本規範化
412語義分析
413分詞
414文本糾錯
42關鍵詞提取
421基於特征統計
422基於主題模型
423基於圖模型
43數據不平衡的處理
431常見方法
432數據不平衡問題實戰
本章小結
思考題
第5章文本的表示技術
51詞袋模型
511基於頻次的詞袋模型
512基於TFIDF的詞袋模型
513相關工具的使用
52Word2Vec詞向量
521Word2Vec的基本原理
522Word2Vec模型細節及代碼演示
523應用工具訓練Word2Vec
53改進後的詞表征
531GloVe模型
532FastText模型
533ELMo模型
54句向量
541基於詞向量的平均
542沿用Word2Vec思想
543有監督方式
本章小結
思考題
第6章序列標注
61序列標注基礎
611序列標注的應用場景
612基線方式
613序列標注任務的難點
62基於概率圖的模型
621隱馬爾科夫模型(HMM)
622最大熵馬爾科夫模型(MEMM)
623條件隨機場模型(CRF)
624天氣預測實例
63基於深度學習的方式
631數據表征形式
632序列處理模型
本章小結
思考題
第7章關係抽取
71關係抽取基礎
711關係抽取概述
712關係抽取的主要方法
713深度學習與關係抽取
714強化學習與關係抽取
72基於半監督的關係抽取模式:Snowball系統
721Patterns及Tuples的生成
722Patterns及Tuples的評估
723Snowball的實現細節
73關係抽取工具——DeepDive
731DeepDive概述
732DeepDive工作流程
733概率推斷與因子圖
本章小結
思考題
第四部分自然語言處理高級任務
第8章知識圖譜
81知識圖譜基本概念
811從語義網絡到知識圖譜
812知識的結構化、存儲及查詢
813幾個開源的知識圖譜
82知識圖譜的關鍵構建技術
821本體匹配
822實體鏈接
823知識推理
83知識圖譜應用
831反欺詐
832個性化推薦
833知識庫問答
本章小結
思考題
第9章文本分類
91文本分類的常見方法
911機器學習
912模型融合
913深度學習
92文本分類的不同應用場景
921二分類
922多分類
923多標簽多分類
93案例:搭建一款新聞主題分類器
931數據預處理
932訓練與預測
933改進
本章小結
思考題
第10章文本摘要
101抽取式摘要
1011傳統方法
1012基於深度學習的方法
1013抽取式摘要的訓練數據問題
102生成式摘要
1021基礎模型
1022前沿模型中的技巧
1023強化學習與生成式摘要
103案例:搭建網球新聞摘要生成器
1031基於詞頻統計的摘要生成器
1032基於圖模型的摘要生成器
1033結果分析
本章小結
思考題
第11章機器翻譯
111傳統機器翻譯
1111源起
1112基於規則
1113基於大規模語料
112統計機器翻譯
1121相關流派
1122基於信源信道的統計機器翻譯
1123案例:外星語的翻譯實戰
113神經機器翻譯
1131基本原理
1132改進機制
1133前沿與挑戰
本章小結
思考題
第12章聊天系統
121聊天系統的類型
1211閑聊式機器人
1212知識問答型機器人
1213任務型聊天機器人
122聊天系統的關鍵技術
1221檢索技術
1222意圖識別和詞槽填充
1223對話管理
1224強化學習與多輪對話
123案例:閑聊機器人實戰
1231技術概要
1232基本配置及數據預處理
1233閑聊機器人模型的搭建
1234模型訓練、預測以及優化
本章小結
思考題
第五部分自然語言處理求職
第13章自然語言處理技術的現在、未來及擇業
131自然語言處理組織及人才需求介紹
1311學術界
1312工業界
1313人才需求現狀
132未來與自然語言處理
1321自然語言處理熱點技術方向
1322自然語言處理的應用暢想
1323自然語言處理帶來的行業衝擊
133面試題
1331數據結構與算法
1332數學基礎
1333機器學習與深度學習
1334自然語言處理專業
1335實際問題解決及技術領域見解
本章小結
思考題
附錄A思考題參考答案
附錄B面試題答案
主題書展
更多
主題書展
更多書展本週66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。