商品簡介
這是一本能讓讀者快速從零開始構建工業級知識圖譜的著作。作者是知識圖譜和自然語言處理領域的專家,本書得到了OpenKG聯合創始人王昊奮、清華大學教授李涓子、東南大學教授漆桂林、美團知識圖譜團隊負責人張富崢、文因互聯創始人鮑捷等學界和業界知識圖譜扛旗人的一致好評和推薦。
本書不僅詳細講解了知識圖譜的技術原理和構建工具,而且還循序漸進地講解了知識圖譜的構建方法、步驟和行業應用。配有大量實戰案例,並且開放了源代碼,確保讀者能學會並落地。
全書一共8章:
第1章介紹了知識圖譜的概念、模式、應用場景和技術架構;
第2章圍繞知識圖譜的技術體系,詳細闡述了知識的表示與建模、抽取與挖掘、存儲與融合,以及檢索與推理;
第3章通過具體的實例介紹了各種知識圖譜工具的使用;
第4章和第5章從工業實踐的角度講解了從0到1構建通用知識圖譜和領域知識圖譜的步驟和方法,並配備詳細的代碼解讀;
第6~7章講解了知識圖譜的具體應用和一個綜合性的知識圖譜案例——問答系統,進一步指導讀者實踐;
第8章對知識圖譜的未來發展進行了總結和展望。
作者簡介
邵浩
資深人工智能技術專家,復星集團CEO助理,集團AI業務負責人。曾任vivo人工智能研究院算法專家、技術總監,曾任狗尾草智能科技AI研究院院長,帶領團隊打造了虛擬生命產品的交互引擎。上海市靜安區首屆優秀人才,上海市人才發展基金獲得者,杭州市高層次人才。中國中文信息學會青年工作委員會委員,語言與知識計算專委會委員,中國計算機學會語音對話與聽覺專委會委員,自然語言處理專委會委員。
日本國立九州大學工學博士,亞利桑那州立大學訪問學者,曾任上海對外經貿大學副教授,碩士生導師。共發表論文 50餘篇,專利十餘項,在國內率先出版了聊天機器人和預訓練語言模型相關的著作,主持多項國jia級和省部級課題。
張凱
資深AI算法工程師,主要研究方向包括知識圖譜、對話系統、推薦系統、機器翻譯等,擁有多年算法落地經驗。主導構建了開放通用知識圖譜七律,參與了《知識圖譜評測標準》和《知識圖譜白皮書》的編寫。聊天機器人專業書籍作者之一。
李方圓
資深AI算法工程師,主要研究方向包括機器翻譯、知識圖譜和問答系統,具有多年實戰項目經驗,現任vivo機器翻譯團隊負責人,主導從零構建機器翻譯能力。
張云柯
資深AI算法工程師,中文信息學會會員,碩士畢業於加拿大Queen’s University,曾任職於奇虎360。主要研究方向包括自然語言處理與知識圖譜,曾於領域內知名會議發表相關論文,擁有豐富的算法落地經驗。
戴錫強
資深AI算法工程師,主要研究方向為知識圖譜、對話系統等,參與構建了百科知識圖譜,醫藥領域知識圖譜,基於知識圖譜的問答系統等,具有豐富的知識圖譜落地經驗。
名人/編輯推薦
序
為什麼寫這本書
知識圖譜,是近年來最火熱的研究方向之一,被認為是實現認知智能的核心基礎技術。知識圖譜以圖的形式表現客觀世界中的實體、概念及其之間的關係,致力於解決認知智能中的復雜推理問題。
隨著大數據時代的紅利逐漸消失,以深度學習為基礎的感知智能逐步觸碰到天花板,理論突破也越來越難。而在認知智能的前進道路上,基於統計概率的深度學習模型仍然無法真正實現和人類相同的推理和理解能力。
充分有效地利用人類社會中海量的知識是可行的解決路徑之一。而知識圖譜將人類知識表示為圖的形式,可以讓機器更好地利用知識,實現一定程度的“智能化”。然而,雖然知識圖譜被寄予厚望,可以實現人工智能從感知到認知的跨越,但通用知識圖譜的建立和完善是一個漫長的過程。在現階段,知識圖譜還是大量應用在簡單場景和垂直場景上,例如搜索引擎、智能問答、語義理解、決策分析、智能物聯等。
構建知識圖譜是一個系統工程,涉及知識的表示、獲取、存儲、應用以及自然語言處理等各項技術,如何全面掌握知識圖譜的構建,成為很多同學和從業者最為關注的問題。縱觀目前市場上的知識圖譜書籍,我們發現,大多數的書都是以理論介紹為主,雖然內容充分翔實,但缺乏應用性的梳理和闡述。
寫這本書的初衷,就是希望將我們在實踐中構建知識圖譜的經驗,包括踩坑的教訓,以文字的形式做出總結,同時分享給各位奮戰在一線的知識圖譜從業人員。書中不僅對知識圖譜的概念和理論做了詳細介紹,同時用開源代碼的形式闡述了落地細節。
本書一共分為8章。第1章給出了知識圖譜的概覽,第2章圍繞知識圖譜的整體技術體系,詳細闡述了知識的表示與建模、抽取與挖掘、存儲與融合,以及檢索與推理。第3章以具體的實例介紹了各種知識圖譜工具的使用。第4章和第5章從實戰的角度帶領讀者從零到一構建通用知識圖譜和領域知識圖譜,並配以詳細的代碼解讀。第6章給出了知識圖譜的具體應用。第7章也是從實戰的角度對知識圖譜的問答系統做了詳盡闡述。最後第8章給出了知識圖譜的總結和展望。
知識圖譜領域仍然有很多問題需要解決,需要各位同人一起努力。希望本書能夠為讀者解決問題提供些許幫助。
由於種種原因,本書成稿過程頗有波折。我們要特別感謝編輯楊福川和李藝,他們對本書出版提供了大力支持。
目次
推薦序
前言
第1章 知識圖譜概覽 1
1.1 知識圖譜序言 1
1.2 知識圖譜基本概念 3
1.2.1 知識圖譜背景 3
1.2.2 知識圖譜的定義 5
1.2.3 典型知識圖譜示例 7
1.3 知識圖譜的模式 10
1.4 為什麼需要知識圖譜 13
1.5 知識圖譜的典型應用 15
1.6 知識圖譜的技術架構 17
參考文獻 18
第2章 知識圖譜技術體系 19
2.1 知識表示與知識建模 19
2.1.1 知識表示 19
2.1.2 知識建模 26
2.2 知識抽取與知識挖掘 29
2.2.1 知識抽取 29
2.2.2 知識挖掘 38
2.3 知識存儲與知識融合 42
2.3.1 知識存儲 42
2.3.2 知識融合 47
2.4 知識檢索與知識推理 52
2.4.1 知識檢索 53
2.4.2 知識推理 58
參考文獻 61
第3章 知識圖譜工具 63
3.1 知識建模工具 63
3.1.1 Protégé 64
3.1.2 其他本體建模工具 79
3.1.3 本體建模工具的選擇 83
3.2 知識抽取工具 84
3.2.1 DeepDive 84
3.2.2 其他知識抽取工具 102
3.2.3 知識抽取工具對比 106
3.3 知識存儲工具 107
3.3.1 Neo4j 108
3.3.2 Neo4j安裝與部署 109
3.3.3 可視化 113
3.3.4 圖模型 115
3.3.5 其他圖數據庫 120
參考文獻 122
第4章 從零構建通用知識圖譜 123
4.1 通用知識表示與抽取 123
4.1.1 通用知識數據來源 123
4.1.2 實體層構建 126
4.1.3 表述層構建 131
4.1.4 概念層構建 134
4.2 知識增強 135
4.2.1 實體層知識增強 135
4.2.2 模式完善 139
4.2.3 實體鏈接:表述層與實體層之間的映射 144
4.2.4 實體分類:實體層與概念層之間的映射 146
4.3 百科知識存儲與更新 153
4.3.1 屬性圖存儲模型 154
4.3.2 知識存儲 156
4.3.3 知識更新 168
第5章 領域知識圖譜構建 172
5.1 領域知識圖譜概覽 172
5.2 醫藥領域知識圖譜 173
5.2.1 領域模式構建 174
5.2.2 領域知識抽取 176
5.2.3 領域圖譜構建 178
5.2.4 圖譜展示 182
5.3 用戶畫像圖譜 183
5.3.1 用戶畫像知識表示 183
5.3.2 知識抽取和挖掘 185
5.3.3 抽取案例 194
參考文獻 207
第6章 知識圖譜應用 208
6.1 知識可視化 208
6.1.1 D3 208
6.1.2 ECharts 213
6.1.3 其他工具介紹 220
6.1.4 小結 225
6.2 實體鏈接 225
6.2.1 實體鏈接的定義 225
6.2.2 實體鏈接的步驟 226
6.2.3 實體鏈接工具 232
6.2.4 實體鏈接的應用 242
6.3 知識問答 245
6.3.1 知識問答系統概述 245
6.3.2 知識問答系統的主要流程 247
6.3.3 主流知識問答系統介紹 252
6.3.4 問答系統實戰 260
6.4 聯想 277
6.4.1 聯想整體流程 278
6.4.2 話題識別 279
6.4.3 候選話題生成 280
6.4.4 候選話題排序 282
6.4.5 聯想回復生成 290
參考文獻 292
第7章 基於知識圖譜的問答系統 297
7.1 簡介 297
7.2 自然語言理解 300
7.2.1 概述 300
7.2.2 基礎NLU 301
7.2.3 意圖理解 309
7.2.4 實體識別與鏈接 317
7.2.5 文本相似度與向量化 317
7.3 對話管理 322
7.3.1 概述 322
7.3.2 知識問答 327
7.3.3 閑聊 331
7.4 自然語言生成 332
7.5 服務化 333
參考文獻 335
第8章 總結與展望 336
參考文獻 338
書摘/試閱
◆推薦序 ◆
近年來,知識圖譜技術及應用受到了廣泛的關注。作為人工智能時代從感知跨越到認知的橋梁,知識圖譜以圖網絡的形式連接人類豐富的知識,並嘗試解決推理和理解問題。越來越多的學者和工業界人士投身於知識圖譜的研究和落地,基於知識圖譜的智能搜索、問答以及推薦也得到了推廣和應用。
知識圖譜相關技術發展迅速,應用也非常廣泛,但仍然有很多問題需要解決。從理論研究方面,知識圖譜的基礎技術仍然需要進一步推進,一些問題,例如語言歧義性、長尾知識獲取、時序知識獲取、多模態知識的融合、復雜推理,還沒有較好的解決辦法。而從工業實踐上來看,由於數據源繁多,數據規模龐大,異構數據質量參差不齊,高質量通用知識圖譜的構建還有很長的路要走。
因此,很多公司將目光轉向特定領域的知識圖譜應用,也催生了諸如醫療、法律、公安、電商等基於行業的知識圖譜。知識圖譜的發展已經進入下半場,由於技術和工具的不斷成熟,構建完整的知識圖譜也不再是巨頭的專利,具備一定基礎的技術人員也能夠將知識圖譜技術應用於自身業務中。
如何將理論化為應用,是一線從業人員最為關注的問題。雖然構建知識圖譜的要求很高,但門檻已經大大降低。各行各業對知識圖譜的關注度都在提升,知識圖譜相關的課程、教材也已面世。但在理論之外,從業人員更需要一本能夠結合工業實踐將知識圖譜落地的指南。
本書正是這樣一本面向實戰的知識圖譜指南,不僅有基礎的知識圖譜技術介紹,還用大量的篇幅闡述如何快速構建和應用知識圖譜。本書作者都是長期深耕於自然語言處理與知識圖譜領域的一線研究人員和工程師,為國內的知識圖譜開源社區OpenKG貢獻了很多有價值的數據和工具。他們從實踐角度,通過淺顯易懂的解析以及開源的代碼,對知識圖譜的理論基礎、相關工具、構建步驟進行了詳細的闡述。相信無論是知識圖譜從業人員還是研究學者,都可以通過本書了解知識圖譜的全流程構建方法,並能夠將其應用到實際項目和業務中。
王昊奮 同濟大學特聘研究員,OpenKG聯合創始人,CCF SIGKG主席
相關商品
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。