TOP
0
0
三民出版.新書搶先報|最速、最優惠的新鮮貨報給你知!
Internet主題搜索引擎設計與研究(簡體書)
滿額折

Internet主題搜索引擎設計與研究(簡體書)

商品資訊

人民幣定價:28 元
定價
:NT$ 168 元
優惠價
87146
海外經銷商無庫存,到貨日平均30天至45天
下單可得紅利積點:4 點
商品簡介
目次
書摘/試閱
相關商品

商品簡介

作為搜索引擎領域的重要發展趨勢之一,主題搜索引擎充分考慮和滿足用戶對某些特定領域的網絡信息需求,具有高度的目標化和專業化。《Internet主題搜索引擎設計與研究》在繼承國內外相關研究成果的基礎上,以化學化工領域為例,設計了一個完整的主題搜索引擎系統,并基于專業知識庫,研究了專業化爬行器、索引和檢索的相關策略以及多語言自動分類技術和個性化技術,使Internet主題搜索引擎可提供更智能化、專業化和個性化的檢索服務,更好地滿足專業用戶的信息需求。
《Internet主題搜索引擎設計與研究》內容豐富、應用性強,可供信息管理、計算機應用等領域從事相關研究的專家學者、工程技術人員及高等院校相關專業教師、研究生參考使用。

目次

前言
常用符號表

第1章 Internet搜索引擎概述
1.1 Internet搜索引擎簡介
1.2 Internet搜索引擎的基本原理
1.3 Internet搜索引擎的相關技術
1.3.1 網絡信息收集
1.3.2 網絡信息索引
1.3.3 網絡信息檢索
1.3.4 網頁重要性評價技術
1.3.5 自動分類技術
1.3.6 個性化技術
1.4 本書研究背景及內容
1.4.1 本書研究背景
1.4.2 本書研究內容

第2章 Internet主題搜索引擎的總體設計
2.1 Internet主題搜索引擎概述
2.2 Internet主題搜索引擎的目標
2.3 Internet主題搜索引擎的總體設計
2.4 Internet主題搜索引擎的基本模塊
2.4.1 爬行
2.4.2 索引
2.4.3 檢索
2.4.4 排序
2.4.5 自動分類
2.4.6 個性化檢索
2.5 本章小結

第3章 Internet主題搜索引擎的信息收集和索引
3.1 Internet主題搜索引擎的收集策略
3.1.1 爬行器的基本概念
3.1.2 爬行器的訪問策略
3.1.3 主題搜索引擎爬行器的設計和實現
3.2 Internet主題搜索引擎的索引策略
3.2.1 索引器的基本概念
3.2.2 主題搜索引擎索引器的設計和實現
3.3 本章小結

第4章 Internet主題搜索引擎的檢索和排序
4.1 基于倒排索引的關鍵詞檢索
4.1.1 檢索策略
4.1.2 檢索的基本功能和實現
4.2 基于網絡鏈接結構的網頁評價和排序
4.2.1 PageRank算法的實現
4.2.2 基本排序方法
4.3 Internet主題搜索引擎的基本檢索功能和相關界面
4.3.1 基本檢索
4.3.2 使用偏好設置
4.3.3 高級檢索
4.3.4 結果顯示
4.4 本章小結

第5章 專業信息的自動分類
5.1 自動分類算法的研究
5.1.1 自動分類算法
5.1.2 特征詞提取方法
5.1.3 自動分類的評價標準
5.1.4 自動分類算法的比較
5.2 專業網絡信息的中英文自動分類
5.2.1 專業詞典
5.2.2 網頁編碼方式的檢測和整合
5.2.3 基于專業詞典的中英文自動分類方法
5.2.4 數據集及評價標準
5.2.5 測試結果及分析
5.3 Internet主題搜索引擎中專業信息的中英文自動分類
5.3.1 網頁資源的自動分類
5.3.2 分類結果和檢索結果的整合
5.3.3 分類結果顯示界面
5.4 本章小結

第6章 Internet主題搜索引擎的個性化檢索
6.1 個性化檢索概述
6.1.1 用戶興趣信息的收集
6.1.2 用戶興趣模型的建立
6.1.3 用戶興趣模型的使用
6.1.4 個性化檢索的評價
6.2 基于用戶興趣模型的個性化檢索策略
6.2.1 用戶個性化信息的收集
6.2.2 用戶興趣模型的建立
6.3 Internet主題搜索引擎的個性化檢索
6.4 本章小結

第7章 Internet主題搜索引擎的展望
附錄A 英文停用詞表
附錄B Reuters-21578數據集的分類體系
附錄C 化學學科分類體系
附錄D ChemEngine的查詢語法規則
參考文獻
後記

書摘/試閱

(1)深度優先策略(Depth-First Traversal):深度優先的URL搜索策略采用先進後出的堆棧方式。這種策略可以深入到服務器中,發現網站文檔的完整結構,而且可以集中獲取某個網站的網頁,節省爬行的時間,但容易過度深入某些網站而影響其他網站服務器的發現。
(2)廣度優先策略(Breadth-First Traversal):廣度優先的URL搜索策略采用先進先出的隊列方式,當起始URL列表包含有大量的網站服務器地址時,廣度優先搜索將產生一個很好的初始結果,在較短的時間內發現較多的網站,但很難深入到網站服務器中去。
由于以上兩種策略各有優缺點,可以采用綜合的辦法。對于每個HTML文檔中的超級鏈接,可以分為內部鏈接和外部鏈接兩種,內部鏈接是指向本網站的其他文檔,而外部鏈接指向其他網站。對于內部鏈接,用深度優先算法遍歷該網站的所有網頁,可以方便地過濾掉重復的URL鏈接或內部交叉鏈接,提高爬行器的爬行速度和效率。而對于外部鏈接,則可以使用廣度優先的策略在查重後直接加到URL列表中,對不同的外部網站URL啟動不同的線程來獲取該網站的資源。
在本書中的化學化工主題搜索引擎Chen Engine中,爬行策略采用了廣度優先的網頁收集策略。使用廣度優先策略的主要原因有三點:
(1)首頁重要的網頁往往離種子比較近,例如我們打開新聞站的時候往往是最熱門的新聞,隨著不斷的深入,所看到網頁重要性越來越低。
……

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 146
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區