商品簡介
要構建一個實用的“智能”推薦系統,不僅需要有好的算法,還需要瞭解接收推薦的使用者。本書分為兩部分,第一部分側重於基礎架構,主要介紹推薦系統的工作原理,展示如何創建推薦系統,以及給應用程式增加推薦系統時,應該如何收集和應用資料 ;第二部分側重於算法,介紹推薦系統算法,以及如何使用系統收集的資料來計算向使用者推薦什麼內容。作者還教授了如何使用***的推薦算法,並剖析它們在 Amazon 和 Netflix 等網站上的實際應用。
作者簡介
Kim Falk 是一位元資料科學家,他在構建資料驅動的應用程式方面有著豐富的經驗。他對推薦系統和機器學習很感興趣。他所訓練的推薦系統,為使用者推薦合適的電影,為人們推送廣告,甚至幫助律師找到判例法的內容。自 2010 年以來,他一直從事大資料解決方案和機器學習方面的工作。Kim 經常參與有關推薦系統的演講和寫作。當 Kim 不工作的時候,他就是一個居家男人,一位父親,會帶著他的德國短毛指示犬越野跑。
李源,曾在華為技術有限公司從事開發、系統架構、項目管理等多個崗位的工作,後在途牛旅遊網擔任研發中心總經理一職,目前在中國旅遊集團旅行服務事業群擔任研發總經理,有豐富的研發、架構設計及管理經驗,負責過多個大型項目的規劃和落地,曾翻譯《Java性能調優指南》、《Serverless架構》等書籍。
朱罡罡,2012年西安電子科技大學本科畢業,曾擔任知名上市OTA企業系統架構師、研發總監等職位,目前就職於TOP50央企信息技術部,擔任研發經理崗位,擁有發明專利1個。技術研究領域涵蓋互聯網系統技術架構設計、大資料、推薦系統算法等,對在線旅遊系統的基於使用者推薦和基於內容推薦有過一定的研究。
溫睿,互聯網行業從業9年,資深系統架構師,從事過大型高併發Web網站開發、手機APP開發、IM服務開發、微服務系統架構等工作,熟練掌握各種常用前後端開發語言、指令碼語言和框架。
目次
第1部分 推薦系統的準備工作
第1章 什麼是推薦
1.1 現實生活中的推薦
1.1.1 推薦系統在互聯網上大顯身手
1.1.2 長尾
1.1.4 推薦系統的定義
1.2 推薦系統的分類
1.2.1 域
1.2.2 目的
1.2.3 上下文
1.2.4 個性化級別
1.2.5 專家意見
1.2.6 隱私與可信度
1.2.7 接口
1.2.8 算法
1.3 機器學習與Netflix Prize
1.4 MovieGEEKs網站
1.4.1 設計與規範
1.4.2 架構
1.5 構建一個推薦系統
小結
第2章 用戶行為以及如何收集使用者行為資料
2.1 在流覽網站時Netflix如何收集證據
2.1.1 Netflix 收集的證據
2.2 尋找有用的用戶行為
2.2.1 捕獲訪客印象
2.2.2 可以從流覽者身上學到什麼
2.2.3 購買行為
2.2.4 消費商品
2.2.5 訪客評分
2.2.6 以(舊的)Netflix 方式瞭解你的使用者
2.3 識別用戶
2.4 從其他途徑獲取訪客資料
2.5 收集器
2.5.1 構建項目檔案
2.5.2 資料模型
2.5.3 告密者(snitch):用戶端證據收集器
2.5.4 將收集器集成到 MovieGEEKs 中
2.6 系統中的使用者是誰以及如何對其進行建模
小結
第3章 監控系統
3.1 為什麼添加儀錶盤是個好主意
3.1.1 回答“我們做得怎麼樣?”
3.2 執行分析
3.2.1 網站分析
3.2.2 基本統計資料
3.2.3 轉化
3.2.4 分析轉化路徑
3.2.5 轉化路徑
3.3 角色
3.4 MovieGEEKs儀錶盤
3.4.1 自動生成日誌資料
3.4.2 分析儀錶盤的規範和設計
3.4.3 分析儀錶盤示意圖
3.4.4 架構
小結
第4章 評分及其計算方法
4.1 用戶-商品喜好
4.1.1 什麼是評分
4.1.2 用戶 - 商品矩陣
4.2 顯式評分和隱式評分
4.2.1 如何選擇可靠的推薦來源
4.3 重溫顯式評分
4.4 什麼是隱式評分
4.4.1 與人相關的推薦
4.4.2 關於計算評分的思考
4.5 計算隱式評分
4.5.1 看看行為資料
4.5.2 一個有關機器學習的問題
4.6 如何計算隱式評分
4.6.1 添加時間因素
4.7 低頻商品更有價值
小結
第5章 非個性化推薦
5.1 什麼是非個性化推薦
5.1.1 什麼是廣告
5.1.2 推薦有什麼作用
5.2 當沒有資料的時候如何做推薦
5.2.1 商品的十大排行榜
5.3 榜單的實現以及推薦系統元件的準備工作
5.3.1 推薦系統元件
5.3.2 GitHub 上的 MovieGEEKs 網站代碼
5.3.3 推薦系統
5.3.4 為 MovieGEEKs 網站添加一個榜單
5.3.5 使內容看起來更具吸引力
5.4 種子推薦
5.4.1 頻繁購買的商品與你正在查看的商品很相似
5.4.2 關聯規則
5.4.3 實現關聯規則
5.4.4 在資料庫中存儲關聯規則
5.4.5 計算關聯規則
5.4.6 運用不同的事件來創建關聯規則
小結
第6章 冷用戶(冷商品)
6.1 什麼是冷開機
6.1.1 冷商品
6.1.2 冷用戶
6.1.3 灰羊
6.1.4 現實生活中的例子
6.1.5 面對冷開機你能做什麼
6.2 追蹤訪客
6.2.1 執著於匿名使用者
6.3 用算法來解決冷開機問題
6.3.1 使用關聯規則為冷使用者創建推薦信息
6.3.2 使用領域知識和業務規則
6.3.3 使用分組
6.3.4 使用類別來避免灰羊問題以及如何介紹冷商品
6.4 那些不詢問就很難被發現的人
6.4.1 當訪客資料不夠新時
6.5 使用關聯規則快速進行推薦
6.5.1 收集資料項目
6.5.2 檢索關聯規則並根據置信度對其排序
6.5.3 顯示推薦內容
6.5.4 評估
小結
第2部分 推薦算法
第7章 找出用戶之間和商品之間的相似之處
7.1 什麼是相似度
7.1.1 什麼是相似度函數
7.2 基本的相似度函數
7.2.1 Jaccard 距離
7.2.2 使用 Lp-norm 測量距離
7.2.3 Cosine 相似度
7.2.4 通過 Pearson 相關係數查找相似度
7.2.5 運行 Pearson 相似度
7.2.6 Pearson 相關性係數與 Cosine 相似度類似
7.3 k-means聚類
7.3.1 k-means 聚類算法
7.3.2 使用 Python 實現 k-means 聚類算法
7.4 實現相似度
7.4.1 在 MovieGEEKs 網站上實現相似度
7.4.2 在 MovieGEEKs 網站上實現聚類
小結
第8章 鄰域協同過濾
8.1 協同過濾:一節歷史課
8.1.1 當信息被協同過濾時
8.1.2 互幫互助
8.1.3 評分矩陣
8.1.4 協同過濾管道
8.1.5 應該使用用戶 - 用戶還是物品 - 物品的協同過濾
8.1.6 資料要求
8.2 推薦的計算
8.3 相似度的計算
8.4 Amazon預測物品相似度的算法
8.5 選擇鄰域的方法
8.6 找到正確的鄰域
8.7 計算預測評分的方法
8.8 使用基於物品的過濾進行預測
8.8.1 計算物品的預測評分
8.9 冷開機問題
8.10 機器學習術語簡介
8.11 MovieGeeks網站上的協同過濾
8.11.1 基於物品的過濾
8.12 關聯規則推薦和協同推薦之間有什麼區別
8.13 用於協同過濾的工具
8.14 協同過濾的優缺點
小結
第9章 評估推薦系統
9.1 推薦系統的評估週期
9.2 為什麼評估很重要
9.3 如何解釋用戶行為
9.4 測量什麼
9.4.1 瞭解我的喜好,儘量減少預測錯誤
9.4.2 多樣性
9.4.3 覆蓋率
9.4.4 驚喜度
9.5 在實現推薦之前
9.5.1 驗證算法
9.5.2 回歸測試
9.6 評估的類型
9.7 離線評估
9.7.1 當算法不產生任何推薦時該怎麼辦
9.8 離線實驗
9.8.1 準備實驗資料
9.9 在MovieGEEKs中實現這個實驗
9.9.1 待辦任務清單
9.10 評估測試集
9.10.1 從基線預測器開始
9.10.2 找到正確的參數
9.11 在線評估
9.11.1 對照實驗
9.11.2 A/B 測試
9.12 利用exploit/explore持續測試
9.12.1 回饋迴圈
小結
第10章 基於內容的過濾
10.1 舉例說明
10.2 什麼是基於內容的過濾
10.3 內容分析器
10.3.1 從物品設定檔提取特徵
10.3.2 數量較少的分類資料
10.3.3 將年份轉換為可比較的特徵
10.4 從描述中提取中繼資料
10.4.1 準備描述
10.5 使用TF-IDF查找重要單詞
10.6 使用LDA進行主題建模
10.6.1 有什麼方法可以調整 LDA
10.7 查找相似內容
10.8 如何創建使用者設定檔
10.8.1 使用 LDA 創建使用者設定檔
10.8.2 使用 TF-IDF 創建使用者設定檔
10.9 MovieGEEKs中基於內容的推薦
10.9.1 載入數據
10.9.2 訓練模型
10.9.3 創建物品設定檔
10.9.4 創建使用者設定檔
10.9.5 展示推薦
10.10 評估基於內容的推薦系統
10.11 基於內容過濾的優缺點
小結
第11章 用矩陣分解法尋找隱藏特徵
11.1 有時減少資料量是好事
11.2 你想要解決的問題的例子
11.3 談一點線性代數
11.3.1 矩陣
11.3.2 什麼是因數分解
11.4 使用SVD構造因數分解
11.4.1 通過分組加入添加新用戶
11.4.2 如何使用 SVD 進行推薦
11.4.3 基線預測
11.4.4 時間動態
11.5 使用Funk SVD構造因數分解
11.5.1 均方根誤差
11.5.2 梯度下降
11.5.3 隨機梯度下降
11.5.4 最後是因數分解
11.5.5 增加偏差
11.5.6 如何開始,何時結束
11.6 用Funk SVD進行推薦
11.7 MovieGEEKs中的Funk SVD實現
11.7.1 如何處理異常值
11.7.2 保持模型的更新
11.7.3 更快的實施方法
11.8 顯式資料與隱式資料
11.9 評估
11.10 用於Funk SVD的參數
小結
第12章 運用最佳算法來實現混合推薦
12.1 混合推薦系統的困惑世界
12.2 單體
12.2.1 將基於內容的特徵與行為資料混合,以改進協同過濾
推薦系統
12.3 摻雜式混合推薦
12.4 集成推薦
12.4.1 可切換的集成推薦
12.4.2 加權式集成推薦
12.4.3 線性回歸
12.5 特徵加權線性疊加(FWLS)
12.5.1 元特徵 :權重作為函數
12.5.2 算法
12.6 實現
小結
第13章 排序和排序學習
13.1 Foursquare的排序學習例子
13.2 重新排序
13.3 什麼是排序學習
13.3.1 三種類型的 LTR 算法
13.4 貝葉斯個性化排序
13.4.1 BPR 排序
13.4.2 數學魔術(高級巫術)
13.4.3 BPR 算法
13.4.4 具有矩陣分解的 BPR
13.5 BPR的實現
13.5.1 執行推薦
13.6 評估
13.7 用於BPR的參數
小結
第14章 推薦系統的未來
14.1 本書內容總結
14.2 接下來要學習的主題
14.2.1 延伸閱讀
14.2.2 算法
14.2.3 所處環境
14.2.4 人機交互
14.2.5 選擇一個好的架構
14.3 推薦系統的未來是什麼
14.4 最後的想法
14.4 最後的想法
主題書展
更多書展今日66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。