數據可視化分析(第2版):分析原理和Tableau、SQL實踐(簡體書)
經典文學名著金庫(名師精評思維導圖版):中國古代寓言(簡體書)
麥琪的禮物 歐‧亨利短篇小說集(名師精評版)(簡體書)
哈姆萊特:莎士比亞戲劇精選(名師精評思維導圖版)(簡體書)
回歸童年的兒童教育(簡體書)
洋蔥頭歷險記(名師精評思維導圖版)(簡體書)
學前兒童文學(簡體書)

TOP
8
0
紅利積點抵現金,消費購書更貼心
數據可視化分析(第2版):分析原理和Tableau、SQL實踐(簡體書)
滿額折

數據可視化分析(第2版):分析原理和Tableau、SQL實踐(簡體書)

商品資訊

人民幣定價:189 元
定價
:NT$ 1134 元
優惠價
87987
海外經銷商無庫存,到貨日平均30天至45天
下單可得紅利積點:29 點
商品簡介
作者簡介
名人/編輯推薦
目次

商品簡介

本書以敏捷分析工具Tableau為基礎,部分章節輔以SQL講解,系統介紹了數據可視化分析的體系和方法,內容涵蓋問題分析方法、數據合並和建模、可視化圖形的選擇和構建、多種交互方式及其組合、儀表板設計與高級交互、基本計算和高級計算等。

本書以Tableau Desktop的應用為中心,借工具講解原理,以原理深化工具應用,並由點及面地介紹了業務分析的思考和原理,特別是提出了實踐性的"業務—數據—分析”層次框架,並以三類"詳細級別”的概念貫通數據模型、高級篩選和高級計算三大主題。

本書重點介紹工具應用背後的思考方式和原理,幫助讀者建立"詳細級別”的思考框架,舉一反三,從而實現多維、結構化分析。

作者簡介

喜樂君Tableau Visionary(2020—2023)、數據分析咨詢顧問、培訓講師·敏捷BI“布道師”。連續創業者、上海唯知唯識創始人。

山東大學法學學士、教育學碩士,首屆“碩士研究生國家獎學金”獲得者。

站在業務角度、深入行業一線,借Tableau洞悉敏捷分析,重新理解和詮釋“業務數據分析”。

名人/編輯推薦

以Tableau Desktop的應用為中心,借工具講解原理,以原理深化工具應用

由點及面地介紹了業務分析的思考和原理

提出了實踐性的“業務—數據—分析”層次框架

以三類“詳細級別”的概念貫通數據模型、高級篩選和高級計算三大主題

第2版自序

感謝Tableau和讀者的支持,是你們給了筆者繼續前進的動力。

2020年年初,我把多年學習Tableau的所思、所想毫無保留地寫出來,配以精致的圖片出版發行。《數據可視化分析:Tableau原理與實踐》一書收到了眾多讀者的一致好評,累計印刷8次,發行逾萬冊,多次入圍“京東大數據推薦榜單”前三名。在讀者群中,筆者認識了很多Tableau粉絲、企業用戶及可視化愛好者。

過去兩年多,Tableau產品持續更新迭代,筆者也進一步補充了SQL、數據庫、數據倉庫等基礎知識,並對比學習了Power BI、帆軟、觀遠等國內外多家優秀BI產品的應用。“實踐是最好的老師”,筆者在分析項目咨詢、Tableau企業培訓、可視化開發項目的鍛煉中,日漸意識到這本書中的諸多不足甚至錯誤,並放棄了小修小補的計劃,重寫此書作為近兩年學習的總結。

於是,2022年4月,筆者開始重寫本書的內容,並重新繪製、調整了大部分插圖,作為第2版。歷經波折,多次延遲,本書終於與讀者見面。

這裡,筆者總結第2版相對於第1版的內容改進。

  1. 第2版改進

— 增加對數字化轉型的實踐思考。

結合筆者多年的切身項目實踐,本書總結了數據的應用及其發展階段,數字化轉型的多種路徑和循序漸進的組織方案(見第1章)。

— 業務分析方法和體系更加成熟。

業務是分析的“土壤”。在項目咨詢過程中,筆者提出了“業務—數據—分析”的框架體系,可以與企業業務流程相結合繪製數據地圖(見第2章)。同時,圍繞問題結構、聚合、聚合度和詳細級別,構建了一個普適性的業務分析方法,適用於各種分析和BI工具,甚至可以作為衡量分析工具的一種尺度(見第3章)。

— 在數據合並、篩選、計算三大主題中,對比介紹了Excel、Tableau和SQL的應用場景。書中總結了“數據合並的分類矩陣”“兩類篩選位置”“計算的分類”等實用方法,幫助沒有相關技術背景的人更快實現超越,也有助於熟悉SQL的“技術派”更好地理解敏捷BI的精髓。高階的BI工具絕非拖曳那般簡單,在技術平民化的背後,是更巧妙的“業務靈魂”。

— 將“數據篩選和交互”獨立為第6章內容,進一步強調篩選在業務分析中的重要性。篩選的類型多樣、優先級複雜,應該盡可能避免濫用SUM IF類型的條件聚合。將篩選視為分析的獨立環節,是優化分析性能的關鍵方式。

— 強化“詳細級別”的概念(替代之前的“層次”概念)。在數據表詳細級別(Table LOD)、視圖詳細級別(Viz LOD)之外,使用“引用詳細級別”(Reference LOD)代表視圖之外預先指定的詳細級別。筆者把數據關係、篩選和計算融為一體,這是本書最重要的知識資產,是超越Tableau理解不同工具背後的分析共性的關鍵。

— 調整了第3篇的知識框架。沒有計算,就沒有無盡的業務分析,這也是本書最重要的內容之一。

Ø 第8章深入介紹了計算的兩大分類:行級別計算完成數據準備、聚合計算完成業務分析。在介紹常見函數後,借助邏輯計算介紹了兩類計算的區別和聯繫。

Ø 第9章使用了新的框架介紹Tableau表計算和SQL窗口函數,表計算代表的“抽象的二次抽象”,是邁向高級分析的臺階。

Ø 第10章則結合“SQL聚合子查詢”深入講解LOD原理,結合購物籃分析、客戶分析等經典案例,把高級分析中“預先聚合”的理念,推廣到更普遍的業務分析中。

— 增加了“從數據管理到數據倉庫”的內容(見第11章),相關內容是從可視化分析走向專業的數據建模、數據方法的關鍵。“視Tableau Server為DW/BI平臺”,給了更多企業全新選擇。

— 受限於篇幅,移除了之前Prep Builder數據處理、Tableau Server相關的大部分內容。

  1. 致謝

每次寫作完成,筆者總是迫不及待地分享。本書付梓之前,筆者在上海組織了“喜樂君精品課”線下活動,詳盡介紹了本書的核心內容。教學相長,在分享過程中筆者進一步發現了自身知識體系的盲點。感謝來自天合光能、漢德車橋、上海電氣、海南航空、上汽集團、英飛凌等企業的熱心讀者。

感謝繼續支持和信任筆者的企業客戶,筆者希望能用專業和熱愛回報大家。

感謝Tableau,你給了筆者穿過迷霧的勇氣,筆者也將無期限地支持你,對得起“Tableau傳道士”的稱號,對得起Tableau Zen Master/Visionary的全球榮譽。

感謝父母,感謝家人,“大愛無言”,筆者當用余生以行動回報。

喜樂君

2023年1月20日

第1版自序

鳥會飛是因為有羽毛嗎——Tableau與筆者的分析之旅

筆者於2017年偶遇Tableau,從昨日的愛好到今朝的工作,仿佛一瞬,又好似半生。如今,筆者完成了之前未曾想象的任務——把筆者的所思所想、所知所悟以出版的方式分享給更多人。

理想主義者總是習慣性地低估困難,寫書這件事情尤其如此。累計638張精心製作的插圖,有別於博客文章,力求建立新的體系框架,你我雖隔書相望,但希望每一位讀者都能感受到筆者毫無保留的寫作態度與努力。2021年,有幸與Tableau藝術家Wendy一起入圍Tableau Zen Master全球榜,這是讀者和Tableau對筆者最好的認可。

與此同時,還是想談一下筆者和Tableau的淵源,以此說明筆者如何以文科學歷和業務背景從零開始成為今日的“Tableau大使”,這條路每個人都可以走,只需要用心與努力即可抵達。

1.筆者和Tableau的淵源

筆者在畢業後歷經國企、創業、私企幾番鍛煉,於2017年回到嬰貝兒擔任總裁助理,忙裡偷閑四處學習,並且獲得了“買任何圖書均可報銷”的公司特權,受領導鼓勵,也在公司義務培訓Excel、消費心理學等。考慮到公司低效的“PPT數據傳統”和自身專業數據分析知識的薄弱,因此私下搜尋各種大數據分析工具,最後被Tableau的靈活、易用和美觀所折服。之後陸陸續續為運營、采購、人力資源等板塊做了一些並非成熟的分析。

筆者是典型的“寫作型”,因此從學習第一周開始,就陸陸續續記筆記、寫博客,純粹為了幫助自己增強理解,不料幾年下來,竟然積累了可觀的筆墨。“所有的成功都是長期主義的勝利”。數據和數據分析恰好是一個不錯的“風口”,於是誤打誤撞地進入了這個“陌生但新鮮的行業”。

《經濟學人》雜志中曾寫道:“21世紀最重要的資源是數據”,但是不經分析的數據沒有價值,如同“不經反省的人生不值得過”(蘇格拉底),而這正是轉型期的企業遇到的成長煩惱。筆者決定和Tableau同行,將自己多年的工作經驗與筆者對數據的理解融為一體,認真服務每一位客戶,同時獲得自我的提升。筆者選擇了Tableau,之後通過了Tableau Desktop和Server QA認證,並在參加Tableau峰會時認識了眾多Tableau員工和愛好者,開始了開發客戶、服務客戶的美好旅程。

在服務客戶的過程中,筆者不斷積累自己的Tableau知識和業務理解,並持續更新博客以增強理解,並向更多客戶傳播Tableau文化。筆者從不拒絕客戶的任何問題,把它視為最好的收集問題和不斷學習的機會——沒有什麼是學習不能解決的問題,如果問題不能被解決,那就是學藝不精。追求超過預期的交付,不僅幫助筆者提高了客戶的續費和增購的概率,而且不斷積累了下一本書的素材。

2.從所知到所悟

在學習過程中,筆者不斷閱讀各類數據分析書籍,並仔細翻閱官方近萬頁的文檔和白皮書。可惜的是,筆者找到的國內外每一本Tableau主題書籍,都只能滿足筆者的初學需求,卻不能滿足向中高級進階時的胃口,總覺得要義未精、框架欠明,如同武林秘籍缺少最後一章,即便各種招式純熟,也難以在實戰面前隨心所欲。這種理解上的束縛,阻礙了為客戶提供最高質量的培訓和咨詢。跟隨山東大學王思悅老師學習,他教給筆者一種處事態度:“和人交往改變自己,和物交道改變對方”,因此,筆者希望重新構建Tableau的知識體系,並希望幫助初學者和高級分析師更好地使用Tableau產品。

在克裡斯坦森教授《你要如何衡量你的人生》一書的開篇,提出了一個讓筆者終生難忘的問題:“鳥會飛是因為有羽毛嗎?”筆者曾經以為是,但正如克裡斯坦森教授所言,人類上千年來一直嘗試仿制輕盈的翅膀飛上天,最後,倒是成噸的鋼鐵飛機實現了。100年前,人類在“流體力學”和“空氣動力學”領域積累了足夠的知識,才實現了飛翔的夢想,這就是原理的重要性。很多人覺得掌握原理是少數人的事情,殊不知,原理是具有實踐性的,它賦予了我們“舉一反三”的能力。

因此,筆者迫切地希望洞察Tableau“拖曳”、可視化,特別是高級計算背後的原理,只有掌握了原理,筆者才能用最簡單的語言,讓所有客戶以最少的時間和金錢成本換來最高效的培訓和使用效果。而通往大徹大悟的道路只有一條,那就是持續的努力和深度的思考相融合的道路。

整個2019年,筆者一方面不斷地向Tableau最難的高級計算和高級互動發起總攻,並持續修改博客文章作為通達明了的明證;另一方面每月組織Tableau公開課程,在分享過程中不斷深化自我理解,並在為中原消費金融、以嶺藥業等客戶提供培訓的過程中不斷總結本書的宏觀框架。2019年在國聯水產進行的客戶培訓中,獲得了本書第5章的關鍵靈感。2021年,在長隆集團信息部門的內部交流中獲得了“業務字段、分析字段”的關鍵靈感,並在平安普惠的項目中開始構思“業務數據分析地圖”。

在這個過程中,筆者持續寫作博客文章以作記錄和思考,如今筆者的不少Tableau博客文章,特別是關於“LOD詳細級別表達式”原理和案例解讀系列,幾乎可以與官方的介紹文章並駕齊驅。2020年年初,因疫情在家,得以從頭重寫每一個細節及其思路,並把基礎計算和高級計算融為一體,形成了全新的講解體系,從而保證初學者也可以快速掌握最高難度的知識環節。

最後,筆者找到了從Excel分析到Tableau數據分析的根本性差異,即層次(LOD詳細級別)。客觀的數據表詳細級別(Table LOD)描述數據結構和顆粒度,主觀的視圖詳細級別(Viz LOD)描述業務問題及其相關性,並通過計算的多種分類把二者融為一體。全書都貫穿了“層次分析”的思路,並在高級計算部分得以升華——高級計算的實質就是多層次問題分析。因此,讀者在本書中能看到很多全新的內容,特別是用層次(詳細級別)理解大數據分析的核心特徵、理解數據結構並識別行級別唯一性、理解Tableau的計算並引導如何選擇等。

而精心繪製的插圖,旨在用可視化的方式增強理解。通過二次處理,盡可能提高每一幅插圖的知識密度。

3.大數據時代的趨勢與業務驅動的數據分析

隨著互聯網經濟的蓬勃發展,大數據時代已經成為不可回避的事實。在經濟競爭面前,企業更應該追求精益分析驅動的精益成長,構建以分析為中心的敏捷平臺變得不可或缺。

因此,敏捷BI(商業智能)已經是大勢所趨、不可抵擋。企業成長依賴於在競爭環境中不斷做出最優的決策,而決策來自充分地建立假設並高效地驗證,數據分析是連接數據資產與價值決策的紐帶,而敏捷BI能提高數據的利用效率和企業的決策效率。“分析即選擇,決策即擇優”,數據分析可以直接創造企業價值,未來已來,所有的企業都將是數據驅動型的組織。

對於企業而言,Tableau提供了敏捷的“數據倉庫、商業智能一體化”整體方案。不管是中小企業還是大型企業,Tableau都是極佳的企業級大數據可視化分析平臺,它在面向業務方面的卓越表現,迄今難有同行產品可以比擬。

對於業務分析師而言,Tableau入門容易、使用靈活,因此它幾乎適用於企業中的每一位數據用戶和業務決策者。同時,Tableau博大精深、足夠專業,在可視化樣式、互動探索、高級計算等方面有無限空間值得探索,因此不斷鉆研的Tableau分析師可以為自己構建足夠高的技術壁壘,從而捍衛自己的專業領地。這也是筆者的選擇和道路,只要努力,人人皆可模仿,沒有所謂的“學習力”,需要的只是用心和努力而已。

在這條充滿光明的道路上,最大的障礙其實不是工具,而是人和文化。借助本書,衷心地希望更多的人能熟練使用Tableau,並建立自己的職業壁壘,節省時間就是拯救個人生命,提高效率就是創造企業利潤。

4.致謝

從博客文章到一本書,這是之前筆者還未曾預料的事情;因為疫情在家隔離,一個春天,不料夢想就變成了現實。

特別感謝唐小強先生、百威啤酒劉洋先生、紅塔集團付聰先生、金發科技黃彬祥先生及其他眾多讀者為本書勘誤做出的貢獻。

特別感謝Tableau賦予的學習機會,讓筆者認識了各行各業的企業客戶、朋友和讀者。

感謝家人,他們給了筆者生活的意義。

感謝時間,感謝充滿坎坷與喜樂的人生。

喜樂君

2023年1月20日修改

目次

內容及說明 XVIII

第1篇 奠基:數字化轉型與業務分析原理

第1章 數字化轉型:21世紀的機遇與挑戰 2

1.1 理解數據的層次及分析的價值 2

1.2 數據應用的3個階段 4

1.2.1 初級·報表展現:信息的整理與固定展現 5

1.2.2 中級·業務分析:分析輔助決策,決策創造價值 7

1.2.3 終極·智能商業:大數據重塑商業模式 8

1.3 數字化轉型到底“轉”什麼 10

1.3.1 塑造實事求是的數據文化:一切用數據說話 10

1.3.2 數字化轉型源自各個業務場景的數字化和持續進化 12

1.3.3 業務和技術兼備的卓越中心和分析型人才 13

1.3.4 統一並持續優化分析方法論,提高分析效率和準確性 15

參考資料 18

第2章 “業務—數據—分析”體系與企業數據地圖 19

2.1 “業務—數據—分析”體系:BDA分析框架 19

2.1.1 分析層:指標體系建設和分析儀表板 21

2.1.2 數據層:數據管理與數據倉庫 22

2.1.3 業務層:業務流程與“業務在線化” 23

2.2 建立全局視角:企業數據地圖 24

2.3 兩種企業級分析推進路徑:“自上而下”與“自下而上” 26

2.3.1 自下而上:從數據出發的分析之路 26

2.3.2 自上而下:從問題和指標出發的分析之路 27

2.4 可視化是大數據分析的橋梁和媒介 28

2.4.1 數字、文字的可視化及可視化要素 28

2.4.2 從可視化到抽象分析:走向儀表板和高級分析 30

2.5 Tableau:大數據敏捷業務分析的“代表作” 32

參考資料 34

第3章 業務可視化分析:關鍵概念與方法論 35

3.1 解析問題結構、理解聚合過程和指標 35

3.1.1 問題的結構及其相互關係 36

3.1.2 聚合是問題分析的本質 38

3.1.3 基於聚合的字段分類:維度描述問題,度量回答問題 40

3.1.4 指標是聚合度量的業務形態 41

3.2 明細表與聚合表:聚合的邏輯過程 42

3.2.1 業務明細表和問題聚合表:聚合的起點和終點 43

3.2.2 物理表與邏輯表:數據表的抽象類型 45

3.2.3 字段的數據類型:數據表字段的抽象類型 46

3.3 可視化圖形:聚合交叉表的“另一面” 49

3.3.1 問題類型與可視化增強分析 50

3.3.2 可視化背後的數據類型:連續和離散 51

3.3.3 Tableau中的字段屬性及其作用 55

3.4 簡單問題的“三步走”方法和Tableau示例 56

3.5 聚合度和詳細級別:構建複雜問題層次理論 58

3.5.1 數據明細表和聚合度:多個問題的基準點和衡量尺度 59

3.5.2 詳細級別:不同“聚合度”問題對應的抽象依據 60

3.5.3 結構化分析的兩個應用方向 62

3.5.4 關鍵概念匯總:聚合、聚合度、詳細級別、顆粒度 64

參考資料 66

練習題目 66

第2篇 數據準備、可視化、交互設計

第4章 數據合並與關係模型(Tableau/SQL) 68

4.1 概論:數據合並與連接數據源 69

4.1.1 理解數據合並、數據模型的重要性 69

4.1.2 數據合並和數據模型的相關概念 71

4.2 數據合並的分類矩陣與數據模型案例 72

4.2.1 “所見即所得”的行級別數據合並:Union和Join 72

4.2.2 Excel的局限:基於數據透視表的數據合並 74

4.2.3 Tableau數據混合初探,在聚合後完成連接 76

4.2.4 數據合並分類矩陣:兩種合並方法、兩個合並位置 78

4.3 行級別並集、連接與Tableau/SQL方法 81

4.3.1 數據並集 81

4.3.2 數據連接:連接條件與連接方式 84

4.3.3 高級連接的形式:僅左側連接、交叉連接與“自連接” 89

4.3.4 明細表並集與連接的異同點與局限性 93

4.4 從數據關係匹配到關係模型 96

4.4.1 “臨時”數據關係:基於問題層次創建數據關係匹配 96

4.4.2 數據模型:在最詳細且有業務意義的詳細級別預先構建數據關係 98

4.4.3 【關鍵】層次分析方法:從數據合並到數據關係模型 100

4.4.4 【難點】關係模型優化(上):匹配類型(基數) 106

4.4.5 【難點】關係模型優化(下):匹配範圍(引用完整性) 111

4.4.6 共享維度表:從雪花模型到網狀模型 116

4.4.7 通往最佳實踐:業務關係模型的可視化表達 117

4.4.8 案例:圖書及銷售的數據關係模型 118

4.5 重說數據混合:編輯匹配關係和匹配詳細級別 120

4.5.1 數據混合設置:自定義混合條件和自定義匹配字段 121

4.5.2 高級數據混合:數據匹配詳細級別不同於主視圖 123

4.6 不同數據合並類型的相互影響 127

4.7 Tableau與SQL/Python的結合 128

4.7.1 Tableau和SQL的結合 128

4.7.2 SQL中的連接 129

4.7.3 Tableau Table Extension:給數據源插上“算法之翼”(Tableau 2022.3 版本) 132

參考資料 133

練習題目 133

第5章 可視化分析與探索 134

5.1 數據準備:理解業務過程與整理數據字段 134

5.1.1 數據表:理解業務過程及數據表詳細級別 134

5.1.2 字段:理解業務過程的物件並做分組分類 136

5.2 從問題到可視化圖形:如何確定主視圖框架 138

5.2.1 從問題類型到主要的可視化圖形 138

5.2.2 初級可視化:“三圖一表” 139

5.2.3 中級可視化:分布分析、相關性分析 143

5.2.4 地理位置可視化 148

5.2.5 數據圖像角色可視化(Tableau 2022.4 版本) 155

5.3 可視化繪製方法與可視化增強 156

5.3.1 像油畫一樣做可視化:可視化三步驟和標記的使用 156

5.3.2 度量雙軸及其綜合處理 158

5.3.3 多個坐標軸的“公共基準”:度量值 160

5.4 高級分析入門:參考線與參考區間 161

5.4.1 參考線的創建及其組合 161

5.4.2 標準甘特圖和標靶圖:條形圖與參考線的兩種結合方式 163

5.4.3 參考區間 166

5.4.4 置信區間模型 167

5.4.5 趨勢線與預測線 168

5.4.6 群集 169

5.5 格式設置:必要調整,但不要過度 170

5.5.1 常見的設置格式工具欄 170

5.5.2 設置“標籤”格式,自定義文本表 171

5.5.3 工具提示的格式設置、交互和“畫中畫” 172

5.5.4 其他常用小技巧 173

參考資料 175

練習題目 175

第6章 Tableau/SQL篩選與集操作 176

6.1 理解不同工具背後的篩選方法與共同點 176

6.1.1 篩選的兩類位置:獨立篩選和“條件計算” 176

6.1.2 使用不同工具完成“獨立篩選” 177

6.2 篩選的分類方法:基於詳細級別的視角 182

6.2.1 【入門】數據表行級別的篩選:維度篩選器 183

6.2.2 【進階】指定詳細級別的聚合篩選:簡單條件和頂部篩選 186

6.2.3 【難點】指定詳細級別聚合的篩選:建立在自定義計算之上 192

6.3 篩選範圍的交互方法:快速篩選和參數控制 195

6.3.1 快速篩選器及其基本配置 195

6.3.2 特殊的日期篩選器:默認篩選到最新日期 196

6.3.3 參數控制:完全獨立和依賴引用 197

6.4 多個篩選的處理:交集計算和優先級 199

6.4.1 多個篩選的基礎知識:數據集及運算 199

6.4.2 多個篩選的計算原則(上):相同類型取交集 200

6.4.3 多個篩選的計算原則(下):不同類型按優先級計算交集 200

6.4.4 調整篩選器優先級(上):上下文篩選器和表計算篩選器 202

6.4.5 調整篩選器優先級(下):數據源篩選器和數據提取篩選器 204

6.4.6 篩選與計算的優先級 206

6.5 集(Set):把篩選保留下來的“神奇容器” 207

6.5.1 創建自定義集及集的本質 207

6.5.2 自定義集內成員:“集控制”(Tableau 2020.2 版本) 209

6.5.3 創建動態條件集 209

6.5.4 集動作:以視圖交互方式更新集成員 211

6.6 集的運算、優先級和應用 212

6.6.1 多個集的合並與“合並集”運算 212

6.6.2 集和篩選的關係及優先級 215

6.6.3 集的高級應用:控制用戶權限的“用戶篩選器” 217

6.7 中級交互:儀表板中的快速篩選、集交互 218

6.7.1 交互設計的基本分類 218

6.7.2 “以圖篩圖”:儀表板中的多表快速關聯篩選 218

6.7.3 共享篩選器、集和參數:典型的儀表板交互 220

6.7.4 工具提示“畫中畫”:最簡單的多表關聯 223

6.8 更多實用工具:分組、數據桶、分層結構、排序 224

6.8.1 作為數據準備的“組” 224

6.8.2 分層結構鉆取分析與僅顯示相關值 225

6.8.3 排序:對離散字段的數據值排序 226

參考資料 228

練習題目 228

第7章 儀表板設計、進階與高級交互 230

7.1 儀表板:最重要的主題展現形式 230

7.1.1 儀表板設計的基本過程和常見功能 231

7.1.2 儀表板大小、布局和物件 233

7.1.3 常用的交互物件:隱藏按鈕、導航按鈕 237

7.1.4 儀表板布局中的分層結構 239

7.1.5 跨設備類型的儀表板適配 240

7.2 故事:以數據故事敘事、探索 241

7.2.1 故事及其基本設置 241

7.2.2 故事的闡述方式 242

7.3 儀表板進階:指標、初始模板、性能優化與“數據指南” 243

7.3.1 指標:聚焦儀表板關鍵度量 244

7.3.2 初始模板:專家分析模板加速分析 246

7.3.3 發布工作簿和“工作簿優化器” 247

7.3.4 數據指南(Tableau 2022.3 版本) 251

7.4 三種基本交互類型:篩選、高亮和頁面 252

7.4.1 突出顯示:以聚焦實現間接篩選 253

7.4.2 頁面輪播:快速篩選的連續疊加 255

7.5 兩類高級交互工具:參數、集交互 257

7.5.1 關鍵原理:參數、集的共同點和差異 257

7.5.2 參數與邏輯判斷結合:切換視圖度量 260

7.5.3 動態參數:動態更新範圍和初始值 262

7.5.4 集控制:以控件方式手動更新集成員 264

7.6 參數動作:參數、計算和交互(Tableau 2019.2 版本) 264

7.6.1 參數動作:使用動作更新度量值 265

7.6.2 動態篩選:參數動作和計算實現差異化篩選 266

7.6.3 動態基準分析:使用參數動作控制參考線和計算基準 268

7.6.4 自定義分層結構:使用參數展開指定的類別 270

7.7 高級交互:指定區域物件的動態可見性(Tableau 2022.3 版本) 272

7.8 高級互動的巔峰:集動作和集控制 275

7.8.1 經典集動作:交互更新自定義集(Tableau 2018.3 版本) 276

7.8.2 集的控制與更新:賦予集以強大的靈魂 278

7.8.3 使用集完成對比分析和標桿分析 279

7.8.4 高級互動的使用建議 282

練習題目 283

第3篇 以有限字段做無盡分析:Tableau、SQL函數和計算體系

第8章 計算的底層框架:行級別計算與聚合計算 286

8.1 計算的演進及分類:從Excel、SQL到Tableau 287

8.1.1 計算的本質及其與業務過程的關係 287

8.1.2 以Excel理解詳細級別與計算的兩大分類 288

8.1.3 從Excel“存取一體”到“數據庫-SQL”的存取分離 292

8.1.4 集大成者Tableau:將查詢、計算和展現融為一體 294

8.2 計算的兩大分類:分析是聚合的抽象過程 297

8.2.1 行級別計算、聚合計算的差異和關係 297

8.2.2 從業務角度理解計算的結果:業務字段VS分析字段 300

8.3 數據準備類函數(上):字符串函數、日期函數 302

8.3.1 字符串函數:截取、查找替換等清理函數 302

8.3.2 日期函數:日期獨特性與轉換、計算 306

8.3.3 數據類型轉換函數 315

8.4 數據準備類函數(下):正則表達式 316

8.5 分析函數:從明細到問題的“直接聚合” 318

8.5.1 描述規模:總和、計數、平均值 319

8.5.2 描述數據的波動程度:方差和標準差 320

8.5.3 關注個體,走向分布:百分位函數及最大值、最小值、中位數 322

8.5.4 ATTR屬性——針對維度字段的聚合判斷 324

8.6 通用型計算:算術函數和邏輯函數 325

8.6.1 算術運算、精度控制函數 325

8.6.2 邏輯表達式和邏輯判斷符 329

8.7 行級別計算與聚合計算的區別與結合 332

8.7.1 案例:各子類別的利潤與盈利結構分析 332

8.7.2 復習:行級別計算和聚合計算的差異 334

8.7.3 SUMIF條件聚合:將行級別篩選和聚合分析合二為一 335

8.8 專題:地理空間分析之“空間函數” 338

參考資料 345

練習題目 345

第9章 高級分析函數:Tableau表計算/ SQL窗口函數 346

9.1 合計的兩個方法及“廣義LOD表達式” 346

9.1.1 入門:從Excel理解“合計百分比”計算的層次關係 347

9.1.2 高級分析的層次框架:數據表詳細級別和聚合度 348

9.1.3 進階:“合計百分比”的兩種SQL方法 349

9.1.4 Tableau敏捷BI,讓業務用戶輕鬆駕馭二次聚合分析 351

9.1.5 “廣義LOD表達式”與計算的分類 354

9.2 “同/環比”偏移計算及表計算設置方法 356

9.2.1 維度作為偏移計算依據:單一維度的同比差異 356

9.2.2 包含多個維度的同比(上):區別範圍和依據 358

9.2.3 包含多個維度的同比(下):設置多個依據 360

9.2.4 SQL窗口函數:偏移類窗口函數案例介紹 361

9.3 小結:表計算的獨特性及兩種設置方法 365

9.3.1 從差異計算的兩種方法理解窗口計算的獨特性 365

9.3.2 Tableau設置範圍的兩種方法:相對/絕對方法與適用場景 368

9.4 高級分析函數之排序計算:INDEX與RANK 369

9.4.1 Tableau/SQL排序與百分位排序 370

9.4.2 公共基準對比:不同時間的電影票房對比(TC2) 374

9.4.3 凹凸圖:隨日期變化的RANK函數(TC4) 376

9.5 最重要的二次聚合函數:WINDOW(窗口)函數 380

9.5.1 合計:最簡單、常用的WINDOW(窗口)函數 381

9.5.2 累計聚合:RUNNING_SUM函數——累計汽車銷量 383

9.5.3 移動聚合:移動窗口計算函數MOVING AVG 385

9.5.4 “大一統”:千變萬化的窗口函數WINDOW 386

9.6 最常用的表計算:快速表計算及其附加計算 389

9.6.1 快速表計算:預置的常見表計算應用 390

9.6.2 快速表計算的嵌套:表計算的組合(TC3) 391

9.7 表計算應用(1):自定義參考線、“合計利潤率” 393

9.7.1 聚合值參考線——表計算的“可視化形式” 393

9.7.2 “合計利潤率”:理解參考線對應的表計算 394

9.7.3 【難點】理解TOTAL(合計)與WINDOW_SUM(匯總)的差異 396

9.7.4 自定義參考線及其計算:箱線圖松散化與散點圖顏色矩陣 398

9.8 表計算應用(2):標桿分析——多種類型的計算組合 402

9.9 表計算應用(3):帕累托分布——累計、合計及嵌套 406

9.10 表計算應用(4):金融ANR計算——表計算高級嵌套 409

9.11 表計算篩選器:優先級最低的篩選類型 413

9.11.1 使用RANK函數聚合判斷完成篩選 413

9.11.2 使用偏移函數LOOKUP完成年度同比和篩選 415

9.12 表計算延伸應用:預測建模函數 416

9.12.1 MODEL_QUANTILE預測模型 417

9.12.2 MODEL_PERCENTILE預測模型 419

練習題目 420

第10章 結構化問題分析:LOD表達式與SQL聚合子查詢 421

10.1 業務解析:理解LOD表達式的邏輯和本質 421

10.1.1 簡單詳細級別:“不同購買頻次的客戶數量” 421

10.1.2 多維詳細級別:“各年度、不同矩陣年度的銷售額貢獻” 424

10.2 LOD表達式的“詳細級別”及其與視圖關係 428

10.2.1 從問題詳細級別出發,理解高級問題的構成 428

10.2.2 主視圖引用“更高聚合度”的詳細級別聚合:占比分析 429

10.2.3 主視圖引用“更低聚合度”的詳細級別之聚合:購買力分析 432

10.2.4 主視圖引用獨立詳細級別的聚合:客戶矩陣分析 433

10.3 相對指定的LOD表達式及運算優先級 435

10.3.1 絕對指定和相對指定的LOD表達式 435

10.3.2 INCLUDE LOD引用更低聚合級別的聚合及優先級 437

10.3.3 EXCLUDE LOD引用更高聚合級別的聚合,以及優先級對比 439

10.4 超越LOD:計算的詳細級別體系及其優先級 441

10.4.1 不同計算類型的應用場景與作用 442

10.4.2 層次分析法:理解計算的運算邏輯及其組合形式 443

10.4.3 Tableau計算、篩選、數據關係的優先級 445

10.5 走向實踐:多遍聚合問題與結構化分析方法 446

10.5.1 方法論:高級問題分析的4個步驟 446

10.5.2 LOD多遍聚合:客戶購買力分析的嵌套LOD計算 447

10.5.3 嵌套LOD的語法和SQL表示 452

10.6 客戶分析專題:客戶RFM相關案例分析 454

10.6.1 客戶分析概論與常見指標體系 454

10.6.2 使用Tableau完成 RFM主題分析 457

10.6.3 單維度的分布案例:客戶頻次分布和生命周期分布 460

10.6.4 多維度的結構分析:與“客戶獲客時間”相關的分析案例 461

10.6.5 復購間隔:行級別計算和LOD計算的結合 464

10.6.6 客戶留存分析:LOD表達式、表計算的結合 465

10.6.7 客戶矩陣分析:客戶價值分類 468

10.7 產品分析高級專題:購物籃分析的多個角度 470

10.7.1 購物籃比率:任意子類別相對於所有訂單的比率 471

10.7.2 支持度、置信度和提升度分析:類別之間的關聯推薦 472

10.7.3 指定類別的關聯比率:篩選中包含“引用詳細級別” 475

10.8 總結:高級計算的最佳實踐 480

10.8.1 問題的3大構成與計算的4種類型 480

10.8.2 如何選擇計算類型 482

練習題目 484

第11章 從數據管理到數據倉庫:敏捷分析的基石 486

11.1 數據管理功能:以數據為中心 486

11.1.1 Tableau Catalog:數據資產目錄和世系管理 487

11.1.2 Tableau Prep Conductor:數據ETL流程管理 491

11.1.3 Virtual Connections:數據庫和分析之間的橋梁 492

11.1.4 Data Policy:為數據訪問增加行級別權限 495

11.2 從數據管理(DM)到數據倉庫(DW) 499

11.2.1 數據倉庫是數據分析發展到一定階段的產物 499

11.2.2 數據倉庫的邏輯分層 502

11.3 ETL:數據倉庫中的數據處理 504

11.3.1 敏捷ETL工具Prep Builder簡介 504

11.3.2 敏捷ETL工具對數據分析的影響 505

11.4 建議:視Tableau為DW/BI平臺 506

參考資料 507

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 987
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區