TOP
0
0
2025新年快樂!買書領券省荷包
Ganglia系統監控(簡體書)
滿額折

Ganglia系統監控(簡體書)

商品資訊

人民幣定價:59 元
定價
:NT$ 354 元
優惠價
87308
絕版無法訂購
商品簡介
作者簡介
名人/編輯推薦
目次
書摘/試閱
相關商品

商品簡介

《Ganglia系統監控》由Ganglia的設計者和維護人員親自執筆,知識性和權威性毋庸置疑。本書不但展示了如何從任意規模的集群、網格或云基礎架構中收集系統指標并使其可視化,而且為如何針對20 000臺主機每10秒跟蹤一次CPU利用率等問題提供答案。一旦你知曉Ganglia的主要部件如何協同工作,就會明白Ganglia是解決上述問題的最佳選擇。本書頗具實踐性,可以幫助經驗豐富的系統管理員更好地運用Ganglia 3.X。
《Ganglia系統監控》還可以幫助你了解如何擴展基本的指標庫,取回當前指標數值,查看指標的匯聚視圖,觀察數據時序的趨勢。你也可以通過一些實際Ganglia案例了解它是如何滿足監控的一些需求的。
■ 判斷Ganglia是否適合你的工作環境。
■ 了解Ganglia的gmond和gmetad后臺程序是如何建立一個臨時指標集合的。
■ 根據一些有價值的提示和建議,在部署Ganglia的早期制訂可擴展的計劃。
■ 利用gweb和Ganglia的Web客戶端進一步可視化數據。
■ 編寫插件來擴展gmond的指標集。
■ 如何解決安裝Ganglia時可能遇到的問題。
■ 如何將Ganglia和sFlow以及Nagios監控系統集成。

 

作者簡介

Matt Massie,2000年在加利福尼亞大學伯克利分校擔任研究員時開發了Ganglia。他設計的Ganglia實現了對遍布整個美國,用于科學研究的共享計算機網格集群的監控。2010年,在O扲eilly出版的由John Allspaw和Jesse Robbins編寫的 Web Operations: Keeping the Data On Time(http://shop.oreilly.com/product/0636920000136.do)一書中,他撰寫了關于集群監控的一個章節。Matt現在Cloudera擔任軟件工程師,聚焦于Apache Hadoop企業管理與監控。
Bernard Li,擔任勞倫斯伯克利國家實驗室高性能計算系統工程師,目前也是Ganglia系統的維護工程師。他從2003年開始涉及高性能計算領域并致力于很多開源項目,如OSCAR、SystemImager和Warewulf。
Brad Nicholes,是Apache軟件基金會的成員,目前在Novell擔任軟件工程師顧問。除了參與Apache HTTPD和APR項目,Brad也是Ganglia項目的開發者和管理員。作為Ganglia項目的開發人員,Brad開發了C/C++和Python指標模塊,并將其集成至Ganglia V3.1.x。目前Ganglia系統提供的部分指標模塊,最初是由他開發貢獻的。Brad畢業于猶他大學(University of Utah)和楊百翰大學(Brigham Young University),擁有計算機科學學位。
Vladimir Vuksan(Broadcom),在技術操作、系統工程和軟件開發領域工作超過15年。就職于Broadcom之前,他曾在Rave Mobile Safety、Demandware和新墨西哥大學(University of New Mexico)開發高可用性解決方案和使管理和基礎設施運行更容易的工具。

名人/編輯推薦

Ganglia的設計者和維護人員親自執筆,知識性和權威性毋庸置疑。

譯者序
Ganglia引起了計算機網絡監控領域的一場大型革命,它獨到的設計理念、強大的功能、豐富的插件,以及它與Nagios、sFlow等工具的有機結合,成為大型計算機網絡監控領域當之無愧的王者。本書詳細介紹了Ganglia的設計、功能和使用方法,并配有大量的實例解析,幫助你快速上手使用Ganglia,而當你開始使用Ganglia的時候,就會發現,以后再也離不開它了。
本書作者同時也是Ganglia系統的締造者,他們就像一群宗師級別的武林高手,把創造的絕世武功寫入一本秘籍中。秘籍中每招每式的背后都深藏著這群宗師返璞歸真的寶貴經驗,反復的閱讀過程中你會感受到這本秘籍的博大精深,每讀一遍,都會有不同的收獲。
翻譯圖書是一個痛苦而又令人興奮的過程。大量的專業詞匯、幾位作者風格迥異的英文寫作方式,以及Ganglia特有的一些參數設置,這些都給翻譯帶來了極大的困難。往往為了翻譯短短的一句話,需要查閱幾個小時的資料,并反復揣摩作者的原意,這些都給我們帶來極大的“痛苦”,而當我們終于為這些詞匯找到準確并合適的翻譯,并貼切地表達出作者的原意時,一種興奮感油然而生,正是這種興奮感讓我們一直堅持著,并最終完成了整本書的翻譯。
由于時間上的倉促和Ganglia極強的專業性,在本書翻譯過程中難免出現欠妥之處,如果對本書的翻譯有任何的問題和建議,請與我們聯系:shally_chen@live.cn,感謝你的理解與支持。
感謝機械工業出版社華章公司對我們的信任,沒有他們的支持,我們很難有勇氣完成這項艱巨的任務。
陳學鑫 張誠誠
2013年7月于深圳

目次

前言1
第1章初識Ganglia9
規模的問題9
主機即監控系統10
基于冗余的結構11
Ganglia是否適合你11
gmond:字節大爆炸12
gmetad:整合所有信息14
gweb:下一代數據分析15
稍等!這并不是所有16
第2章Ganglia的安裝和配置18
Ganglia的安裝18
Ganglia的配置27
安裝后的工作47
第3章可擴展性49
誰會關注可擴展性49
gmond和Ganglia集群的可擴展性49
gmetad存儲規劃和可擴展性50
第4章Ganglia的Web界面58
Ganglia的Web界面導航58
gweb的Search選項卡65
gweb的Views選項卡66
gweb的AggregatedGraphs選項卡68
gweb的CompareHosts選項卡69
gweb的Events選項卡69
gweb的AutomaticRotation選項卡72
gweb的Mobile選項卡72
自定義復合圖表72
其他特性74
認證和授權75
第5章指標管理和擴展78
gmond:指標收集代理78
基本指標79
擴展指標81
利用模塊擴展gmond82
利用gmetric擴展gmond98
如何在C/C++、Python和gmetric之間做出選擇101
XDR協議102
Java和gmetric4j104
真實世界:利用NVML模塊進行GPU監控105
第6章Ganglia故障排查與處理108
概述108
有用的資源109
對監控系統進行監控110
常用故障排查機制及工具110
在前臺/調試模式下運行115
常見的部署問題120
典型問題及解決步驟121
第7章Ganglia與Nagios129
發送Nagios數據到Ganglia130
使用Nagios監控Ganglia指標133
在NagiosUI中顯示Ganglia數據138
使用Nagios監控Ganglia139
第8章Ganglia與sFlow142
架構144
標準sFlow指標145
Java虛擬機指標149
配置gmond以接收sFlow153
HostsFlow代理155
故障解決160
聯合其他sFlow工具使用Ganglia163
第9章Ganglia案例分析168
Tagged公司169
SARA177
路透社財務軟件182
Lumicall(Android上的移動VoIP)186
稍等,多少指標?監控Quantcast191
工具箱中的很多工具:監控Etsy197
附錄A先進的指標配置與調試201
附錄BGanglia和Hadoop/HBase209

書摘/試閱



strace(Solaris系統中的truss)是一個工具,它可以使用戶連接到正在運行的進程,并攔截進程執行時的系統調用和所接收信號。當Ganglia程序由于分段故障或占用99%的CPU而崩潰時,可以使用strace來確定故障發生時系統正在執行的調用對象。通常系統調用可以提供故障發生前關于進程調用文件的重要詳細信息。當gmond或gmetad運行錯誤時,用戶會試圖查明gmond或gmetad在做些什么;如果在調試模式下運行仍不能解決問題(本章稍后將介紹),可以使用strace連接到正在運行的進程以獲得相關提示。
valgrind:內存泄漏和內存損壞
一個處于單發模式且沒有自定義指標的基本gmond所占用的RAM不應超過8MB。而從其他進程接收指標的gmond進程(通過多播或作為UDP匯聚器)所占用的內存將會隨著接收主機或指標數量的增加而線性增加。任何其他形式的內存占用的增加都應該作為gmond或某種指標模塊錯誤運行的標志。
通過運行top或ps命令可以檢查進程的RSS。如果發現RSS以穩定速率攀升,嘗試運行strace看能否找到一些引起內存消耗的線索。如果正在使用指標模塊,可以嘗試一個一個地關閉模塊,看看能否將錯誤孤立出來。如果最后所有的嘗試都未能奏效,可以運行像valgrind這樣的工具,來看看能收集到怎樣的信息。如果確定該問題未匯報過,那么將其在bug tracker中形成文件就再好不過了——當然,不要忘記在bugle告中將valgrind的輸出包含進去。
內存損壞是另一種可能的故障,尤其是當第三方指標模塊錯誤地運行時。valgrind能夠探測到訪問錯誤內存的代碼,如果確實探測成功,請以問題報告的形式與其他用戶共享。
iostat:檢查gmetad的IOPS需求
第3章介紹過,負荷沉重的gmetad服務器可能會產生大量的I/O操作。強烈建議在常規操作的過程中觀測I/O水平。如果在所有圖表中都觀測到缺口,這通常是內存飽和的征兆,可以使用iostat進行確認。

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 308
絕版無法訂購