《大數據技術叢書:Splunk大數據分析》是2014年5月1日機械工業出版社出版的圖書,作者是扎德羅津尼 (Peter Zadrozny) Raghu Kodali。
基本介紹
- 中文名:大數據技術叢書:Splunk大數據分析
- 外文名:Big Data Analytics Using Splunk
- 出版社:機械工業出版社
- 頁數:291頁
- 開本:16
- 品牌:機械工業出版社
- 類型:科技
- 出版日期:2014年5月1日
- 語種:簡體中文
- ISBN:9787111464297
內容簡介,編輯推薦,作者簡介,圖書目錄,
內容簡介
《大數據技術叢書:Splunk大數據分析》寫到,通過Splunk,你可以即時地識別出不斷變化的趨勢和通過社會化媒體發布的公眾意見,以及新的電商模式和客戶行為,並積極回響。在今天這樣一個快節奏的網際網路業務世界中,能即時地識別並回響不斷變化的趨勢是一個巨大的優勢。《大數據技術叢書:Splunk大數據分析》為你打開了通向實時業務智慧型領域的大門。通過《大數據技術叢書:Splunk大數據分析》你能學到監控社會化媒體,並從中挖掘影響業務的趨勢;你能從中了解客戶對產品的評價,以及客戶評價的實時動態;你能從挖掘的業務數據中檢測不斷變化的客戶行為;收集並分析實時數據和歷史數據;通過基本的分析指標更好地理解數據;創建有說服力的可視化圖表,展示數據挖掘結果。
編輯推薦
《大數據技術叢書:Splunk大數據分析》是介紹如何實時處理大數據並從中獲得商業價值的一本實用指南。《大數據技術叢書:Splunk大數據分析》通過真實的大數據分析項目,從數據導入、訪問、挖掘和可視化角度全面而系統地介紹splunk的基本概念和使用方法,以幫助讀者快速掌握splunk。 全書共16章,分為四個部分:第一部分(第1~7章)介紹splunk的基本操作,包括利用splunk進行數據收集、處理、分析及結果可視化等的基本操作和命令,以及使用日誌檔案創建高級數據分析報表的方法;第二部分(第8~11章)使用“航空公司準點性能數據”介紹一個典型的數據分析案例,詳細講解如何運用splunk深度挖掘現有數據倉庫,並介紹一些新的splunk命令和實用技巧;第三部分(第12~14章)詳細介紹如何收集、處理、分析推文和Foursquare的簽到信息等,涵蓋分析社會化媒體流數據所需的知識;第四部分(第15~16章)詳細介紹如何按需求擴展splunk,以及分散式處理和高可用性的基本概念。此外,還包括兩個附錄,展示splunk的性能以及各種可用的應用程式。
作者簡介
作者:(美國)扎德羅津尼(Peter Zadrozny) (美國)Raghu Kodali 譯者:唐宏 陳健
Peter Zadrozny,資深軟體技術專家,OpalliosS公司創始人兼首席技術官,專注於利用大數據和雲技術為客戶提供有價值產品。Peter還是聖荷西州立大學大數據相關課程的講師。他曾先後在多家大中型公司擔任行政和技術職務,並主導在歐洲開啟webLogic和在墨西哥啟動sun微作業系統。他在J2EE和性能工程領域有多部非常成功的著作,並且是流行開源項目Grinder的最初貢獻者。
Peter Zadrozny,資深軟體技術專家,OpalliosS公司創始人兼首席技術官,專注於利用大數據和雲技術為客戶提供有價值產品。Peter還是聖荷西州立大學大數據相關課程的講師。他曾先後在多家大中型公司擔任行政和技術職務,並主導在歐洲開啟webLogic和在墨西哥啟動sun微作業系統。他在J2EE和性能工程領域有多部非常成功的著作,並且是流行開源項目Grinder的最初貢獻者。
圖書目錄
譯者序
致謝
第1章大數據和
1.1什麼是大數據
1.2非傳統的數據處理技術
1.3Splunk是什麼
1.4關於本書
第2章將數據導入
2.1數據的多樣性
2.2Splunk如何處理多樣化的數據
2.2.1檔案和目錄
2.2.2數據生成器
2.2.3生成樣本數據
2.2.4網路資源
2.2.5Windows數據
2.2.6其他資源
2.3應用程式和附加組件
2.4轉發器
2.5小結
第3章處理和分析數據
3.1了解組合訪問日誌數據
3.2搜尋和分析索引數據
3.3報表
3.3.1使用最多的瀏覽器
3.3.2排名前五的IP位址
3.3.3瀏覽量來源最多的網站
3.3.4有多少404事件
3.3.5有多少事件包含購買行為
3.3.6列出購買的商品
3.4排序
3.5過濾
3.6添加和評估欄位
3.7聚合
3.8小結
第4章結果的可視化
4.1數據可視化
4.2Splunk是怎樣處理可視化的
4.3.1製作每一個主機的GET和POST事件數量的圖表
4.3.2製作每一個產品類別的購買數和瀏覽數的圖表
4.3.3哪個產品種類受HTTP404錯誤的影響
4.3.4MyGizmoStore.com的購買趨勢
4.3.5事務持續時間
4.4.1最高購買數量的產品
4.4.2頁面瀏覽率和購買量
4.5使用GoogleMaps應用程式來可視化
4.7儀錶盤
4.8小結
第5章定義警報
5.1什麼是警報
5.2Splunk如何提供警報
5.2.1基於商品銷售量的警報
5.2.2登錄失敗的警報
5.2.3日誌檔案中關鍵性錯誤的警報
5.3小結
第6章網站監測
6.1監測網站
6.2IT運作
6.2.1主機訪問量
6.2.2無內部訪問的主機訪問量
6.2.3HTTP請求成功的流量
6.2.4HTTP請求未成功的流量
6.2.5返回HTTP錯誤狀態碼最多的頁面
6.3業務
6.3.1區域用戶統計
6.3.2跳出率
6.3.3獨立訪問者數量
6.4小結
第7章使用日誌檔案創建高級分析
7.1傳統的分析方法
7.2範式變更
7.3語義日誌
7.4日誌最佳實踐
7.5小結
第8章航班準點率項目
小結
第9章將航班數據導入
9.1處理CSV檔案
9.1.1航班數據
9.1.2下載數據
9.1.3了解航班數據
9.1.4關於時間戳
9.1.5將欄位映射成一個時間戳
9.1.6對所有航班數據建立索引
9.2從關係資料庫中索引數據
9.2.1定義一個新的資料庫連線
9.2.2資料庫監測
9.3小結
第10章分析航空公司、機場、航班和延遲
10.1分析航空公司
10.1.1計算航空公司的總數
10.1.2可視化結果
10.2分析機場
10.3分析航班
10.4分析延遲
10.4.1各航空公司航班延遲情況
10.4.2各機場航班延遲的原因
10.4.3冬天與夏天的航班延遲情況
10.5創建和使用宏命令
10.6報告加速
10.7加速統計
10.8小結
第11章分析一個特定航班的歷年數據
11.1航空公司名稱
11.1.1欄位查找自動化
11.1.2從搜尋中創建查找表
11.2Unitedflight871航班
11.3小結
第12章分析推文
12.1開發樣本流
12.2將推文載入到Splunk中
12.4最流行的單詞
12.5實時的Twitter趨勢
12.6小結
第13章分析Foursquare簽到信息
13.1簽到信息格式
13.2時區注意事項
13.3裝載簽到數據
13.4分析簽到信息
13.4.1星期日早午餐搜尋
13.4.2Google地圖和熱門地點
13.4.3地點的簽到模式
13.4.4地點的簽到數量
13.4.5分析性別活動
13.5小結
第14章情感分析
14.1意見、觀點、信仰、信念
14.2商業用途
14.3情感分析的技術性工作
14.4情感分析應用程式
14.4.1全局性的命令
14.4.2挖掘情感
14.4.3語言的處理
14.4.4訓練數據和測試數據
14.5世界情緒指數項目
14.5.1收集RSS摘要
14.5.2將新聞標題索引到Splunk中
14.5.3定義情感語料庫
14.5.4對結果進行可視化
14.6小結
第15章遠程數據收集
15.1轉發器
15.1.1流行的拓撲結構
15.1.2安裝轉發器
15.2部署伺服器
15.2.1配置部署伺服器
15.2.2配置轉發器
15.3部署監控
15.4小結
第16章可擴展性和高可用性
16.1擴展
16.2聚類
16.3小結
附錄ASplunk的性能
附錄B有用的Splunk應用程式
致謝
第1章大數據和
1.1什麼是大數據
1.2非傳統的數據處理技術
1.3Splunk是什麼
1.4關於本書
第2章將數據導入
2.1數據的多樣性
2.2Splunk如何處理多樣化的數據
2.2.1檔案和目錄
2.2.2數據生成器
2.2.3生成樣本數據
2.2.4網路資源
2.2.5Windows數據
2.2.6其他資源
2.3應用程式和附加組件
2.4轉發器
2.5小結
第3章處理和分析數據
3.1了解組合訪問日誌數據
3.2搜尋和分析索引數據
3.3報表
3.3.1使用最多的瀏覽器
3.3.2排名前五的IP位址
3.3.3瀏覽量來源最多的網站
3.3.4有多少404事件
3.3.5有多少事件包含購買行為
3.3.6列出購買的商品
3.4排序
3.5過濾
3.6添加和評估欄位
3.7聚合
3.8小結
第4章結果的可視化
4.1數據可視化
4.2Splunk是怎樣處理可視化的
4.3.1製作每一個主機的GET和POST事件數量的圖表
4.3.2製作每一個產品類別的購買數和瀏覽數的圖表
4.3.3哪個產品種類受HTTP404錯誤的影響
4.3.4MyGizmoStore.com的購買趨勢
4.3.5事務持續時間
4.4.1最高購買數量的產品
4.4.2頁面瀏覽率和購買量
4.5使用GoogleMaps應用程式來可視化
4.7儀錶盤
4.8小結
第5章定義警報
5.1什麼是警報
5.2Splunk如何提供警報
5.2.1基於商品銷售量的警報
5.2.2登錄失敗的警報
5.2.3日誌檔案中關鍵性錯誤的警報
5.3小結
第6章網站監測
6.1監測網站
6.2IT運作
6.2.1主機訪問量
6.2.2無內部訪問的主機訪問量
6.2.3HTTP請求成功的流量
6.2.4HTTP請求未成功的流量
6.2.5返回HTTP錯誤狀態碼最多的頁面
6.3業務
6.3.1區域用戶統計
6.3.2跳出率
6.3.3獨立訪問者數量
6.4小結
第7章使用日誌檔案創建高級分析
7.1傳統的分析方法
7.2範式變更
7.3語義日誌
7.4日誌最佳實踐
7.5小結
第8章航班準點率項目
小結
第9章將航班數據導入
9.1處理CSV檔案
9.1.1航班數據
9.1.2下載數據
9.1.3了解航班數據
9.1.4關於時間戳
9.1.5將欄位映射成一個時間戳
9.1.6對所有航班數據建立索引
9.2從關係資料庫中索引數據
9.2.1定義一個新的資料庫連線
9.2.2資料庫監測
9.3小結
第10章分析航空公司、機場、航班和延遲
10.1分析航空公司
10.1.1計算航空公司的總數
10.1.2可視化結果
10.2分析機場
10.3分析航班
10.4分析延遲
10.4.1各航空公司航班延遲情況
10.4.2各機場航班延遲的原因
10.4.3冬天與夏天的航班延遲情況
10.5創建和使用宏命令
10.6報告加速
10.7加速統計
10.8小結
第11章分析一個特定航班的歷年數據
11.1航空公司名稱
11.1.1欄位查找自動化
11.1.2從搜尋中創建查找表
11.2Unitedflight871航班
11.3小結
第12章分析推文
12.1開發樣本流
12.2將推文載入到Splunk中
12.4最流行的單詞
12.5實時的Twitter趨勢
12.6小結
第13章分析Foursquare簽到信息
13.1簽到信息格式
13.2時區注意事項
13.3裝載簽到數據
13.4分析簽到信息
13.4.1星期日早午餐搜尋
13.4.2Google地圖和熱門地點
13.4.3地點的簽到模式
13.4.4地點的簽到數量
13.4.5分析性別活動
13.5小結
第14章情感分析
14.1意見、觀點、信仰、信念
14.2商業用途
14.3情感分析的技術性工作
14.4情感分析應用程式
14.4.1全局性的命令
14.4.2挖掘情感
14.4.3語言的處理
14.4.4訓練數據和測試數據
14.5世界情緒指數項目
14.5.1收集RSS摘要
14.5.2將新聞標題索引到Splunk中
14.5.3定義情感語料庫
14.5.4對結果進行可視化
14.6小結
第15章遠程數據收集
15.1轉發器
15.1.1流行的拓撲結構
15.1.2安裝轉發器
15.2部署伺服器
15.2.1配置部署伺服器
15.2.2配置轉發器
15.3部署監控
15.4小結
第16章可擴展性和高可用性
16.1擴展
16.2聚類
16.3小結
附錄ASplunk的性能
附錄B有用的Splunk應用程式