變尺度數據分析

變尺度數據分析

變尺度數據分析是一種通過模擬分析人員在決策過程中的“尺度變換”思維活動特徵,實現數據挖掘套用過程中數據分析層次自動化、智慧型化轉換,並利用確定尺度下的元數據分析算法得到滿意解決方案及其尺度特徵的理論方法。同時保證尺度變換過程中不同業務層次的數據分析結果間具有一致性。

基本介紹

  • 中文名:變尺度數據分析
  • 外文名:Variable-scale data analysis,VSDA
  • 所屬學科管理科學與工程、大數據管理與套用、數據科學與技術
定義,原理,特點,

定義

尺是承載對象特徵的維,但可獨立於對象而存在。當用尺測量對象的特徵時,得到反映對象特徵或狀態的數據。
尺度是尺的一維測度,根據其在尺上的取值結構特徵,具有均勻尺度和非均勻尺度兩種類型。
觀測尺與觀測尺度是分析人員根據企業業務管理需求而人為選擇的用於數據挖掘的數據尺度,能夠反映業務數據的行業背景和企業業務狀態,且滿足分析人員在決策分析過程中對合理數據結構的主觀偏好。
尺度變換是在決策分析過程中,為滿足某種對於特定對象的觀測需求,如獲取對象特徵等,通過調整、選取合適的尺度來得到期望數據的過程。這種觀測需求既可能是初始明確的,也可能是初始模糊而在尺度變換過程中逐漸清晰的。尺度變換與被觀測對象及分析目的有著緊密聯繫,決策分析中的尺度變換行為也正是人類智慧型的重要體現。

原理

根據數據挖掘套用系統建設的生命周期,數據挖掘技術在實踐套用中逐漸形成了規範化的數據挖掘套用過程方法論,即跨行業數據挖掘標準流程(CRISP-DM)。在CRISP-DM標準流程中,數據挖掘技術的套用過程被劃分為目標清晰的六個環節,即業務理解(Business understanding)、數據理解(Data understanding)、數據準備(Data preparation)、建模(Modeling)、評價(Evaluation)和部署(Deployment)。
變尺度數據分析理論通過模擬決策分析人員思維模式及思考問題時的尺度變換特徵,為跨行業數據挖掘標準流程CRISP-DM各環節分別建立數據分析的數據尺度自動化變換機制和變尺度數據分析方法,從而為實現不同決策分析場景下的智慧型決策支持提供理論基礎。
變尺度數據分析
變尺度數據分析的理論、方法和套用技術框架
其中,針對“業務理解-數據挖掘任務”環節,根據業務及決策分析領域的背景和管理決策目標,通過建立思維概念圖模型及其分析主題發現方法,實現自動確定分析問題並進一步得到分析主題圖模型;並且針對“數據理解-數據挖掘任務”環節,通過證明分析主題圖中不同數據分析任務的結構特徵判定定理,實現為各分析主題自動確定數據挖掘任務及挖掘對象。這克服了當前數據挖掘技術套用過程中,分析問題的確定、分析任務(數據挖掘任務)的確定以及挖掘對象的確認都是數據挖掘分析人員通過自身已有的先驗知識主觀完成的局限,共同實現業務理解與數據理解疊代環節的自動化、智慧型化。
針對“數據準備-建模”環節,通過構建多尺度數據模型,實現按照各觀測尺度之間的聯繫將初始單尺度數據有序擴展至多尺度數據;而針對“建模-數據準備”環節,通過建立尺度變換策略,實現根據尺度變換過程的數據需求自動確立多尺度數據中對象的數據分析尺度,共同為尺度變換過程提供數據基礎。
針對“建模-數據挖掘結果”環節,基於確定尺度下的元聚類分析算法建立了變尺度聚類分析方法,實現自動疊代計算多尺度數據的聚類分析結果。尺度變換定理和滿意類一致定理保證了決策分析過程中尺度變換的正確性。
針對“評價-數據挖掘結果”環節,根據元聚類分析算法的評價方法(指標),通過建立尺度變換效果評價機制,實現按照決策人員對數據分析結果是否滿足業務場景需求的判定標準,自動評價當前變尺度聚類分析效果。並且針對“數據挖掘結果-數據準備”環節,通過進一步建立尺度變換疊代終止機制,實現根據變尺度聚類分析方法評價過程的反饋結果,自動判斷是否開始新一輪尺度變換疊代過程,以得到全部滿足評價標準的最終聚類結果。

特點

變尺度數據分析以數據挖掘套用過程的智慧型化、工程化為目標,對跨行業數據挖掘標準流程CRISP-DM的“數據準備-分析模型建立-分析結果評價”過程建立核心數據挖掘環節的自動化數據尺度變換機制,能夠針對數據挖掘評價結果來疊代修正數據準備和建模中的業務數據分析層次,並且通過量化多尺度業務數據模型中不同觀測尺的尺度變換價值來確定數據尺度變換策略。
變尺度數據分析的優勢在於,不僅能夠克服傳統建設企業決策分析系統時存在的缺乏明確疊代機制和多環節不得不依賴分析人員主觀經驗的不足,而且可以保證系統運行過程中不同業務層次的分析結果間具有一致性。通過模擬人的決策分析層次轉換實現了數據分析層次自主變換的工程化方法,助力企業決策分析系統建設及運行過程實現自動化、智慧型化。

相關詞條

熱門詞條

聯絡我們