分類操作

分類操作

分類就是將被研究客體按照其特徵聯合為一個同類總體(組)。在計算機科學中,分類問題到處可見。分類操作有多種解釋:1、在計算機系統,分類操作是指將同一種屬性的數據或檔案歸併到一起;2、在數據挖掘中,分類操作是指將同一屬性數據分類到幾個區域或列表中。

基本介紹

  • 中文名:分類操作
  • 外文名:sort operation
  • 學科:計算機
  • 方法:屬性、區域
  • 目的:方便管理、分析
  • 領域:計算機編程
簡介,屬性,數據挖掘中分類操作實現,聚類,決策樹,

簡介

分類操作是指將同一種屬性或類別數據或檔案歸併到一起,或是指同一屬性數據分類到幾個區域或列表中。前者在計算機作業系統管理中經常可見,例如作業系統將檔案分類成源檔案、目標檔案、文本檔案等不同類型檔案。分類操作的目的主要方便系統對計算機中資源進行管理,提高系統效率。或者主要套用於數據挖掘中,經數據進行分類操作,便於分析和聚類,經常通過聚類和決策樹實現。

屬性

一個具體事物,總是有許許多多的性質與關係,我們把一個事物的性質與關係,都叫做事物的屬性
計算機中的欄位屬性、資源特性和那些讀取與修改的許可權。例如:檔案屬性、用戶的屬性。
Windows、MS-DOS中資料夾的管理屬性如:“唯讀”、“歸檔”、“隱藏”。並且顯示在屬性欄的檔案屬性是可以改變的。
在類Unix作業系統的屬性,指的是檔案許可權。
在關係資料庫的關係模型屬性,指的是資料庫屬性。

數據挖掘中分類操作實現

聚類

聚類分析(Cluster analysis,)是對於統計數據分析的一門技術,在許多領域受到廣泛套用,包括機器學習數據挖掘模式識別圖像分析以及生物信息。聚類是把相似的對象通過靜態分類的方法分成不同的組別或者更多的子集(subset),這樣讓在同一個子集中的成員對象都有相似的一些屬性,常見的包括在坐標系中更加短的空間距離等。聚類(Cluster)分析是由若干模式(Pattern)組成的,通常,模式是一個度量(Measurement)的向量,或者是多維空間中的一個點。

決策樹

決策樹(Decision tree)由一個決策和可能的結果(包括資源成本和風險)組成,用來創建到達目標的規劃。決策樹建立並用來輔助決策,是一種特殊的樹結構。決策樹是一個利用像樹一樣的圖形或決策模型的決策支持工具,包括隨機事件結果,資源代價和實用性。它是一個算法顯示的方法。決策樹經常在運籌學中使用,特別是在決策分析中,它幫助確定一個能最可能達到目標的策略。如果在實際中,決策不得不在沒有完備知識的情況下被線上採用,一個決策樹應該平行機率模型作為最佳的選擇模型或線上選擇模型算法。決策樹的另一個使用是作為計算條件機率的描述性手段。分類決策樹模型是一種描述對實例進行分類的樹形結構。決策樹由結點(node)和有向邊(directed edge)組成。
在機器學習中,決策樹是一個預測模型;他代表的是對象屬性與對象值之間的一種映射關係。樹中每個節點表示某個對象,而每個分叉路徑則代表某個可能的屬性值,而每個葉節點則對應從根節點到該葉節點所經歷的路徑所表示的對象的值。決策樹僅有單一輸出,若欲有複數輸出,可以建立獨立的決策樹以處理不同輸出。 數據挖掘中決策樹是一種經常要用到的技術,可以用於分析數據,同樣也可以用來作預測。從數據產生決策樹的機器學習技術叫做決策樹學習,通俗說就是決策樹。

相關詞條

熱門詞條

聯絡我們