探索函式

探索函式可大致分為統計特徵函式與統計作圖函式。統計特徵函式用於計算數據的均值、方差、標準差、分位數、相關係數、協方差等,這些統計特徵能反映出數據的整體分布。

基本介紹

  • 中文名:探索函式
  • 套用領域:計算機,數學分析
Python中探索函式簡介,基本統計特徵函式,R語言的探索函式,

Python中探索函式簡介

Python中用於數據探索的庫主要是:
1、Pandas(數據分析)統計分析函式,統計作圖函式;
2、Matplotlib(數據可視化)。

基本統計特徵函式

  • sum按列計算樣本總和;
  • mean計算樣本的算數平均數;
  • var樣本的方差;
  • std標準差;
  • corr 計算spearman(Person)相關係數矩陣
  • cov協方差矩陣;
  • skew樣本偏值(三階矩陣);
  • kurt樣本峰度(四階矩陣);
  • describe樣本的基本描述(均值 標準差)。

R語言的探索函式

mean(X)用於計算數據樣本的算數平均數(均值)。樣本X可為向量、矩陣或多維數組。
exp(mean(log(X)))用於計算數據樣本的幾何平均數。樣本X可為向量、矩陣或多維數組。
var(X)用於計算數據樣本的方差。若X為向量,則計算向量的樣本方差;若X為矩陣,則結果為X的各列向量的樣本方差構成的行向量。
sd(X)用於計算數據樣本的標準差。若X為向量,則計算向量的標準差;若X為矩陣,則結果為X的各列向量的標準差構成的行向量。
cor()函式用於計算數據樣本的相關係數矩陣,它的使用格式為:
cor(x, y=NULL,use="everything",method=c("pearson","kendall","spearman"))。

相關詞條

熱門詞條

聯絡我們