簡介
在統計學中,
三均值(TM)或
圖基三均值, 是
機率分布中的一個概念, 由如下式定義:
三均值最初由Arthur Bowley在教學中提出, 而後由統計學家John Tukey在其於1997年出版的書籍中推廣, 並在
探索性數據分析技術中命名.
同
中位數及中軸數(上、下
四分位數)相似, 而相迥於樣本平均值, 三均值是一個有25%崩潰點的具有統計學抗性的L-估計. 三均值的這個屬性十分有用, 正如下面的引述所言“”
作為一個分布的中心的測量值, 三均值的一個優勢是, 它綜合了中位數和中軸數, 既反映了分布的中心值, 也不失對極端值的注意。
效率
三均值儘管計算簡單, 卻是一個非常有
效率的估計人口中值的估計量. 確切而言, 對於從均勻人口中得到的一個大數據集 (超過100個人口數據), 其中位於20%, 50%, 80%
百分位數, 是得出人口的L-估計的最高效的3個數, 效率為88%.相較之下, L-估計中最好的一點估計, 是
中位數, 效率為64%或更高; 最高效的兩點估計 (用於一個從均勻人口中獲得的超過100個數據的大數據集), 是用29%
中程數(29%和71%百分位數的平均值), 效率約為81%. 這些最佳估計可以使用中軸數及三均值近似. 當然, 使用相距更遠的點能獲得更高的效率; 總之, 只需要3個點就能獲得較高的計算
效率。