異常值就是和其他樣本數(shù)據(jù)有顯著差異的值。這個詞在統(tǒng)計學中經(jīng)常用到,可以表示數(shù)據(jù)異?;驕y量錯誤。明白算異常值的方法,對于正確理解數(shù)據(jù)非常有用,而且會引出更精確的結(jié)論。以下介紹一個很簡單的算異常值的過程和方法。
怎么計算異常值的方法1了解如何認出潛在異常值。
計算之前先辨認數(shù)據(jù)中的潛在異常值。比如一列數(shù)據(jù),表示的是房間內(nèi)12個東西的溫度。如果其中11個的溫度在70華氏度(21攝氏度左右)內(nèi),第12個卻跑到300華氏度(約150攝氏度)了,那你可以粗略判斷這是一個異常值。2把數(shù)據(jù)從小到大排列。
以以上數(shù)據(jù)為例,繼續(xù)考慮房間內(nèi)物體溫度: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69},變更順序為: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.3計算中位數(shù)。
中位數(shù)是一串數(shù)據(jù)中間的一個數(shù)據(jù)點,如果數(shù)據(jù)總數(shù)是偶數(shù),那么中間兩位數(shù)的平均數(shù)就是中位數(shù)。上面數(shù)據(jù)中,中間兩項是70、71,則中位數(shù)是((70 + 71) / 2)或70.54計算下四分位數(shù),這里設(shè)置為Q1,表示總數(shù)據(jù)最小的25%的數(shù)據(jù)在這個點以下。
在上面例子中,又有兩個數(shù)據(jù)要被平分,即((70 + 70) / 2) 或 705計算上四分位數(shù),設(shè)置為Q3,表示最大的25%數(shù)據(jù)都在這個點以上。
本例子中Q3 是71、72的平均數(shù),即 71.56找出數(shù)據(jù)的“內(nèi)圍”。
第一步是把Q1和Q3的差(四分位差)乘以1.5。上面的例子中,四分位差是(71.5 - 70)得 1.5。再乘以1.5 得 2.25 ,加上Q3 ,用Q1 減去這個和,得到內(nèi)圍。本例中內(nèi)圍是67.75 and 73.75.7找出數(shù)據(jù)外圍。
和內(nèi)圍方法類似,不過這里要將四分位差乘以3 而非1.5。乘以3即(1.5 * 3) 得到 4.5。得到外圍是65.5 、 76大學院校在線查
有疑問就來發(fā)現(xiàn)