异常值分析又分连续异常值,离散异常值,和知识异常值。

一.连续异常值     

Q3,Q2,Q1分别为上四分位数,中位数和下四分位数

如图上下界之间的为正常值,那么上下界以外的就是异常值了,由此可见,异常值的测定程度由K决定。

通常当K=1.5,就算是中等异常;K=3时,就算是非常的异常。

由于异常值的出现,它让大部分本可以代表数据属性的值失去意义

二.离散异常值

 离散属性定义范围以外的所有值均为异常值

三.知识异常值

在限定知识与常识范围之外的所有值均为异常值。比如身高10米