1. 什么是异常点(outliers)
From wikipedia:
In statistics, an outlier is an observation point that is distant from other observations.
关键是observation,或者先验,通过人的知识来去除异常点
2. 数据分布(先验)
茶叶的特征点一般分布在叶片以及枝干上,高度差异在5cm以内
所以我们的预期是:
- 大部分点在5cm以内,假设下限low,$low<x<low+5$
- 超过范围,$x<low$ or $x>low+5$,判定为outliers
问题归结于如何找到low,或者平均值,或者low+5