我有一个大约10个整数特征的数据集,我希望从每个特征的数据集中删除离群值。我过去所做的是计算每个特征的平均值和标准偏差,并对数据集进行传递,并丢弃符合异常值的行。在每一列/每个要素上执行此操作,可以帮助我摆脱具有至少一个异常要素的行。
由于多次分析数据集不是最佳方法,因此我一直在寻找以高效计算的方式执行此操作的方法。有人可以提出一种更好的方法,以便对数据集进行一次解析,并且可以摆脱所有异常行吗?