作者:爱上高清_925 | 来源:互联网 | 2024-12-09 14:29
在尝试使用winsorize
函数(来自robustHD
包)对数据集中的变量进行winsorization处理时,遇到了一些问题。具体来说,我已经计算出数据的95%分位数为5.47,99%分位数为14.13。目标是在1%和99%的水平上对变量进行winsorization,因此尝试了几种不同的代码实现方式:
change3$EPS <- winsorize(change3$EPS, maxval = quantile(change3$EPS, 0.99))
以及
change3$EPS <- winsorize(change3$EPS, minval = 0.01, maxval = 0.99)
还有
change3$EPS <- winsorize(change3$EPS, maxval = 14.12998)
然而,这些方法似乎都没有达到预期的效果。执行上述任一命令后,变量的最大值变成了4.309,这与我的预期不符。根据我的理解,maxval
参数应该被用来指定winsorization的上限,但如果按照默认设置,函数应该自动在5%和95%的分位数水平上进行winsorization。手动验证显示95%分位数确实是5.47,那么为什么经过winsorization后的最大值会变成4.309呢?这个问题引发了我对maxval
参数用法的疑问。