作者:浪奔西安 | 来源:互联网 | 2023-05-25 16:49
我正在尝试使用R中的"密度"函数找到具有未知分布的连续数据的最佳PDF.现在,给定一个新的数据点,我想根据内核密度找到该数据点的概率密度我从"密度"函数结果得到的估计量.我怎样才能做到这一点?
1> Glen_b..:
如果你的新点将在产生的值的范围内density
,那么这很容易做 - 我建议使用approx
(或者approxfun
如果你需要它作为函数)来处理网格值之间的插值.
这是一个例子:
set.seed(2937107)
x <- rnorm(10,30,3)
dx <- density(x)
xnew <- 32.137
approx(dx$x,dx$y,xout=xnew)
如果我们绘制密度和新点,我们可以看到它正在做你需要的:
NA
如果需要推断新值,这将返回.如果你想处理外推,我建议直接计算该点的KDE(使用你所拥有的KDE的带宽).