1、什么是朴素贝叶斯,具体过程是怎么样的。
朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。
对于给定的训练数据集,首先基于特征条件独立假设学习输入输出的联合概率分布;
然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。
2、朴素贝叶斯‘朴素’在什么地方。
朴素在贝叶斯定理对条件概率分布做了条件独立性假设。
3、朴素贝叶斯假设特征条件独立,为什么这种情况下分类效果还不错。
分类只需比较概率大小,无需得出精确概率;
如果数据不独立,存在依赖关系,如果这种关系对所有分类结果有影响,那不会影响最终结果。
4、训练数据集独立同分布。
5、为什么要条件概率分布做条件独立性假设。
条件概率分布有指数级量的参数,其估计实际是不可行的。
6、朴素贝叶斯属于生成模型、监督学习。
7、朴素贝叶斯采用的是期望风险最小化,就是取后验概率中概率最大时对应的y值。
8、还有极大似然估计法、贝叶斯估计法。
9、极大似然估计法取P(ci/x)最大,最大后验概率估计取P(ci/x)P(ci)最大,也就是说在极大似然估计法的基础上添加了先验经验,这样估计就更准确。
10、当数据量小的时候,最大后验概率估计比极大似然估计更准确,当数据量大的时候,最大后验概率估计会退化为极大似然估计。
11、例子:比如要挑选一个班级一个学生去代表班级参加比赛,最大似然估计选择成绩第一的,最大后验概率估计则加入了先验经验,比如老师认为第三名的平时综合成绩不错,所以最大后验估计选择第三名的,而贝叶斯估计则给每个同学一个权重,平时成绩好的权重高,成绩差的权重低,然后全班再考一次,最后综合得出成绩最好的,选择他代表班级比赛。
12、贝叶斯估计是为了解决最大似然估计当某个标签对应的特征不存在时,概率取0的情况,因为这会影响后验概率的计算结果,使分类产生偏差。
13、贝叶斯估计在极大似然估计的基础上,分子分母分别加一些常数,当常数对应的参数是1时,称为拉普拉斯平滑。
14、贝叶斯估计的参数不是凭空写的,是根据某些公式推出来的,具体咋推就不知道了。