热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Python实现朴素贝叶斯代码演示

朴素贝叶斯可以细分为三种方法:分别是伯努利朴素贝叶斯、高斯朴素贝叶斯和多项式朴素贝叶斯。下文就这三种方法进行详细讲解和演示。目录一、伯努利朴素贝叶斯方法1.1例

朴素贝叶斯可以细分为三种方法:分别是伯努利朴素贝叶斯、高斯朴素贝叶斯和多项式朴素贝叶斯。下文就这三种方法进行详细讲解和演示。

目录

一、伯努利朴素贝叶斯方法

1.1 例子解答

1.1.1 代码:

1.1.2 结果: 

 二、高斯朴素贝叶斯方法

2.1 解题

2.1.1 代码:

2.1.2 结果:

2.2 检查高斯朴素贝叶斯的正确率

2.2.1 代码:

2.2.2 结果: 

 三、多项式朴素贝叶斯方法

3.1 多项式朴素贝叶斯实现新闻文本分类

3.1.1 代码

3.1.2 结果

 3.2 检测正确率

3.2.1 代码

3.2.2结果 


一、伯努利朴素贝叶斯方法

伯努利朴素贝叶斯是假定样本特征的条件概率分布服从二项分布,即“0-1分布”。

1.1 例子解答

例如利用伯努利朴素贝叶斯预测天气会不会下雨:

 其中有雨用1标识,无雨用0标识。

各种属性则是用1标识,否用0标识。一直上表的下雨情况为Y=[1,1,1,1,0,1,1,0]

问(无风,不潮湿,多云,不闷热)的情况是否下雨。

这里可以将预测数据设为x_pre=[0,0,1,1]

1.1.1 代码:

import numpy as np
x = np.array([[0,1,0,1],[1,1,1,1],[1,1,1,0],[0,1,1,0],[0,1,0,0],[0,1,0,1],[1,1,0,1],[1,0,0,1],[1,1,0,1],[0,0,0,0]])
y = np.array([1,1,1,1,0,1,0,1,1,0])from sklearn.naive_bayes import BernoulliNB
bnb = BernoulliNB()
bnb.fit(x,y)
day_pre=[[0,0,1,0]]
pre = bnb.predict(day_pre)
print("预测结果如下\n:",'*'*50)
print('结果为:',pre)
print('*'*50)#进一步查看概率分布
pre_pro = bnb.predict_proba(day_pre)
print("不下雨的概率为:",pre_pro[0][0],"\n下雨的概率为:",pre_pro[0][1])

1.1.2 结果: 

 二、高斯朴素贝叶斯方法

高斯朴素贝叶斯分类器是假定样本特征符合高斯分布时常用的算法。高斯分布也称为正态分布。如果随机变量X服从一个数学期望μ、方差的正态分布。可以直接调用sklearn.native_bayes.GuassianNB().

2.1 解题

上述题用高斯朴素贝叶斯方法预测的结果如下:

2.1.1 代码:

import numpy as np
x = np.array([[0,1,0,1],[1,1,1,1],[1,1,1,0],[0,1,1,0],[0,1,0,0],[0,1,0,1],[1,1,0,1],[1,0,0,1],[1,1,0,1],[0,0,0,0]])
y = np.array([1,1,1,1,0,1,0,1,1,0])# from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
gnb = GaussianNB()
gnb.fit(x,y)
day_pre=[[0,0,1,0]]
pre = gnb.predict(day_pre)
print("预测结果如下\n:",'*'*50)
print('结果为:',pre)
print('*'*50)#进一步查看概率分布
pre_pro = gnb.predict_proba(day_pre)
print("不下雨的概率为:",pre_pro[0][0],"\n下雨的概率为:",pre_pro[0][1])

2.1.2 结果:

2.2 检查高斯朴素贝叶斯的正确率

利用sklearn自带的数据集来展示高斯朴素贝叶斯来验证正确率:

2.2.1 代码:

from sklearn.datasets import make_blobs
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
x,y = make_blobs(n_samples = 800,centers = 6,random_state = 6)
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.25,random_state=33)gnb = GaussianNB()
gnb.fit(x_train,y_train)
print('-'*50)
print('高斯朴素贝叶斯的正确率为:',gnb.score(x_test,y_test))
print('-'*50)

2.2.2 结果: 

 三、多项式朴素贝叶斯方法

多项式朴素贝叶斯是假定样本特征符合多项式分布时常用的算法,把一个二项式公式推广至多种状态,就得到了多项分布。例如骰子。

3.1 多项式朴素贝叶斯实现新闻文本分类

以sklearn.datasets中的新闻文本数据集为例,展示朴素贝叶斯分类方法。

其中sklearn.dates中的fetch_20newsgroups数据集一共射击20个话题,进行预测分类。

3.1.1 代码

#加载数据
from sklearn.datasets import fetch_20newsgroups
newsgroups = fetch_20newsgroups(subset='all')
x = newsgroups.data
y = newsgroups.target
#查看目标
print('目标变量:\n',newsgroups.target_names)
#查看特征变量情况
print('特征变量示例:\n',x[0])
#查看特征变量目标
print('特征变量目标:\n',y)from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.3,random_state=33)from sklearn.feature_extraction.text import CountVectorizer
vec = CountVectorizer()
x_vec_train = vec.fit_transform(x_train)
x_vec_test = vec.transform(x_test)from sklearn.naive_bayes import MultinomialNB
mnb = MultinomialNB()
mnb.fit(x_vec_train,y_train)
mnb_y_predict = mnb.predict(x_vec_test)from sklearn.metrics import classification_report
print(classification_report(y_test,mnb_y_predict))

3.1.2 结果

 

 

 3.2 检测正确率


3.2.1 代码

from sklearn.datasets import make_blobs
import numpy as np#自带数据集
x,y = make_blobs(n_samples=800,centers=6,random_state=6)
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.25,random_state=33)from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaler.fit(x_train)
x_train_s = scaler.transform(x_train)
x_test_s = scaler.transform(x_test)from sklearn.naive_bayes import MultinomialNB
mnb = MultinomialNB()
mnb.fit(x_train_s,y_train)print('*'*50)
print('多项式朴素贝叶斯法准确率:',mnb.score(x_test_s,y_test))
print('*'*50)


3.2.2结果 

 


推荐阅读
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 如何自行分析定位SAP BSP错误
    The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ... [详细]
  • 本文介绍了Android 7的学习笔记总结,包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容,并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同,否则会出现问题。 ... [详细]
  • 本文讨论了在VMWARE5.1的虚拟服务器Windows Server 2008R2上安装oracle 10g客户端时出现的问题,并提供了解决方法。错误日志显示了异常访问违例,通过分析日志中的问题帧,找到了解决问题的线索。文章详细介绍了解决方法,帮助读者顺利安装oracle 10g客户端。 ... [详细]
  • 本文介绍了一个React Native新手在尝试将数据发布到服务器时遇到的问题,以及他的React Native代码和服务器端代码。他使用fetch方法将数据发送到服务器,但无法在服务器端读取/获取发布的数据。 ... [详细]
  • OpenMap教程4 – 图层概述
    本文介绍了OpenMap教程4中关于地图图层的内容,包括将ShapeLayer添加到MapBean中的方法,OpenMap支持的图层类型以及使用BufferedLayer创建图像的MapBean。此外,还介绍了Layer背景标志的作用和OMGraphicHandlerLayer的基础层类。 ... [详细]
  • Spring源码解密之默认标签的解析方式分析
    本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断,区分默认命名空间和自定义命名空间,并采用不同的解析方式。其中,bean标签的解析最为复杂和重要。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • 本文详细介绍了Spring的JdbcTemplate的使用方法,包括执行存储过程、存储函数的call()方法,执行任何SQL语句的execute()方法,单个更新和批量更新的update()和batchUpdate()方法,以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • 本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景,描述了学童们面对老先生的教导时的反应,以及上官如在这个过程中的表现。同时,文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后,文章强调了日期和时区操作在机器学习中的重要性,并指出了其在实际应用中的作用和意义。 ... [详细]
  • 花瓣|目标值_Compose 动画边学边做夏日彩虹
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了Compose动画边学边做-夏日彩虹相关的知识,希望对你有一定的参考价值。引言Comp ... [详细]
  • 颜色迁移(reinhard VS welsh)
    不要谈什么天分,运气,你需要的是一个截稿日,以及一个不交稿就能打爆你狗头的人,然后你就会被自己的才华吓到。------ ... [详细]
author-avatar
叶治样
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有