首页
技术博客
PHP教程
数据库技术
前端开发
HTML5
Nginx
php论坛
新用户注册
|
会员登录
PHP教程
技术博客
编程问答
PNG素材
编程语言
前端技术
Android
PHP教程
HTML5教程
数据库
Linux技术
Nginx技术
PHP安全
WebSerer
职场攻略
JavaScript
开放平台
业界资讯
大话程序猿
登录
极速注册
取消
热门标签 | HotTags
join
数据库
mysql
elasticsearch
sql
redis
hbase
memcached
oracle
database
nosql
insert
pymongo
json
odbc
sqlite
mongodb
sqlserver
mariadb
firebase
mysqli
当前位置:
开发笔记
>
数据库
> 正文
机器学习贝叶斯方法
作者:aijunli2502898197 | 来源:互联网 | 2023-07-30 20:34
朴素贝叶斯分类实例:检测SNS社区中不真实账号 下面讨论一个使用朴素贝叶斯分类解决实际问题的例子,为了简单起见,对例子中的数据做了适当的简化。 这个问题是这样的,对
朴素贝叶斯分类实例:检测SNS社区中不真实账号
下面讨论一个使用朴素贝叶斯分类解决实际问题的例子,为了简单起见,对例子中的数据做了适当的简化。
这个问题是这样的,对于SNS社区来说,不真实账号(使用虚假身份或用户的小号)是一个普遍存在的问题,作为SNS社区的运营商,希望可以检测出这些不真实账号,从而在一些运营分析报告中避免这些账号的干扰,亦可以加强对SNS社区的了解与监管。
如果通过纯人工检测,需要耗费大量的人力,效率也十分低下,如能引入自动检测机制,必将大大提升工作效率。这个问题说白了,就是要将社区中所有账号在真实账号和不真实账号两个类别上进行分类,下面我们一步一步实现这个过程。
首先设C=0表示真实账号,C=1表示不真实账号。
1、确定特征属性及划分
这一步要找出可以帮助我们区分真实账号与不真实账号的特征属性,在实际应用中,特征属性的数量是很多的,划分也会比较细致,但这里为了简单起见,我们用少量的特征属性以及较粗的划分,并对数据做了修改。
我们选择三个特征属性:a1:日志数量/注册天数,a2:好友数量/注册天数,a3:是否使用真实头像。在SNS社区中这三项都是可以直接从数据库里得到或计算出来的。
下面给出划分:a1:{a<=0.05, 0.05
=0.2},a1:{a<=0.1, 0.1
=0.8},a3:{a=0(不是),a=1(是)}。
2、获取训练样本
这里使用运维人员曾经人工检测过的1万个账号作为训练样本。
3、计算训练样本中每个类别的频率
用训练样本中真实账号和不真实账号数量分别除以一万,得到:
4、计算每个类别条件下各个特征属性划分的频率
5、使用分类器进行鉴别
下面我们使用上面训练得到的分类器鉴别一个账号,这个账号使用非真实头像,日志数量与注册天数的比率为0.1,好友数与注册天数的比率为0.2。
可以看到,虽然这个用户没有使用真实头像,但是通过分类器的鉴别,更倾向于将此账号归入真实账号类别。这个例子也展示了当特征属性充分多时,朴素贝叶斯分类对个别属性的抗干扰性。
机器学习
日志
数据库
写下你的评论吧 !
吐个槽吧,看都看了
会员登录
|
用户注册
推荐阅读
oracle
从0到1搭建大数据平台
从0到1搭建大数据平台 ...
[详细]
蜡笔小新 2024-11-12 15:26:03
oracle
Oracle 数据库自动备份及安装步骤详解
本文详细介绍了 Oracle 数据库的自动备份机制及其安装步骤。通过具体示例,解释了系统变更号(SCN)和块结构在备份过程中的作用,以及热备份恢复的具体步骤。 ...
[详细]
蜡笔小新 2024-11-14 15:15:15
json
PHP 行为日志记录详解
本文详细介绍了如何在PHP中记录和管理行为日志,包括ThinkPHP框架中的日志记录方法、日志的用途、实现原理以及相关配置。 ...
[详细]
蜡笔小新 2024-11-14 09:55:11
oracle
赠书活动:《Oracle DBA工作笔记》签名版
为了回馈读者,特此举办《Oracle DBA工作笔记》签名版赠书活动。 ...
[详细]
蜡笔小新 2024-11-14 09:50:17
sql
基于iSCSI的SQL Server 2012群集测试(一)SQL群集安装
一、测试需求介绍与准备公司计划服务器迁移过程计划同时上线SQLServer2012,引入SQLServer2012群集提高高可用性,需要对SQLServ ...
[详细]
蜡笔小新 2024-11-13 15:49:49
nosql
Python 数据可视化实战指南
本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ...
[详细]
蜡笔小新 2024-11-13 06:03:30
sql
Linux CentOS 7 安装PostgreSQL 9.5.17 (源码编译)
近日需要将PostgreSQL数据库从Windows中迁移到Linux中,LinuxCentOS7安装PostgreSQL9.5.17安装过程特此记录。安装环境 ...
[详细]
蜡笔小新 2024-11-12 22:05:03
redis
秒建一个后台管理系统?用这5个开源免费的Java项目就够了
秒建一个后台管理系统?用这5个开源免费的Java项目就够了 ...
[详细]
蜡笔小新 2024-11-12 03:21:33
数据库
Kubernetes 控制平面与节点之间的通信机制解析
本文深入解析了 Kubernetes 控制平面(特别是 API 服务器)与集群节点之间的通信机制,并对其通信路径进行了详细分类。旨在帮助用户更好地理解和定制其安装配置,从而增强网络安全性,确保集群的稳定运行。 ...
[详细]
蜡笔小新 2024-11-11 21:38:03
database
InfluxDB、collectd与Grafana的详细安装与配置指南
本文详细介绍了 InfluxDB、collectd 和 Grafana 的安装与配置流程。首先,按照启动顺序依次安装并配置 InfluxDB、collectd 和 Grafana。InfluxDB 作为时序数据库,用于存储时间序列数据;collectd 负责数据的采集与传输;Grafana 则用于数据的可视化展示。文中提供了 collectd 的官方文档链接,便于用户参考和进一步了解其配置选项。通过本指南,读者可以轻松搭建一个高效的数据监控系统。 ...
[详细]
蜡笔小新 2024-11-11 19:54:24
数据库
系统数据实体验证异常:多个实体验证失败的错误处理与分析
在使用MVC和EF框架进行数据保存时,遇到了 `System.Data.Entity.Validation.DbEntityValidationException` 错误,表明存在一个或多个实体验证失败的情况。本文详细分析了该错误的成因,并提出了有效的处理方法,包括检查实体属性的约束条件、调试日志的使用以及优化数据验证逻辑,以确保数据的一致性和完整性。 ...
[详细]
蜡笔小新 2024-11-11 16:54:45
数据库
Python多线程详解与示例
本文介绍了Python中的多线程编程,包括僵尸进程和孤儿进程的概念,并提供了具体的代码示例。同时,详细解释了0号进程和1号进程在系统中的作用。 ...
[详细]
蜡笔小新 2024-11-14 12:47:24
odbc
包含phppdoerrorcode的词条
包含phppdoerrorcode的词条 ...
[详细]
蜡笔小新 2024-11-14 12:06:14
数据库
高端存储技术演进与趋势
本文探讨了高端存储技术的发展趋势,包括松耦合架构、虚拟化、高性能、高安全性和智能化等方面。同时,分析了全闪存阵列和中端存储集群对高端存储市场的冲击,以及高端存储在不同应用场景中的发展趋势。 ...
[详细]
蜡笔小新 2024-11-14 11:58:22
数据库
Linux常用命令解析:ipcs与ipcrm
本文详细介绍了Linux系统中用于管理IPC(Inter-Process Communication)资源的两个重要命令:ipcs和ipcrm。通过这些命令,用户可以查看和删除系统中的消息队列、共享内存和信号量。 ...
[详细]
蜡笔小新 2024-11-14 11:42:14
aijunli2502898197
这个家伙很懒,什么也没留下!
Tags | 热门标签
join
数据库
mysql
elasticsearch
sql
redis
hbase
memcached
oracle
database
nosql
insert
pymongo
json
odbc
sqlite
mongodb
sqlserver
mariadb
firebase
mysqli
RankList | 热门文章
1
阿里云新年折扣续费活动现已开启
2
Linux刻录光盘win10认不到,Windows10系统读不取DVD光驱和刻录光盘
3
Linux SLUB:无法在节点上分配内存
4
ps怎么羽化图片边缘?
5
CAEmitterCell颜色属性不起作用
6
无线wifi网络企业微信认证解决方案
7
分析哪些因素会影响MOS管的使用性能?这些知识需要你务必牢记
8
如何在zsh中绑定CTRL + Enter?
9
Debian11系统怎么挂起? Debian11挂起系统的两种方法
10
无法连接虚拟设备sata0:1,因为主机上没有相应的设备可用
11
[ubuntu]Gedit修改文件后提示无法创建备份文件同时不能保存修改过后的文件
12
windows环境下端口被占用问题
13
对路径的访问被拒绝怎么办?
14
云服务器四核8G5M的多少钱
15
MOSS 2007 应用随笔(22)-- 搜索(一)启用搜索服务
PHP1.CN | 中国最专业的PHP中文社区 |
DevBox开发工具箱
|
json解析格式化
|
PHP资讯
|
PHP教程
|
数据库技术
|
服务器技术
|
前端开发技术
|
PHP框架
|
开发工具
|
在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |
京公网安备 11010802041100号
|
京ICP备19059560号-4
| PHP1.CN 第一PHP社区 版权所有