当前位置: 开发笔记 > 编程语言 > 正文

数据分析关联规则apriori

作者：甜甜天蚕宝_431 | 来源：互联网 | 2023-10-13 16:49

目录关联规则衡量标准支持度置信度杠杆率(leverage)确信度(conviction)提升度实现美国沃尔玛超市对一年多的原始交易数据进行了详细的分析，

关联规则

衡量标准

支持度

置信度

杠杆率(leverage)

确信度(conviction)

提升度

实现

美国沃尔玛超市对一年多的原始交易数据进行了详细的分析&＃xff0c;得到一个意外发现&＃xff1a;与尿布一起被购买最多的商品竟然是啤酒。

--关联规则在客户关系管理系统中的经典案例

关联规则

形如"如果A那么B(If…Then…)",前者为条件&＃xff0c;后者为结果。例如一个顾客&＃xff0c;如果买了A&＃xff0c;那么他也会购B。

衡量标准

如何来度量一个规则是否够好&＃xff1f;主要有两个量&＃xff0c;置信度(Confidence)和支持度(Support)。

支持度

对于关联规则R&＃xff1a;X&＃61;>Y&＃xff0c;其中 $X \subset I$ &＃xff0c; $Y \subset I$ &＃xff0c;并且 $X \cap Y &＃61;\phi$ 。

规则R的的支持度(Support)是交易集中同时包含X和Y的交易数与所有交易数之比。

关联规则的最小支持度也就是衡量频繁集的最小支持度(Minimum Support)&＃xff0c;记为supmin&＃xff0c;它用于衡量规则需要满足的最低重要性。

置信度

表示了这条规则有多大程度上值得可信。

设条件的项的集合为A,结果的集合为B。置信度计算在A中&＃xff0c;同时也含有B的概率(即&＃xff1a;if A ,then B的概率)。即 Confidence(AàB)&＃61;P(B|A)。

关联规则的最小置信度(Minimum Confidence)记为confmin&＃xff0c;它表示关联规则需要满足的最低可靠性。

如果规则R:X&＃61;>Y满足support(X&＃61;>Y)>supmin且confidence(X&＃61;>Y)>confmin&＃xff0c;称关联规则X&＃61;>Y为强关联规则&＃xff0c;否则称关联规则X&＃61;>Y为弱关联规则。

在挖掘关联规则时&＃xff0c;产生的关联规则要经过supmin和confmin的衡量&＃xff0c;筛选出来的强关联规则才能用于指导商家的决策。

杠杆率(leverage)

P(A,B)−P(A)P(B)P(A,B)-P(A)P(B)P(A,B)−P(A)P(B)&＃xff0c;为0时A和B独立&＃xff0c;越大A和B的关系越密切。

确信度(conviction)

P(A)P(!B)/(P(A,!B)&＃43;1/K)P(A)P(!B)/(P(A,!B)&＃43;1/K)P(A)P(!B)/(P(A,!B)&＃43;1/K) ,&＃xff08;!B表示B没有发生&＃xff0c;K表示总条目数量&＃xff09; 也是用来衡量A和B的独立性。

提升度

引入提升度Lift&＃xff0c;以度量此规则是否可用。它描述的是&＃xff1a;相对于不用规则&＃xff0c;使用规则可以提高多少。

实现

#定义函数读取购物篮数据 def read_file_apriori(filename):k&＃61;[]with open(filename) as f:for i in f:k.append(i.split())return k data&＃61;read_file_apriori("d:/datasets/basket.txt")from mlxtend.preprocessing import TransactionEncoder from mlxtend.frequent_patterns import apriori import pandas as pd te &＃61; TransactionEncoder() #编码 te_ary &＃61; te.fit(data).transform(data) df &＃61; pd.DataFrame(te_ary, columns&＃61;te.columns_) freq&＃61;apriori(df,min_support&＃61;0.05, use_colnames&＃61;True) #导入关联规则包 from mlxtend.frequent_patterns import association_rules #计算关联规则 result &＃61; association_rules(freq, metric&＃61;"confidence", min_threshold&＃61;0.4)

推荐阅读

get
Transforming the Future of Virtual Worlds

Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]

蜡笔小新 2024-12-28 09:44:49
get
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
get
PyCharm下载与安装指南

本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境（IDE），涵盖Windows、macOS和Linux系统，同时提供详细的安装步骤及配置建议。 ... [详细]

蜡笔小新 2024-12-28 09:42:41
get
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
get
深入解析Spring Cloud Ribbon负载均衡机制

本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式，帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]

蜡笔小新 2024-12-27 16:01:25
java
Java 序列化接口详解

本文深入探讨了 Java 中的 Serializable 接口，解释了其实现机制、用途及注意事项，帮助开发者更好地理解和使用序列化功能。 ... [详细]

蜡笔小新 2024-12-27 15:06:12
get
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
format
DNN Community 和 Professional 版本的主要差异

本文详细解析了 DotNetNuke (DNN) 的两种主要版本：Community 和 Professional。通过对比两者的功能和附加组件，帮助用户选择最适合其需求的版本。 ... [详细]

蜡笔小新 2024-12-27 13:14:08
format
ImmutableX Poised to Pioneer Web3 Gaming Revolution

ImmutableX is set to spearhead the evolution of Web3 gaming, with its innovative technologies and strategic partnerships driving significant advancements in the industry. ... [详细]

蜡笔小新 2024-12-27 08:55:17
get
计算机图形学实训：OpenGL入门与直线光栅化算法

本教程涵盖OpenGL基础操作及直线光栅化技术，包括点的绘制、简单图形绘制、直线绘制以及DDA和中点画线算法。通过逐步实践，帮助读者掌握OpenGL的基本使用方法。 ... [详细]

蜡笔小新 2024-12-26 12:24:25
get
Python 异步编程：深入理解 asyncio 库（上）

本文介绍了 Python 3.4 版本引入的标准库 asyncio，该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio，以及它如何简化并发编程的复杂性，并详细介绍其核心概念和使用方法。 ... [详细]

蜡笔小新 2024-12-28 11:52:00
get
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
get
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
get
c# – UWP：BrightnessOverride StartOverride逻辑

c# – UWP：BrightnessOverride StartOverride逻辑 ... [详细]

蜡笔小新 2024-12-27 16:56:40
get
深入解析 MVC 源码：ParameterDescriptor 与 Action 方法参数绑定

在前两篇文章中，我们探讨了 ControllerDescriptor 和 ActionDescriptor 这两个描述对象，分别对应控制器和操作方法。本文将基于 MVC3 源码进一步分析 ParameterDescriptor，即用于描述 Action 方法参数的对象，并详细介绍其工作原理。 ... [详细]

蜡笔小新 2024-12-27 15:26:10

甜甜天蚕宝_431

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章