热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

几种相似度方法

1、相似度的几种方法1.1Jaccard相关系数Jaccard相关系数主要用于计算两个集合的并集和交集的比值来度量用户相似度注:Jaccard相关系数适合计

1、相似度的几种方法

1.1Jaccard相关系数

     Jaccard相关系数主要用于计算两个集合的并集和交集的比值来度量用户相似度

    

 

注:Jaccard相关系数适合计算离散型集和的相似度,对于非离散型的评分矩阵,Jaccard相关系数没有考虑评分值对相似度的影响,对于10级评分矩阵的相似度计算效果较差

1.2余弦相似度

    余弦相似度通过计算两个向量间的夹角余弦值衡量两个用户的相似度,首先找到两个用户共同评过分的项目集,然后再计算这两个向量余弦值,余弦相似度更加注重方向上的相似性而非距离上的。

 

 

1.3皮尔森相关系数

    皮尔森相关系数利用向量间的线性相关性表示用户相似度,首先找到两个用户共同评过分的项目集,然后再计算这两个向量的相关系数

  

 

1.4欧几德距离

    欧几里德距离是最常见的距离计算公式,计算多维空间各个点的绝对距离,同类型的还有曼哈顿距离,明可夫斯距离等

    因为计算是基于各维度特征的绝对数值,所以欧氏度量需要保证各维度指标在相同的刻度级别,比如对身高(cm)和体重(kg)两个单位不同的指标使用欧式距离可能使结果失效

 

 

2、标准化的几种方式

2.1 0-1标准化

 

2.2 Z-score标准化

  这种方式处理后的数据服从正态分布,需要用到均值mu和标准差sigma

2.3 Sigmoid函数

Sigmoid函数是一个具有S型曲线的函数都可以称为Sigmoid函数,在(0, 0.5)处中心对称,在(0, 0.5)附近有比较大的斜率,而当数据趋向于正无穷和负无穷的时候,映射出来的值就会无限趋向于1和0

 

 

参考:https://blog.csdn.net/kryolith/article/details/39770187

 

 

 


推荐阅读
  • Encountering frequent mismatches during Terraform apply operations, particularly with resource attributes. ... [详细]
  • Python Matplotlib 绘制折线图示例
    本文提供了一个详细的 Python 代码示例,展示如何使用 Matplotlib 库绘制折线图,包括设置图像尺寸、背景色、分辨率、标题、坐标轴标签、刻度、图例和注释等。 ... [详细]
  • Hadoop Datanode DataXceiver 错误处理问题
    Ambari 每分钟会向 Datanode 发送一次“ping”请求以确保其正常运行。然而,Datanode 在处理空内容时没有相应的逻辑,导致出现错误。 ... [详细]
  • 使用System.getProperty()获取系统属性
    本文详细介绍了如何使用System.getProperty()方法获取Java运行时环境中的各种系统属性,包括Java版本、操作系统信息等。 ... [详细]
  • 本文整理了 DedeCMS 中常用的标签分类及其具体应用方法,包括标题调用、导航调用、文章列表、子栏目调用、尾部信息调用等。 ... [详细]
  • 深入理解Select、Poll和Epoll
    本文详细介绍了三种常用的I/O多路复用技术:Select、Poll和Epoll。通过对比它们的工作原理和性能特点,帮助读者更好地选择适合的I/O模型。 ... [详细]
  • 阿里云OSS访问权限错误:AccessDenied
    在使用阿里云对象存储服务(OSS)时,遇到AccessDenied错误,提示您无权访问指定对象,原因可能与Bucket的ACL设置有关。 ... [详细]
  • RobotFramework之资源文件资源文件导入资源文件资源文件与用例前置、后置结合使用资源文件资源(Resource):用户关键字的 ... [详细]
  • ABP框架是ASP.NET Boilerplate的简称,它不仅是一个开源且文档丰富的应用程序框架,还提供了一套基于领域驱动设计(DDD)的最佳实践架构模型。本文将详细介绍ABP框架的特点、项目结构及其在Web API优先架构中的应用。 ... [详细]
  • 用示例链接 Java 中的 hashset ... [详细]
  • MyBatisCodeHelperPro 2.9.3 最新在线免费激活方法
    MyBatisCodeHelperPro 2.9.3 是一款强大的代码生成工具,适用于多种开发环境。本文将介绍如何在线免费激活该工具,帮助开发者提高工作效率。 ... [详细]
  • 随着SEO技术的发展,越来越多的企业和个人开始重视网络营销。然而,要让网站在搜索引擎中获得良好的排名,不仅需要提升网站内容的质量,还需要构建高质量的外部链接。本文将详细介绍什么是高质量的外部链接以及如何有效构建这些链接。 ... [详细]
  • 本文详细解析了 PyTorch 中的 torch.multinomial 函数,包括其参数、功能及使用示例。该函数用于从输入张量中按权重进行采样,并返回采样的索引。 ... [详细]
  • QSplitter 使用详解
    阅读《C++ GUI Programming with Qt 4, 2nd Edition》第六章布局管理器中的第三节关于 Splitters 的内容,并尝试实现书中的示例,发现实际效果与书中描述存在差异,尤其是分界线部分。 ... [详细]
  • 精选优质开源应用程序
    本文介绍了多个广泛使用的优质开源应用程序,包括内容管理系统(CMS)、电子商务平台和企业资源管理工具等。这些应用不仅功能强大,而且具有高度的可扩展性和社区支持。 ... [详细]
author-avatar
俊铭士弘政翰
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有