热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

mysql海明距离,MySQL或PostgreSQL的汉明距离优化?

我试图在MySQL数据库中改进搜索类似图像的pHashed.现在我比较pHash计算汉明距离像这样:SELECT*FROMimagesWHEREBIT_COUNT(h

我试图在MySQL数据库中改进搜索类似图像的pHashed.

现在我比较pHash计算汉明距离像这样:

SELECT * FROM images WHERE BIT_COUNT(hash ^ 2028359052535108275) <&#61; 4

选择结果(引擎MyISAM)

> 20000行;查询时间<20ms的

> 100000行;查询时间~60ms#这很好,直到达到150000行

> 300000行;查询时间~150ms

因此查询时间增加取决于表中的行数.

SELECT * FROM images WHERE

BIT_COUNT(h1 ^ 11110011) &#43;

BIT_COUNT(h2 ^ 10110100) &#43;

BIT_COUNT(h3 ^ 11001001) &#43;

BIT_COUNT(h4 ^ 11010001) &#43;

BIT_COUNT(h5 ^ 00100011) &#43;

BIT_COUNT(h6 ^ 00010100) &#43;

BIT_COUNT(h7 ^ 00011111) &#43;

BIT_COUNT(h8 ^ 00001111) <&#61; 4

行300000;查询时间~240ms

我将数据库引擎更改为PostgreSQL. Translate this MySQL query to PyGreSQL

没有成功.

行300000;查询时间〜18s

有优化上述查询的解决方案吗&#xff1f;

我的意思是优化不依赖于行数.

我有限的方法(工具)来解决这个问题.

MySQL到目前为止似乎是最简单的解决方案,但我可以在每个开源数据库引擎上部署代码,该引擎将在专用机器上使用Ruby.

MsSQL https://stackoverflow.com/a/5930944/766217有一些现成的解决方案(未经测试).也许有人知道如何为MySQL或PostgreSQL翻译它.

请根据一些代码或观察结果发布答案.我们在stackoverflow.com上有很多关于汉明距离的理论问题

谢谢&#xff01;

解决方法:

在考虑算法的效率时,计算机科学家使用表示为O(某事物)的概念,其中某事物是n的函数,即计算的事物的数量,在这种情况下是行.所以我们越来越多地得到&#xff1a;

> O(1) – 与项目数无关

> O(log(n)) – 随项目的对数增加

> O(n) – 物品比例增加(你有什么)

> O(n ^ 2) – 增加为项目的平方

> O(n ^ 3) – 等

> O(2 ^ n) – 呈指数增长

> O(n&#xff01;) – 随着数字的阶乘而增加

对于任何合理数量的n(80),最后2个实际上是不可计算的.

只有最重要的术语才重要,因为这对大n来说是主导的,所以n ^ 2和65 * n ^ 2 787 * n 4656566都是O(n ^ 2)

请记住,这是一种数学结构,算法在真实硬件上使用真实数据进行实际软件所花费的时间可能会受到其他因素的严重影响(例如,O(n ^ 2)存储器操作可能比O(O)花费更少的时间( n)磁盘操作).

对于您的问题,您需要遍历每一行并计算BIT_COUNT(hash ^ 2028359052535108275)<&#61; 4.这是一个O(n)操作.

可以改进的唯一方法是利用索引,因为b树索引检索是O(log(n))操作.

但是,由于列字段包含在函数中,因此无法使用该列的索引.你有两种可能性&#xff1a;

>这是一个SQL服务器解决方案,我不知道它是否可以移植到MySQL.使用公式BIT_COUNT(hash ^ 2028359052535108275)在表中创建一个持久计算列,并在其上放置索引.如果您需要更改位掩码,这将不合适.

>找出一种不使用BIT_COUNT函数进行按位运算的方法.

标签&#xff1a;mysql,sql,query-optimization

来源&#xff1a; https://codeday.me/bug/20190520/1143321.html



推荐阅读
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 解决VS写C#项目导入MySQL数据源报错“You have a usable connection already”问题的正确方法
    本文介绍了在VS写C#项目导入MySQL数据源时出现报错“You have a usable connection already”的问题,并给出了正确的解决方法。详细描述了问题的出现情况和报错信息,并提供了解决该问题的步骤和注意事项。 ... [详细]
  • 本文详细介绍了MySQL表分区的创建、增加和删除方法,包括查看分区数据量和全库数据量的方法。欢迎大家阅读并给予点评。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 目录实现效果:实现环境实现方法一:基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]
  • 如何使用Java获取服务器硬件信息和磁盘负载率
    本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • ubuntu用sqoop将数据从hive导入mysql时,命令: ... [详细]
  • r2dbc配置多数据源
    R2dbc配置多数据源问题根据官网配置r2dbc连接mysql多数据源所遇到的问题pom配置可以参考官网,不过我这样配置会报错我并没有这样配置将以下内容添加到pom.xml文件d ... [详细]
  • CSS3 animation动画属性详解及用法
    本文详细介绍了CSS3 animation动画的各种属性及用法,包括关键帧动画、动画名称、动画时间、动画曲线、动画延迟、动画播放次数、动画状态和动画前后的状态等。通过本文的学习,读者可以深入了解CSS3 animation动画的使用方法。 ... [详细]
  • 之前一直都知道css中的部分元素具有包裹性,今天写博客的时候正好也遇到了一个,所以想总结一下,有错误的地方欢迎指出来。什么是包裹性?包裹性就是父元素的宽度会收缩到和内部元素宽度一样 ... [详细]
  • 我用Tkinter制作了一个图形用户界面,有两个主按钮:“开始”和“停止”。请您就如何使用“停止”按钮终止“开始”按钮为以下代码调用的已运行功能提供建议 ... [详细]
author-avatar
turneerpelliccia_291
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有