热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

echarts无数据时显示无数据_面试题|无索引如何删除亿级数据?

作者:杨奇龙标签:MySQL、无索引、删除亿级数据转自:yangyidba(yangyidba)一业务需求某业务表a数据量大约4.7亿&#

作者:杨奇龙

标签:MySQL、无索引、删除亿级数据

转自:yangyidba(yangyidba)

一 业务需求

某业务表a 数据量大约4.7亿,单表物理大小为370G,其中某些指定xxid='xxx'值的记录大约2亿。受限于磁盘空间比较紧张,需要对在无索引的情况下删除无效数据。如何优雅的删除呢?

二 思路

2.1 xxid本身有索引

存在索引的情况下就比较简单,直接利用索引进行删除,写一个for 循环语句 每次删除500行,每次判断delete 影响的行数可以累加计算删除了多少行,直到删除结果为0行。

delete from a where xxid='xxx' limit 500 ;

那么问题来了 ,如果要求不能创建索引怎么处理?

2.2 xxid 字段无索引

因为表占用的空间已经比较大 370G ,再添加索引会更大。因为没有索引,故我们不能直接像方法一 那样 根据 where xxxid='xxx' 删除数据,那样更慢,可能会引发故障。

我们采取分而治之的方式,基于主键把表的数据分段,比如每段1000行-2000行(如果主键id不连续 则实际数据量会小于指定分段数据)。然后在这1000行里面删除指定的数据,这样delete的执行效率会比直接依赖 xxxid='xxx' 好很多。

1 select min(a.id) min_id,max(a.id) max_id

from (select id from a where id>{init_id} order by id limit 1000) a

2 delete from a where xxid&#61;&#39;xxx&#39; and id >&#61;min_id and id <&#61;max_id

3 init_id &#61; max_id

代码如下:

def get_current_max_id():

"""

获取当前最大的id

:return:

"""

get_max_id &#61; """select max(a.id) max_id from a"""

try:

mydb &#61; pymysql.connect(

host&#61;IP,

port&#61;int(PORT),

user&#61;USER,

read_timeout&#61;5, write_timeout&#61;5,

charset&#61;&#39;utf8&#39;, autocommit&#61;True)

cursor &#61; mydb.cursor(pymysql.cursors.DictCursor)

cursor.execute(get_max_id)

data &#61; cursor.fetchall()

except Exception as e:

print traceback.format_exc(e)

exit(0)

finally:

mydb.close()

print "we get max id of table : %s" % (data[0][&#39;max_id&#39;])

return data[0][&#39;max_id&#39;]

def get_min_max_id(min_id):

"""

:param min_id:

:return:

"""

get_ids &#61; """select min(a.id) min_id,max(a.id) max_id from

(select id from a where id>{init_id} order by id limit 2000) a

""".format(init_id&#61;min_id)

try:

mydb &#61; pymysql.connect(

host&#61;IP,

port&#61;int(PORT),

user&#61;USER,

read_timeout&#61;5, write_timeout&#61;5,

charset&#61;&#39;utf8&#39;, database&#61;&#39;test&#39;, autocommit&#61;True)

cursor &#61; mydb.cursor(pymysql.cursors.DictCursor)

cursor.execute(get_ids)

data &#61; cursor.fetchall()

except Exception as e:

print traceback.format_exc(e)

exit(0)

finally:

mydb.close()

return data[0][&#39;min_id&#39;], data[0][&#39;max_id&#39;]

def del_tokens(min_id, max_id):

"""

:param min_id:

:param max_id:

:return:

"""

del_token &#61; """delete from a

where client_id in (&#39;xxx&#39;,&#39;yyy&#39;) and id>&#61;%s and id<&#61;%s """

try:

mydb &#61; pymysql.connect(

host&#61;IP,

port&#61;int(PORT),

user&#61;USER,

read_timeout&#61;5, write_timeout&#61;5,

charset&#61;&#39;utf8&#39;, database&#61;&#39;test&#39;, autocommit&#61;True)

cursor &#61; mydb.cursor(pymysql.cursors.DictCursor)

rows &#61; cursor.execute(del_token, (min_id, max_id))

except Exception as e:

print traceback.format_exc(e)

exit(0)

finally:

mydb.close()

return rows

def get_last_del_id(file_name):

if not os.path.exists(file_name):

print "{file} is not exist ,exit .".format(file&#61;file_name)

exit(-1)

with open(file_name, &#39;r&#39;) as fh:

del_id &#61; fh.readline().strip()

if not del_id.isdigit():

print "it is &#39;{delid}&#39;, not a num , exit ".format(delid&#61;del_id)

exit(-1)

return del_id

def main():

file_name &#61; &#39;/tmp/del_aid.id&#39;

rows_deleted &#61; 0

maxid &#61; get_current_max_id()

init_id &#61; get_last_del_id(file_name)

while True:

min_id, max_id &#61; get_min_max_id(init_id)

if max_id > maxid:

with open(&#39;/tmp/del_aid.id&#39;, &#39;w&#39;) as f:

f.write(str(min_id))

print "delete end at : {end_id}".format(end_id&#61;init_id)

exit(0)

rows &#61; del_tokens(int(min_id), int(max_id))

init_id &#61; max_id

rows_deleted &#43;&#61; rows

print "delete at %d ,and we have deleted %d rows " % (max_id, rows_deleted)

time.sleep(0.3) ### 可以控制每秒删除的速度

if __name__ &#61;&#61; &#39;__main__&#39;:

main()

这个脚本可以记录上一次的id&#xff0c;用上一次id 作为 init_id进行删除。第一次使用的时候需要手工初始化/tmp/del_aid.id 比如写入 0 或者符合条件的最小主键 id。

2.3 如何更快速的删除

这个环节就当做思考题吧&#xff0c;可以不考虑从库的延迟。大家有什么好的思路&#xff0c;可以分享一下。

推荐文章

工具|Explain 使用分析

哪些因素会导致慢查询&#xff1f;

关于「3306π」社区

围绕 MySQL 核心技术&#xff0c;将互联网行业中最重要的数据化解决方案带到传统行业中&#xff1b;囊括其他开源技术Redis、MongoDB、Hbase、Hadoop、ElasticSearch、Storm、Spark等&#xff1b;分享干货知识&#xff0c;即便是赞助商&#xff0c;也要求如此&#xff0c;拒绝放水。

ca7a1193fe64797983c91f69c1a0914e.png




推荐阅读
  • 本文详细介绍了 GWT 中 PopupPanel 类的 onKeyDownPreview 方法,提供了多个代码示例及应用场景,帮助开发者更好地理解和使用该方法。 ... [详细]
  • Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]
  • golang常用库:配置文件解析库/管理工具viper使用
    golang常用库:配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库,是由大神SteveFrancia开发,他在google领导着golang的 ... [详细]
  • MQTT技术周报:硬件连接与协议解析
    本周开发笔记重点介绍了在新项目中使用MQTT协议进行硬件连接的技术细节,涵盖其特性、原理及实现步骤。 ... [详细]
  • 本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例,帮助开发者更好地理解和应用该方法。 ... [详细]
  • Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 导航栏样式练习:项目实例解析
    本文详细介绍了如何创建一个具有动态效果的导航栏,包括HTML、CSS和JavaScript代码的实现,并附有详细的说明和效果图。 ... [详细]
  • 深入理解 SQL 视图、存储过程与事务
    本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式,存储过程则封装了复杂的SQL逻辑,而事务确保了数据库操作的完整性和一致性。 ... [详细]
  • 本文详细介绍了Akka中的BackoffSupervisor机制,探讨其在处理持久化失败和Actor重启时的应用。通过具体示例,展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • UNP 第9章:主机名与地址转换
    本章探讨了用于在主机名和数值地址之间进行转换的函数,如gethostbyname和gethostbyaddr。此外,还介绍了getservbyname和getservbyport函数,用于在服务器名和端口号之间进行转换。 ... [详细]
  • RecyclerView初步学习(一)
    RecyclerView初步学习(一)ReCyclerView提供了一种插件式的编程模式,除了提供ViewHolder缓存模式,还可以自定义动画,分割符,布局样式,相比于传统的ListVi ... [详细]
  • 掌握远程执行Linux脚本和命令的技巧
    本文将详细介绍如何利用Python的Paramiko库实现远程执行Linux脚本和命令,帮助读者快速掌握这一实用技能。通过具体的示例和详尽的解释,让初学者也能轻松上手。 ... [详细]
  • 利用存储过程构建年度日历表的详细指南
    本文将介绍如何使用SQL存储过程创建一个完整的年度日历表。通过实例演示,帮助读者掌握存储过程的应用技巧,并提供详细的代码解析和执行步骤。 ... [详细]
author-avatar
i1L3i1L4
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有