热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

mysql表导出到mongodb_一个将mysql表导入到mongodb的ruby脚本

功能:将mysql指定表的数据导入到mongodb的指定表,导入过程保证数据不丢失,如果数据有更新也会重新再导。要求:源表必

功能:

将mysql指定表的数据导入到mongodb的指定表,导入过程保证数据不丢失,如果数据有更新也会重新再导。

要求:

源表必须要有两个字段:id:主键 mmm_ts:最后更新时间戳

require 'rubygems'

require 'mongo'

require 'active_record'

mongo_server =

{:local =>

{:server => "localhost", :port => 27017}

}

mysql_server =

{:local =>

{

:adapter => 'mysql',

:host => 'localhost',

:username => 'root',

:password => '$$$',

:encoding => 'utf8'

} ,

:main_db =>

{

:adapter => 'mysql',

:host => 'mydb.com',

:username => 'abc',

:password => 'cba',

:encoding => 'utf8'

}

}

#从mysql指定的表中将数据导入到mongodb中

#源表必须有两个字段:id,自增, mmm_ts, 时间戳

#导数据的时候先按上次操作截止的时间戳获取指定数量的数据,然后再将数据存入到目标库中(如果id相同则更新数据)

#导入完毕更新截止点

class MMM

def initialize(mysql_server, mongo_server, operation_type)

@mysql_server= mysql_server

@mongo_server = mongo_server

@operation_type = operation_type

end

def migrate(source_db, source_table, process_items_each_time, target_db, target_table)

mongodb = Mongo::Connection.new(@mongo_server[:server], @mongo_server[:port]).db(target_db)

mongo_collection = mongodb.collection(target_table)

@mysql_server[:database] = source_db

ActiveRecord::Base.establish_connection(@mysql_server)

model = Class.new(ActiveRecord::Base) do

set_table_name source_table

end

operation_point = OperationPoint.new(mongodb)

opt = operation_point.get(@operation_type)

if opt == nil

opt = 0

mongo_collection.create_index("id", :unique => true)

else

opt = opt["point"].getlocal()

end

cnt = model.count( :conditions => ["mmm_ts=?", opt])

#防止在过多mmm_ts字段的值都一样的情况下无法进行到下一步,这里一定要避免大量mmm_ts字段的值相同

process_items_each_time = cnt + 1 if cnt >= process_items_each_time

records = model.find(:all, :conditions => ["mmm_ts>=?", opt], :order => "mmm_ts", :limit => process_items_each_time)

puts("#{records.length} records read from mysql")

records.each do |record|

record_hash = {}

model.column_names.each do |column|

record_hash[column] = record.read_attribute(column)

end

mongo_collection.update({:id => record.id}, record_hash, :upsert => true)

opt = record.mmm_ts

end

operation_point.save(@operation_type, opt)

puts("#{records.length} records saved to mongodb")

end

end

#操作点

class OperationPoint

def initialize(db)

@table = db.collection("operation_point")

@table.create_index("operation", :unique => true)

end

def save(operation, point)

@table.update({:operation => operation}, {:operation => operation, :point => point}, :upsert => true)

end

def get(operation)

return @table.find_one({:operation => operation})

end

end

mmm = MMM.new(mysql_server[:main_db], mongo_server[:local], "export_mdb")

while (true) do

begin

mmm.migrate("mdb_production", "bet_plans", 3000, "mdb_production", "export_mdb")

rescue Exception => ex

puts ex.message

puts ex.backtrace.join("\n")

sleep(30)

ensure

sleep(0.001)

end

end

分享到:

18e900b8666ce6f233d25ec02f95ee59.png

72dd548719f0ace4d5f9bca64e1d7715.png

2011-05-21 12:01

浏览 2089

评论



推荐阅读
  • 如何自行分析定位SAP BSP错误
    The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • Nginx使用(server参数配置)
    本文介绍了Nginx的使用,重点讲解了server参数配置,包括端口号、主机名、根目录等内容。同时,还介绍了Nginx的反向代理功能。 ... [详细]
  • 本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置,但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置,并列出了出现的错误信息。 ... [详细]
  • 本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法,并给出了问题的解析和解决方法。详细介绍了问题的背景和规则,并给出了相应的算法解析和实现步骤。通过本文的解析,读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]
  • 本文讨论了在Spring 3.1中,数据源未能自动连接到@Configuration类的错误原因,并提供了解决方法。作者发现了错误的原因,并在代码中手动定义了PersistenceAnnotationBeanPostProcessor。作者删除了该定义后,问题得到解决。此外,作者还指出了默认的PersistenceAnnotationBeanPostProcessor的注册方式,并提供了自定义该bean定义的方法。 ... [详细]
  • ZSI.generate.Wsdl2PythonError: unsupported local simpleType restriction ... [详细]
  • FeatureRequestIsyourfeaturerequestrelatedtoaproblem?Please ... [详细]
  • Android开发实现的计时器功能示例
    本文分享了Android开发实现的计时器功能示例,包括效果图、布局和按钮的使用。通过使用Chronometer控件,可以实现计时器功能。该示例适用于Android平台,供开发者参考。 ... [详细]
  • Linux如何安装Mongodb的详细步骤和注意事项
    本文介绍了Linux如何安装Mongodb的详细步骤和注意事项,同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库,适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作,能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]
  • 在Kubernetes上部署JupyterHub的步骤和实验依赖
    本文介绍了在Kubernetes上部署JupyterHub的步骤和实验所需的依赖,包括安装Docker和K8s,使用kubeadm进行安装,以及更新下载的镜像等。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • 关于我们EMQ是一家全球领先的开源物联网基础设施软件供应商,服务新产业周期的IoT&5G、边缘计算与云计算市场,交付全球领先的开源物联网消息服务器和流处理数据 ... [详细]
  • http:my.oschina.netleejun2005blog136820刚看到群里又有同学在说HTTP协议下的Get请求参数长度是有大小限制的,最大不能超过XX ... [详细]
author-avatar
loto1115丨
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有