热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Python程序操作MongoDB数据库的方法

1.Mongodb版本:mongodb-linux-x86_64-static-legacy-1.8.1.tgz下载地址:http://www.mongodb.org/downloadsmongodb提供两个下载版本:mongodb-linux-x86_64-1.8.1.tgz和mongodb-linux-x86_64
1.Mongodb
   版本:mongodb-linux-x86_64-static-legacy-1.8.1.tgz
  下载地址:http://www.mongodb.org/downloads    mongodb提供两个下载版本: mongodb-linux-x86_64-1.8.1.tgz 和 mongodb-linux-x86_64-static-legacy-1.8.1.tgz
   区别:只有在linux是老系统,mongodb无法启动时,或者出现浮点数异常,才使用"legacy static“版,
尽可能使用mongodb-linux-x86_64-1.8.1.tgz

2.简介
(以下内容从网上摘抄的,原址:http://hi.baidu.com/moioo/blog/item/8d464a8f05eb37f6513d923e.html)
MongDB是一个可扩展,高性能、开源、模式自由、面向文档的数据库,并不是我们通常用的RDBMS,属于“NoSql”的范畴。
它和一般的基于key-value的db还是不大一样,因为他本身的功能很强大,已经实现了类似于SQL的很多功能,
   如index、limit、skip、group。。。。。
   当应用的数据量达到海量级,传统的Mysql,Oracle 不能满足我们的性能需求,而对于数据还有一定的查询需求时,可以考虑
   MongoDB。

3.安装:
   由于RHEL4.3使用mongodb-linux-x86_64-1.8.1.tgz 版本,
  会出现错误: error while loading shared libraries: requires glibc 2.5 or later dynamic linker
所以使用版本:mongodb-linux-x86_64-static-legacy-1.8.1.tgz
  1)创建mongodb程序运行目录及默认的数据存放目录:
     #mkdir -p /usr/local/mongodb-1.18.1
     #mkdir -p /data/db
  2)解压缩:
     #tar zxf mongodb-linux-x86_64-static-legacy-1.8.1.tgz -C /usr/local/mongodb
  3)cd到mongodb安装目录,运行:
     #./mongod --dbpath=/data/db/ --logpath=/data/db/mongodb.log --logappend

4.python测试
   1)RHEL4.3默认的python版本为 2.3.4.
        升级为python 2.7.1
        (1)下载python2.7.1的源码包 http://www.python.org/getit/,版本:Python-2.7.1.tgz
安装:#tar zxf Python-2.7.1.tgz
#cd Python-2.7.1
#configure
#make
#make install
              修改path
#mv /usr/bin/python /usr/bin/python_2.3  //将原始的2.3版本重命名
      #mv /usr/local/bin/python2.7 /usr/bin/python  //将新生成的2.7版本考到/usr/bin/目录下
      #python -V     //查看python新版本是否生效
(2)安装python2.7.1版本对应的setuptools
   下载:http://pypi.python.org/pypi/setuptools  版本:setuptools-0.6c11-py2.7.egg
  安装:#chmod +x setuptools-0.6c11-py2.7.egg
#./setuptools-0.6c11-py2.7.egg
     2)下载并安装mongodb的python驱动包
下载http://www.mongodb.org/downloads,版本:pymongo-1.11.tar.gz
安装:#tar zxf pymongo-1.11.tar.gz
#cd pymongo-1.11
#python setup.py build
#python setup.py install
测试:#python
>>>import pymongo
      3)入库速度测试
测试脚本
########################################################
#!/usr/bin/python
           #-*- coding: utf-8 -*-
           import os,sys
           import random
           import string
           import time
           import pymongo
           insertinfo={}
valid_letters='ABCDEFGHIJKLMNOPQRSTUVWXYZbcdefghijklmnopqrstuvwxyz1234567890'
           def getrandstring(length):
           return ''.join([random.choice(valid_letters) for i in range(0,length)])
           cOnn=pymongo.Connection('127.0.0.1',27017)                  //创建数据库连接
conn.drop_database('test')                                                 //删除已有的数据库 ‘test’
           print 'database_names:%s' % conn.database_names()     //打印当所有的数据库名
           print 'nodes         :%s' % conn.nodes                                 //打印节点名称
           print 'port          :%s' % conn.port                                       //打印单口号
           print 'host          :%s' % conn.host                                      //打印host地址
          #print 'serverinfo    :',conn.server_info()                             //打印server信息
          db=conn.test                                                                     //创建一个数据库连接
mycollection=db.test_collection_2                                    //创建一个collection。若test库和此collection并不存在
则此时也并未实际创建,直到插入数据时,才生成。
          print 'dbname        :%s\n' % db.name                               //打印当前连接的库名
          print "test_collection_2 index info:",mycollection.index_information()   //打印collection的索引信息
          print "connection information ------------------"
          for myconn in db.collection_names():                                                   //打印当前连接的所有colleciton
print myconn
          #print 'insert data ----------------------'
          print mycollection.count()                                                                    //打印当前collection的数据条数
          begtime=time.time()
pretime=begtime
          for i in range(0,1000000):                                                                  //生成循环的随机字符串
insertinfo["_id"]=i                                                                            //手动插入“_id”值.
insertinfo["y"]=str(getrandstring(random.randint(15,30)))
insertinfo["z"]=str(getrandstring(random.randint(15,30)))
insertinfo["m"]=str(getrandstring(random.randint(15,30)))
mycollection.insert(insertinfo,safe=False,check_keys=False)       //向当前的collection插入数据
if db.error() is not None:                                                                //检测插入是否成功,否则输出错误信息
print db.error()
print insertinfo
print mycollection.index_information()
if i % 10000==0:
    print i,mycollection.count(),(time.time()-pretime)
pretime=time.time()
endtime=time.time()
           print 'run time: %s' % (endtime-begtime)
"""
           print 'insert finish,outpu insert info------------------'
           for item in mycollection.find():
for key in item.keys():
print key+":",item[key]
"""
conn.disconnect()                                                                                //关闭数据库连接
########################################################
           测试结果:
本地vmware虚拟机:512M内存,单cpu。
100万数据,插入时间:404.967557907秒。
       生成的数据文件列表:
#ls -l /data/db
##########################  
-rw-------  1 root root  64M Jun 13 09:37 test.0
-rw-------  1 root root 128M Jun 13 09:37 test.1
-rw-------  1 root root 256M Jun 13 09:40 test.2
-rw-------  1 root root  16M Jun 13 09:37 test.ns
##########################

推荐阅读
  • 在CentOS 7环境中安装配置Redis及使用Redis Desktop Manager连接时的注意事项与技巧
    在 CentOS 7 环境中安装和配置 Redis 时,需要注意一些关键步骤和最佳实践。本文详细介绍了从安装 Redis 到配置其基本参数的全过程,并提供了使用 Redis Desktop Manager 连接 Redis 服务器的技巧和注意事项。此外,还探讨了如何优化性能和确保数据安全,帮助用户在生产环境中高效地管理和使用 Redis。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 本文详细介绍了Python编程语言的学习路径,涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划,帮助初学者快速掌握Python的核心技能。 ... [详细]
  • 本文回顾了作者在求职阿里和腾讯实习生过程中,从最初的迷茫到最后成功获得Offer的心路历程。文中不仅分享了个人的面试经历,还提供了宝贵的面试准备建议和技巧。 ... [详细]
  • MongoDB核心概念详解
    本文介绍了NoSQL数据库的概念及其应用场景,重点解析了MongoDB的基本特性、数据结构以及常用操作。MongoDB是一个高性能、高可用且易于扩展的文档数据库系统。 ... [详细]
  • Docker的安全基准
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 在哈佛大学商学院举行的Cyberposium大会上,专家们深入探讨了开源软件的崛起及其对企业市场的影响。会议指出,开源软件不仅为企业提供了新的增长机会,还促进了软件质量的提升和创新。 ... [详细]
  • 本文探讨了MariaDB在当前数据库市场中的地位和挑战,分析其可能面临的困境,并提出了对未来发展的几点看法。 ... [详细]
  • 本文探讨了2019年前端技术的发展趋势,包括工具化、配置化和泛前端化等方面,并提供了详细的学习路线和职业规划建议。 ... [详细]
  • 58同城的Elasticsearch应用与平台构建实践
    本文由58同城高级架构师于伯伟分享,由陈树昌编辑整理,内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用,特别是在58同城的实施案例,包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]
  • 本文详细介绍了如何构建MongoDB的ReplSet复制集群,包括环境准备、配置文件设置以及初始化复制集群的具体步骤。 ... [详细]
  • 开发笔记:Mongodb副本集集群搭建 ... [详细]
  • Redis:缓存与内存数据库详解
    本文介绍了数据库的基本分类,重点探讨了关系型与非关系型数据库的区别,并详细解析了Redis作为非关系型数据库的特点、工作模式、优点及持久化机制。 ... [详细]
  • 本文深入探讨了NoSQL数据库的四大主要类型:键值对存储、文档存储、列式存储和图数据库。NoSQL(Not Only SQL)是指一系列非关系型数据库系统,它们不依赖于固定模式的数据存储方式,能够灵活处理大规模、高并发的数据需求。键值对存储适用于简单的数据结构;文档存储支持复杂的数据对象;列式存储优化了大数据量的读写性能;而图数据库则擅长处理复杂的关系网络。每种类型的NoSQL数据库都有其独特的优势和应用场景,本文将详细分析它们的特点及应用实例。 ... [详细]
author-avatar
aiminilee
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有