利用Python操作MongoDB数据库的详细指南

作者：小杰01234 | 来源：互联网 | 2023-05-18 15:56

MongoDB是由C++语言编写的非关系型数据库,是一个基于分布式文件存储的开源数据库系统,其内容存储形式类似JSON对象,下面这篇文章主要给大家介绍了关于利用Python操作MongoDB数据库的相关资料,需要的朋友可以参考下

前言

通常在项目中，一般都需要一种编程语言来操作数据库，使用Python来操作数据库有着天然的优势，因为Python的字典和MongoDB的文档几乎是一样的格式，本文讲介绍如何使用Python进行MongoDB操作

1 连接数据库

1.1 安装PyMongo

使用Python操作MongoDB需要使用一个第三方库——PyMongo。安装这个库与安装Python其他的第三方库一样，使用pip安装即可：

python3 -m pip install pymongo

也可以指定安装的版本:

python3 -m pip3 install pymOngo==3.5.1

更新 pymongo 命令：

python3 -m pip3 install --upgrade pymongo

安装完成以后，打开Python交互环境，导入PyMongo。如果不报错（如图所示），则表示安装成功

1.2 连接数据库

要使用PyMongo操作MongoDB，首先需要初始化数据库连接。

（1）如果 MongoDB 就运行在本地电脑上，而且也没有修改端口或者添加用户名和密码，则初始化MongoClient的实例不需要带参数，直接写为以下格式：

import pymongo
cOnn= pymongo.MongoClient()

（2）如果MongoDB运行在其他服务器上，则需要使用“URI（UniformResource Identifier，统一资源标志符）”来指定链接地址

import pymongo
cOnn= pymongo.MongoClient('mongodb://test:12345@45.10.110.77:27019')

MongoDB的URI格式如下：mongodb://用户名：密码@服务器IP或域名：端口例如：

（3）如果没有设置权限验证，则不需要用户名和密码，可写为

import pymongo
cOnn= pymongo.MongoClient('mongodb://45.10.110.77:27019')

1.3 连接库与集合

PyMongo连接库与集合有两种方式

方式1

连接数据库与集合的方法1

from pymongo import MongoClient
cOnn= MongoClient()
databae = conn.数据库名
collection = database.集合名

需要注意，在使用这种方式时，代码中的“数据库名”和“集合名”都不是变量名，它们直接就是库的名字和集合的名字。例如，要连接上example_data_1所在的集合，则Python代码如下：

from pymongo import MongoClient
cOnn= MongoClient()
database = conn.chapter_1
collection = database.example_data_1

方式2

连接数据库与集合方法2

from pymongo import MongoClient
db_name = 'chapter_1'
collection_name = 'example_data_1'
cOnn= MongoClient()
database = conn[db_name]
collection = database[collection_name]

在使用这种方式时，在方括号中可以直接填变量来指定库名和集合名。当然，也可以直接填字符串，例如：

from pymongo import MongoClient
cOnn= MongoClient()
database = conn['chapter_1']
collection = database['example_data_1']

方式1 和方式2效果是完全相同的。大家可以任意选择一种自己喜欢的方式。

方式2主要用在需要批量操作数据库的情况下。例如在项目中，有时有多个测试环境，现在需要同时更新这些环境对应的数据库，则可以使用方式2。因为，这样可以将多个数据库的名字或者是多个集合的名字保存在列表中，然后再使用循环来进行操作,如下所示：

database_name_list = ['develop_env_alpha','develop_env_beta','develop_env_preflight']
for each_db in database_name_list:
        database = conn[each_db]
    collection = database.account
    collection.updateMany(.....)

其中第3行代码，在循环里面每次连接不同的库，这样写可以同时更新多个数据库的信息，对于同一个数据库里面的多个集合，也可以使用这个方法来操作。

注意: 在 MongoDB 中，集合只有在内容插入后才会创建! 就是说，创建集合(数据表)后要再插入一个文档(记录)，集合才会真正创建。

2 MongoDB命令在Python中的对应方法

在获取到集合连接对象collection后，就可以用这个对象的各个方法来操作MongoDB了。

虽然 MongoDB 的命令和 collection 的方法名在写法上有微小的差异，但绝大多数的MongoDB语句的参数直接复制到Python代码中都可以使用。

MongoDB的命令使用的是驼峰命名法，而PyMongo使用的是“小写字母加下划线”的方式。它们的对比见下表：

MongoDB命令	PyMongo方法
insertOne	insert_one
insertMany	insert_many
find	find
updateone	update_one
updateMany	update_many
deleteOne	delete_one
deleteMany	delete_many

例如，Robo 3T执行的批量插入语句:

db.getCollection('example_data_1').insertMany([
     {'name': '赵小三','age':20,'address':'北京'},
   {'name': '钱小四','age':21,'address':'上海'},
   {'name': '孙小五','age':20,'address':'山东'},
   {'name': '李小六','age':23,'address':'河北'},
   {'name': '欧阳小七','age':24,'address':'杭州'}
 ])

使用Python批量插入数据，代码如下：

from pymongo import MongoClient
cOnn= MongoClient()
database = conn.chapter_1
collection = database.example_data_2
collection.insert_many([
   {'name': '王小二','age':21,'student':True,'address':'广州'},
   {'name': '赵小三','age':20,'student':True,'address':'北京'},
   {'name': '钱小四','age':21,'student':True,'address':'上海'},
   {'name': '孙小五','age':20,'student':True,'address':'山东'},
   {'name': '李小六','age': None,'student':True,'address':'河北'},
   {'name': '欧阳小七','age':24,'student':False,'address':'杭州'},
   {'name': '公孙小八','age':25,'student':False,'address':'广州'}
 ])

其中，第4行代码中使用了新的集合名字，用以区别。

使用Python操作MongoDB还有一个好处：如果当前使用的库或者集合不存在，则在调用了插入方法以后，PyMongo会自动创建对应的库或集合。

总之，绝大部分的操作，直接从Robo 3T中复制到Python中都可以运行，几乎不需要修改。

3 插入数据到MongoDB

基本语法

collection.insert_one(字典)  # 插入一条数据
collection.insert_many(包含字典的列表)  # 批量插入多条数据

被插入的数据格式

{'field_1': value_1, 'field_2': value_2}
[
 {'field_1': value_1, 'field_2': value_2},
 {'field_1': value_3, 'field_2': value_4}
]

说明

MongoDB不需要提前创建数据库、不需要提前创建集合、不需要提取定义数据格式，想插入什么数据，直接插就行。
同一个集合的不同行数据，字典可以不一

举例

在Python中，将字典{‘name’: ’王小六’, ‘age’: 25, ‘work’: ’厨师’}插入到MongoDB中。

具体命令如下：

collection.insert_one({'name': '王小六', 'age': 25, 'work': '厨师'})

提示：PyMongo还有一个通用方法——collection.insert()。

如果传入的是一个字典，则collection.insert()相当于insert_one
如果传入的是一个包含字典的集合，则collection.insert()相当于insert_many

但是PyMongo开发者准备移除它，因此不推荐读者在正式环境中使用这个方法。

4 从MongoDB中查询数据

查询一条数据

我们可以使用 find_one() 方法来查询集合中的一条数据，查询example_data_2 文档中的第一条数据：

from pymongo import MongoClient
db_name = 'chapter_1'
collection_name = 'example_data_1'
cOnn= MongoClient()
database = conn[db_name]
collection = database[collection_name]
x=collection.find_one({})
print(x)

输出结果：

查询集合中所有数据

from pymongo import MongoClient
db_name = 'chapter_1'
collection_name = 'example_data_1'
cOnn= MongoClient()
database = conn[db_name]
collection = database[collection_name]
collection = database.example_data_2
rows = collection.find()
for row in rows:
    print(row)

结果如下：

逻辑查询

collection.find({'字段名': {'基本符号': 边界值, '基本符号': 边界值}})

在Python中，从MongoDB中查询所有“age”大于21小于25，并且“name”不等于“夏侯小七”的记录。

collection = database.example_data_2
rows = collection.find({'age':{'$lt':25,'$gt':21},
                        'name':{'$ne':'公孙小八'}})
for row in rows:
    print(row)

运行效果如图所示:

查询并对结果进行计数

collection.find().count()

查询并对结果进行计数

# 在Python中
collection.find().sort('字段名', 方向)
# 在Robo 3T的命令输入区域
collection.find().sort({'字段名': 方向})

其中方向为1表示升序，方向为**-1**表示降序

对字段去重

# 对字段去重
handler.distinct('字段名')
# 先筛选再去重
handler.distinct('字段名', 查询条件)

注意：如果字段的数量很大，那么轻易不要在Robo 3T里面直接执行，否则可能导致Robo 3T卡死

5 更新/删除MongoDB中的数据

基本语法

# 更新一条数据
collection.update_one(查询条件, {'$set': 被更新的数据})
# 更新所有满足要求的数据
collection.update_many(查询条件, {'$set': 被更新的数据})

被更新的数据

{'field_1': value_1, 'field_2': value_2}

举例

在Python中更新数据和删除数据：

（1）对于“name”为“公孙小八”的记录，将“age”更新为80，将“address”更新为“美国”。

（2）删除“age”为0的数据

1．更新MongoDB中的数据

在Python中，可以使用udate_many方法来批量更新数据

collection.update_many(
    {'name': '公孙小八'},
    {'$set': {'address': '英国','age':80}})

更新操作还支持一个“upsert”参数。该参数的作用是：如果数据存在，则更新；如果数据不存在，则创建。

例如，对于“name”为“隐身人”的记录，将“age”改为0，将“address”改为“里世界”

由于example_data_1中没有这一条记录，因此直接更新会报错，如图所示。

result = collection.update_one({'name':'隐身人'},
                               {'$set':{'name':'隐身人',
                                        'age': 0,
                                        'address':'里世界'}})
print(list(result))

加上“upsert”参数,看看效果

result = collection.update_one({'name':'隐身人'},
                               {'$set':{'name':'隐身人',
                                        'age': 0,
                                        'address':'里世界'}},
                                upsert = True)
print(result)

提示：如果打开了更新或插入功能，则“$set”的值是完整的文档内容，应该包含每一个字段，而不仅仅是需要被更新的字段，否则被插入的内容只有被更新的这几个字段。

2．删除MongoDB中的数据基本语法

# 删除第一个满足条件的数据
collection.delete_one(查询条件)
# 删除所有满足条件的数据
collection.delete_many(查询条件)

删除“age”为0的数据。删除语句如下:

collection.delete_many({'age': 0})

建议先写查询语句，确认查询出来的数据就是自己想删除的数据，然后把关键字find改为delete_one或者delete_many

6 MongoDB与Python不通用的操作

绝大部分情况下，MongoDB中的命令参数直接复制到Python中就可以使用，但有一些情况例外。假设数据集example_data_2如图所示:

6.1 空值

在MongoDB中，空值写作null,在Python中，空值写作None。

MongoDB不认识None,Python不认识null。

为了从数据集example_data_2中查询出所有“age”字段为空的数据，在Robo 3T中的查询语句为：

db.getCollection('example_data_2').find({'age': null})

运行结果如图所示：

如果直接把这段查询语句中的参数搬到Python中运行，则会导致报错，如图所示：

Python会把null当作一个普通的变量，但是这个变量又没有定义，所以导致报错。

在 Python 中，要查询空值需要使用 None,对上述代码做一些修改——把“null”改为“None”，则查询成功，如图所示:

6.2 布尔值

布尔值就是“真”和“假”两个值。在MongoDB中，“真”为true,“假”为false，首字母小写；在Python中，“真”为True,“假”为False，首字母大写。

在MongoDB中，查询所有student为true的记录，如图所示:

如果把这段查询语句的参数直接复制到 Python 中，同样也会导致报错，因为 Python 会把true当作一个普通的变量，如图所示:

把true改为True，则查询成功，如图所示:

6.3 排序参数

对查询到的结果进行排序是一个常见操作,在MongoDB中，sort()命令接收一个参数，这个参数是一个字典，Key是被排序的字段名，值为1或者−1。

对于数据集example_data_2，在Robo 3T中对“age”字段进行倒序排列，如图所示:

但在Python中，查询结果的sort()方法如果使用MongoDB的写法则会报错，如图所示:

在Python中，sort()方法接收两个参数：第1个参数为字段名，第2个参数为-1或者1。就能够正常运行,如图所示：

6.4 查询_id

在Robo 3T中，可以根据_id的值来查询文档。此时查询语句如下：

在安装PyMongo的同时，Python会自动安装一个叫作“bson”的第三方库。ObjectId这个类需要从bson库中导入，具体命令如下：

from bson import ObjectId
collection.find({'_id': ObjectId('5e8ac5dfdd9cf99b7a446e99')})

运行结果如下：

小结

本文首先介绍了MongoDB的安装，然后介绍了MongoDB的图形化操作软件Robo 3T。通过Robo 3T的命令输入窗口输入命令，可实现对MongoDB数据库的增、删、改、查操作。

MongoDB的大部分操作都可以平滑移植到Python中。因此，大多数情况下，直接把Robo 3T中的MongoDB操作语句复制到Python中就能使用。当然，有很小一部分情况例外。

总结

到此这篇关于利用Python操作MongoDB数据库的文章就介绍到这了,更多相关Python操作MongoDB内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

推荐阅读

select
PHP与MySQL实现高效分页查询

本文探讨了如何在PHP与MySQL环境中实现高效的分页查询，包括基本的分页实现、性能优化技巧以及高级的分页策略。 ... [详细]

蜡笔小新 2024-11-22 05:45:48
select
Oracle 11g 创建表空间与基础配置

本文详细介绍了Oracle 11g中的创建表空间的方法，以及如何设置客户端和服务端的基本配置，包括用户管理、环境变量配置等。 ... [详细]

蜡笔小新 2024-11-21 18:54:39
select
Web动态服务器Python基本实现

Web动态服务器Python基本实现 ... [详细]

蜡笔小新 2024-11-21 08:01:30
int
为何 TypeScript 如此流行而 Python 类型注解却鲜少使用？

本文探讨了Python类型注解使用率低下的原因，主要归结于历史背景和投资回报率（ROI）的考量。文章不仅分析了类型注解的实际效用，还回顾了Python类型注解的发展历程。 ... [详细]

蜡笔小新 2024-11-22 14:02:28
int
深入理解函数式编程中的函子

函子（Functor）是函数式编程中的一个重要概念，它不仅是一个特殊的容器，还提供了一种优雅的方式来处理值和函数。本文将详细介绍函子的基本概念及其在函数式编程中的应用，包括如何通过函子控制副作用、处理异常以及进行异步操作。 ... [详细]

蜡笔小新 2024-11-21 20:29:15
ip
Docker安全策略与管理

本文探讨了Docker的安全挑战、核心安全特性及其管理策略，旨在帮助读者深入理解Docker安全机制，并提供实用的安全管理建议。 ... [详细]

蜡笔小新 2024-11-21 20:03:03
ip
SIP基础概览

本文介绍了SIP（Session Initiation Protocol，会话发起协议）的基本概念、功能、消息格式及其实现机制。SIP是一种在IP网络上用于建立、管理和终止多媒体通信会话的应用层协议。 ... [详细]

蜡笔小新 2024-11-21 17:42:08
request
软件测试行业深度解析：迈向高薪的必经之路

本文深入探讨了软件测试行业的发展现状及未来趋势，旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]

蜡笔小新 2024-11-21 17:32:44
ip
如何在Django框架中实现对象关系映射（ORM）

本文介绍了Django框架中对象关系映射（ORM）的实现方式，通过ORM，开发者可以通过定义模型类来间接操作数据库表，从而简化数据库操作流程，提高开发效率。 ... [详细]

蜡笔小新 2024-11-21 17:17:01
select
JUnit下的测试和suite

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2024-11-21 16:03:49
int
Singleton单例模式和DoubleChecked Locking双重检查锁定模式

问题描述现在，不管开发一个多大的系统（至少我现在的部门是这样的），都会带一个日志功能；在实际开发过程中 ... [详细]

蜡笔小新 2024-11-21 15:14:45
int
Jupyter Notebook多语言环境搭建指南

本文详细介绍了如何在Linux环境下为Jupyter Notebook配置Python、Python3、R及Go四种编程语言的环境，包括必要的软件安装和配置步骤。 ... [详细]

蜡笔小新 2024-11-20 18:37:27
select
Linux环境下MySQL的安装与部署指南

本文详细介绍了在Linux操作系统上安装和部署MySQL数据库的过程，包括必要的环境准备、安装步骤、配置优化及安全设置等内容。 ... [详细]

蜡笔小新 2024-11-20 18:10:53
int
Bootstrap Paginator 分页插件详解与应用

本文深入探讨了Bootstrap Paginator这款流行的JavaScript分页插件，提供了详细的使用指南和示例代码，旨在帮助开发者更好地理解和利用该工具进行高效的数据展示。 ... [详细]

蜡笔小新 2024-11-20 13:39:53
int
Logging all MySQL queries into the Slow Log

MySQLoptionallylogsslowqueriesintotheSlowQueryLog–orjustSlowLog,asfriendscallit.However,Thereareseveralreasonstologallqueries.Thislistisnotexhaustive:Belowyoucanfindthevariablestochange,astheyshouldbewritteninth ... [详细]

蜡笔小新 2024-11-20 12:50:01