篇首语:本文由编程笔记#小编为大家整理,主要介绍了python进阶-MongoDB相关的知识,希望对你有一定的参考价值。
Python 可以在数据库应用程序中使用。
最受欢迎的 NoSQL 数据库之一是 MongoDB。
MongoDB 将数据存储在类似 JSON 的文档中,这使得数据库非常灵活和可伸缩。
为了能够测试本教程中的代码示例,您需要访问 MongoDB 数据库。
您可以在 https://www.mongodb.com 下载免费的 MongoDB 数据库。
Python 需要 MongoDB 驱动程序来访问 MongoDB 数据库。
在本教程中,我们会使用 MongoDB 驱动程序 “PyMongo”。
我们建议您使用 PIP 安装 “PyMongo”。
PIP 很可能已经安装在 Python 环境中。
将命令行导航到 PIP 的位置,然后键入以下内容:
下载并安装 “PyMongo”:
C:\\Users\\...\\AppData\\Local\\Programs\\Python\\Python36-32\\Scripts>python -m pip install pymongo
现在您已经下载并安装了 mongoDB 驱动程序。
如需测试安装是否成功,或者您是否已安装 “pymongo”,请创建一张包含以下内容的 Python 页面:
demo_mongodb_test.py:
import pymongo
如果执行上述代码没有错误,则 “pymongo” 已安装就绪。
要在 MongoDB 中创建数据库,首先要创建 MongoClient 对象,然后使用正确的 IP 地址和要创建的数据库的名称指定连接 URL。
如果数据库不存在,MongoDB 将创建数据库并建立连接。
实例
创建名为 “mydatabase” 的数据库:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
重要说明:在 MongoDB 中,数据库在获取内容之前不会创建!
在实际创建数据库(和集合)之前,MongoDB 会一直等待您创建至少有一个文档(记录)的集合(表)。
请记住:在 MongoDB 中,数据库在获取内容之前不会创建,因此如果这是您第一次创建数据库,则应在检查数据库是否存在之前完成接下来的两章(创建集合和创建文档)!
您可以通过列出系统中的所有数据库来检查数据库是否存在:
实例
返回系统中的数据库列表:
print(myclient.list_database_names())
或者您可以按名称检查特定数据库:
实例
检查 “mydatabase” 是否存在:
dblist = myclient.list_database_names()
if "mydatabase" in dblist:
print("The database exists.")
二、Python MongoDB 创建集合
MongoDB 中的集合与 SQL 数据库中的表相同。
要在 MongoDB 中创建集合,请使用数据库对象并指定要创建的集合的名称。
如果它不存在,MongoDB 会创建该集合。
实例
创建名为 “customers” 的集合:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
重要提示:在 MongoDB 中,集合在获得内容之前不会被创建!
在实际创建集合之前,MongoDB 会等待直到您已插入文档。
请记住:在 MongoDB 中,集合在获取内容之前不会创建,因此如果这是您第一次创建集合,则应在检查集合是否存在之前完成下一章(创建文档)!
您可以通过列出所有集合来检查数据库中是否存在集合:
实例
返回数据库中所有集合的列表:
print(mydb.list_collection_names())
或者您可以按名称检查特定集合:
实例
检查 “customers” 集合是否存在:
collist = mydb.list_collection_names()
if "customers" in collist:
print("The collection exists.")
三、Python MongoDB 插入文档
MongoDB 中的文档与 SQL 数据库中的记录相同。
要在 MongoDB 中把记录或我们所称的文档插入集合,我们使用 insert_one() 方法。
insert_one() 方法的第一个参数是字典,其中包含希望插入文档中的每个字段名称和值。
实例
在 “customers” 集合中插入记录:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
mydict = { "name": "Bill", "address": "Highway 37" }
x = mycol.insert_one(mydict)
insert_one() 方法返回 InsertOneResult 对象,该对象拥有属性 inserted_id,用于保存插入文档的 id。
实例
在 “customers” 集合中插入另一条记录,并返回 _id 字段的值:
mydict = { "name": "Peter", "address": "Lowstreet 27" }
x = mycol.insert_one(mydict)
print(x.inserted_id)
如果您没有指定 _id 字段,那么 MongoDB 将为您添加一个,并为每个文档分配一个唯一的 ID。
在上例中,没有指定 _id 字段,因此 MongoDB 为记录(文档)分配了唯一的 _id。
要将多个文档插入 MongoDB 中的集合,我们使用 insert_many() 方法。
insert_many() 方法的第一个参数是包含字典的列表,其中包含要插入的数据:
实例
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
mylist = [
{ "name": "Amy", "address": "Apple st 652"},
{ "name": "Hannah", "address": "Mountain 21"},
{ "name": "Michael", "address": "Valley 345"},
{ "name": "Sandy", "address": "Ocean blvd 2"},
{ "name": "Betty", "address": "Green Grass 1"},
{ "name": "Richard", "address": "Sky st 331"},
{ "name": "Susan", "address": "One way 98"},
{ "name": "Vicky", "address": "Yellow Garden 2"},
{ "name": "Ben", "address": "Park Lane 38"},
{ "name": "William", "address": "Central st 954"},
{ "name": "Chuck", "address": "Main Road 989"},
{ "name": "Viola", "address": "Sideway 1633"}
]
x = mycol.insert_many(mylist)
# 打印被插入文档的 _id 值列表:
print(x.inserted_ids)
insert_many() 方法返回 InsertManyResult 对象,该对象拥有属性 inserted_ids,用于保存被插入文档的 id。
如果您不希望 MongoDB 为您的文档分配唯一 id,则可以在插入文档时指定 _id 字段。
请记住,值必须是唯一的。两个文件不能有相同的 _id。
实例
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
mylist = [
{ "_id": 1, "name": "John", "address": "Highway 37"},
{ "_id": 2, "name": "Peter", "address": "Lowstreet 27"},
{ "_id": 3, "name": "Amy", "address": "Apple st 652"},
{ "_id": 4, "name": "Hannah", "address": "Mountain 21"},
{ "_id": 5, "name": "Michael", "address": "Valley 345"},
{ "_id": 6, "name": "Sandy", "address": "Ocean blvd 2"},
{ "_id": 7, "name": "Betty", "address": "Green Grass 1"},
{ "_id": 8, "name": "Richard", "address": "Sky st 331"},
{ "_id": 9, "name": "Susan", "address": "One way 98"},
{ "_id": 10, "name": "Vicky", "address": "Yellow Garden 2"},
{ "_id": 11, "name": "Ben", "address": "Park Lane 38"},
{ "_id": 12, "name": "William", "address": "Central st 954"},
{ "_id": 13, "name": "Chuck", "address": "Main Road 989"},
{ "_id": 14, "name": "Viola", "address": "Sideway 1633"}
]
x = mycol.insert_many(mylist)
# 打印被插入文档的 _id 值列表:
print(x.inserted_ids)
四、Python MongoDB 查找
在 MongoDB 中,我们使用 find 和 findOne 方法来查找集合中的数据。
就像 SELECT 语句用于查找 MySQL 数据库中的表中的数据一样。
如需在 MongoDB 中的集合中选取数据,我们可以使用 find_one() 方法。
find_one() 方法返回选择中的第一个匹配项。
实例
查找 customers 集合中的首个文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
x = mycol.find_one()
print(x)
如需从 MongoDB 中的表中选取数据,我们还可以使用 find() 方法。
find() 方法返回选择中的所有匹配项。
find() 方法的第一个参数是 query 对象。在这个例子中,我们用了一个空的 query 对象,它会选取集合中的所有文档。
find() 方法没有参数提供与 mysql 中的 SELECT * 相同的结果。
实例
返回 “customers” 集合中的所有文档,并打印每个文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
for x in mycol.find():
print(x)
find() 方法的第二个参数是描述包含在结果中字段的对象。
此参数是可选的,如果省略,则所有字段都将包含在结果中。
实例
只返回姓名和地址,而不是 _ids:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
for x in mycol.find({},{ "_id": 0, "name": 1, "address": 1 }):
print(x)
不允许在同一对象中同时指定 0 和 1 值(除非其中一个字段是 _id 字段)。如果指定值为 0 的字段,则所有其他字段的值为 1,反之亦然:
实例
这个例子从结果中排出 “address”:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
for x in mycol.find({},{ "address": 0 }):
print(x)
实例
如果在同一对象中同时指定 0 和 1 值,则会出现错误(除非其中一个字段是 _id 字段):
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
for x in mycol.find({},{ "name": 1, "address": 0 }):
print(x)
五、Python MongoDB 查询
在集合中查找文档时,您能够使用 query 对象过滤结果。
find() 方法的第一个参数是 query 对象,用于限定搜索。
实例
查找地址为 “Park Lane 38” 的文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
myquery = { "address": "Park Lane 38" }
mydoc = mycol.find(myquery)
for x in mydoc:
print(x)
如需进行高级查询,可以使用修饰符作为查询对象中的值。
例如,要查找 “address” 字段以字母 “S” 或更高(按字母顺序)开头的文档,请使用大于修饰符:{"$gt": “S”}:
实例
查找地址以字母 “S” 或更高开头的文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
myquery = { "address": { "$gt": "S" } }
mydoc = mycol.find(myquery)
for x in mydoc:
print(x)
您也可以将正则表达式用作修饰符。
正则表达式只能用于查询字符串。
如果只查找 “address” 字段以字母 “S” 开头的文档,请使用正则表达式 {"$regex": “^S”}:
实例
查找地址以字母 “S” 开头的文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
myquery = { "address": { "$regex": "^S" } }
mydoc = mycol.find(myquery)
for x in mydoc:
print(x)
六、Python MongoDB 排序
请使用 sort() 方法按升序或降序对结果进行排序。
sort() 方法为 “fieldname”(字段名称)提供一个参数,为 “direction”(方向)提供一个参数(升序是默认方向)。
实例
按姓名的字母顺序对结果进行排序:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
mydoc = mycol.find().sort("name")
for x in mydoc:
print(x)
使用值 -1 作为第二个参数进行降序排序。
sort("name", 1) # 升序
sort("name", -1) # 降序
实例
按名称的逆向字母顺序对结果进行排序:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
mydoc = mycol.find().sort("name", -1)
for x in mydoc:
print(x)
七、Python MongoDB 删除文档
要删除一个文档,我们使用 delete_one() 方法。
delete_one() 方法的第一个参数是 query 对象,用于定义要删除的文档。
注释:如果查询找到了多个文档,则仅删除第一个匹配项。
实例
删除地址为 “Mountain 21” 的文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
myquery = { "address": "Mountain 21" }
mycol.delete_one(myquery)
要删除多个文档,请使用 delete_many() 方法。
delete_many() 方法的第一个参数是一个查询对象,用于定义要删除的文档。
实例
删除地址以字母 S 开头的所有文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
myquery = { "address": {"$regex": "^S"} }
x = mycol.delete_many(myquery)
print(x.deleted_count, " documents deleted.")
要删除集合中的所有文档,请把空的查询对象传递给 delete_many() 方法:
实例
删除 “customers” 集合中的所有文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
x = mycol.delete_many({})
print(x.deleted_count, " documents deleted.")
八、Python MongoDB 删除集合
您可以使用 drop() 方法删除在 MongoDB 中调用的表或集合。
实例
删除 “customers” 集合:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
mycol.drop()
如果成功删除集合,则 drop() 方法返回 true,如果集合不存在则返回 false。
您可以使用 update_one() 方法来更新 MongoDB 中调用的记录或文档。
update_one() 方法的第一个参数是 query 对象,用于定义要更新的文档。
注释:如果查询找到多个记录,则仅更新第一个匹配项。
第二个参数是定义文档新值的对象。
实例
把地址 “Valley 345” 改为 “Canyon 123”:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
myquery = { "address": "Valley 345" }
newvalues = { "$set": { "address": "Canyon 123" } }
mycol.update_one(myquery, newvalues)
#print "customers" after the update:
for x in mycol.find():
print(x)
如需更新符合查询条件的所有文档,请使用 update_many() 方法。
实例
更新地址以字母 “S” 开头的所有文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
myquery = { "address": { "$regex": "^S" } }
newvalues = { "$set": { "name": "Minnie" } }
x = mycol.update_many(myquery, newvalues)
print(x.modified_count, "documents updated.")
十、Python MongoDB Limit
要限制 MongoDB 中的结果,我们使用 limit() 方法。
limit() 方法接受一个参数,定义的数字表示返回的文档数。
假设你有一个 “customers” 集合:
Customers
实例
把结果限定为只返回 5 个文档:
import pymongo
myclient = pymongo.MongoClient("mongodb://localhost:27017/")
mydb = myclient["mydatabase"]
mycol = mydb["customers"]
myresult = mycol.find().limit(5)
# 打印结果:
for x in myresult:
print(x)