热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

一日二技:MongoDB与Scrapy的小技巧各一个

MongoDB向数组插入不重复的数据;Scrapy使用

摄影:产品经理
红烧肉

今天我们来讲两个小技巧。

如何更新 MongoDB 中的一个数组

我们知道,如果想给 MongoDB 的一条文档增加一个字段,我们可以使用update_one
方法:

import pymongo

handler = pymongo.MongoClient().db.col
handler.update_one({'name''kingname'}, {'$set': {'新的字段名''新的字段值'}})

但如果有一个字段是数组,我想向这个数组里面添加一个元素。并且,如果这个元素之前就已经在这个数组中了,就什么也不做,只要之前不存在时才添加。

这个时候,我们就可以使用$addToSet
操作符来实现这个功能。

这个操作符的语法为:

handler.update_one({'name''kingname'}, {'$addToSet': {'字段名''要插入的元素'}})

我们来看一个例子。

例如对于如图所示的一条文档:

执行代码:

handler.update_one({'name''kingname'}, {'$addToSet': {'excellent''Javascript'}})

运行以后,数组excellent
变为如下图所示:

如果插入一条已经存在的数据,那么这个数组就不会变化。例如:

handler.update_one({'name''kingname'}, {'$addToSet': {'excellent''Python'}})

如何使用参数给 Scrapy 爬虫增加属性

在Scrapy 项目中,我们有时候需要在启动爬虫的时候,传入一些参数,从而让一份代码执行不同的逻辑。这个时候,有一个非常方便的方法,就是使用-a
参数。它的语法为:

scrapy crawl 爬虫名 -a 参数1 -a 参数2 -a 参数3

那么,传入的这些参数,在爬虫里面怎么使用呢?其实很简单,你不需要做任何额外的配置,直接在爬虫里面通过self.参数名
就可以调用了。例如下面这个爬虫:

大家可以看到,PyCharm 给两个属性self.body_name
self.age_from_cmdline
标上了黄色的背景,这是因为PyCharm 找不到这两个属性是在哪里定义的。

但没有关系,我们启动 Scrapy 爬虫的时候,使用-a
参数传递进去就好了:

scrapy crawl example -a body_name=kingname -a age_from_cmdline=28

运行效果如下图所示:

可以看到,这个接口成功接收到了这两个参数,并且把它显示了出来。

未闻 Code·知识星球开放啦!

  • 每周一场直播分享

  • 一对一答疑

  • 面试经验分享

  • 职业生涯咨询

  • ……






未闻 Code技术交流群开放啦!群里既有国内一二线大厂在职员工,也有国内外高校在读学生,既有十多年码龄的编程老鸟,也有中小学刚刚入门的新人,学习氛围良好!想入群的同学,请添加我的微信“mekingname”,备注“粉丝群”(谢绝广告党,非诚勿扰!)~









推荐阅读
author-avatar
不语皓月
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有