作者:元元木樨_669 | 来源:互联网 | 2023-09-10 16:38
前言
最近在做一个自动化爬取IT桔子投融资到mongodb,然后自动导出我想要的字段到CSV发送邮件到指定邮箱。
其中,如果做到遍历json这点确实难倒了我,找了很多方法,最终实现遍历效果。
原始数据如下
{'_id': ObjectId('5cbd1a8513405c7b215db28f'),'agg_time': '2019-04-21','city': '深圳','com_des': '金斧子是国内专业的互联网财富管理机构,为新时代的高净值人群提供专业、独立的互联网财富管理服务。金斧子致力于成为新时代高端投资者的百万理财专业平台。一方面,金斧子根据市场动态,不断寻找不同品类、不同策略的私募股权、纯多私募、量化对冲、并购定增、海外基金和固定收益等理财产品满足高净值客户多样化的资产配置需求。另一方面,金斧子追求极致的互联网财富管理服务体验,为客户提供便捷的搜索比价、净值查询、财富记账和线上线下相结合的路演服务。迄今为止,金斧子累计资产管理规模已超300亿,为30万+名新时代的高端投资者提供专业、独立的互联网财富管理服务。','com_id': 3030,'com_registered_name': '深圳市金斧子网络科技有限公司','com_scope': '金融','com_sub_scope': '理财','com_tag': [{'tag_id': 33,'tag_name': '金融超市'},{'tag_id': 116,'tag_name': '垂直搜索'},{'tag_id': 482,'tag_name': '财富管理'},{'tag_id': 609,'tag_name': '金融'},{'tag_id': 614,'tag_name': '理财'},{'tag_id': 615,'tag_name': '基金'},{'tag_id': 3453,'tag_name': '资产管理'},{'tag_id': 3572,'tag_name': '理财平台'},{'tag_id': 3753,'tag_name': '量化交易'},{'tag_id': 4005,'tag_name': '海外投资'},{'tag_id': 5000,'tag_name': '连续获投'},{'tag_id': 6927,'tag_name': '金融机构'},{'tag_id': 6928,'tag_name': '投资理财'},{'tag_id': 6930,'tag_name': '综合金融服务'},{'tag_id': 6944,'tag_name': '高净值'}],'currency': '人民币','day': 21,'id': 10403165,'investor': [{'type_id': 2,'name': '正心谷创新资本(领投)','id': 3213,'url': 'https: //www.itjuzi.com/investfirm/3213','type': '领投'},{'type_id': 2,'name': '启诚资本','id': 6869,'url': 'https: //www.itjuzi.com/investfirm/6869','type': '跟投'}],'invse_des': '金斧子是意见互联网财富管理机构,为新时代的高净值人群提供专业、独立的互联网财富管理服务。近日,在第三届私募大会上,金斧子宣布获得1.72亿的Pre-D轮融资,由正心谷创新资本领投,启诚资本跟投。','invse_title': '金斧子获得1.72亿人民币D轮融资,正心谷创新资本领投,启诚资本参投','location': 'in','logo': 'https: //cdn.itjuzi.com/images/c3aa63802178dfd19af780cf653dbff5.png?imageView2/0/q/100','maxima': False,'money': '1.72亿人民币','money_num': 17200,'month': 4,'name': '金斧子','nicorn': False,'one_year': True,'prov': '广东','round': 'D轮','slogan': '国内专业的互联网财富管理机构','term_tag': [{'tag_id': 33,'tag_name': '金融超市'},{'tag_id': 116,'tag_name': '垂直搜索'},{'tag_id': 482,'tag_name': '财富管理'},{'tag_id': 609,'tag_name': '金融'},{'tag_id': 614,'tag_name': '理财'},{'tag_id': 615,'tag_name': '基金'},{'tag_id': 3453,'tag_name': '资产管理'},{'tag_id': 3572,'tag_name': '理财平台'},{'tag_id': 3753,'tag_name': '量化交易'},{'tag_id': 4005,'tag_name': '海外投资'},{'tag_id': 5000,'tag_name': '连续获投'},{'tag_id': 6927,'tag_name': '金融机构'},{'tag_id': 6928,'tag_name': '投资理财'},{'tag_id': 6930,'tag_name': '综合金融服务'},{'tag_id': 6944,'tag_name': '高净值'}],'time': 1555776000,'two_year': False,'valuation': 86000,'well_known_enterprises': True,'well_known_fa': False,'well_known_wind_cast': True,'year': 2019
}
实现
这里我要导出的是investor中的name字段,这个name字段可能有1个,可能有两个。
company = [company.get('name') for company in row['investor']]
效果