作者:我叫yyson_836 | 来源:互联网 | 2023-09-25 17:35
数据整合1.背景及前期准备1.1背景介绍1.2需要安装的库2.数据处理2.1数据提取2.2具体过程2.2.1docx数据的处理2.2.2docx数据的处理完整代码2.2.3pdf数
数据整合
- 1. 背景及前期准备
- 2. 数据处理
- 2.1 数据提取
- 2.2 具体过程
- 2.2.1 docx数据的处理
- 2.2.2 docx数据的处理完整代码
- 2.2.3 pdf数据的处理及完整代码
- 3. 最终结果
1. 背景及前期准备
1.1 背景介绍
在参加比赛过程中,需要获取江苏省科学技术奖近十年的数据,因此需要在官网上获取相应的数据,再查找数据的过程中发现,官网中给出的数据,并不是完整的可以直接拿来用的
比如:
① 2018-2019年的人员及项目名单是pdf的形式给出,
② 2015、2017年的内容直接附在发布的公告后面(纯文字的)
③ 2008-2011、 2014、2016年的内容是以doc的形式给出
④ 2012-2013年的可以找到xls形式数据
因此需要将数据进行整合,数据最后的表现形式就是每一年的数据&