热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

Excel操作用excel实现爬取网站上表格数据

  Excel下,数据-获取数据-自网站输入网站,即可选择想要抓取的数据。抓取数据要定期更新,可以找到刷新-链接属性,设置刷新频率。数据抓取需要网页自带表格,无表格则要用爬虫工具或

 

 



  • Excel下,数据-获取数据-自网站输入网站,即可选择想要抓取的数据。

  • 抓取数据要定期更新,可以找到刷新-链接属性,设置刷新频率。

  • 数据抓取需要网页自带表格,无表格则要用爬虫工具或更深入知识。 

 

获取豆瓣电影

  使用excel爬取豆瓣网 https://movie.douban.com/coming 即将要上映电影的数据,并快速将数据保存到excel单元格中。

  点击“数据-获取数据-自其他来源-自网站”或者直接点击"数据-自网站"。

 

 

获取股票实时行情

  这次要获取股票实时行情数据 http://q.10jqka.com.cn/

  相比获取豆瓣要上映电影有点不一样,获取股票实时行情需要每一分钟都要自动更新数据。

  同理我们和获取豆瓣电影即将上映电影数据操作一样

 

  将股票实时行情数据保存在excel数据表格中后,右击表格,可以看到表格中有个"刷新"按钮。可以通过点击"刷新"使excel重新获取网页上的表单数据。(学习的时候是晚上十点多,已经收市,点击刷新表格数据没有发生变化)

 

  可以通过"数据"-"全部刷新"-“链接属性”-"查询属性",设置excel自动刷新表单频率,就可以实现excel自动刷新表单上的数据。

 

 

  对比excel和爬虫一样的编程语言去爬取网站内上数据,excel有一个比较大的缺点,excel只能爬取网站上表格类型的数据,不能爬取结构化的数据。

 

 

 



推荐阅读
  • Android实战——jsoup实现网络爬虫,糗事百科项目的起步
    本文介绍了Android实战中使用jsoup实现网络爬虫的方法,以糗事百科项目为例。对于初学者来说,数据源的缺乏是做项目的最大烦恼之一。本文讲述了如何使用网络爬虫获取数据,并以糗事百科作为练手项目。同时,提到了使用jsoup需要结合前端基础知识,以及如果学过JS的话可以更轻松地使用该框架。 ... [详细]
  • WebShell代码分析溯源(二)
    WebShell代码分析溯源(二)一、一句话变形马样本 ... [详细]
  • 微服务应用性能如何?APM监控工具来告诉你
    当微服务系统越来越庞大,各个服务间的调用关系也变得越来越复杂,需要一个工具来帮忙理清请求调用的服务链路。之前使用的是Sleuth+Zipkin的解决方案,最近发现应 ... [详细]
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • 本文介绍了Python爬虫技术基础篇面向对象高级编程(中)中的多重继承概念。通过继承,子类可以扩展父类的功能。文章以动物类层次的设计为例,讨论了按照不同分类方式设计类层次的复杂性和多重继承的优势。最后给出了哺乳动物和鸟类的设计示例,以及能跑、能飞、宠物类和非宠物类的增加对类数量的影响。 ... [详细]
  • Python开源库和第三方包的常用框架及库
    本文介绍了Python开源库和第三方包中常用的框架和库,包括Django、CubicWeb等。同时还整理了GitHub中最受欢迎的15个Python开源框架,涵盖了事件I/O、OLAP、Web开发、高性能网络通信、测试和爬虫等领域。 ... [详细]
  • 【爬虫】关于企业信用信息公示系统加速乐最新反爬虫机制
    ( ̄▽ ̄)~又得半夜修仙了,作为一个爬虫小白,花了3天时间写好的程序,才跑了一个月目标网站就更新了,是有点悲催,还是要只有一天的时间重构。升级后网站的层次结构并没有太多变化,表面上 ... [详细]
  • Python入门后,想要从事自由职业可以做哪方面工作?1.爬虫很多人入门Python的必修课之一就是web开发和爬虫。但是这两项想要赚钱的话 ... [详细]
  • 电脑f5键是什么作用
    常见问题f5常见问题韩亚整形医院源码,vscode写前端代码,ubuntu低配,tomcat下载路径乱码,爬虫_gscu,php精粹pdf,广州快速seo优化排名,aspwap网站 ... [详细]
  • 【Python 爬虫】破解按照顺序点击验证码(非自动化浏览器)
    #请求到验证码base64编码json_img_datajson_raw.get(Vimage)#获取到验证码编码 #保存验证码图片到本地defbase64_to_img(bstr ... [详细]
  • 从去年11月开始,工作之余陆陆续续准备了半年的时间,在昨天考过了OCP的三门考试,Handson后等待审核通过。当初打算考这个认证也是为了争取一个工作机会想作为增加成功的砝码而准备的,可惜的是 ... [详细]
  • 使用 Kubernetes 和 Istio 构建大规模集群带来的挑战和解决方案
    原文地址:https:blog.houzz.comchallenges-and-solutions-in-building-a-large-scale-cluster-with-k ... [详细]
  • 1.Looper消息机制,postDelay的Message怎么处理,Looper中的消息是同步还是异步?什么情况下会有异步消息Andr ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • 《51CTO编辑部的外传》——剧本篇(下)阴天MMA咏春电动车时隔《51CTO编辑部的外传》——剧本篇(上)的出炉ÿ ... [详细]
author-avatar
3051451abcd
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有