热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据科学项目所需的数据集去哪里找?看看这18个来源吧!

本文是讲述“如何构建数据科学作品集”系列文章中的第五篇。你可在本文最后找到指向其它文章的链接。如果你自己独立开发过数据科学项目,那你可能知道,寻找可供分析的、有意思的数据集是一项即

本文是讲述“如何构建数据科学作品集”系列文章中的第五篇。你可在本文最后找到指向其它文章的链接。

如果你自己独立开发过数据科学项目,那你可能知道,寻找可供分析的、有意思的数据集是一项即为耗时的工作。虽然有些时候,筛选出最合适的数据集是一件很有趣的事;但也有些时候,在你下载、导入了好几个 CSV 文件后,才会发现这些数据其实并没有什么意思,这就让人很不爽了。幸好,现在网络有许多在线仓库,早就有人帮你筛掉了(大部分)没意思的数据集。

在本文中,我将带你了解多种类型的数据科学项目(如:数据可视化项目、数据清洗项目以及机器学习项目等)。同时我还会告诉你应该去哪里寻找与这些项目相关的数据集。无论你是想为自己的数据科学作品集添砖加瓦,比如展示自己的数据可视化能力;还是想利用空闲时间来锻炼机器学习技能,本文都能帮助你。

数据可视化项目数据集

最常见的数据可视化项目可能来自于“我想制作一个能够展示美国各州人均收入区别的信息图”等等想法。而在寻找相关数据集的过程中,下面的一些事情应该时刻注意:

  • 数据集一定不要是杂乱无章的,没必要花时间在数据清洗工作上
  • 数据集一定要区别于一般数据集,其中的数据要足够有趣,要能撑得起图表
  • 最理想的数据集应该要详细说明每个字段的含义,这样才能保证可视化工作的准确性
  • 数据行数和列数不宜过多,数据量合适才更容易处理

寻找可视化项目数据集的最佳去处,自然是那些定期公开数据的新闻网站。他们通常会帮你做好数据清洗工作,而且一般也会有现成的图表可供参考或改进。

1. FiveThirtyEight

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》
《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

FiveThirtyEight 是一个十分流行的互动式新闻与体育赛事网站,其创始人是 Nate Silver。网站中会发布许多数据相关的文章,如“技能差距并不是造成制造行业人力供给不足的原因”以及“2016 年 NFL 赛事预测”等等。

FiveThirtyEight 也会将其在文章中使用到的数据集发布在 Github 上。

点击此处查看 FiveThirtyEight 数据集

下面是一些示例:

  • 航空安全 — 包含各家航空公司的意外信息。
  • 美国历史天气 — 美国天气历史数据。
  • 药品调查 — 在美国到底是什么人在服用 Adderall

2. BuzzFeed

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

BuzzFeed 起初仅仅是一个提供劣质文章的供应商,但其后续发展顺利,目前已经开始提供一系列带有调查性质的文章,比如“统治世界的法庭”以及“Deonte Hoard 的短暂一生”。

BuzzFeed 会将其在文章中使用到的数据集发布在 Github 上。

查看BuzzFeed数据集

下面是一些示例:

  • 联邦政府飞机监控数据 – 包含用于国内监控的飞机数据。
  • 寨卡病毒 – 寨卡病毒爆发情况的地理数据。
  • 枪械背景调查 – 尝试购买枪械人士的背景调查数据。

3. Socrata OpenData

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》
《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

Socrata OpenData 门户包含多个清洗后的数据集,可在浏览器中直接查看,或下载至本地进行可视化。其中的大部分数据来源于美国政府,同时也有诸多已过时数据。

OpenData 网站无需注册即可查看、下载数据。你也可以在浏览器中使用可视化工具与分析工具来查看数据。

查看 Socrata OpenData

下面是一些示例:

  • 白宫员工工资 — 2010 年所有白宫员工的工资。
  • 辐射分析 — 关于美国某些地点所产牛奶制品的辐射性数据。
  • 美国工伤致死人数 — 全美由于工伤导致死亡的情况。

数据处理项目数据集

有时你可能只是想找一些大型的数据集来进行分析。分析的结果可能并不重要,重要的只是对于数据的读取与分析过程。你可能会用上诸如 Spark 或 Hadoop 一类的工具,来使用多个节点来对数据进行分布式处理。在寻找优质的数据处理数据集时,你需要将下面的一些事项铭记于心:

  • 数据越干净越好 — 大型数据集的数据清洗工作可能会十分耗时。
  • 数据集应该具有一定的趣味性。
  • 这些数据应该要能够回答某个有意思的问题。

寻找大型公开数据集的最好去处是云托管服务供应商,比如亚马逊和 Google他们有充足的理由来存储这些数据集,因为他们会让你通过他们的框架进行分析(并支付一定费用)。

4. AWS 公开数据集

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

亚马逊在其 Amazon Web Services 中提供了一些大型数据集。你可前往网站上下载并在个人电脑上进行处理,也可以通过 EMR 使用 EC2 与 Hadoop 来对数据进行分析。请点击此处查看更多与该项目相关的信息。

亚马逊提供有一个列明所有数据集的页面供用户随时浏览查看。虽然你需要持有一个 AWS 账户,但是亚马逊会向新账户提供免费访问权限,也就是说你不需要支付任何费用即可查看这些数据。

查看 AWS 公开数据集

下面是一些示例:

  • Google Books 的 n-grams 列表 — 大量图书中的常用词语与词组。
  • 常用网页爬虫集 — 从超过50亿个网页中爬取的数据。
  • 陆地卫星图片 — 地球表面的中等分辨率卫星图片。

5. Google 公开数据集

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

与亚马逊非常相似,Google 同样也提供云托管服务,其服务名称为 Google 云端平台(GCP)。你可在 GCP 上使用一款名为 BigQuery 的工具来查看大型数据集。

Google 也有一个页面列明了所有数据集。虽然你需要注册一个 GCP 账户才能使用其服务,但前 1TB 的查询量将是免费的。

查看 Google 公开数据集

下面是一些示例:

  • 美国人的名称 — 包含从 1879 年到 2015 年美国所有社保申请表上的名字。
  • Github 活动 — 包含超过 280 万个公开 Github 仓库的所有公开活动。
  • 天气历史数据 — 1929 年至 2016 年间从 9000 个 NOAA 气象站收集到的数据。

6. 维基百科

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

维基百科是一本由社区成员编辑的免费在线百科全书。维基百科中的知识内容涵盖范围极其广泛,包括从奥斯曼-哈布斯堡战争到伦纳德·尼莫伊的一系列页面。维基百科致力于实现知识的进步,他们所提供的一切内容都是免费的,同时也会经常生成网站所有文章的转储文件。进一步的,维基百科还提供编辑历史与活动数据,你可以通过这些数据追踪某个话题页面随时间的变化情况,同时了解促成其变化的贡献者。

你可在维基百科的网页中找到多种下载数据的方式。同时还有多种可用于格式化数据的脚本。

查看维基百科数据集

下面是一些示例:

  • 维基百科上的所有图片与其它媒体文件 – 维基百科上的所有图片与其它媒体文件。
  • 全站转储文件 — 以多种文件格式提供的维基百科全站内容转储文件。

机器学习项目数据集

在进行机器学习相关项目时,你可能会想:能不能通过数据集中其它字段的数据来预测出某个字段的数据呢?如果想要实现这一功能,那我们需要确保下面的一些事:

  • 所使用的数据集不能是杂乱无章的 — 因为如果数据集不够好的话,我们就得花费许多时间来进行数据清洗工作。
  • 进行预测的目标字段需要具有一定的趣味性。
  • 其它数据能够对目标字段数据进行一定程度的阐释与说明。

目前网上有一些专门针对机器学习的数据集仓库。此类数据集通常已提前整理好,并且能够快速用于算法的测试工作。

7. Kaggle

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》
《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

Kaggle 是一个举办了多项机器学习竞赛的数据科学社区。该网站有众多由外部人员提供的有趣数据集。Kaggle 同时还会组织实时与历史竞赛。你可以下载两种竞赛的数据,但是你需要注册 Kaggle 并且接受其竞赛的服务条款。

你可以通过加入某项竞赛来从 Kaggle 处下载数据。每项竞赛都有与其自身相关联的数据集。此外还可在新的 Kaggle 数据集中找到用户提供的数据集。

查看 Kaggle 数据集
查看 Kaggle 竞赛

下面是一些示例:

  • 卫星照片顺序 — 提供一系列的地球卫星照片 — 其目的是预测哪些照片的拍摄时间早于其它照片。
  • 制造过程失效 — 从制造过程中测量得到的变量数据集。其目的是预测制造过程中的失效情况。
  • 多选问题 — 包含多选问题及其相应正确答案的数据集。其目的是预测任意给定问题的答案。

8. UCI 机器学习仓库

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

UCI 机器学习仓库是网络上存在时间最为悠久的数据集来源之一。这些数据集是由用户提供的,所以其文档水平与数据整洁程度参差不齐,但其中的大部分数据整洁性较高,且能够直接供机器学习项目使用。在寻找有趣数据集的过程中,UCI 将是绝佳的第一站。

用户无需注册即可直接从 UCI 机器学习仓库中下载数据。这些数据集通常体积较小,同时也不会有太多细微差别,但却十分适合用于机器学习项目中。

查看 UCI 机器学习仓库

下面是一些示例:

  • 垃圾邮件 — 包含一些邮件以及标识其是否为垃圾邮件的标签。
  • 酒品分类 — 包含178种酒类的多项特性。
  • 太阳耀斑 — 太阳耀斑的特征,可用于预测耀斑性质。

9. Quandl

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

Quandl 是一个包含经济与金融数据的仓库。其中的部分信息是免费的,但大部分数据集需要购买。用户可通过 Quandl 构建用于预测经济指标或股价的模型。由于包含大量的可用数据集,它还可帮助构建使用多种数据集来预测其它价格的复杂模型。

查看 Quandl 数据集

下面是一些示例:

  • 基于种族与其它因素的企业活动 — 包含出自考夫曼基金会的美国企业数据。
  • 中国宏观经济数据 — 中国经济健康指标。
  • 美国联邦储备数据 — 来自美联储的美国经济指标。

数据清洗项目数据集

清洗包含多个文件的数据集,将其整合为一个文件并进行分析,有时这是一件非常有非常有成就感的事。在数据清洗项目中,一些时候你可能需要花费好几个小时才能理清数据集中每个字段的意义。有时你正在分析的数据集与目标可能并不十分契合,所以从头再来是经常的事。

最适合数据清洗项目的数据集有如下特点:

  • 分布于多个文件中。
  • 包含众多细微差别,以及许多可供切入的角度。
  • 需要大量研究才能理解。
  • 尽可能地贴近“现实世界”。

此类数据集通常是多个数据集的聚合体。这些聚合体通常包含来自多个来源的数据集,同时也没有经过较好的处理。如果进行了过多处理,那么数据集也会过于整洁,也就难以进一步进行清洗了。

10. data.world

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

Data.world 自称是“数据人的社交网络”,但更准确的说法是“数据界的 GitHub”。在这里,用户可以检索、复制、分析、下载数据集。此外,你还可以将自己的数据上传至 data.world,并与他人进行协作。

data.world 在很短的时间内就成为了获取数据的“必经之地”,其中有许多由用户提供的数据集,以及来自 data.world 合作伙伴与多家组织的优秀数据集,包括来自美国联邦政府的数据。

data.world 与其它同类产品的主要区别是其搭建的工具。该工具能够让数据处理工具更加轻松 – 你可在其界面中编写 SQL 查询语句,并对数据集进行分析或合并查询。

data.world 同时还有针对 R 与 Python 的 SDK,用户可轻松选择最合适的工具来进行数据处理工作(你可能会对我们的 data.world Python SDK 教程感兴趣。)

查看 data.world 数据集

11. http://Data.gov

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

Data.gov 是一个出现时间相对较晚的网站,也是助力美国政府实现政务开放的工作成果之一。Data.gov 让用户能够从多个美国政府机构处下载数据。无论是政府预算还是学校成绩分数,用户均可前往 Data.gov 进行下载。大部分数据需要进行额外的研究工作,同时有时也很难分辨出哪个数据集才是“正确”的版本。任何人都可下载这些数据,虽然部分数据集需要一些额外的操作才能正常下载,比如同意一些许可条款之类的。

用户无需注册即可直接在 Data.gov 上浏览数据集。你可以按照话题领域进行浏览,也可检索特定的数据集。

查看 Data.gov 数据集

下面是一些示例:

  • 食品环境地图 — 包含关于当地食物选择如何影响美国饮食的数据。
  • 学校系统财务数据 — 调查美国学校系统财务状况的研究数据。
  • 慢性疾病数据 — 美国各地区的慢性疾病指标数据。

12. 世界银行

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

世界银行是一个全球性的发展组织,为发展中国家提供贷款与发展建议。世界银行会定期资助发展中国家的项目,然后监测项目是否成功并收集相关数据。

用户无需注册即可直接浏览世界银行的数据集。其数据集中有许多数据缺失,此外有时还需要点击多次才能真正获得数据。

查看世界银行数据集

下面是一些示例:

  • 世界发展指标 — 包含国家水平的发展信息。
  • 教育数据 — 包含各国的教育数据。
  • 世界银行项目成本 — 世界银行项目数据及其相关成本。

13. /r/datasets

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

Reddit 是一个颇为流行的社区讨论网站,其中专门有一个部分用于分享有趣的数据集。那就是 datasets subreddit,或者 /r/datasets。这些数据集所涉及的领域非常广泛,由于大部分数据是由用户提供的,所以其中的内容非常有趣,相互之间也有众多不同。

你可以点击这里浏览 subreddit。也可以在这里查看一些最受人推崇的数据集。

查看最受欢迎的 /r/datasets 推文

下面是一些示例:

  • 所有的 Reddit 提交活动 — 包含自 2015 年以来在 Reddit 上提交的所有问题。
  • 《危险边缘》中的问题 — 电视竞猜游戏节目《危险边缘》中的所有问题与分值。
  • 纽约市房产税数据 — 有关纽约市房产与价值评估的数据。

14. Academic Torrents

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》
《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

Academic Torrents 是同类网站中的后起之秀,提供科技论文中的一些数据集。网站建立的时间不长,所以很难说其中最常见的数据集是什么形式。目前来看,网站中有许多有趣的数据集,但同时也缺少一些背景信息。

用户可直接在网站上浏览数据集。因为这是一个种子站,所以可随时下载其中的所有数据集,但你需要安装一个客户端。Deluge(免费)是一个不错的选择。

查看 Academic Torrents 数据集

下面是一些示例:

  • 安然公司邮件 — 一系列出自安然公司总裁的邮件。安然公司的破产震惊了整个美国。
  • 学生学习因素 — 一系列衡量并影响学生学习效果的因素。
  • 新闻文章 — 包含新闻文章属性与一项目标变量。

额外奖励:流数据

在构建数据科学项目的过程中,下载并处理数据集是一种非常常见的操作。然而,线上服务正在生成越来越多的数据,人们随时都在制造越来越多的数据,然而这些数据并不是以数据集的形式存在的。这样的数据形式包括来自 Twitter 的推文数据,以及股价数据。想要获取此类数据并非易事,不过我们还是会列出一些来,以便你着手进行一些流数据项目。

15. Twitter

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

Twitter 提供了绝佳的流数据 API,让用户能够以相对直接的方式来过滤并生成推文数据流。你可以点击这里查看更多信息。网站中提供诸多选项 — 你可以找出哪个州的人民是最快乐的,或者哪个国家的语言最复杂。同时,我们最近也完成了一篇有关 Twitter API 的指导性文章,请点击此处查看。

开始使用 Twitter API

16. Github

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》
《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

Github 提供了一个可供用户访问仓库活动与代码的 API。你可以点击这里查看有关这一 API 的相关信息。同样,Github 也提供了众多选项 — 你可以搭建一个系统来自动进行代码质量评分,或者了解大型项目中代码随时间变化的情况。

开始使用 Github API

17. Quantopian

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》
《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

Quantopian 是一个可供你开发、测试股票交易算法并将其投入使用的网站。为了便于用户使用,网站提供免费的、精确到分钟的股票价格数据。这将可以帮助你搭建股价预测算法。

开始使用 Quantopian

18. Wunderground

《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》
《数据科学项目所需的数据集去哪里找?看看这 18 个来源吧!》

Wunderground 开放有提供天气预测数据的 API,每天可供免费调用 500 次。你可以使用这些调用次数来获取一系列历史天气数据,并据此预测明天的天气情况。

开始使用 Wunderground API

接下来的步骤

在这篇文章中,我们介绍了一些寻找多种数据集的好去处,适合各种类型的数据科学项目。希望你能在其中找到一些有趣的东西,找到一些足够让你沉浸其中无法自拔的东西!

如果你也在尝试自行搭建项目的话,欢迎你随时与我们沟通。你可以在这里找到我们!

Dataquest 将为你提供一系列互动式的指导性项目,这些项目将协助你构建能够向雇主展示技能的数据科学作品集,帮助你找到一份数据相关的工作。如果你感兴趣的话,请在这里注册并免费试用首个模组。

如果你觉得这篇文章还不错的话,那不妨看看我们“如何构建数据科学作品集”系列中的其它文章:

  • 用数据讲故事(Storytelling with data)
  • 如何搭建一个数据科学博客(How to setup up a data science blog)
  • 搭建一个机器学习项目(Building a machine learning project)
  • 如何构建一个能够帮你找到工作的数据科学作品集(The key to building a data science portfolio that will get you a job)
  • 如何在 Github 上展示你的数据科学作品集(How to present your data science portfolio on Github)

推荐阅读
  • Node.js 配置文件管理方法详解与最佳实践
    本文详细介绍了 Node.js 中配置文件管理的方法与最佳实践,涵盖常见的配置文件格式及其优缺点,并提供了多种实用技巧和示例代码,帮助开发者高效地管理和维护项目配置,具有较高的参考价值。 ... [详细]
  • CSS3 @font-face 字体应用技术解析与实践
    在Web前端开发中,HTML教程和CSS3的结合使得网页设计更加多样化。长期以来,Web设计师受限于“web-safe”字体的选择。然而,CSS3中的`@font-face`规则允许从服务器端加载自定义字体,极大地丰富了网页的视觉效果。通过这一技术,设计师可以自由选择和使用各种字体,提升用户体验和页面美观度。本文将深入解析`@font-face`的实现原理,并提供实际应用案例,帮助开发者更好地掌握这一强大工具。 ... [详细]
  • 技术分享:使用 Flask、AngularJS 和 Jinja2 构建高效前后端交互系统
    技术分享:使用 Flask、AngularJS 和 Jinja2 构建高效前后端交互系统 ... [详细]
  • 如何将TS文件转换为M3U8直播流:HLS与M3U8格式详解
    在视频传输领域,MP4虽然常见,但在直播场景中直接使用MP4格式存在诸多问题。例如,MP4文件的头部信息(如ftyp、moov)较大,导致初始加载时间较长,影响用户体验。相比之下,HLS(HTTP Live Streaming)协议及其M3U8格式更具优势。HLS通过将视频切分成多个小片段,并生成一个M3U8播放列表文件,实现低延迟和高稳定性。本文详细介绍了如何将TS文件转换为M3U8直播流,包括技术原理和具体操作步骤,帮助读者更好地理解和应用这一技术。 ... [详细]
  • Presto:高效即席查询引擎的深度解析与应用
    本文深入解析了Presto这一高效的即席查询引擎,详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式,显著提升了查询性能,相比传统的MapReduce查询,不仅减少了数据传输的延迟,还提高了查询的准确性和效率。然而,Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景,展示了其在大数据分析领域的强大潜力。 ... [详细]
  • CTF竞赛中文件上传技巧与安全绕过方法深入解析
    CTF竞赛中文件上传技巧与安全绕过方法深入解析 ... [详细]
  • 在 CentOS 6.6 系统中搭建 MONO 和 Jexus 以支持 ASP.NET 及 MVC 应用的运行环境配置指南
    本文提供了在 CentOS 6.6 系统上配置 MONO 和 Jexus 以支持 ASP.NET 及 MVC 应用的详细步骤。首先,确保本机环境为 CentOS 6.6,并使用阿里云的 YUM 源来安装必要的软件包,包括 gcc、gcc-c++、bison、pkgconfig 和 glib2-devel。这些软件包是构建和运行 MONO 环境的基础,确保系统能够顺利支持 ASP.NET 和 MVC 应用的部署和运行。 ... [详细]
  • 实现Nginx对ThinkPHP URL重写及PATHINFO支持的详细方法解析【PHP开发】
    在PHP后端开发中,实现Nginx对ThinkPHP的URL重写及PATHINFO支持是一项常见的需求。本文详细解析了经过多次尝试和研究,最终找到的一种有效配置方法,能够确保URL_MODERewrite功能正常运行,并提供稳定的服务。此外,文章还探讨了相关配置项的具体作用及其优化建议,帮助开发者更好地理解和应用这些技术。 ... [详细]
  • 全面解析JavaScript代码注释技巧与标准规范
    在Web前端开发中,JavaScript代码的可读性和维护性至关重要。本文将详细介绍如何有效地使用注释来提高代码的可读性,并探讨JavaScript代码注释的最佳实践和标准规范。通过合理的注释,开发者可以更好地理解和维护复杂的代码逻辑,提升团队协作效率。 ... [详细]
  • 系统转换的三种方法及其具体应用分析
    系统转换是信息技术领域中常见的任务,本文详细探讨了三种主要的系统转换方法及其具体应用场景。这些方法包括:代码迁移、数据迁移和平台迁移。文章通过实例分析了每种方法的优势和局限性,并提供了实际操作中的注意事项和技术要点。例如,代码迁移适用于从VB6获取网页源码,数据迁移在Ubuntu中用于隐藏侧边栏,而平台迁移则涉及Tomcat 6.0的使用和谷歌爬虫的测试。此外,文章还讨论了蓝翰互动PHP面试和5118 SEO工具在系统转换中的应用,为读者提供了全面的技术参考。 ... [详细]
  • Maven Web项目创建时JSP文件常见错误及解决方案
    Maven Web项目创建时JSP文件常见错误及解决方案 ... [详细]
  • Python 程序转换为 EXE 文件:详细解析 .py 脚本打包成独立可执行文件的方法与技巧
    在开发了几个简单的爬虫 Python 程序后,我决定将其封装成独立的可执行文件以便于分发和使用。为了实现这一目标,首先需要解决的是如何将 Python 脚本转换为 EXE 文件。在这个过程中,我选择了 Qt 作为 GUI 框架,因为之前对此并不熟悉,希望通过这个项目进一步学习和掌握 Qt 的基本用法。本文将详细介绍从 .py 脚本到 EXE 文件的整个过程,包括所需工具、具体步骤以及常见问题的解决方案。 ... [详细]
  • Python爬虫数据导出至CSV及图片存储技术详解
    Python爬虫数据导出至CSV及图片存储技术详解 ... [详细]
  • 利用爬虫技术抓取数据,结合Fiddler与Postman在Chrome中的应用优化提交流程
    本文探讨了如何利用爬虫技术抓取目标网站的数据,并结合Fiddler和Postman工具在Chrome浏览器中的应用,优化数据提交流程。通过详细的抓包分析和模拟提交,有效提升了数据抓取的效率和准确性。此外,文章还介绍了如何使用这些工具进行调试和优化,为开发者提供了实用的操作指南。 ... [详细]
  • 本文详细介绍了一种利用 ESP8266 01S 模块构建 Web 服务器的成功实践方案。通过具体的代码示例和详细的步骤说明,帮助读者快速掌握该模块的使用方法。在疫情期间,作者重新审视并研究了这一未被充分利用的模块,最终成功实现了 Web 服务器的功能。本文不仅提供了完整的代码实现,还涵盖了调试过程中遇到的常见问题及其解决方法,为初学者提供了宝贵的参考。 ... [详细]
author-avatar
nzl
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有