热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Python网络爬虫与信息提取(3)——实战之IP地址归属地查询

前言前面学习了request库,这一节利用request库和beautifulsoup库爬取IP地址归属地。技术框架requests+bs4bs4官方介绍:Beautiful
前言

前面学习了request库,这一节利用request库和beautifulsoup库爬取IP地址归属地。

技术框架

requests + bs4
bs4官方介绍:

Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。
Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。你不需要考虑编码方式,除非文档没有指定一个编码方式,这时,Beautiful Soup就不能自动识别编码方式了。然后,你仅仅需要说明一下原始编码方式就可以了。
Beautiful Soup已成为和lxml、html6lib一样出色的python解释器,为用户灵活地提供不同的解析策略或强劲的速度。


整体思路

因为是爬虫,主要是爬取网站上的消息,这里我们常用的IP地址查询网站是ip138网站,网站链接:IP138
在这里插入图片描述
有了


推荐阅读
author-avatar
永无止境
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有