热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python爬虫3urllib请求库之parse模块

parse定义了处理URL的标准接口,实现URL的拆分,合并以及转换。1.urlparse()url拆分urlparse(urlstring,scheme‘’,allow_ragm

parse定义了处理URL的标准接口,实现URL的拆分,合并以及转换。

1.urlparse() url拆分

urlparse(urlstring,scheme=‘’,allow_ragments=True)



  • scheme:默认协议,如果url不带协议的时候生效;

  • allow_fragments:是否忽略fragment,如果忽略,会被解析成path,params或query的一部分。

将url拆分为6部分:



  • scheme:协议;

  • netloc:域名;

  • path:访问路径;

  • params:参数;

  • query:查询条件;

  • fragment:锚点

结果为元组,可用参数或索引取值。

代码:

技术分享图片

运行结果:

 

 技术分享图片

 

 

 2.urlunparse() url合并

urlunparse([scheme,netloc,path,params,query,frament])



  • 接受的参数为可迭代对象;

  • 个数必须为6个,否则报错

代码:

技术分享图片

 

运行结果:

 

 技术分享图片

 

3.urlsplit()

 

 和urlparse()相似,只是不再单独拆分params部分,将params合并到path中

4.urlunsplit()

和urlunparse()相似,唯一区别传入参数为5个

5.urljoin()

base_url作为第一个参数,新连接作为第二个参数,该方法会分析base_url中的scheme,netloc,path三部分内容,并对新链接确实的部分予以补充。

如果新链接中有这三部分,怎用新链接的,没有则用base_url中的。

而base_url中params,query,fragment不起作用。

6.urlencode()

在构造请求参数时非常有用,将字典类型的参数,序列化为url可用的参数。

7.parse_qs()

 与urlencode()相反,把url参数反序列化为字典。

8.parse_qsl()

将url参数转化为元组组成的列表,运行结果为列表,列表的每一个元素为元组。

9.quote()

将url中中文参数转化为url编码的格式,避免因中文参数导致乱码。

10.unquote()

和quote()相反

 


推荐阅读
  • 本文介绍了一种支付平台异步风控系统的架构模型,旨在为开发类似系统的工程师提供参考。 ... [详细]
  • 解决SQL Server数据库sa登录名无法连接的问题
    在安装SQL Server数据库后,使用Windows身份验证成功,但使用SQL Server身份验证时遇到问题。本文将介绍如何通过设置sa登录名的密码、启用登录名状态以及开启TCP协议来解决这一问题。 ... [详细]
  • 如果应用程序经常播放密集、急促而又短暂的音效(如游戏音效)那么使用MediaPlayer显得有些不太适合了。因为MediaPlayer存在如下缺点:1)延时时间较长,且资源占用率高 ... [详细]
  • 自动验证时页面显示问题的解决方法
    在使用自动验证功能时,页面未能正确显示错误信息。通过使用 `dump($info->getError())` 可以帮助诊断和解决问题。 ... [详细]
  • 蒜头君的倒水问题(矩阵快速幂优化)
    蒜头君将两杯热水分别倒入两个杯子中,每杯水的初始量分别为a毫升和b毫升。为了使水冷却,蒜头君采用了一种特殊的方式,即每次将第一杯中的x%的水倒入第二杯,同时将第二杯中的y%的水倒入第一杯。这种操作会重复进行k次,最终求出两杯水中各自的水量。 ... [详细]
  • 经过一年的思考,我发现自己对开发的兴趣并不浓厚,而对算法研究则更加热衷。本文将探讨开发与算法之间的本质差异,并分享我的未来学习计划。 ... [详细]
  • Bootstrap 缩略图展示示例
    本文将展示如何使用 Bootstrap 实现缩略图效果,并提供详细的代码示例。 ... [详细]
  • 网络爬虫的规范与限制
    本文探讨了网络爬虫引发的问题及其解决方案,重点介绍了Robots协议的作用和使用方法,旨在为网络爬虫的合理使用提供指导。 ... [详细]
  • 本文介绍了 AngularJS 中的 $compile 服务及其用法,通过示例代码展示了如何使用 $compile 动态编译和链接 HTML 元素。 ... [详细]
  • [c++基础]STL
    cppfig15_10.cppincludeincludeusingnamespacestd;templatevoidprintVector(constvector&integer ... [详细]
  • 本文详细介绍了如何解决DNS服务器配置转发无法解析的问题,包括编辑主配置文件和重启域名服务的具体步骤。 ... [详细]
  • 数字资产量化交易通过大数据分析,以客观的方式制定交易决策,有效减少人为的主观判断和情绪影响。本文介绍了几种常见的数字资产量化交易策略,包括搬砖套利和趋势交易,并探讨了量化交易软件的开发前景。 ... [详细]
  • 自定义滚动条美化页面内容
    当页面内容超出显示范围时,为了提升用户体验和页面美观,通常会添加滚动条。如果默认的浏览器滚动条无法满足设计需求,我们可以自定义一个符合要求的滚动条。本文将详细介绍自定义滚动条的实现过程。 ... [详细]
  • importpymysql#一、直接连接mysql数据库'''coonpymysql.connect(host'192.168.*.*',u ... [详细]
  • 微软推出Windows Terminal Preview v0.10
    微软近期发布了Windows Terminal Preview v0.10,用户可以在微软商店或GitHub上获取这一更新。该版本在2月份发布的v0.9基础上,新增了鼠标输入和复制Pane等功能。 ... [详细]
author-avatar
SREFLANKCWF
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有