热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python爬虫3urllib请求库之parse模块

parse定义了处理URL的标准接口,实现URL的拆分,合并以及转换。1.urlparse()url拆分urlparse(urlstring,scheme‘’,allow_ragm

parse定义了处理URL的标准接口,实现URL的拆分,合并以及转换。

1.urlparse() url拆分

urlparse(urlstring,scheme=‘’,allow_ragments=True)



  • scheme:默认协议,如果url不带协议的时候生效;

  • allow_fragments:是否忽略fragment,如果忽略,会被解析成path,params或query的一部分。

将url拆分为6部分:



  • scheme:协议;

  • netloc:域名;

  • path:访问路径;

  • params:参数;

  • query:查询条件;

  • fragment:锚点

结果为元组,可用参数或索引取值。

代码:

技术分享图片

运行结果:

 

 技术分享图片

 

 

 2.urlunparse() url合并

urlunparse([scheme,netloc,path,params,query,frament])



  • 接受的参数为可迭代对象;

  • 个数必须为6个,否则报错

代码:

技术分享图片

 

运行结果:

 

 技术分享图片

 

3.urlsplit()

 

 和urlparse()相似,只是不再单独拆分params部分,将params合并到path中

4.urlunsplit()

和urlunparse()相似,唯一区别传入参数为5个

5.urljoin()

base_url作为第一个参数,新连接作为第二个参数,该方法会分析base_url中的scheme,netloc,path三部分内容,并对新链接确实的部分予以补充。

如果新链接中有这三部分,怎用新链接的,没有则用base_url中的。

而base_url中params,query,fragment不起作用。

6.urlencode()

在构造请求参数时非常有用,将字典类型的参数,序列化为url可用的参数。

7.parse_qs()

 与urlencode()相反,把url参数反序列化为字典。

8.parse_qsl()

将url参数转化为元组组成的列表,运行结果为列表,列表的每一个元素为元组。

9.quote()

将url中中文参数转化为url编码的格式,避免因中文参数导致乱码。

10.unquote()

和quote()相反

 


推荐阅读
  • importjava.io.*;importjava.util.*;publicclass五子棋游戏{staticintm1;staticintn1;staticfinalintS ... [详细]
  • 在1995年,Simon Plouffe 发现了一种特殊的求和方法来表示某些常数。两年后,Bailey 和 Borwein 在他们的论文中发表了这一发现,这种方法被命名为 Bailey-Borwein-Plouffe (BBP) 公式。该问题要求计算圆周率 π 的第 n 个十六进制数字。 ... [详细]
  • 二维码的实现与应用
    本文介绍了二维码的基本概念、分类及其优缺点,并详细描述了如何使用Java编程语言结合第三方库(如ZXing和qrcode.jar)来实现二维码的生成与解析。 ... [详细]
  • 本文介绍了如何通过安装 sqlacodegen 和 pymysql 来根据现有的 MySQL 数据库自动生成 ORM 的模型文件(model.py)。此方法适用于需要快速搭建项目模型层的情况。 ... [详细]
  • 本文探讨了程序员这一职业的本质,认为他们是专注于问题解决的专业人士。文章深入分析了他们的日常工作状态、个人品质以及面对挑战时的态度,强调了编程不仅是一项技术活动,更是个人成长和精神修炼的过程。 ... [详细]
  • 我的读书清单(持续更新)201705311.《一千零一夜》2006(四五年级)2.《中华上下五千年》2008(初一)3.《鲁滨孙漂流记》2008(初二)4.《钢铁是怎样炼成的》20 ... [详细]
  • 本文介绍了如何通过C#语言调用动态链接库(DLL)中的函数来实现IC卡的基本操作,包括初始化设备、设置密码模式、获取设备状态等,并详细展示了将TextBox中的数据写入IC卡的具体实现方法。 ... [详细]
  • 本文详细介绍了C++中的构造函数,包括其定义、特点以及如何通过构造函数进行对象的初始化。此外,还探讨了转换构造函数的概念及其在不同情境下的应用,以及如何避免不必要的隐式类型转换。 ... [详细]
  • 数据类型--char一、char1.1char占用2个字节char取值范围:【0~65535】char采用unicode编码方式char类型的字面量用单引号括起来char可以存储一 ... [详细]
  • 本文详细介绍了iOS应用的生命周期,包括各个状态及其转换过程中的关键方法调用。 ... [详细]
  • 本文将从基础概念入手,详细探讨SpringMVC框架中DispatcherServlet如何通过HandlerMapping进行请求分发,以及其背后的源码实现细节。 ... [详细]
  • 解决Visual Studio Code中PHP Intelephense误报问题
    PHP作为一种高度灵活的编程语言,其代码结构可能导致Intelephense插件在某些情况下报告不必要的错误或警告。自1.3.3版本起,Intelephense引入了多个配置选项,允许用户根据具体的工作环境和编程风格调整这些诊断信息的显示。 ... [详细]
  • 在日常生活中,支付宝已成为不可或缺的支付工具之一。本文将详细介绍如何通过支付宝实现免费提现,帮助用户更好地管理个人财务,避免不必要的手续费支出。 ... [详细]
  • JUnit下的测试和suite
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • Windows操作系统提供了Encrypting File System (EFS)作为内置的数据加密工具,特别适用于对NTFS分区上的文件和文件夹进行加密处理。本文将详细介绍如何使用EFS加密文件夹,以及加密过程中的注意事项。 ... [详细]
author-avatar
SREFLANKCWF
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有