python实现切割url得到域名、协议、主机名等各个字段

作者：魂牵夢绕的思念丶 | 来源：互联网 | 2023-09-03 20:32

有一个需求就是需要对url进行进一步的划分得到详细的各个字段信息，下面是简单的实现：#!usrbinpython#-*-coding:UTF-8-*-

有一个需求就是需要对url进行进一步的划分得到详细的各个字段信息&＃xff0c;下面是简单的实现&＃xff1a;

#!/usr/bin/python # -*- coding: UTF-8 -*- &＃39;&＃39;&＃39; __Author__:沂水寒城功能: 对URL进行分割&＃xff0c;基于urlparse, publicsuffix, urllib编写 &＃39;&＃39;&＃39; from urlparse import urlparse import codecs from publicsuffix import PublicSuffixList from urllib import splitport import redef domain_split(server_domain):&＃39;&＃39;&＃39;server_domain为网站所用服务名&＃43;域名分割域名, 得到前缀(服务名)、主机域名、后缀(顶级域名)输入www.baidu.com&＃xff0c;输出&＃39;www&＃39;, &＃39;baidu&＃39;, &＃39;com&＃39;输入172.31.137.240&＃xff0c;输出&＃39;&＃39;, &＃39;172.31.137.240&＃39;, &＃39;&＃39;&＃39;&＃39;&＃39;PSL_FILE &＃61; codecs.open(&＃39;public_suffix_list.dat&＃39;, encoding&＃61;&＃39;utf8&＃39;)psl &＃61; PublicSuffixList(PSL_FILE)domain &＃61; psl.get_public_suffix(server_domain)# 取域名的第一个字段&＃xff0c;即第一个&＃39;.&＃39;之前的为主机域名, 后面为顶级域名&＃xff0c;前面为所使用的服务if &＃39;.&＃39; in domain:server &＃61; server_domain[:-len(domain)]host &＃61; domain[:domain.index(&＃39;.&＃39;)]top &＃61; domain[domain.index(&＃39;.&＃39;):]hostname &＃61; server &＃43; host &＃43; topelse: # 说明提取域名失败&＃xff0c;例如172.31.137.240等IP形式&＃xff0c;此时全部当作主机域名server &＃61; &＃39;&＃39;host &＃61; server_domaintop &＃61; &＃39;&＃39;hostname &＃61; server_domainreturn server, host, top, hostnamedef url_split_new(url):&＃39;&＃39;&＃39;url分割&＃39;&＃39;&＃39;if not url.startswith(&＃39;http&＃39;): # 补全协议&＃xff0c;否则urlparse出错url &＃61; &＃39;http://&＃39; &＃43; urlparts &＃61; urlparse(url)# 服务&＃43;域名&＃39;www.baidu.api.com.cn&＃39;切分server, host, top, hostname &＃61; domain_split(parts.netloc)host, port &＃61; splitport(host)if port &＃61;&＃61; None: port &＃61; &＃39;&＃39;return {&＃39;protocol&＃39;: parts.scheme, &＃39;hostname&＃39;: hostname, &＃39;path&＃39;: parts.path}if __name__ &＃61;&＃61; &＃39;__main__&＃39;:print url_split_new(&＃39;http://www.baidu.com/&＃39;)print url_split(&＃39;http://www.baidu.com/&＃39;)

推荐阅读

merge
颜色迁移（reinhard VS welsh）

不要谈什么天分，运气，你需要的是一个截稿日，以及一个不交稿就能打爆你狗头的人，然后你就会被自己的才华吓到。------ ... [详细]

蜡笔小新 2023-10-17 21:20:36
php
Jquery 跨域问题

为什么80%的码农都做不了架构师？JQuery1.2后getJSON方法支持跨域读取json数据，原理是利用一个叫做jsonp的概念。当然 ... [详细]

蜡笔小新 2023-12-09 18:24:55
copy
Nginx使用（server参数配置）

本文介绍了Nginx的使用，重点讲解了server参数配置，包括端口号、主机名、根目录等内容。同时，还介绍了Nginx的反向代理功能。 ... [详细]

蜡笔小新 2023-12-14 17:08:34
function
实现下拉列表，点击其他位置自动隐藏效果的三种方式比较

目录实现效果：实现环境实现方法一：基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]

蜡笔小新 2023-12-14 15:03:14
io
android listview OnItemClickListener失效原因

最近在做listview时发现OnItemClickListener失效的问题，经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效，还会导致单击后listview每个item的背景改变，使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况，并提供了解决方法。 ... [详细]

蜡笔小新 2023-12-14 14:25:50
js
Html5-Canvas实现简易的抽奖转盘效果

本文介绍了如何使用Html5和Canvas标签来实现简易的抽奖转盘效果，同时使用了jQueryRotate.js旋转插件。文章中给出了主要的html和css代码，并展示了实现的基本效果。 ... [详细]

蜡笔小新 2023-12-13 06:02:20
import
第四章高阶函数（参数传递、高阶函数、lambda表达式）（python进阶）的讲解和应用

本文主要讲解了第四章高阶函数（参数传递、高阶函数、lambda表达式）的相关知识，包括函数参数传递机制和赋值机制、引用传递的概念和应用、默认参数的定义和使用等内容。同时介绍了高阶函数和lambda表达式的概念，并给出了一些实例代码进行演示。对于想要进一步提升python编程能力的读者来说，本文将是一个不错的学习资料。 ... [详细]

蜡笔小新 2023-12-12 15:52:48
join
Python自动提取文本中的时间（包含中文日期）及特殊时间识别方法

本文介绍了在处理不规则数据时如何使用Python自动提取文本中的时间日期，包括使用dateutil.parser模块统一日期字符串格式和使用datefinder模块提取日期。同时，还介绍了一段使用正则表达式的代码，可以支持中文日期和一些特殊的时间识别，例如'2012年12月12日'、'3小时前'、'在2012/12/13哈哈'等。 ... [详细]

蜡笔小新 2023-12-12 12:09:33
function
《JavaScript高等顺序设计》进修笔记：JavaScript中的事宜流和事宜处置惩罚顺序

JavaScript和HTML之间的交互是经由过程事宜完成的。事宜：文档或浏览器窗口中发作的一些特定的交互霎时。能够运用侦听器（或处置惩罚递次来预订事宜），以便事宜发作时实行相应的 ... [详细]

蜡笔小新 2023-12-11 11:40:52
io
判断两个数组是否包含相同元素的Python函数

本文介绍了一个Python函数same_set，用于判断两个相等长度的数组是否包含相同的元素。函数会忽略元素的顺序和重复次数，如果两个数组包含相同的元素，则返回1，否则返回0。文章还提供了函数的具体实现代码和样例输入输出。 ... [详细]

蜡笔小新 2023-12-10 11:48:02
js
JS兼容总结及解决方法

本文总结了在编写JS代码时，不同浏览器间的兼容性差异，并提供了相应的解决方法。其中包括阻止默认事件的代码示例和猎取兄弟节点的函数。这些方法可以帮助开发者在不同浏览器上实现一致的功能。 ... [详细]

蜡笔小新 2023-12-09 17:31:06
import
tcpdump 4.5.1 crash 深入分析

tcpdump 4.5.1 crash 深入分析 ... [详细]

蜡笔小新 2023-12-09 07:11:34
string
JavaSE笔试题-接口、抽象类、多态等问题解答

本文解答了JavaSE笔试题中关于接口、抽象类、多态等问题。包括Math类的取整数方法、接口是否可继承、抽象类是否可实现接口、抽象类是否可继承具体类、抽象类中是否可以有静态main方法等问题。同时介绍了面向对象的特征，以及Java中实现多态的机制。 ... [详细]

蜡笔小新 2023-12-14 10:01:13
js
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
grid
Python字典视图对象的示例和用法

本文介绍了Python字典视图对象的示例和用法。通过对示例代码的解释，展示了字典视图对象的基本操作和特点。字典视图对象可以通过迭代或转换为列表来获取字典的键或值。同时，字典视图对象也是动态的，可以反映字典的变化。通过学习字典视图对象的用法，可以更好地理解和处理字典数据。 ... [详细]

蜡笔小新 2023-12-09 09:14:13

魂牵夢绕的思念丶

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章