python利用正则表达式提取字符串的方法

作者：qianweirui7058 | 来源：互联网 | 2017-05-14 02:44

前言正则表达式的基础知识就不说了,有兴趣的可以点击这里，提取一般分两种情况，一种是提取在文本中提取单个位置的字符串，另一种是提取连续多个位置的字符串。日志分析会遇到这种情况，下面我会分别讲一下对应的方法。一、单个位置的字符串提取这种情况我们可以使用(.+?)这个正则表达

前言
正则表达式的基础知识就不说了,有兴趣的可以点击这里，提取一般分两种情况，一种是提取在文本中提取单个位置的字符串，另一种是提取连续多个位置的字符串。日志分析会遇到这种情况，下面我会分别讲一下对应的方法。
一、单个位置的字符串提取
这种情况我们可以使用(.+?)这个正则表达式来提取。举例，一个字符串"a123b",如果我们想提取ab之间的值123，可以使用findall配合正则表达式，这样会返回一个包含所以符合情况的list。
代码如下：

import re
str = "a123b"
print re.findall(r"a(.+?)b",str)#
输出[&＃39;123&＃39;]

1.1贪婪和非贪婪匹配
如果我们有一个字符串”a123b456b”，如果我们想匹配a和最后一个b之间的所有值而非a和第一个出现的b之间的值，可以用?来控制正则贪婪和非贪婪匹配的情况。
代码如下：

import re
str = "a123b456b"
print re.findall(r"a(.+?)b", str)
#输出[&＃39;123&＃39;]#?控制只匹配0或1个,所以只会输出和最近的b之间的匹配情况
print re.findall(r"a(.+)b", str)
#输出[&＃39;123b456&＃39;]
print re.findall(r"a(.*)b", str)
#输出[&＃39;123b456&＃39;]

1.2多行匹配
如果你要多行匹配，那么需要加上re.S和re.M标志. 加上re.S后。将会匹配换行符，默认.不会匹配换行符。
代码如下：

str = "a23b\na34b"
re.findall(r"a(\d+)b.+a(\d+)b", str)
#输出[]
#因为不能处理str中间有\n换行的情况
re.findall(r"a(\d+)b.+a(\d+)b", str, re.S)
#s输出[(&＃39;23&＃39;, &＃39;34&＃39;)]

加上re.M后,^$标志将会匹配每一行，默认^和$只会匹配第一行。
代码如下：

str = "a23b\na34b"
re.findall(r"^a(\d+)b", str)
#输出[&＃39;23&＃39;]
re.findall(r"^a(\d+)b", str, re.M)
#输出[&＃39;23&＃39;, &＃39;34&＃39;]

二、连续多个位置的字符串提取
这种情况我们可以使用

(?P…)

这个正则表达式来提取。举例，如果我们有一行webserver的access日志:

&＃39;192.168.0.1 25/Oct/2012:14:46:34 "GET /api HTTP/1.1" 200 44 "http://abc.com/search" "Mozilla/5.0"&＃39;

，我们想提取这行日志里面所有的内容，可以写多个

(?Pexpr)

来提取,其中name可以更改为你为该位置字符串命名的变量，expr改成提取位置的正则即可。
代码如下：

import re
line =&＃39;192.168.0.1 25/Oct/2012:14:46:34 "GET /api HTTP/1.1" 200 44 "http://abc.com/search" 
"Mozilla/5.0"&＃39;
reg = re.compile(&＃39;^(?P[^ ]*) (?P[^ ]*) "(?P[^"]*)" 
(?P[^ ]*) (?P[^ ]*) "(?P[^"]*)" "(?P[^"]*)"&＃39;)
regMatch = reg.match(line)
linebits = regMatch.groupdict()
print linebits
for k, v in linebits.items() :
 print k+": "+v

输出的结果为：

status: 200
referrer: 
request: GET /api HTTP/1.1
user_agent: Mozilla/5.0
date: 25/Oct/2012:14:46:34size: 44
remote_ip: 192.168.0.1

总结
以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有疑问大家可以留言交流。

以上就是python利用正则表达式提取字符串的方法的详细内容，更多请关注第一PHP社区其它相关文章！

python
php

推荐阅读

client
Python网络编程：深入探讨TCP粘包问题及解决方案

本文详细探讨了TCP协议下的粘包现象及其产生的原因，并提供了通过自定义报头解决粘包问题的具体实现方案。同时，对比了TCP与UDP协议在数据传输上的不同特性。 ... [详细]

蜡笔小新 2024-11-23 15:55:15
settings
利用Scrapy构建的数据采集与分析可视化系统

本文探讨了如何使用Scrapy框架构建高效的数据采集系统，以及如何通过异步处理技术提升数据存储的效率。同时，文章还介绍了针对不同网站采用的不同采集策略。 ... [详细]

蜡笔小新 2024-11-23 16:56:38
settings
Python环境下OpenCV的安装与验证方法

本文介绍了如何在Python环境中安装OpenCV库及其额外模块，并提供了验证安装是否成功的具体步骤和代码示例。 ... [详细]

蜡笔小新 2024-11-23 18:14:52
jsp
AOJ1024 清洁机器人2.0

本文介绍了一个来自AIZU ONLINE JUDGE平台的问题，即清洁机器人2.0。该问题来源于某次编程竞赛，涉及复杂的算法逻辑与实现技巧。 ... [详细]

蜡笔小新 2024-11-23 17:16:33
jsp
PHP版本选择指南：适应不同场景的最佳实践

本文详细探讨了如何根据不同的应用场景选择合适的PHP版本，包括多版本切换技巧、稳定性分析及针对WordPress等特定平台的版本建议。 ... [详细]

蜡笔小新 2024-11-23 17:00:59
jsp
使用CorelDRAW X7轻松绘制卡通风格杯子教程

本文将引导您通过CorelDRAW X7软件，利用贝塞尔工具和交互式填充功能，创作出一个既可爱又生动的卡通杯子。我们将详细介绍每个步骤，帮助您掌握绘制技巧。 ... [详细]

蜡笔小新 2024-11-23 16:38:47
export
egg实现登录鉴权（七）：权限管理

权限管理包含三部分：访问页面的权限，操作功能的权限和获取数据权限。页面权限：登录用户所属角色的可访问页面的权限功能权限：登录用户所属角色的可访问页面的操作权限数据权限：登录用户所属 ... [详细]

蜡笔小新 2024-11-23 16:30:15
jsp
iOS开发中的UIView及其子类应用

本文介绍了用户界面（User Interface, UI）的基本概念，以及在iOS应用程序中UIView及其子类的重要性和使用方式。文章详细探讨了UIView如何作为用户交互的核心组件，以及它与其他UI控件和业务逻辑的关系。 ... [详细]

蜡笔小新 2024-11-23 16:25:09
jsp
线性表中的元素删除算法

本文探讨了线性表中元素的删除方法，包括顺序表和链表的不同实现策略，以及这些策略在实际应用中的性能分析。 ... [详细]

蜡笔小新 2024-11-23 16:14:36
jsp
《风流子》译文与赏析——宋代词人宋方君的诗意世界

本文深入解析宋代著名词人宋方君的作品《风流子》，通过细腻的译文和独到的赏析，带领读者走进词人的内心世界，感受其独特的艺术魅力。 ... [详细]

蜡笔小新 2024-11-23 16:11:01
jsp
在AI设计中精准对齐单个对象而不影响其他对象

本文将详细介绍如何在Adobe Illustrator中实现仅移动一个对象以完成对齐，同时确保另一个对象保持原位不变的方法。通过具体的操作步骤，帮助设计师们更加高效地完成设计任务。 ... [详细]

蜡笔小新 2024-11-23 16:03:27
jsp
实现Win10与Linux服务器的SSH无密码登录

本文介绍了如何在Windows 10环境下使用Git工具，通过配置SSH密钥对，实现与Linux服务器的无密码登录。主要步骤包括生成本地公钥、上传至服务器以及配置服务器端的信任关系。 ... [详细]

蜡笔小新 2024-11-23 15:50:03
jsp
PHP中Smarty模板引擎自定义函数详解

本文详细介绍了如何在PHP的Smarty模板引擎中自定义函数，并通过具体示例演示了这些函数的使用方法和应用场景。适合PHP后端开发者学习。 ... [详细]

蜡笔小新 2024-11-23 15:39:25
jsp
利用他人信息注册游戏账号的反思与讨论

本文探讨了在无法使用个人身份信息的情况下，利用他人（如网络上公开的个人信息）注册游戏账号的行为及其潜在的法律和道德问题。 ... [详细]

蜡笔小新 2024-11-23 15:35:44
client
深入解析Apache Mina开发指南

本文由chszs撰写，详细介绍了Apache Mina框架的核心开发流程及自定义协议处理方法。文章涵盖从创建IoService实例到协议编解码的具体步骤，适合希望深入了解Mina框架应用的开发者。 ... [详细]

蜡笔小新 2024-11-23 15:02:21

qianweirui7058

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章