日志分析代码实现(字符串切割)

作者：手浪用户2502939427_143 | 来源：互联网 | 2023-09-25 09:08

日志分析代码实现(字符串切割)思路不使用正则表达式处理:进行字符串切割将[]和括起的内容特殊处理将每段数据转换为对应格式代码精简,代码效率检查importdatetime#目标日

日志分析代码实现(字符串切割)

思路
不使用正则表达式处理:进行字符串切割将[]和"括起的内容特殊处理将每段数据转换为对应格式代码精简,代码效率检查

import datetime # 目标日志 logline &＃61; &＃39;&＃39;&＃39;183.60.212.153 - - [19/Feb/2013:10:23:29 &＃43;0800] \ "GET /o2o/media.html?menu&＃61;3 HTTP/1.1" 200 16691 "-" \ "Mozilla/5.0 (compatible; EasouSpider; &＃43;http://www.easou.com/search/spider.html)"&＃39;&＃39;&＃39; clean_log &＃61; logline.split() # list #[&＃39;183.60.212.153&＃39;, &＃39;-&＃39;, &＃39;-&＃39;, &＃39;[19/Feb/2013:10:23:29&＃39;, &＃39;&＃43;0800]&＃39;,\ # &＃39;"GET&＃39;, &＃39;/o2o/media.html?menu&＃61;3&＃39;, &＃39;HTTP/1.1"&＃39;, &＃39;200&＃39;, &＃39;16691&＃39;, \ # &＃39;"-"&＃39;, &＃39;"Mozilla/5.0&＃39;, &＃39;(compatible;&＃39;, &＃39;EasouSpider;&＃39;, &＃39;&＃43;http://www.easou.com/search/spider.html)"&＃39;] # 转换时间格式 def convert_time(time:str): return datetime.datetime.strptime(time, &＃39;%d/%b/%Y:%H:%M:%S %z&＃39;) # 将request字符串切分为三段 def convert_request(request:str): return dict(zip((&＃39;method&＃39;,&＃39;url&＃39;,&＃39;protocol&＃39;),request.split())) # 给予对应字段名 names &＃61; [ &＃39;remote&＃39;,&＃39;&＃39;,&＃39;&＃39;,&＃39;time&＃39;, &＃39;request&＃39;,&＃39;status&＃39;,&＃39;size&＃39;,&＃39;&＃39;, &＃39;useragent&＃39; ] # 处理对应字段名的函数 operations &＃61; [ None,None,None,convert_time, convert_request,int,int,None, None ] # 切割字符串为合适格式 def log_clean(line:str,ret&＃61;None): if ret: ret &＃61; [] tmp &＃61; &＃39;&＃39; flag &＃61; False for word in line.split(): if word.startswith(&＃39;[&＃39;) or word.startswith(&＃39;"&＃39;): tmp &＃61; word.strip(&＃39;["&＃39;) if word.endswith(&＃39;"&＃39;) or word.endswith(&＃39;]&＃39;): ret.append(tmp) flag &＃61; False continue flag &＃61; True continue if flag: tmp &＃43;&＃61; &＃39; &＃39; &＃43; word if word.endswith(&＃39;"&＃39;) or word.endswith(&＃39;]&＃39;): ret.append(tmp.strip(&＃39;"]&＃39;)) flag &＃61; False continue else: ret.append(word) # 遍历处理后日志,根据对应字段,进行对应处理后再保存至新字典中 ret_d &＃61; {} log_clean(logline) for i, field in enumerate(ret): key &＃61; names[i] if operations[i]: ret_d[key] &＃61; operations[i](field) else: ret_d[key] &＃61; field print(ret_d)

转载于:https://blog.51cto.com/12074120/1980427

推荐阅读

request
（7）Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息，包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容，然后将爬取的信息写入Exce ... [详细]

蜡笔小新 2024-11-13 11:35:24
config
Spring详解（六）AOP

原文网址：https:www.cnblogs.comysoceanp7476379.html目录1、AOP什么？2、需求3、解决办法1:使用静态代理4 ... [详细]

蜡笔小新 2024-11-12 14:40:40
int
python解决CSF布料模拟滤波的批处理问题（解决获取多个点云数据las数据）

解决问题：1、批量读取点云las数据2、点云数据读与写出3、csf滤波分类参考：https:github.comsuyunzzzCSF论文题目ÿ ... [详细]

蜡笔小新 2024-11-12 11:32:15
config
如何使用 `org.apache.tomcat.websocket.server.WsServerContainer.findMapping()` 方法及其代码示例解析

如何使用 `org.apache.tomcat.websocket.server.WsServerContainer.findMapping()` 方法及其代码示例解析 ... [详细]

蜡笔小新 2024-11-11 10:08:55
php
网络爬虫的规范与限制

本文探讨了网络爬虫引发的问题及其解决方案，重点介绍了Robots协议的作用和使用方法，旨在为网络爬虫的合理使用提供指导。 ... [详细]

蜡笔小新 2024-11-13 15:45:41
runtime
SpringMVC 入门指南：快速上手 Java Web 开发

本文将带你快速了解 SpringMVC 框架的基本使用方法，通过实现一个简单的 Controller 并在浏览器中访问，展示 SpringMVC 的强大与简便。 ... [详细]

蜡笔小新 2024-11-13 14:22:01
php
Spring 切面配置中的切点表达式详解

本文介绍了如何在Spring框架中使用AspectJ风格的切面配置，详细解释了切点表达式的语法和常见示例，帮助开发者更好地理解和应用Spring AOP。 ... [详细]

蜡笔小新 2024-11-13 14:07:16
request
Spring Boot 中配置全局文件上传路径并实现文件上传功能

本文介绍如何在 Spring Boot 项目中配置全局文件上传路径，并通过读取配置项实现文件上传功能。通过这种方式，可以更好地管理和维护文件路径。 ... [详细]

蜡笔小新 2024-11-13 11:19:38
php
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
go
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
input
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新 2024-11-12 16:19:40
go
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57
main
检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0

检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0 ... [详细]

蜡笔小新 2024-11-12 11:35:01
request
Python 3 Scrapy 框架执行流程详解

本文详细介绍了如何在 Python 3 环境下安装和使用 Scrapy 框架，包括常用命令和执行流程。Scrapy 是一个强大的 Web 抓取框架，适用于数据挖掘、监控和自动化测试等多种场景。 ... [详细]

蜡笔小新 2024-11-12 10:51:15
request
DNS服务器证书与SSL证书：IP地址、域名注册、查询及CDN加速技术详解

在配置Nginx的SSL证书后，虽然HTTPS访问能够正常工作，但HTTP请求却会遇到400错误。本文详细解析了这一问题，并提供了Nginx配置的具体示例。此外，还深入探讨了DNS服务器证书、SSL证书的申请与安装流程，以及域名注册、查询方法和CDN加速技术的应用，帮助读者全面了解相关技术细节。 ... [详细]

蜡笔小新 2024-11-10 08:22:07

手浪用户2502939427_143

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章