热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

从批量eml文件中提取附件的Python代码实现方法

本文介绍了使用Python代码从批量eml文件中提取附件的实现方法,包括获取eml附件信息、递归文件夹下所有文件、创建目的文件夹等步骤。通过该方法可以方便地提取eml文件中的附件,并保存到指定的文件夹中。

从批量eml文件中提取附件,使用方式如下

 


代码如下

1 import email
2 import os
3 import sys
4
5 #获取eml附件信息
6 def Get_Annex_Message(FilePath, Annex_Path):
7 global sum
8 try:
9 fp = open(FilePath, 'rb') #打开任意格式文件,通过email库来判断是否为eml文件
10 msg = email.message_from_binary_file(fp)
11 for part in msg.walk(): #循环信件中的每一个mime的数据块
12 if part.get_content_maintype() == 'multipart':
13 continue
14 Annex_name = part.get_filename()
15 if Annex_name: #如果附件存在名字
16 Annex_name = str(sum) + '.' + Annex_name
17 fp = open(os.path.join(Annex_Path, Annex_name), 'wb')
18 fp.write(part.get_payload(decode=True))
19 sum += 1
20
21 except Exception as e:
22 print(e)
23 return
24
25 #递归文件夹下所有文件
26 def List_Filepath(Eml_Path, Annex_Path):
27 for parent,dirnames,filenames in os.walk(Eml_Path): #遍历文件夹
28 for dirname in dirnames: #对文件夹进行递归
29 List_Filepath(dirname, Annex_Path)
30 for filename in filenames: #r对文件进行判断
31 FilePath = os.path.join(parent,filename)
32 Get_Annex_Message(FilePath, Annex_Path)
33
34 #创建目的文件夹
35 def Create_Dir(Annex_Path):
36 if os.path.exists(Annex_Path):
37 print("dir exists, Annex file will create in %s" % Annex_Path)
38 else:
39 os.mkdir(Annex_Path)
40
41 #主函数
42 def main():
43 global sum
44 sum = int(1)
45 Eml_Path = sys.argv[1] #第一个参数为eml所在文件夹
46 Annex_Path = sys.argv[2] #第二个参数为eml附件输出的路径
47 Create_Dir(Annex_Path) #创建保存附加的文件夹
48 List_Filepath(Eml_Path, Annex_Path)
49
50 if __name__ == "__main__":
51 main()
52

 


推荐阅读
  • 本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节,作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识,为后续的机器学习应用打下坚实的基础。 ... [详细]
  • 本文详细介绍了如何使用Python的多进程技术来高效地分块读取超大文件,并将其输出为多个文件。通过这种方式,可以显著提高读取速度和处理效率。 ... [详细]
  • Python 程序转换为 EXE 文件:详细解析 .py 脚本打包成独立可执行文件的方法与技巧
    在开发了几个简单的爬虫 Python 程序后,我决定将其封装成独立的可执行文件以便于分发和使用。为了实现这一目标,首先需要解决的是如何将 Python 脚本转换为 EXE 文件。在这个过程中,我选择了 Qt 作为 GUI 框架,因为之前对此并不熟悉,希望通过这个项目进一步学习和掌握 Qt 的基本用法。本文将详细介绍从 .py 脚本到 EXE 文件的整个过程,包括所需工具、具体步骤以及常见问题的解决方案。 ... [详细]
  • 本文介绍了如何使用Python爬取妙笔阁小说网仙侠系列中所有小说的信息,并将其保存为TXT和CSV格式。主要内容包括如何构造请求头以避免被网站封禁,以及如何利用XPath解析HTML并提取所需信息。 ... [详细]
  • 本文详细介绍了如何使用Python中的smtplib库来发送带有附件的邮件,并提供了完整的代码示例。作者:多测师_王sir,时间:2020年5月20日 17:24,微信:15367499889,公司:上海多测师信息有限公司。 ... [详细]
  • Python 序列图分割与可视化编程入门教程
    本文介绍了如何使用 Python 进行序列图的快速分割与可视化。通过一个实际案例,详细展示了从需求分析到代码实现的全过程。具体包括如何读取序列图数据、应用分割算法以及利用可视化库生成直观的图表,帮助非编程背景的用户也能轻松上手。 ... [详细]
  • vue引入echarts地图的四种方式
    一、vue中引入echart1、安装echarts:npminstallecharts--save2、在main.js文件中引入echarts实例:  Vue.prototype.$echartsecharts3、在需要用到echart图形的vue文件中引入:   importechartsfrom"echarts";4、如果用到map(地图),还 ... [详细]
  • C语言编写线程池的简单实现方法
    2019独角兽企业重金招聘Python工程师标准好文章,一起分享——有时我们会需要大量线程来处理一些相互独立的任务,为了避免频繁的申请释放线程所带 ... [详细]
  • 普通树(每个节点可以有任意数量的子节点)级序遍历 ... [详细]
  • Leetcode学习成长记:天池leetcode基础训练营Task01数组
    前言这是本人第一次参加由Datawhale举办的组队学习活动,这个活动每月一次,之前也一直关注,但未亲身参与过,这次看到活动 ... [详细]
  • python模块之正则
    re模块可以读懂你写的正则表达式根据你写的表达式去执行任务用re去操作正则正则表达式使用一些规则来检测一些字符串是否符合个人要求,从一段字符串中找到符合要求的内容。在 ... [详细]
  • 本文详细介绍了如何在 Django 项目中使用 Admin 管理后台,包括创建超级用户、启动项目、管理数据模型和修改用户密码等步骤。 ... [详细]
  • 本文介绍了如何在Spring框架中使用AspectJ实现AOP编程,重点讲解了通过注解配置切面的方法,包括方法执行前和方法执行后的增强处理。阅读本文前,请确保已安装并配置好AspectJ。 ... [详细]
  • 使用 Jupyter Notebook 实现 Markdown 编写与代码运行
    Jupyter Notebook 是一个开源的基于网页的应用程序,允许用户在同一文档中编写 Markdown 文本和运行多种编程语言的代码,并实时查看运行结果。 ... [详细]
  • 本文整理了一份基础的嵌入式Linux工程师笔试题,涵盖填空题、编程题和简答题,旨在帮助考生更好地准备考试。 ... [详细]
author-avatar
波波微博1987_704
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有