前言
1)python自动化文档手册
python自动化文章一直深受广大python爱好者的青睐。基于此,我花了整整一周时间真理出来的python自动化文档手册,涉及到五个章节(如下图所示),① python使用openpyxl操作excel;② python使用PyPDF2和pdfplumber操作pdf;③ python使用python-docx操作word;④ python使用python-pptx操作PPT;⑤ python如何自动收发邮件;⑥ python制作电话号码归属地查询工具。
2)关于本文的说明
python自动化操作word,excel,pdf的文章,大家有时候会看到发布这样的文章。但是python操作ppt的文章,却少之又少。因此,我将这篇文章单独整理出来,供大家学习参考。其余文章详细见文档。
3)关于文档的获取(文末获取)
python自动化文档手册文档已经整理成册(附带标签),手册中涉及到的数据都是自制。该文档已经上传,请勿滥用,如有盗版,必定追究。
本文目录
1、python-pptx模块简介
使用python操作PPT,需要使用的模块就是python-pptx,下面来对该模块做一个简单的介绍。这里提前做一个说明:python操作PPT,最好是我们提前设计好自己的一套样式,然后利用进行python进行内容的获取和填充(最主要的功能!),最好是不用使用python代码操作PPT的格式,格式的修改肯定不如我们直接在PPT中修改方便。
2、模块的安装与导入
1)模块的安装
"Windows用户命令行下输入"
pip install python-pptx
"Mac用户命令行下输入"
pip3 install python-pptx
2)模块的导入
这里有一点需要注意的是:安装的库是python-pptx,但是导入的时候却有点不同。
import pptx
3、python读取PPT文档中的内容
1)PPT的结构说明
在使用python操作PPT之前,首先应该清楚PPT的结构,这个对于之后代码的编写很有帮助。
注意:关于run块儿的概念,可以参考我的另外一篇文章https://blog.csdn.net/weixin_41261833/article/details/106028038
2)获取Slide
from pptx import Presentation
prs = Presentation("统计学习方法PPT.pptx")
for slide in prs.slides:
print(slide)
结果如下:
3)获取Shape形状
import pptx
from pptx import Presentation
prs = Presentation("统计学习方法PPT.pptx")
for slide in prs.slides:
for shape in slide.shapes:
print(shape)
"""
注意:这里得到的Shape对象,并不能看出什么,接着往下看。
"""
结果如下:
4)判断每个Shape中是否存在文字
import pptx
from pptx import Presentation
prs = Presentation("统计学习方法PPT.pptx")
for slide in prs.slides:
for shape in slide.shapes:
if shape.has_text_frame:
text_frame = shape.text_frame
print(text_frame.text)
结果如下:
5)获取某一页Slide中的内容
import pptx
from pptx import Presentation
prs = Presentation("统计学习方法PPT.pptx")
for i,slide in enumerate(prs.slides):
if i == 5:
for shape in slide.shapes:
if shape.has_text_frame:
text_frame = shape.text_frame
print(text_frame.text)
结果如下:
6)获取Shape中的某个Paragraph
import pptx
from pptx import Presentation
prs = Presentation("统计学习方法PPT.pptx")
for i,slide in enumerate(prs.slides):
if i == 5:
for shape in slide.shapes:
if shape.has_text_frame:
text_frame = shape.text_frame
for paragraph in text_frame.paragraphs:
print(paragraph.text)
"""
注意:该方法和上述4)中的方法一摸一样。上述方法是直接获取Shpae中的文字内容;
下面这个更灵活,先获取每个Shape,然后在获取每个Shape中的paragraph;
下面方式更好:因为我们可以针对paragraph,写一个判断条件,只获取第几个paragraph;
"""
结果如下:
4、利用python像PPT中写入内容
1)幻灯片模板及占位符的概念
2)怎么自定义母版?
https://jingyan.baidu.com/article/925f8cb8b5dfe7c0dce05671.html
3)什么是版式?
这个概念在下面的效果中,会得以体现。其中prs.slide_layouts传入0表示获取的是第一个版式,传入1表示获取的是第二个版式,以此类推下去。
4)添加Slide和内容
这里就需要使用上述的自定义母版。因为毕竟是使用python操作PPT,我们可以定义好自己想要展示的PPT母版,然后借助代码完成PPT的内容写入操作。
① 占位符id的确认
import pptx
from pptx import Presentation
prs = Presentation("空白.pptx")
# prs.slide_layouts表示的是ppt中不同的版式
slide = prs.slides.add_slide(prs.slide_layouts[0])
for shape in slide.placeholders:
phf = shape.placeholder_format
print(f"{phf.idx}--{shape.name}--{phf.type}")
shape.text = f"{phf.idx}--{shape.name}--{phf.type}"
# 注意:做完这个操作,一定要记得保存一下!
prs.save("电子奖状模板.pptx")
"""
上述打印结果如下:
0--Title 1--TITLE (1) 这个表示标题占位符,id为0
13--Picture Placeholder 2--PICTURE (18) 这个表示图片占位符,id为13
14--Text Placeholder 3--BODY (2) 这个表示正文内容占位符,id为14
15--Text Placeholder 4--BODY (2) 这个表示正文内容占位符,id为15
我们一定要先知道每个空格的占位符id,才可以进行下面内容的填充。
"""
效果如下:
② PPT内容的填写
import pptx
from pptx import Presentation
prs = Presentation("空白.pptx")
slide = prs.slides.add_slide(prs.slide_layouts[0])
name = slide.placeholders[14]
why = slide.placeholders[15]
name.text = "黄同学"
why.text = "学习太积极"
prs.save("内容填充.pptx")
效果如下:
5)添加段落
① 占位符id的确认
import pptx
from pptx import Presentation
prs = Presentation("finall.pptx")
slide = prs.slides.add_slide(prs.slide_layouts[0])
for shape in slide.placeholders:
phf = shape.placeholder_format
print(f"{phf.idx}--{shape.name}--{phf.type}")
shape.text = f"{phf.idx}--{shape.name}--{phf.type}"
print("-------------------------------------------")
slide = prs.slides.add_slide(prs.slide_layouts[1])
for shape in slide.placeholders:
phf = shape.placeholder_format
print(f"{phf.idx}--{shape.name}--{phf.type}")
shape.text = f"{phf.idx}--{shape.name}--{phf.type}"
prs.save("哈哈.pptx")
效果如下:
② 段落的添加
import pptx
from pptx import Presentation
prs = Presentation("finall.pptx")
slide = prs.slides.add_slide(prs.slide_layouts[0])
name = slide.placeholders[14]
why = slide.placeholders[15]
name.text = "黄同学"
why.text = "学习太积极"
# --------------------------------------------------- #
prs1 = Presentation("finall.pptx")
slide1 = prs.slides.add_slide(prs.slide_layouts[1])
shapes = slide1.shapes
title_shape = shapes.title # 这句代码可以改为title_shape = shapes.placeholders[0]
body_shape = shapes.placeholders[1]
title_shape.text = "这是一个标题"
tf = body_shape.text_frame
# 这句代码就是给body占位符添加内容!
tf.text = "带圆点的符号1"
p = tf.add_paragraph
# 这个代码表示在原来的基础上,添加第一个段落!
p.text = "带圆点的符号2"
p = tf.add_paragraph
# 这个代码表示在原来的基础上,添加第二个段落!
p.text = "带圆点的符号3"
prs.save("嘿嘿.pptx")
效果如下:
③ 给段落设定层级关系
import pptx
from pptx import Presentation
prs = Presentation("finall.pptx")
slide = prs.slides.add_slide(prs.slide_layouts[0])
name = slide.placeholders[14]
why = slide.placeholders[15]
name.text = "黄同学"
why.text = "学习太积极"
# --------------------------------------------------- #
prs1 = Presentation("finall.pptx")
slide1 = prs.slides.add_slide(prs.slide_layouts[1])
shapes = slide1.shapes
title_shape = shapes.title # 这句代码可以改为title_shape = shapes.placeholders[0]
body_shape = shapes.placeholders[1]
title_shape.text = "这是一个标题"
tf = body_shape.text_frame
tf.text = "带圆点的符号1"
p = tf.add_paragraph
p.text = "带圆点的符号2"
# 原始内容的层级相当于是0,因此这个段落我设置为层级1,下面的段落设置为层级2
p.level = 1
p = tf.add_paragraph
p.text = "带圆点的符号3"
p.level = 2
prs.save("嘻嘻.pptx")
效果如下:
④ 添加一个文本框
from pptx import Presentation
from pptx.util import Cm, Pt
prs = Presentation
# 使用第一个版式
black_slide_layout = prs.slide_layouts[0]
slide = prs.slides.add_slide(black_slide_layout)
left = top = width = height = Cm(3)
text_box = slide.shapes.add_textbox(left, top, width, height)
tf = text_box.text_frame
tf.text = "这是一段文本框里面的文字"
p = tf.add_paragraph
p.text = "这是第二段文字,加粗,字号40"
p.font.bold = True
p.font.size = Pt(40)
prs.save("添加一个文本框0.pptx")
效果如下:
⑤ 添加一个图片
slide.shapes.add_picture(图片路径, 距离左边, 距离顶端, 宽度, 高度)
第一种展示:
from pptx import Presentation
from pptx.util import Cm
prs = Presentation
# 使用第七个版式
black_slide_layout = prs.slide_layouts[6]
slide = prs.slides.add_slide(black_slide_layout)
left = top = Cm(3)
pic = slide.shapes.add_picture("孙悟空.png