本文由我司收集整编,推荐下载,如有疑问,请与我司联系
如何在
Python
中生成
HTML
文本的目录?
如何在
Python
中生成
HTML
文本的目录?
[
英
]How
do
I
generate
a
table
of
contents
for
HTML
text
in
Python?
Assume
that
I
have
some
HTML
code,
like
this
(generated from Markdown or Textile or something):
假设我有一些
HTML
代码
,
如此
(
从
Markdown
或
Textile
或其他东西生成
):
h1
A
header
/h1
p
Foo
/p
h2
Another
header
/h2
p
More
content
/p
h2
Different header /h2
h1 Another toplevel header !-- and so on --
How could I generate
a table of contents for it using Python?
我怎么能用
Python
为它生成一个目录
?
6
Use an HTML parser such as lxml or BeautifulSoup to find all header elements.
使用
HTML
解析器
(
如
lxml
或
BeautifulSoup)
查找所有标题元素。
3
Here’s an example using lxml and xpath.
这是使用
lxml
和
xpath
的示例。
from
lxml
import
etreedoc
=
etree.parse(“test.xml”)for
node
in
doc.xpath(‘//h1|//h2|//h3|//h4|//h5’):
print
node.tag,
node.texttips:
感谢大家的阅读,本文
由我司收集整编。仅供参阅!