作者:ndmlhr | 来源:互联网 | 2023-10-10 12:18
请问一下各位大神,我该怎么获取两个
xx........
XX获取XX也获取.....中的内容!
谢谢了~
5 个解决方案
lxml模块里面有个tail 可以获取节点之后的内容 http://blog.csdn.net/betabin/article/details/24392369
用scrapy模块,里面用xpath+正则解析就可以了
reg = r''
name = re.findall(reg, html)
from bs4 import BeautifulSoup
import urllib.request
def GetURL(url):
html=urllib.request.urlopen(url)
soup=BeautifulSoup(html)
ls=soup.find_all('p')
for l in ls:
s=l.find_all('span')
print(s)