热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

新手--Python爬虫请问一下这个怎么爬取?

请问一下各位大神,我该怎么获取两个<span>xx<span>..<span>XX<span>获取XX也获取..中的内容!

请问一下各位大神,我该怎么获取两个xx........XX获取XX也获取.....中的内容!
谢谢了~

5 个解决方案

#1


lxml模块里面有个tail 可以获取节点之后的内容   http://blog.csdn.net/betabin/article/details/24392369

#2


学了正则表达式就简单好多呢

#3


用scrapy模块,里面用xpath+正则解析就可以了

#4


 reg = r'
    name = re.findall(reg, html)

#5


from bs4 import BeautifulSoup
import urllib.request

def GetURL(url):
    html=urllib.request.urlopen(url)
    soup=BeautifulSoup(html)
    ls=soup.find_all('p')
    for l in ls:
        s=l.find_all('span')
        print(s)

推荐阅读
author-avatar
ndmlhr
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有