作者:皆靖所能 | 来源:互联网 | 2018-07-18 09:52
本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下:
#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8')
rc = re.compile(r'(?P.*?) ',re.I)
match = rc.finditer(xh)
rcr = re.compile(r'<[^>]+>',re.I)
f = codecs.open("xiaohei.txt", "w", "utf-8")
for i in rc.finditer(xh):
ss = i.group(0)
s1 = rcr.sub('',ss)
print (s1)
f.write(s1)
f.close()
希望本文所述对大家的Python程序设计有所帮助。
推荐阅读
本文详细介绍了如何在HTML前端开发中利用UINavigationController进行页面管理和数据传递,适合初学者和有一定基础的开发者学习。 ...
[详细]
蜡笔小新 2024-11-20 09:46:39
nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ...
[详细]
蜡笔小新 2024-11-21 16:03:49
本文探讨了在使用PHP进行后端开发时,遇到的一个常见问题:即在本地环境中能够正常通过CURL获取远程网页内容,但在服务器上却无法实现。我们将分析可能的原因并提供解决方案。 ...
[详细]
蜡笔小新 2024-11-21 10:31:32
探讨符合特定需求的个人网盘选择,包括分享功能、WebDAV支持及长期稳定性等。 ...
[详细]
蜡笔小新 2024-11-20 18:07:25
本文详细解析了ArrayList的工作原理及其性能特点,包括其内存分配机制和增删查改的操作效率。 ...
[详细]
蜡笔小新 2024-11-20 15:50:56
本文提供了详细的JDK下载和安装步骤,包括多个可靠的下载源、环境配置以及如何验证安装成功。同时,文章还涉及版权问题处理和个人见解分享。 ...
[详细]
蜡笔小新 2024-11-20 15:05:29
本文将详细介绍由百度WebFE团队开发的Web Uploader,这是一款集成了HTML5与Flash技术的上传组件,以其卓越的用户体验和强大的功能著称。 ...
[详细]
蜡笔小新 2024-11-20 14:51:32
为您带来最新的科技资讯,涵盖社交媒体动态、软件更新及行业重大事件。CSDN携手您共同关注科技前沿。 ...
[详细]
蜡笔小新 2024-11-20 12:38:19
本文精选了新浪PHP笔试题及最新的PHP面试题,并提供了详细的答案解析,帮助求职者更好地准备PHP相关的面试。 ...
[详细]
蜡笔小新 2024-11-19 20:00:19
在图论中,完全图是指一个无向图,其中任意两个不同的顶点之间都恰好有一条边相连。本文探讨了如何通过删除不超过指定数量的边,使得完全图中的连通分量数量最大化。 ...
[详细]
蜡笔小新 2024-11-19 17:54:27
探讨低代码行业发展现状,分析其未能催生大型企业的原因,包括市场需求、技术局限及商业模型等方面。 ...
[详细]
蜡笔小新 2024-11-19 14:38:02
本文详细记录了腾讯ABS云平台的一次前端开发岗位面试经历,包括面试过程中遇到的JavaScript相关问题、Vue.js等框架的深入探讨以及算法挑战等内容。 ...
[详细]
蜡笔小新 2024-11-19 12:59:38
POJ2263是一个经典的图论问题,涉及寻找从起点到终点的最大载重路径。本文将详细介绍该问题的背景、解题思路及代码实现。 ...
[详细]
蜡笔小新 2024-11-19 11:02:03
本文提供了《汇编语言 第3版》中检测点11.2的详细参考答案,包括了各指令执行后的状态标志分析。 ...
[详细]
蜡笔小新 2024-11-19 09:35:11
本文探讨了如何在百度地图最新SDK中将RouteLine显示在地图上,并提供了解决方案。 ...
[详细]
蜡笔小新 2024-11-18 17:25:02