Python抓取百度查询结果的方法

作者：皆靖所能 | 来源：互联网 | 2018-07-18 09:52

这篇文章主要介绍了Python抓取百度查询结果的方法,涉及Python正则匹配及字符串与URL操作的相关技巧,需要的朋友可以参考下

本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下：

#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen("http://www.baidu.com/s&＃63;q1=123&rn=100").read().decode('utf-8') 
rc = re.compile(r'(&＃63;P.*&＃63;)',re.I)
match = rc.finditer(xh)
rcr = re.compile(r'<[^>]+>',re.I)
f = codecs.open("xiaohei.txt", "w", "utf-8")
for i in rc.finditer(xh):
  ss = i.group(0)
  s1 = rcr.sub('',ss)
  print (s1)
  f.write(s1)
f.close()

希望本文所述对大家的Python程序设计有所帮助。

推荐阅读

install
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
install
你根本不会用百度

本文转载自第2大脑，详情可以扫描下方二维码关注该公众号摘要：教你正确使用百度。想必你的朋友圈这两天应该被《搜索引擎百度已死》这篇文章刷屏了吧࿰ ... [详细]

蜡笔小新 2024-12-21 15:43:30
import
Python技巧：利用Cookie实现自动登录绕过验证码

本文详细介绍了如何通过Python和Selenium库利用浏览器Cookie实现自动登录，从而绕过验证码验证。文章提供了具体的操作步骤，并附有代码示例，帮助读者理解和实践。 ... [详细]

蜡笔小新 2024-12-21 15:24:54
email
SaltStack部署实践（4）JOB管理与Returns模块

目录一、salt-job管理#job存放数据目录#缓存时间设置#Others二、returns模块配置job数据入库#配置returns返回值信息#mysql安全设置#创建模块相关 ... [详细]

蜡笔小新 2024-12-22 18:53:43
email
深入理解ExtJS：从入门到精通

本文详细介绍了ExtJS的功能及其在大型企业前端开发中的应用。通过实例和详细的文件结构解析，帮助初学者快速掌握ExtJS的核心概念，并提供实用技巧和最佳实践。 ... [详细]

蜡笔小新 2024-12-21 15:41:04
email
使用EmguCV 4.5.4实现LSD直线检测的C#示例

欢迎关注“视觉与AI技术前沿”公众号，获取最新的计算机视觉和深度学习干货。本文将详细介绍如何使用EmguCV 4.5.4在C#中实现LSD（Line Segment Detector）直线检测，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-20 19:49:33
email
BSRC与补天携手推出2021暑期安全挑战赛

百度安全应急响应中心（BSRC）与补天漏洞响应平台共同举办2021年暑期挑战赛，提供丰厚奖励、联名证书及更多惊喜。活动时间从7月12日至7月31日。 ... [详细]

蜡笔小新 2024-12-20 19:32:40
email
Java SpringMVC SSM 实现多模块集成：操作日志、文件管理、头像编辑、权限控制及缓存优化

本文介绍了一个基于 Java SpringMVC 和 SSM 框架的综合系统，涵盖了操作日志记录、文件管理、头像编辑、权限控制、以及多种技术集成如 Shiro、Redis 等，旨在提供一个高效且功能丰富的开发平台。 ... [详细]

蜡笔小新 2024-12-20 19:17:47
tree
备战BAT面试：掌握这些MySQL核心问题

本文深入探讨了MySQL中常见的面试问题，包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析，帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]

蜡笔小新 2024-12-20 18:58:01
tree
深入解析 Android 值动画实现细节

本文详细介绍了如何在 Android 中使用值动画（ValueAnimator）来动态调整 ImageView 的高度，并探讨了相关的关键属性和方法，包括图片填充后的高度、原始图片高度、动画变化因子以及布局重置等。 ... [详细]

蜡笔小新 2024-12-20 17:58:54
tree
C语言数据类型详解

本文详细介绍了C语言中的基本数据类型，包括整型、浮点型、字符型及其各自的子类型，并探讨了这些类型在不同编译环境下的表现。 ... [详细]

蜡笔小新 2024-12-20 15:03:51
tree
数据排序、无限滚动与分页加载及子查询的使用

本文介绍了数据排序的基本方法，包括升序和降序排列。同时探讨了瀑布流布局（无限滚动）和传统分页技术在Web应用中的应用，并详细解释了子查询的概念及其替代方案。 ... [详细]

蜡笔小新 2024-12-20 13:20:11
import
解决Spring Boot项目创建失败的问题

在尝试创建新的Spring Boot项目时遇到了一些问题，具体表现为在项目创建过程中的两个关键步骤出现错误。本文将详细探讨这些问题及其解决方案。 ... [详细]

蜡笔小新 2024-12-20 10:15:24
import
百度AI Studio实战：利用高性能GPU集群进行线性回归

本文介绍百度AI Studio这一集成开发平台，涵盖丰富的AI教程、经典数据集及云端计算资源。通过具体示例——在AI Studio上构建线性回归项目，帮助初学者快速掌握其核心功能与操作方法。 ... [详细]

蜡笔小新 2024-12-20 06:24:41
import
JMeter接口关联与数据提取：正则表达式和JSON Extractor的使用

在使用JMeter进行接口测试时，常常需要从前一个接口的响应中提取数据并应用于后续请求。本文将详细介绍如何利用正则表达式提取器（Regular Expression Extractor）和JSON Extractor来实现这一需求。 ... [详细]

蜡笔小新 2024-12-19 16:31:21

皆靖所能

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章