作者:农大军乐团_697 | 来源:互联网 | 2023-01-27 19:52
我有一本关于BeautifulSoup的书和文档.两者都说我应该能够链接find/find_all方法并使用下标从单页抓取中获得我想要的内容.情况似乎并非如此.请考虑下表.
Dresser ! **Louise Dresser **
Ship ! A Ship Comes In
Pleznik ! Mrs. Pleznik
Swanson ! Gloria Swanson
Sadie Thompson
Thompson ! Sadie Thompson
1928 /29
(2nd)
Pickford ! **Mary Pickford **
对于每个表行,我需要获取第一个元素,然后是第一个嵌套标记内的文本.Lousie Dresser将成为第一个数据点,其次是Gloria Swanson,然后是Mary Pickford.
我以为以下会让我在那里,但我错了,6个小时后我就花了.
def getActresses(URL):
try:
html = urlopen(URL)
except HTTPError:
print("Page not found.")
return None
try:
bsObj = BeautifulSoup(html, "lxml")
soup = bsObj.find("table", {"class":"wikitable sortable"})
except AttributeError:
print("Error creating/navigating soup object")
data = soup.find_all("tr").find_all("td").find("a").get_text()
print(data)
getActresses("https://en.wikipedia.org/wiki/Academy_Award_for_Best_Actress")
这不是我尝试过的唯一代码.我尝试循环遍历行,然后表格数据单元格,然后访问标签.我已经尝试过要求标签然后重新制作它们,只是被告知我没有我想要的文本.我尝试连接操作时遇到的最常见的错误(如上所述)是AttributeError: 'ResultSet' object has no attribute 'find'.
订阅绝对不起作用,即使复制书籍示例(去图?!).此外,我已经让流程中止了,我不知道这是可能的.
关于正在发生什么以及为什么应该如此简单的事情的想法似乎是这样一个事件将受到极大的赞赏.
1> Jeeva..: import requests
from bs4 import BeautifulSoup
def getActresses(URL):
res = requests.get(URL)
try:
soup = BeautifulSoup(res.content, "lxml")
table = soup.find("table", {"class":"wikitable sortable"})
except AttributeError:
print("Error creating/navigating soup object")
tr = table.find_all("tr")
for _tr in tr:
td = _tr.find_all("td")
for _td in td:
a = _td.find_all("a")
for _a in a:
print(_a.text.encode("utf-8"))
getActresses("https://en.wikipedia.org/wiki/Academy_Award_for_Best_Actress")
使用text
而不是get_text()
抱歉我使用requests
模块来演示
find_all
方法总是返回一个列表,所以你必须循环它
推荐阅读
篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ...
[详细]
蜡笔小新 2023-12-14 15:18:35
最近在做listview时发现OnItemClickListener失效的问题,经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效,还会导致单击后listview每个item的背景改变,使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况,并提供了解决方法。 ...
[详细]
蜡笔小新 2023-12-14 14:25:50
本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ...
[详细]
蜡笔小新 2023-12-14 18:28:01
在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ...
[详细]
蜡笔小新 2023-12-14 17:34:00
本文介绍了使用kotlin实现动画效果的方法,包括上下移动、放大缩小、旋转等功能。通过代码示例演示了如何使用ObjectAnimator和AnimatorSet来实现动画效果,并提供了实现抖动效果的代码。同时还介绍了如何使用translationY和translationX来实现上下和左右移动的效果。最后还提供了一个anim_small.xml文件的代码示例,可以用来实现放大缩小的效果。 ...
[详细]
蜡笔小新 2023-12-14 17:29:08
本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断,区分默认命名空间和自定义命名空间,并采用不同的解析方式。其中,bean标签的解析最为复杂和重要。 ...
[详细]
蜡笔小新 2023-12-14 17:24:50
本文分享了一个关于在C#中使用异步代码的问题,作者在控制台中运行时代码正常工作,但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机,但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ...
[详细]
蜡笔小新 2023-12-14 15:56:00
本文介绍了Linux系统中重启网络命令的实例,以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法,以及使用shutdown命令进行系统关机和重启的句法和用法。 ...
[详细]
蜡笔小新 2023-12-14 15:52:52
本文介绍了Redis的基础数据结构string的应用场景,并以面试的形式进行问答讲解,帮助读者更好地理解和应用Redis。同时,描述了一位面试者的心理状态和面试官的行为。 ...
[详细]
蜡笔小新 2023-12-14 14:02:42
本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ...
[详细]
蜡笔小新 2023-12-14 13:56:20
本文从源码解析Java容器中的compareto方法的排序原理,讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点,回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录,展示了整个讲解过程。 ...
[详细]
蜡笔小新 2023-12-14 13:53:31
本文介绍了eclipse学习中的第三章内容,主要讲解了ssh中的Hibernate的缓存,包括2级缓存和get方法、load方法的区别。文章还涉及了项目实践和相关知识点的讲解。 ...
[详细]
蜡笔小新 2023-12-14 00:31:35
本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ...
[详细]
蜡笔小新 2023-12-13 22:09:56
本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ...
[详细]
蜡笔小新 2023-12-13 17:45:15
本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ...
[详细]
蜡笔小新 2023-12-13 16:05:14