如何在美丽的套件中与一个标签分开获取不同的文本?
我正在尝试从此Wikipedia页面上刮擦迪士尼电影的数据:
这是我的代码:
import pandas as pd
from bs4 import BeautifulSoup as bs
import requests
url="https://en.wikipedia.org/wiki/List_of_Walt_Disney_Pictures_films"
page=requests.get(url).content
soup=bs(page,"html.parser")
tbodies=soup.find_all("tbody")
for tbody in tbodies:
trs=tbody.find_all("tr")
for tr in trs:
tds=tr.find_all("td")
for td in tds:
print(td.text)
如您所见,我想获得的不同文本(标题,日期和注释)在此突出显示的“ TD”标签中。
我在代码末尾尝试了PRINT(TD [0] .TEXT)或打印(TD [2] .Text),但它返回错误。
如何分别打印这三个不同的文本?
ps我不想使用pd.read_html(url)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
要分别获取不同的文本,您可以使用CSS选择器而不是列表切片
输出:
To get different texts separately, You can use css selectors instead of list slicing
Output: