我想使用 BeautifulSoup 制作站点地图。但是面对这个问题“TypeError:”NoneType”;对象不可订阅”
我正在尝试使用beautifulsoup从网站上抓取站点地图,但我面临着巨大的问题。这是我的代码,错误是 "TypeError: 'NoneType' object is not subscriptab…
Python Beautiful Soup 检索旧数据
我是 Beautiful Soup 的新手,我正在从以下页面检索信息 https://www.virginmedia .com/broadband/broadband-only。 它根据我需要检索数据,但现在我…
使用 python beautiful soup 从 oreilly 媒体网站提取书名
我正在尝试使用 python beautiful soup 从 oreilly 媒体网站中提取书名。 但是我看到书名不在页面源 html 中。 我正在使用此链接查看书籍: https://w…
如何使用 BeautifulSoup 访问“查看更多”选项卡的内容
我正在尝试从此 网站 我已找到“查看更多”执行器的特定 div: div _ngcontent-flo-app-c111 但无法访问其下的任何内容。我在这里缺少什么?…
字符串缩写中的转义字符不一致
我有正在尝试处理的文本。这里有 2 个例子: Example 1: An alternative way with *:

puts ["Toronto", "Maple Leafs"] * ', '
#Toronto…
如果语句不为真,Python 在下一行开始 for 循环
with open('./links.txt', 'r') as f: for line in f: browser.get(line) WebDriverWait(browser, 20).until(EC.element_to_be_clickable((By.CSS_SEL…
使用 beautiful soup 的 html 文档中缺少标签
我正在从 IMDB 进行网络抓取,并且正在尝试获取节目中某一集的年龄评级。检查网站时,您可以在此处看到证书标签。然而,当我使用 beautiful soup 并打…
使用 python 抓取延迟加载页面的所有条目
请参阅本页的欧洲央行新闻稿。这些可以追溯到 1997 年,所以如果能自动获取所有回到过去的链接就好了。 我找到了包含链接的标签 ('//*[@id="lazyload-…
使用python将数据写入excel时索引超出范围异常
从 URL 获取数据时出现错误,数据 [][] 中索引超出范围异常。 import requests from bs4 import BeautifulSoup import openpyxl import uuid row_numb…
Python 函数在尝试显示数据帧时返回 None
我试图从 bbc 食谱获取 url,然后获取信息,然后将其放入数据框中。当我尝试运行我所做的函数时,我得到的结果是“无”,我不确定为什么,因为它在我…
使用 BeautifulSoup 抓取多个网页的问题
我正在抓取一个网址(例如: https://bitinfocharts.com/ top-100-richest-dogecoin-addresses-4.html),URL 末尾的数字是页码。我正在尝试抓取多个…
如何使用 BeautifulSoup 从 hr 标签获取文本?
这是 HTML 的示例(我试图使其比实际看起来更简洁): random text Anonymous Nov 30 12:46pm
拆分问题:“NoneType”对象不可调用
我一直面临着分割/切片字符串的一个小问题: import requests from bs4 import BeautifulSoup url = 'http://www.example.com' r = requests.get(url)…
在Python中发送POST请求
我正在尝试抓取一个需要向表单发送 POST 请求以查询数据的网站。这是我正在使用的代码。 import requests headers = {'User-Agent': "Mozilla/5.0 (Wi…