BeautifulSoup:属性错误:'NavigableString'对象没有属性“名称”;
你知道为什么 BeautifulSoup 教程中的第一个例子 http://www.crummy.com /software/BeautifulSoup/documentation.html#QuickStart 给出 AttributeErro…
BeautifulStoneSoup - 如何取消转义并添加结束标签
我正在此处编辑原始帖子以进行澄清,并希望我已将其简化为更易于管理的内容。我有一个 xml 字符串,看起来像: <img alt="jules.png" src="http://…
使用 beautiful soup 基于类和 href 标签解析 html 标签
我正在尝试使用 BeautifulSoup 解析 HTML。 我想要的内容是这样的: Title 我尝试并得到以下错误: maxx = soup.findAll("href", {"class: "yil-biz-t…
Beautiful Soup - 如何修复损坏的标签
我想知道如何在使用 Beautiful Soup 解析之前修复损坏的 html 标签。 在以下脚本中,td> 需要替换为 。 我怎样才能进行替换以便 Beautiful Soup 可以…
Beautiful Soup - 如何解析表的列并将它们插入到两个列表中
我正在尝试解析一个包含两列的表,并将每列中的文本插入到两个列表中。 我需要一些想法如何去做。 from BeautifulSoup import BeautifulSoup s = """T…
美丽的汤 - 处理错误
我想知道如何处理 Text: 之后不存在 href 的情况 Is there搜索内容的更好方法Contact: 之后存在的 http://pastebin.com/FYMxTJkf…
BeautifulSoup python 解析html文件
我正在使用 BeautifulSoup 将 html 文件中的所有逗号替换为 ‚。这是我的代码: f = open(sys.argv[1],"r") data = f.read() soup = BeautifulSo…
美丽的汤 - 如何获取 href
我似乎无法从以下 html 汤中提取 href(页面上只有一个 Website:): Website: www.google.com 这就是我的思想应该有效 href = soup.find("strong" ,t…
行为怪异的美丽汤字符串方法
我正在尝试在此页面中获取图像 - http://www.bkstr.com/webapp/wcs/stores/servlet/CourseMaterialsResultsView?catalogId=10001&categoryId=9604&sto…
Python BeautifulSoup 编码
我有一个代码可以使用 Beautiful Soup 读取 html 并修改一些文本。它工作正常,但是当我读取输出时,我的 html 文件的这一部分会自动更改: Original …
在 Python 中运行基本 Web Scrape 时出现索引错误
我正在使用Python 2.7。当我尝试运行此代码时,当函数命中 print findPatTitle[i] 时出现问题,并且 python 返回“索引错误:列表索引超出范围”。我…
在此 Python 脚本中将 BeautifulSoup 替换为另一个(标准)HTML 解析模块
我用 BeautifulSoup 制作了一个脚本,它运行良好并且非常可读,但我想有一天重新分发它,而 BeautifulSoup 是我想避免的外部依赖项,特别是考虑到 Win…