我无法用 BeautifulSoup 刮任何东西
我正在使用 BeautifulSoup 来抓取一些网页内容。 我正在学习这个示例代码,但我总是得到“无”响应。 代码: import urllib2 from BeautifulSoup impo…
使用 Beautiful Soup 剥离 HTML 时保留空间
from BeautifulSoup import BeautifulSoup html = "Para 1. WordsMerge. Para 2Quote 1Quote 2" print html soup = BeautifulSoup(html) print u''.jo…
如何使用 python mechanize 解析动态更新的 .jsp 表单?
我正在学习如何使用 Python Mechanize 来抓取一些数据。在大多数情况下,它是有效的,但我遇到的一个问题是我正在查看的 .jsp 页面会动态更新,而不是…
为什么使用 BeautifulSoup 和 IDLE 会出现递归错误?
我正在按照教程尝试学习如何使用 BeautifulSoup。我正在尝试从我下载的 html 页面上的网址中删除名称。到目前为止我的效果很好。 from bs4 import Bea…
写入文件时出现 UnicodeEncodeError
我正在尝试将一些字符串写入文件(这些字符串是由 HTML 解析器 BeautifulSoup 提供给我的)。 我可以使用“print”来显示它们,但是当我使用 file.wri…
Python 中最宽容的 HTML 解析器是什么?
我有一些随机的 HTML,我使用 BeautifulSoup 来解析它,但在大多数情况下(> 70%)它会令人窒息。我尝试使用Beautiful soup 3.0.8和3.2.0(3.1.0以上…
在 Mac OS X 上安装另一个 Python 版本的 BeautifulSoup
我的 Mac 上有三个版本的 Python:2.6.1(内置)、2.5.4(Google App Engine 开发)和 2.7.2(通用 Python 编程)。 我使用 python setup.py install …
需要 Python 抓取工具的帮助
我正在尝试使用 urllib 和 python 来制作一个刮刀,我可以下载图像,但它们是缩略图,250x250 或更少。(我正在尝试 4chan,因为我喜欢一些图片线程)…
使用 BeautifulSoup 提取锚标记值
我正在尝试使用 BeautifulSoup 从网站中提取值。这些值本质上是搜索结果,在本例中是特定地区的药房。我试图从中提取的页面源包含以下 HTML: Applege…
python BeautifulSoup查找span id名称而不使用string\re方法
我正在尝试获取我的跨度标签的 ID 名称。 מספר תאגיד: 520000472 שם תאגיד (עברית): חברת החשמל לישראל בעמ …
带有 BeautifulSoup 的 Python XMl 解析器。如何删除标签?
对于一个项目,我决定制作一个应用程序来帮助人们在 Twitter 上寻找朋友。 我已经能够从 xml 页面获取用户名。例如,使用我当前的代码,我可以从 XML …