beautifulsoup

beautifulsoup

文章 107 浏览 123

Python HTML 解析与漂亮的汤和过滤停用词

我正在将网站中的特定信息解析到文件中。现在,我的程序会查看网页,找到正确的 HTML 标签并解析出正确的内容。现在我想进一步过滤这些“结果”。 例…

琉璃梦幻 2024-10-31 13:37:18 4 0

Python 使用 Beautiful Soup 对特定内容进行 HTML 处理

所以当我决定解析网站的内容时。例如,http://allrecipes.com/Recipe/Slow- Cooker-Pork-Chops-II/Detail.aspx 我想将成分解析为文本文件。成分位于:…

二智少女 2024-10-31 05:42:52 4 0

我可以用 BeautifulSoup 删除脚本标签吗?

可以使用 BeautifulSoup 从 HTML 中删除 标签及其所有内容,还是必须使用正则表达式或其他内容?…

开始看清了 2024-10-31 03:07:29 5 0

Python BeautifulSoup 自动跟踪内容表行和列

首先我想说我是 Stack 和 Python 的新手。我上周才开始使用它。然而,我是一位经验丰富的 PHP/C++/Pascal/ADA/B/Forth(显示了我的年龄)程序员。 我…

一身骄傲 2024-10-30 09:33:09 2 0

Python / BeautifulSoup:如何直接查看代码注释下方?

我正在使用 BeautifulSoup 解析一些网页,并尝试在库中工作(而不是尝试使用强制正则表达式解决所有问题。) 我正在查看的页面结构如下: a b c a b

乖乖 2024-10-28 18:54:25 3 0

将图像从一个站点抓取到另一个站点

我是新来的,总体来说对网络开发还很陌生。我的背景是 3D 建模和设计,但我最近启动了一个项目,我认为该项目可能是 3D 社区的一个很好的资源。 我的…

岁月打碎记忆 2024-10-28 15:45:15 6 0

在 python 中检测和更改网站编码

我的网站编码有问题。我编写了一个程序来抓取网站,但我没有成功地更改读取内容的编码。我的代码是: import sys,os,glob,re,datetime,optparse impor…

纵山崖 2024-10-28 15:22:21 3 0

使用 BeautifulSoup 或 LXML.HTML 进行网页抓取

我看过一些网络广播,需要帮助来尝试做到这一点: 我一直在使用lxml.html。雅虎最近改变了网络结构。 目标页面; http://finance.yahoo.com/quote/IBM…

森林散布 2024-10-27 15:32:38 5 0

删除不必要的内部标签

我们正在通过一些外部转换器工具将 DOCX 转换为 HTML。 为表格生成的 HTML 包含如下内容: Patienten TD 内的 和 标记在这里完全是多余的。 预期的结…

雪化雨蝶 2024-10-27 03:12:35 3 0

Beautifulsoup:如何在其他元素之间获取元素

html: ... ... ... ... ... ... ... ... ... 预期结果: ... ... ... 我的意思是,获取 h2 元素之间的所有内容…

回忆追雨的时光 2024-10-26 16:42:18 4 0

使用 BeautifulSoup 从 HTML 页面获取内容类型

我试图获取我抓取的页面的字符编码,但在某些情况下它会失败。这就是我正在做的事情: resp = urllib2.urlopen(request) self.COOKIE_JAR.extract_coo…

ㄟ。诗瑗 2024-10-26 16:29:15 2 0

Python - BeautifulSoup - HTML 解析

这是站点代码的片段 Hotel NameSee More... 00000 City Address Phone number ,我尝试解析它, for element in BeautifulSoup(page).findAll('td'): …

孤独患者 2024-10-26 02:51:42 2 0

在Python中如何使用存储为字符串的变量调用函数

我有类似于描述的问题 这里,但有点复杂。有 BeautifulSoup 对象(存储在列表中),我想找到一些其他标签。我想要查找的标签信息存储在字符串中。 即…

最笨的告白 2024-10-25 17:35:25 1 0

Perl html 解析 lib/工具

是否有一些强大的 perl 工具/库,例如 BeautifulSoup 到 python? 谢谢…

木森分化 2024-10-24 12:01:24 2 0

正则表达式匹配问题

我目前正在学习 Python,并且正在尝试制作一个小型刮刀,但我遇到了 Beautiful Soup 和正则表达式的问题。 我试图匹配具有以下 html 的网站中的所有链…

拔了角的鹿 2024-10-23 23:36:08 2 0
更多

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文