第 9 页 - beautifulsoup

投稿关注

beautifulsoup

文章 107 浏览 123

Python HTML 解析与漂亮的汤和过滤停用词

我正在将网站中的特定信息解析到文件中。现在，我的程序会查看网页，找到正确的 HTML 标签并解析出正确的内容。现在我想进一步过滤这些“结果”。例…

琉璃梦幻 2024-10-31 13:37:18 4 0

Python 使用 Beautiful Soup 对特定内容进行 HTML 处理

所以当我决定解析网站的内容时。例如，http://allrecipes.com/Recipe/Slow- Cooker-Pork-Chops-II/Detail.aspx 我想将成分解析为文本文件。成分位于：…

二智少女 2024-10-31 05:42:52 4 0

我可以用 BeautifulSoup 删除脚本标签吗？

可以使用 BeautifulSoup 从 HTML 中删除标签及其所有内容，还是必须使用正则表达式或其他内容？…

开始看清了 2024-10-31 03:07:29 5 0

Python BeautifulSoup 自动跟踪内容表行和列

首先我想说我是 Stack 和 Python 的新手。我上周才开始使用它。然而，我是一位经验丰富的 PHP/C++/Pascal/ADA/B/Forth（显示了我的年龄）程序员。我…

一身骄傲 2024-10-30 09:33:09 2 0

Python / BeautifulSoup：如何直接查看代码注释下方？

我正在使用 BeautifulSoup 解析一些网页，并尝试在库中工作（而不是尝试使用强制正则表达式解决所有问题。）我正在查看的页面结构如下： a b c a b

乖乖 2024-10-28 18:54:25 3 0

将图像从一个站点抓取到另一个站点

我是新来的，总体来说对网络开发还很陌生。我的背景是 3D 建模和设计，但我最近启动了一个项目，我认为该项目可能是 3D 社区的一个很好的资源。我的…

岁月打碎记忆 2024-10-28 15:45:15 6 0

在 python 中检测和更改网站编码

我的网站编码有问题。我编写了一个程序来抓取网站，但我没有成功地更改读取内容的编码。我的代码是： import sys,os,glob,re,datetime,optparse impor…

纵山崖 2024-10-28 15:22:21 3 0

使用 BeautifulSoup 或 LXML.HTML 进行网页抓取

我看过一些网络广播，需要帮助来尝试做到这一点：我一直在使用lxml.html。雅虎最近改变了网络结构。目标页面； http://finance.yahoo.com/quote/IBM…

森林散布 2024-10-27 15:32:38 5 0

删除不必要的内部标签

我们正在通过一些外部转换器工具将 DOCX 转换为 HTML。为表格生成的 HTML 包含如下内容： Patienten TD 内的和标记在这里完全是多余的。预期的结…

雪化雨蝶 2024-10-27 03:12:35 3 0

Beautifulsoup：如何在其他元素之间获取元素

html： ... ... ... ... ... ... ... ... ... 预期结果： ... ... ... 我的意思是，获取 h2 元素之间的所有内容…

回忆追雨的时光 2024-10-26 16:42:18 4 0

使用 BeautifulSoup 从 HTML 页面获取内容类型

我试图获取我抓取的页面的字符编码，但在某些情况下它会失败。这就是我正在做的事情： resp = urllib2.urlopen(request) self.COOKIE_JAR.extract_coo…

ㄟ。诗瑗 2024-10-26 16:29:15 2 0

Python - BeautifulSoup - HTML 解析

这是站点代码的片段 Hotel NameSee More... 00000 City Address Phone number ，我尝试解析它， for element in BeautifulSoup(page).findAll('td'): …

孤独患者 2024-10-26 02:51:42 2 0

在Python中如何使用存储为字符串的变量调用函数

我有类似于描述的问题这里，但有点复杂。有 BeautifulSoup 对象（存储在列表中），我想找到一些其他标签。我想要查找的标签信息存储在字符串中。即…

最笨的告白 2024-10-25 17:35:25 1 0

Perl html 解析 lib/工具

是否有一些强大的 perl 工具/库，例如 BeautifulSoup 到 python？谢谢…

木森分化 2024-10-24 12:01:24 2 0

正则表达式匹配问题

我目前正在学习 Python，并且正在尝试制作一个小型刮刀，但我遇到了 Beautiful Soup 和正则表达式的问题。我试图匹配具有以下 html 的网站中的所有链…

拔了角的鹿 2024-10-23 23:36:08 2 0

共 27 页
上一页
7
8
9
10
11
下一页

关注

友情链接

文江博客