通过网页搜索

发布于 2024-10-16 10:16:27 字数 130 浏览 3 评论 0原文

嘿,我正在开发一个 Python 项目,需要浏览网页。我想查找特定的文本,如果找到该文本,则会打印出一些内容。如果没有,它会打印出一条错误消息。我已经尝试过不同的模块,例如 libxml,但我不知道该怎么做。

有人可以提供帮助吗?

Hey I'm working on a Python project that requires I look through a webpage. I want to look through to find a specific text and if it finds the text, then it prints something out. If not, it prints out an error message. I've already tried with different modules such as libxml but I can't figure out how I would do it.

Could anybody lend some help?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

此刻的回忆 2024-10-23 10:16:27

你可以做一些简单的事情,比如:


import urllib2
import re

html_content = urllib2.urlopen('http://www.domain.com').read()

matches = re.findall('regex of string to find', html_content);

if len(matches) == 0: 
   print 'I did not find anything'
else:
   print 'My string is in the html'

You could do something simple like:


import urllib2
import re

html_content = urllib2.urlopen('http://www.domain.com').read()

matches = re.findall('regex of string to find', html_content);

if len(matches) == 0: 
   print 'I did not find anything'
else:
   print 'My string is in the html'
沧笙踏歌 2024-10-23 10:16:27

lxml 很棒: http://lxml.de/parsing.html

我经常将它与 xpath 一起使用来提取来自 html 的数据。

另一个选项是 http://www.crummy.com/software/BeautifulSoup/ 这是也很棒。

lxml is awesome: http://lxml.de/parsing.html

I use it regularly with xpath for extracting data from the html.

The other option is http://www.crummy.com/software/BeautifulSoup/ which is great as well.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文