快速准确抓取网页标题

发布于 2024-10-18 14:13:32 字数 304 浏览 0 评论 0原文

我正在寻找网页的标题，这是许多 IRC 机器人的共同功能，我想将其合并到我为了好玩而编写的 IRC 客户端中。

我目前使用的方法基本上连接并发送整个网页的 GET 请求，然后查找标签并读取它们之间的内容。对于较大的网页，这可能比我想要的要慢。我注意到的另一个问题是具有动态标题的网页（例如一些 phpbb 论坛）不会返回在浏览器中显示的准确标题，因为我不执行任何 javascript 等操作。

这似乎是一种方法获得准确的标题的方法是将html转储到浏览器控件（例如IE COM控件）中并拉取标题，但这只会使其更加耗时。

有我不知道的简单方法吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

不一样的天空 2024-10-25 14:13:32

总之，不，不是。

我想您可以将 HTTP 文件流式传输到您的应用程序中，然后在到达时停止下载，而不是下载整个文档 - 这将节省您等待整个 HTML 文档下载的时间。

但是，如果您需要在某些客户端 JavaScript 更改标题后阅读标题，那么这并没有什么帮助。正如你所说，我能想到的唯一方法是使用浏览器控件。

回复收藏 0 原文

~没有更多了~

关于作者

心的憧憬

暂无简介

0 文章

0 评论

22 人气

关注发私信

lorenzathorton8

文章 0 评论 0

关注

Zero

文章 0 评论 0

关注

萧瑟寒风

文章 0 评论 0

关注

mylayout

文章 0 评论 0

关注

tkewei

文章 0 评论 0

关注

17818769742

文章 0 评论 0

友情链接

文江博客

快速准确抓取网页标题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签