当前位置：文江博客话题详情

PHP 总结任意 URL

发布于 2024-09-04 18:44:34 字数 151 浏览 10 评论 0原文

在 PHP 中，如何获取任意 URL 的摘要？总而言之，我的意思是类似于 Google 网络搜索结果中的 URL 描述。

这可能吗？是否已经有某种我可以插入的工具，这样我就不必生成自己的摘要？

如果可能的话，我不想使用元数据描述。

-迪伦

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

掐死时间 2024-09-11 18:44:34

Google 中显示的（通常）是 META 描述标签。如果您不想使用它，也可以使用页面标题。

回复收藏 0 原文

凉月流沐 2024-09-11 18:44:34

如果您不想使用元数据描述（顺便说一句，这正是它们的用途），您需要做大量的研究和工作。本质上，您必须猜测页面的哪一部分是内容，哪一部分只是导航/绒毛。事实上，谷歌正是这样的；但请注意，从无用的废话中提取有价值的信息是他们的第一能力，十年来他们一直在研究和改进这一能力。

当然，您可以进行有根据的猜测（例如“查找具有 ID 或类 maincontent 的元素”并从中获取第一段），也许就可以了。真正的问题是，您希望结果有多好？（Facebook 有类似的网站链接，有时摘要只是坚持广告是主要内容）。

回复收藏 0 原文

夜访吸血鬼 2024-09-11 18:44:34

下面将允许您解析页面的 title 标记的内容。注意：必须将 php 配置为允许 file_get_contents 检索 URL。否则，您必须使用 curl 来检索页面 HTML。

$title_open = '<title>';
$title_close = '</title>';

$page = file_get_contents( 'http://www.domain.com' );
$n = stripos( $page, $title_open ) + strlen( $title_open );
$m = stripos( $page, $title_close);

$title = substr( $page, n, m-n );

The following will allow you to to parse the contents of a page's title tag. Note: php must be configured to allow file_get_contents to retrieve URLs. Otherwise you'll have to use curl to retrieve the page HTML.

$title_open = '<title>';
$title_close = '</title>';

$page = file_get_contents( 'http://www.domain.com' );
$n = stripos( $page, $title_open ) + strlen( $title_open );
$m = stripos( $page, $title_close);

$title = substr( $page, n, m-n );

回复收藏 0 原文