如何使用正则表达式获取文章标题?

发布于 2024-11-29 08:08:39 字数 412 浏览 1 评论 0原文

我想使用正则表达式和 simplehtmldom 从此页面获取文章的标题: http://laperuanavegana.wordpress.com /about/

在这种情况下,标题是:Cómo preparar SEITÁN

这是我的正则表达式:

$html = file_get_html($url);
preg_match_all("title=(.*?)",$html->innertext,$title);
echo "this is title ".$title[0][0]."<br>";

如果有人帮助我找到错误,那将会很有帮助。

I want to get the title of an article from this page using regex and simplehtmldom : http://laperuanavegana.wordpress.com/about/

in this case title is : Cómo preparar SEITÁN

Here is my regex :

$html = file_get_html($url);
preg_match_all("title=(.*?)",$html->innertext,$title);
echo "this is title ".$title[0][0]."<br>";

It would be helpful if anyone help me to find the bug.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

两仪 2024-12-06 08:08:39

我认为您需要查找 </code> 和 <code> 之间的文本,而不是 title= 之后的文本。

例如:

$html = "Sometext<title>Seitan</title>More text";
preg_match_all('|<title>(.*?)</title>|',$html,$title);
echo "this is title ".$title[1][0]."<br>";

I think you need to look for text between <title> and </title>, not for text following title=.

For example:

$html = "Sometext<title>Seitan</title>More text";
preg_match_all('|<title>(.*?)</title>|',$html,$title);
echo "this is title ".$title[1][0]."<br>";
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文