如何使用正则表达式获取文章标题?
我想使用正则表达式和 simplehtmldom 从此页面获取文章的标题: http://laperuanavegana.wordpress.com /about/
在这种情况下,标题是:Cómo preparar SEITÁN
这是我的正则表达式:
$html = file_get_html($url);
preg_match_all("title=(.*?)",$html->innertext,$title);
echo "this is title ".$title[0][0]."<br>";
如果有人帮助我找到错误,那将会很有帮助。
I want to get the title of an article from this page using regex and simplehtmldom : http://laperuanavegana.wordpress.com/about/
in this case title is : Cómo preparar SEITÁN
Here is my regex :
$html = file_get_html($url);
preg_match_all("title=(.*?)",$html->innertext,$title);
echo "this is title ".$title[0][0]."<br>";
It would be helpful if anyone help me to find the bug.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我认为您需要查找
</code> 和 <code>
之间的文本,而不是title=
之后的文本。例如:
I think you need to look for text between
<title>
and</title>
, not for text followingtitle=
.For example: