使用 PHP,如何解析 HTML 页面的标题和元标记?
我需要能够从页面中获取 TITLE 和 DESCIPTION 元数据。
我一直在尝试这样做,但我得到的错误比实际结果更多。 (我有一个大约 10 个 URL 的数组,通常只有大约 2 个给我描述。我还没有得到标题)。
那么,在 PHP 中,如何从远程页面获取 DES 和 Title,如果没有或有错误,则忽略它?
-迪伦
Possible Duplicate:
CodeIgniter: A Class/Library to help get meta tags from a web page?
I need to be able to get the TITLE and DESCIPTION metadata out of a page.
I've been trying to do this but I've been getting more errors than actual results. (I have an array of about 10 URLS, usually only about 2 of them give me the descrption. I have yet to get the title).
So how do I, in PHP, get the Desc and Title from a remote page, and if there is none or if there's an error, ignore it?
-Dylan
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
使用 cURL 之类的内容(检查结果是否为 false 以及 HTTP 状态为 200 等内容)来获取页面,然后 简单的 HTML DOM 来解析它并提取你想要的元素。 (记住这些元素可能不存在)
Use something like cURL (Checking things like the result isn't false and that the HTTP status is 200) to get the page and then Simple HTML DOM to parse it and extract the elements you want. (Remembering that the elements might not exist)