当前位置：文江博客话题详情

PHP CSS 选择器库？

发布于 2024-07-08 20:14:32 字数 110 浏览 8 评论 0原文

是否有 PHP 类/库允许我使用 CSS 选择器查询 XHTML 文档？如果我能以某种方式使用 CSS 选择器（jQuery 宠坏了我！），我需要抓取一些页面来获取非常容易访问的数据。有任何想法吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

寂寞美少年 2024-07-15 20:14:32

进一步谷歌搜索后（最初的结果不是很有帮助），似乎实际上有一个 Zend Framework 库，以及其他一些库：

回复收藏 0 原文

南汐寒笙箫 2024-07-15 20:14:32

XPath 是访问 XML（和 XHTML）节点的相当标准的方法，并且提供比 CSS 更高的精度。

回复收藏 0 原文

演出会有结束 2024-07-15 20:14:32

另一张：
http://querypath.org/

回复收藏 0 原文

-小熊_ 2024-07-15 20:14:32

一个很棒的组件是 symfony 2 的一个组件， CssSelector\Parser ^简介。它将 CSS 选择器转换为 XPath 表达式。看看 =)

源代码

回复收藏 0 原文

甜心小果奶 2024-07-15 20:14:32

对于 jQuery 用户来说，最感兴趣的可能是 将 jQuery 移植到 PHP，即 < a href="http://code.google.com/p/phpquery/" rel="noreferrer">phpQuery。库的几乎所有部分都已移植。此外，它还包含WebBrowser插件，可用于Web抓取整个站点的路径/进程（例如，访问登录后可用的数据）。它只是模拟服务器上的 Web 浏览器（还有事件和 cookie）。最新版本对 XML 命名空间 和 CSS3 "|" 选择器提供了实验性支持。

回复收藏 0 原文

梦屿孤独相伴 2024-07-15 20:14:32

我最终使用了 PHP Query Lite，它非常简单并且拥有我需要的一切。

回复收藏 0 原文

木格 2024-07-15 20:14:32

对于文档解析，我使用 DOM。如果您知道标签名称（在本例中为“div”），这可以很容易地解决您的问题：

 $doc = new DOMDocument();
 $doc->loadHTML($html);

 $elements = $doc->getElementsByTagName("div");
 foreach ($elements as $e){
  if ($e->getAttribute("class")!="someclass") continue;

  //its a div.classname
 }

不确定 DOM 是否允许您一次获取文档的所有元素...您可能必须进行树遍历。

For document parsing I use DOM. This can quite easily solve your problem if you know the tag name (in this example "div"):

 $doc = new DOMDocument();
 $doc->loadHTML($html);

 $elements = $doc->getElementsByTagName("div");
 foreach ($elements as $e){
  if ($e->getAttribute("class")!="someclass") continue;

  //its a div.classname
 }

Not sure if DOM lets you get all elements of a document at once... you might have to do a tree traversal.

回复收藏 0 原文