任何用于 ruby 的 html/css 解析库PHP?
我即将完成使用 mechanize&ruby 解析/抓取网站的脚本。
我将来需要将我的脚本移植到 PHP。
我的问题是
- 是否有任何库可用于 ruby 和 php,或者
- 是否有人可以推荐任何其他方法?
I am about to finish my script that parses/scrapes website using mechanize&ruby.
I need to port my script to PHP in the future.
My question is
- if there is any library available for both ruby and php or
- if anybody can recommend any other approach to this?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
没有与 Ruby 和 Mechanize 同等的 PHP 语言。
然而,Zend_Framework 提供了一些很棒的与抓取相关的库,包括
There's no PHP equivalent of Ruby and Mechanize.
However, Zend_Framework offers some great scraping-related libraries including
作为标准,PHP 附带了几种用于解析 XML 的工具(DOM 工具可以处理许多格式错误的 HTML),
请参阅
https://www.php.net/manual/en/refs.xml.php
C.
As standard, PHP comes with several tools for parsing XML (and the DOM one can cope with a lot of badly formed HTML)
See
https://www.php.net/manual/en/refs.xml.php
C.
对于 PHP 中的 DOM 操作,请使用 DOMDocument 类
简单又容易:)
For DOM manipulation in PHP use the DOMDocument class
Simple and easy :)
另一个 PHP DOM 操作工具是 phpQuery。
Another DOM manipulation tool for php is phpQuery.