PHP 简单 HTML DOM 解析器拒绝处理 [无效] HTML - 第一次尝试失败
亲爱的社区,大家好!
好吧,我试图使用 PHP Simple HTML DOM Parser 选择一个类或一个 id,但绝对没有运气。也许我必须一次又一次地研究手册页。
嗯 - DOM 技术有点超出了我的理解范围: 但我的示例非常简单,似乎符合手册中给出的示例(simplehtmldom.sourceforge AT net/manual.htm),但它就是行不通,它让我陷入困境。使用简单 dom 给出的其他示例脚本工作正常。
请参阅示例: http://www.aktive-buergerschaft.de/buergerstiftungsfinder
这是最简单的我发现的例子......问题是 - 如何解析它?
我应该用 Perl 来做吗 - 示例 HTML 页面是无效的 HTML。 我不知道简单 HTML DOM 解析器是否能够处理严重畸形的 HTML (可能不是)。然后我就迷路了。
嗯:这很难相信 - 但你可以使用 file_get_contents 获取内容:但之后你必须完成解析器工作!我还有一些缺失的部件!
最后:如果我无法让它运行,我可以尝试一些 Perl 解析器,例如 HTML::TreeBuilder::XPath
g day dear community - hello all!
well I am trying to select either a class or an id using PHP Simple HTML DOM Parser with absolutely no luck. Perhaps i have to study the manpages again and again.
Well - the DOM-technique somewhat goes over my head:
But my example is very simple and seems to comply to the examples given in the manual (simplehtmldom.sourceforge AT net/manual.htm) but it just wont work, it's driving me up the wall. Other example scripts given with simple dom work fine.
See the example: http://www.aktive-buergerschaft.de/buergerstiftungsfinder
This is the easiest example i have found ... The question is - how to parse it?
Should i do it with Perl - The example HTML page is invalid HTML.
I do not know if the Simple HTML DOM Parser is able to handle badly malformed HTML
(probably not). And then i am lost.
Well: it is pretty hard to believe - but you can get the content with file_get_contents: But you afterwards have to do the parser job! And there i have some missing parts!
Finally: if i cannot get it to run i can try out some Perl parsers eg HTML::TreeBuilder::XPath
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
1:检查file_get_contents是否工作!!!
2:如果没有使用curl或fopen或telnet读取数据。
简单的 Html Dom 过滤所有噪音,还可以处理格式错误的标签...
问题可能出在您的数据检索上
1: check whether file_get_contents is working!!!!
2: If no use curl or fopen or telnet to read the data.
Simple Html Dom filters all the noise can process malformed tags also...
Problem might be with your data retrieving