PHP 简单 HTML DOM 解析器拒绝处理 [无效] HTML - 第一次尝试失败

发布于 2024-11-09 03:44:16 字数 675 浏览 0 评论 0原文

亲爱的社区,大家好!

好吧,我试图使用 PHP Simple HTML DOM Parser 选择一个类或一个 id,但绝对没有运气。也许我必须一次又一次地研究手册页。

嗯 - DOM 技术有点超出了我的理解范围: 但我的示例非常简单,似乎符合手册中给出的示例(simplehtmldom.sourceforge AT net/manual.htm),但它就是行不通,它让我陷入困境。使用简单 dom 给出的其他示例脚本工作正常。

请参阅示例: http://www.aktive-buergerschaft.de/buergerstiftungsfinder

这是最简单的我发现的例子......问题是 - 如何解析它?

我应该用 Perl 来做吗 - 示例 HTML 页面是无效的 HTML。 我不知道简单 HTML DOM 解析器是否能够处理严重畸形的 HTML (可能不是)。然后我就迷路了。

嗯:这很难相信 - 但你可以使用 file_get_contents 获取内容:但之后你必须完成解析器工作!我还有一些缺失的部件!

最后:如果我无法让它运行,我可以尝试一些 Perl 解析器,例如 HTML::TreeBuilder::XPath

g day dear community - hello all!

well I am trying to select either a class or an id using PHP Simple HTML DOM Parser with absolutely no luck. Perhaps i have to study the manpages again and again.

Well - the DOM-technique somewhat goes over my head:
But my example is very simple and seems to comply to the examples given in the manual (simplehtmldom.sourceforge AT net/manual.htm) but it just wont work, it's driving me up the wall. Other example scripts given with simple dom work fine.

See the example: http://www.aktive-buergerschaft.de/buergerstiftungsfinder

This is the easiest example i have found ... The question is - how to parse it?

Should i do it with Perl - The example HTML page is invalid HTML.
I do not know if the Simple HTML DOM Parser is able to handle badly malformed HTML
(probably not). And then i am lost.

Well: it is pretty hard to believe - but you can get the content with file_get_contents: But you afterwards have to do the parser job! And there i have some missing parts!

Finally: if i cannot get it to run i can try out some Perl parsers eg HTML::TreeBuilder::XPath

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

耳根太软 2024-11-16 03:44:16

1:检查file_get_contents是否工作!!!

2:如果没有使用curl或fopen或telnet读取数据。

简单的 Html Dom 过滤所有噪音,还可以处理格式错误的标签...

问题可能出在您的数据检索上

1: check whether file_get_contents is working!!!!

2: If no use curl or fopen or telnet to read the data.

Simple Html Dom filters all the noise can process malformed tags also...

Problem might be with your data retrieving

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文