如何从具有 DnP 防火墙 (PHP) 的 url 获取 HTML 代码
我使用了 file_get_contents 和简单的 html dom (http://simplehtmldom.sourceforge.net) 但无法获取此 URL 的 HTML:
http://forum.hui.vn/Thread-nhung-hanh-dong-ngo-ngan-cua-dan-ong-15824?action=lastpost
我得到的 HTML 是 DnP防火墙。请帮助从具有 DnP 防火墙的 url 获取 HTML 代码。谢谢你!
I used file_get_contents and simple html dom (http://simplehtmldom.sourceforge.net) but can't get HTML of this URL:
http://forum.hui.vn/Thread-nhung-hanh-dong-ngo-ngan-cua-dan-ong-15824?action=lastpost
The HTML I was got is DnP Firewall. Please help to get HTML code from an url has DnP Firewall. Thank you!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您需要在解决方案中启用 cookie。
该站点正在尝试设置一个会话 ID Cookie,您需要对其进行响应,以免每次都获得新会话。
基本上,您需要解析最初获得的服务器响应的标头,并在新响应中发回相同的 cookie。到该页面上“操作”表单中指定的位置:
您将形成如下所示的响应:
然后您需要处理由于这些操作而发生的任何重定向。
在这种情况下, 建议将您的 UserAgent 设置为常见的内容,例如:
或者您可以只使用 Curl
http://php.net/manual/en/book.curl.php
You need cookies enabled in your solution.
This site is attempting to set a session id cookie, which you need to respond back with in order to not get a new session every time.
Basically you need to parse through the header of the server response you initially get, and send back that same cookie in a new response. to the location specified in the form 'action' on that page:
In this case you'd form your response something like this:
Then you'll need to process any redirects that occur as a result of these actions..
I'd also suggest setting your UserAgent to something common like:
Or you could just use Curl
http://php.net/manual/en/book.curl.php