如何使用 PHP、CURL 抓取 javascript 网站

发布于 2025-01-07 05:58:39 字数 735 浏览 2 评论 0原文

可能的重复:
如何从其他站点呈现 javascript ,在 PHP 应用程序内?

这是网站 http://www.oferta.pl/strona_v2/gazeta_v2/ 。该网站完全基于 JavaScript 构建。我想使用 PHP 和curl 进行抓取。目前我使用 DOMXPath。在左侧菜单中有一些类别可供选择。我在那里看不到“形式”。如何使用curl 提交该表单并废弃输出页面?

我只使用过 file_get_contents() 。它没有获取整个页面。我该如何继续?

注意: http://www.html-form- guide.com/php-form/php-form-submit.html 我发现这个例子有一个“表单”。但我指定的网站没有“表格”。

Possible Duplicate:
How do I render javascript from another site, inside a PHP application?

This is the site http://www.oferta.pl/strona_v2/gazeta_v2/ . This site is built totally on JavaScript. I want to scrape using PHP and curl. Currently I use DOMXPath. In the left menu there are some category to be selected. I see no 'form' there. How can I use curl to submit that form and scrap the output page?

I have used file_get_contents() only. It doesn't get all of the page. How can I proceed?

N.B : http://www.html-form-guide.com/php-form/php-form-submit.html I have found this example which have a 'form'. But my specified site has no 'form'.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

请恋爱 2025-01-14 05:58:39

你不能刮它。这是可能的。但这太难了。

  1. 通过curl模拟http请求。检查ajax发出的每个请求并尝试模拟它。

  2. 模拟 Javascript 执行(这部分几乎是不可能的)。某些请求包含由 Javascript 生成的值。您需要在 php 中执行此操作。如果他们有一些用 JS 实现的复杂算法,您可以调用 v8 javascript 引擎。

You can not scrape it. Its possible. But its way too hard.

  1. Simulate the http request by curl. Check every request it makes by ajax and try to simulate it.

  2. Simulate Javascript executions (this part is almost impossible). Some requests contains values which are generated by Javascript. You need to do it in php. If they has some complicated algorithm implemented in JS you can invoke v8 javascript engine.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文