使用 PHP 抓取网站
可能的重复:
抓取网页内容
如何从网站上抓取所有内容?
尝试从网站 covers.com,我一生都不知道该怎么做。我想获取特定日期的评分,但当我使用 simplehtmldom
包中的 file_get_html
时,页面默认为今天游戏的视图状态。关于如何获取特定日期游戏的网址有什么想法吗?提前致谢!
Possible Duplicate:
Scrape web page contents
How to scrape all content from a website?
I'm trying to scrape some boxscore data from the site covers.com and for the life of me I can't figure out how to do it. I want to get boxscores from a certain date but the page defaults to a viewstate of today's games when I use file_get_html
from the simplehtmldom
package. Any ideas on how to get the url for a certain days games? Thanks in advance!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
仅加载 HTML 页面不会对您有帮助。大部分数据是通过 AJAX 获取的。要了解哪些网址使用
Firebug
或蜻蜓
。查看网络请求选项卡,观察资源和请求参数。(强制提示您应该获得抓取数据的许可,除非是出于科学和非商业目的。)
Just loading the HTML page won't help you there. Most of the data is pulled in via AJAX. To find out under which URLs use
Firebug
orDragonfly
. Look at the network requests tab, and observe resources and request parameters.(Obligatory hint that you should have permission to scrape data, unless its for a science and non-commercial purposes.)