从 URL 读取 HTML 文件
虽然大多数时候我只使用 file_get_contents
和 CURL,但我无法让它与 URL 中的端口一起使用。我怎样才能读取这个文件? 这是一个喊播统计文件)
http://174.120.124.178:7800/7.html ( ,我只想要最后一个逗号后面的文本。
While most of the time I'd just use file_get_contents
and CURL, I can't get it to work with a port in the URL. How can I read this file?
http://174.120.124.178:7800/7.html (It's a shoutcast statistics file)
Ultimately, I just want the text after the last comma.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
和端口没有关系。他们阻止您是因为您没有使用浏览器用户代理。
curl
确实可以让您伪造用户代理,但这可能违反网站的服务条款。根据这篇文章,这不是关于阻止脚本,但只是区分 Shoutcast 客户端和其他一切。所以代码是:
It has nothing to do with the port. They're blocking you because you're not using a browser user agent.
curl
does let you fake the user agent, but that may be a violation of the site's terms of service.According to this post it's not about blocking scripts, but just distinguishing between Shoutcast clients and everything else. So the code is:
我尝试在命令行上使用 Curl 下载您的文件,但收到 404 错误;它可以在 Firefox 和 Lynx 上加载。 此页面表示您需要更改
用户代理 字符串供其下载。
I tried to download your file with Curl on the command line and got a 404 error; it does load with Firefox and Lynx. This page says that you need to change the
User-Agent
string for it to download.CURLOPT_PORT
或许需要设置合适的端口~CURLOPT_PORT
Needs to be set to the appropriate port perhaps~