保存网页中的动态内容?

发布于 2024-07-30 07:56:54 字数 213 浏览 12 评论 0原文

是否可以从网站保存动态文本并将其转储到我的服务器上的文件中? 我感兴趣的具体情况是从此页面保存歌曲标题 http://www.z1035 .com/player.php 并将所有歌曲标题保存在我的服务器上的文件中。 这可能吗? 我可以使用什么方法来做到这一点?

Is it possible to save dynamic text from a website and dump it into a file on my server? The specific case that I'm interested in is saving the song title from this page http://www.z1035.com/player.php
and saving all the song titles in a file on my server. Is this possible? What methods could I use to do this?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

白芷 2024-08-06 07:56:54

您所指的通常称为“抓取”。 这是一篇关于使用 PHP 执行此操作的一种方法的文章:

http://www.developertutorials.com/blog/php/easy-screen-scraping-in-php-simple-html-dom-library-simplehtmldom-398/

What you're referring to is generally known as 'scraping'. Here's an article about one way to do it with PHP:

http://www.developertutorials.com/blog/php/easy-screen-scraping-in-php-simple-html-dom-library-simplehtmldom-398/

屋顶上的小猫咪 2024-08-06 07:56:54

在我看来,Python 的 URLLib 库使抓取变得非常容易。

import urllib, re

url = "http://www.z1035.com/player.php"
f = urllib.urlopen(url)
t = f.read()
#  use regular expression here 
m = re.search(t, "some pattern")
print m.group(1)

这将加载外部资源,就好像它是本地文件一样,并允许您根据需要对其进行解析。

曾几何时,我想保存我听过的广播节目的所有曲目列表。 我使用 Python 下载所有曲目列表,然后以编程方式访问每个曲目并将内容附加到文件中。 它非常方便,大约需要 20 行。

Python's URLLib library makes scraping pretty easy, in my opinion.

import urllib, re

url = "http://www.z1035.com/player.php"
f = urllib.urlopen(url)
t = f.read()
#  use regular expression here 
m = re.search(t, "some pattern")
print m.group(1)

This will load the external resource as if it were a local file, and allow you to parse it as necessary.

Once upon a time I wanted to save all the tracklistings for a radio show I listened to. I used Python to download a list of all the tracklistings, and then to programmatically visit each and append the contents to a file. It was very handy, and took probably 20 lines.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文