如何扫描网页并获取图像和 YouTube 嵌入?
我正在构建一个网络应用程序,我需要获取给定 URL 上嵌入的所有图像和任何 Flash 视频(例如 youtube)。 我正在使用Python。
我已经用谷歌搜索过,但没有找到任何关于此的好信息(可能是因为我不知道这叫什么来搜索),有没有人有这方面的经验并且知道如何做到这一点?
我很想看到一些代码示例(如果有的话)。
谢谢!
I am building a web app where I need to get all the images and any flash videos that are embedded (e.g. youtube) on a given URL. I'm using Python.
I've googled, but have not found any good information about this (probably because I don't know what this is called to search for), does anyone have any experience with this and knows how it can be done?
I'd love to see some code examples if there are any available.
Thanks!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
BeautifulSoup 是一个很棒的屏幕抓取库。 使用 urllib2 获取页面,并使用 BeautifulSoup 对其进行解析。 这是他们文档中的代码示例:
BeautifulSoup is a great screen-scraping library. Use urllib2 to fetch the page, and BeautifulSoup to parse it apart. Here's a code sample from their docs: