从 Perl 中的链接检索媒体（图像、视频等）

发布于 2024-12-15 07:48:08 字数 647 浏览 0 评论 0 原文

与 Reddit 的 r/pic 子 reddit 类似，我想聚合来自各种来源的媒体。有些网站使用 OEmbed 规范在页面上公开媒体，但并非所有网站都这样做。我正在浏览 Reddit 的源代码，因为本质上他们“抓取”用户提交的链接、检索图像、视频等。他们创建缩略图，然后沿着链接显示在他们的网站上。现在，我想做类似的事情，我查看了他们的代码[1]，似乎他们为他们识别的每个域都有自定义抓取器，然后他们有一个通用的 Scraper 类，它使用简单的逻辑从任何域获取图像（基本上，他们检索网页，解析 html，然后确定页面上最大的图像，然后使用该图像生成缩略图）。

由于它是开源的，我可能可以在我的应用程序中重用该代码，但不幸的是我选择了 Perl，因为这是一个业余爱好项目，并且我正在尝试学习 Perl。有没有具有类似功能的 Perl 模块？如果没有，是否有类似于Python Imaging Library 的Perl 模块？无需实际下载整个图像即可确定图像大小，这将很方便。缩略图生成。

谢谢！

[1] https://github.com/reddit/ reddit/blob/master/r2/r2/lib/scraper.py

原文