当前位置：文江博客话题详情

解析图像以从中获取信息

发布于 2024-11-08 03:46:23 字数 1956 浏览 7 评论 0原文

几天来，我一直在思考 a 的三重工作

。得到 b.解析 c.存储多个页面。

两天前，我认为获取页面将是主要任务。不，情况并非如此 - 我猜解析器工作将是一项艰巨的任务。每个要解析的页面都是一个 png 图像。

所以问题是——在得到所有这些之后。如何解析它们！？这似乎是问题所在。猜猜那里有一些 perl 模块 - 可以帮助做到这一点......

好吧 - 我认为这项工作只能通过嵌入一些 OCR 来完成！问题：是否有一个 perl 模块可以在这里使用来支持此任务：

顺便说一句：请参阅结果页面。

see an image

顺便说一句；：正如我所想，我可以在一定范围内找到所有 790 个结果页面 Id= 0 和 Id= 100000 我想，我可以循环使用：

http://www.foundationfinder.ch/ShowDetails.php?Id=11233&InterfaceLanguage=&Type=Html http://www.foundationfinder.ch/ShowDetails。 php?Id=927&InterfaceLanguage=1&Type=Html http://www.foundationfinder.ch/ShowDetails。 php?Id=949&InterfaceLanguage=1&Type=Html http://www.foundationfinder.ch/ShowDetails。 php?Id=20011&InterfaceLanguage=1&Type=Html http://www.foundationfinder.ch/ShowDetails。 php?Id=10579&InterfaceLanguage=1&Type=Html

我以为我可以采用 Perl-Way，但我不太确定：我试图在相同的 URL 上使用 LWP::UserAgent [见下文] 使用不同的查询参数，我想知道 LWP::UserAgent 是否提供了我们如何循环查询参数？我不确定 LWP::UserAgent 有没有方法可以让我们做到这一点。嗯 - 我有时听说使用 Mechanize 更容易。但这真的容易吗？

但是——坦白说； 第一个任务“获取所有页面并不是很困难 - 如果我们将此任务与解析进行比较......如何完成此任务 ！？

任何想法 - 建议 -

期待收到您的来信...

零

原文