从 SWF 中提取文本

发布于 2024-07-19 20:52:09 字数 472 浏览 2 评论 0原文

我们目前使用 print2flash (http://print2flash.com) 来转换用户提交的文档(Word 文档、RTF、PowerPoint、等)转换为可在线查看的基于 Flash 的文档(la docstoc 和 scribd)。

我们希望对这些文件中的文本进行索引以进行全文索引。 我们可以使用任何工具或库来完成此任务吗?

我们正在 ASP.NET / C# 中进行开发,并尝试使用第三方工具,例如 SWFTools (http://www.swftools .org),但结果不一致且低于标准。

PS:我们希望在原始文档转换为 Flash 后进行索引,因为这样可以减少我们需要处理的文件格式。

We currently use print2flash (http://print2flash.com) to convert user submitted documents (Word documents, RTF, PowerPoint, etc) into Flash-based documents that can be viewed online (a la docstoc and scribd).

We would like to index the text inside these files for full-text indexing. Are there any tools or libraries we can use to accomplish this?

We are developing in ASP.NET / C# and have tried working with 3rd party tools such as SWFTools (http://www.swftools.org) but the results have been inconsistent and subpar.

PS: We would like to do the indexing after the original document has been converted to flash because that gives us fewer file formats to deal with.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

落花浅忆 2024-07-26 20:52:09

最好的选择是第三方 Flash 解析库。 Flash 的格式非常密集,解析起来很困难。 话虽如此,格式还是很好理解的。 您可以在这里找到官方规范: http://www.adobe.com/devnet/swf/< /a>

Your best bet is a third-party Flash parsing library. Flash has a very dense format and it's painful to parse. Having said that, the format is well-understood. You can find the official specification here: http://www.adobe.com/devnet/swf/

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文