从 SWF 中提取文本
我们目前使用 print2flash (http://print2flash.com) 来转换用户提交的文档(Word 文档、RTF、PowerPoint、等)转换为可在线查看的基于 Flash 的文档(la docstoc 和 scribd)。
我们希望对这些文件中的文本进行索引以进行全文索引。 我们可以使用任何工具或库来完成此任务吗?
我们正在 ASP.NET / C# 中进行开发,并尝试使用第三方工具,例如 SWFTools (http://www.swftools .org),但结果不一致且低于标准。
PS:我们希望在原始文档转换为 Flash 后进行索引,因为这样可以减少我们需要处理的文件格式。
We currently use print2flash (http://print2flash.com) to convert user submitted documents (Word documents, RTF, PowerPoint, etc) into Flash-based documents that can be viewed online (a la docstoc and scribd).
We would like to index the text inside these files for full-text indexing. Are there any tools or libraries we can use to accomplish this?
We are developing in ASP.NET / C# and have tried working with 3rd party tools such as SWFTools (http://www.swftools.org) but the results have been inconsistent and subpar.
PS: We would like to do the indexing after the original document has been converted to flash because that gives us fewer file formats to deal with.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
最好的选择是第三方 Flash 解析库。 Flash 的格式非常密集,解析起来很困难。 话虽如此,格式还是很好理解的。 您可以在这里找到官方规范: http://www.adobe.com/devnet/swf/< /a>
Your best bet is a third-party Flash parsing library. Flash has a very dense format and it's painful to parse. Having said that, the format is well-understood. You can find the official specification here: http://www.adobe.com/devnet/swf/