以编程方式从邮件合并的 Word 文档中检索 MergeField 值

发布于 2024-07-27 04:36:57 字数 366 浏览 15 评论 0原文

我有大量的 MSWord 文档（大约 40,000 个），它们是邮件合并的结果（相同的主文档，不同的数据源）。

合并字段之一是文本字段，可以包含文本“是”或“否”。

有没有一种简单的方法来列出哪些文档的合并字段设置为值“是”？（我预计大约有 10,000 个“是”文档。）

我对任何方法都感兴趣，无论是使用 Word 本身、办公自动化、十六进制转储二进制文件并 grep 某些魔法，还是任何现成的工具（perl 脚本、 .NET 应用程序等）可以执行此类操作。

这些文件位于可以从 Linux 和 Windows 机器访问的网络共享上（如果需要的话，我可能可以偷用 Mac 一段时间），所以我不太担心这些工具在哪个平台上运行......

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

柠檬心 2024-08-03 04:36:57

如果它们是 Word 2007 文档，那就容易多了，因为文件格式是 XML。（即使使用 Word 2003，您也可以另存为 XML 文档，尽管这不是默认设置）。不过，我假设这些是使用默认（二进制）文件格式的标准 Word 2003 文档。

我相信有一些工具可以直接处理二进制文件格式，并且可能能够将文档转换为文本文件，然后您可以处理它们 - 大概您可以搜索出现在字段之前的一些文本，例如“你是认真的：”。

然而，最简单/最简单的方法（但就执行时间而言最慢）是编写一个 VBA 程序来打开每个文档、搜索字段并提取结果。这将是非常简单的 VBA，您可以在 Word 本身中完成（这意味着代码可以使用 Word 的现有运行实例）。我想说你可以在几个小时内启动并运行它 - 然后你可以在它完成工作时再多呆几个小时:-)

回复收藏 0 原文

~没有更多了~