归档平面文件的理想选择

发布于 2024-07-13 08:20:15 字数 258 浏览 9 评论 0原文

目前，我们每周收到数千个平面文件，我有一个系统可以运行这些报告并将其导出为 PDF 供我们的人员处理和参考。

我目前将它们批量加载到数据库中，确保所有字段/格式均有效，导出它们，并在下次运行时截断表。

我想知道的是，每个人都认为存储可能 6 个月的批量加载纯文本数据的最节省空间的方法是什么？

无论是日常 SQL 备份、压缩存档还是其他形式，因此我始终能够重新加载旧数据以进行故障排除。

欢迎任何想法，我愿意接受任何建议。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

许一世地老天荒 2024-07-20 08:20:15

那么，您批量加载原始数据的平面文件，使用 SQL Server 2005 来处理它们并获得一组单独的处理后的平面文件，然后转储数据？

好吧，如果这是正确的，那么 SQL 备份将无济于事，因为您似乎在说数据不会保留在数据库中。您唯一的选择是有效压缩输入和/或输出文件，并在目录中良好地组织批次。

我会推荐一种激进的压缩程序，它具有预定的批处理功能，但请注意不要对您使用的程序进行深奥的操作，以避免被锁定在一个程序中......

回复收藏 0 原文

情深如许 2024-07-20 08:20:15

使用最新一代的压缩实用程序（7z 和 rar 压缩很棒）并在组织所有内容后压缩成捆绑包，以便轻松查找。

有适用于 7zip 的 SDK 可以与 .net 配合使用，使这一切变得简单。

-亚当

回复收藏 0 原文

深白境迁sunset 2024-07-20 08:20:15

数据后分析有两种类型：

原始数据（通常非常大）
派生数据（通常较小）

在您的情况下，派生数据可能是进入报告的数据。对于您的原始数据，我只是制作一个巨大的压缩存档文件，并根据日期和数据类型使用系统名称。这样做的价值在于，如果您团队中的某个新手以某种方式完全删除了将原始数据导入数据库的代码，您可以从中恢复。如果派生数据很小，您可能会考虑将其复制到另一个数据库表，或将其保存在单独的平面文件中，因为只需获取派生数据即可解决一些问题。

一般来说，备份数据是一个棘手的问题，因为它取决于以下因素：