如何从 blob/文件流中识别文件类型？

发布于 2024-07-25 13:59:25 字数 325 浏览 9 评论 0原文

我们很久以前购买了一个“现成的”应用程序，它能够在 SQL Server 中将文件存储为 blob。我们注意到，由于一个部门更频繁地使用此 blob 字段，数据库的大小在过去六个月内增加了一倍多。结果，应用程序变得非常缓慢。

我的任务是从数据库中删除 blob 字段并将文件保存到实际的文件系统上。不幸的是，应用程序不存储数据库中的文件类型。虽然我可以读取数据库中存在的文件，但我不知道将该文件保存为什么扩展名。该应用程序的支持台不再支持该版本的软件，并且不会与我们讨论提取数据的问题。不幸的是，我们无法访问他们的源代码。

任何建议将不胜感激！提前致谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

吲‖鸣 2024-08-01 13:59:25

您可以查看前几个字节并找出最常见的文件类型

http://www .garykessler.net/library/file_sigs.html

回复收藏 0 原文

纵情客 2024-08-01 13:59:25

不要将其保存为任何类型。将其另存为不带扩展名的文件。如果您不知道它是什么，请不要伪造它。如果保存它的应用程序请求它，则从文件系统返回它，就像从数据库返回它一样；作为二进制数据。数据库不关心二进制对象是什么类型的数据；你也不应该。

回复收藏 0 原文

自由如风 2024-08-01 13:59:25

您可以尝试使用 TriD http://mark0.net/soft-trid-e.html

它将扫描文件并尝试确定扩展名。

回复收藏 0 原文

只是在用心讲痛 2024-08-01 13:59:25

您可以使用 UrlMon.dll 中的 FindMimeFromData() 函数（使用 pinvoke）。

请参阅此页面获取示例和此该函数的文档的 MSDN 页面。

回复收藏 0 原文

甜中书 2024-08-01 13:59:25

您如何知道这些信息是人类可读的？

文件扩展名的目的是关联用于打开文件的特定软件，以便当您双击 .txt 文件时，notepad.exe 会处理它。

如果您只是为了卸载数据库而将它们写入文件系统，则不需要任何特定的扩展名。如果您想将软件与其关联，请使用适当的扩展名

回复收藏 0 原文

南城旧梦 2024-08-01 13:59:25

另一种选择是对数据库进行物理分区。您可以将包含 blob 字段的表存储在不同的数据库文件中，该数据库文件可以存储在不同的硬盘/主轴上。包含 blob 表的磁盘可以通过将其设置为 RAID 0 或 RAID 10 来进一步优化。

这可以加快速度。此外，这种方法无需更改应用程序逻辑。

回复收藏 0 原文

始终不够 2024-08-01 13:59:25

用你的话来说“......我的任务是......” - 你确定这不是一个可以通过对数据库进行一些优化来解决的问题吗？您要尽可能避免对没有源代码且没有支持的遗留应用程序进行黑客攻击。

所以，看看这里的问题——应用程序的缓慢。那么为什么会慢呢？数据库索引无法解决的问题？

如果必须将 BLOB 提取到文件系统，那么为什么文件的格式是相关的？当然，应用程序的设计目的是对数据库进行查询，以便无论如何都能获取文件——将 BLOB 提取到文件系统对您有何帮助？

顺便说一句 - 我通常使用 Unix file 命令通过幻数来识别文件。

回复收藏 0 原文

~没有更多了~

关于作者

温馨耳语

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

如何从 blob/文件流中识别文件类型？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（7）

关于作者

相关话题

热门标签

推荐作者

丶情人眼里出诗心の

WTF

junpengz2000

对岸观火

我还不会笑

O.o?

友情链接

如何从 blob/文件流中识别文件类型？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（7）

关于作者

相关话题

热门标签

推荐作者

丶情人眼里出诗心の

WTF

junpengz2000

对岸观火

我还不会笑

O.o?

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。