当前位置：文江博客话题详情

建议存储有关 2 亿张图像（100 万本书）元数据的数据库（NoSQL？SQL？）

发布于 2024-09-06 20:10:43 字数 280 浏览 10 评论 0原文

朋友们，

我们将进行一个知识保存项目，扫描超过100万本书。我们需要一些关于实现用于存储和检索元数据的数据库以及使用它来跟踪每个对象（书籍）的扫描状态的建议

你们能建议我们应该使用 SQL 还是 NoSQL（元数据可能因项目而异）项目说这个项目可以有 15 个字段）
我们正在考虑基于Lucene/Solr 或某些可扩展 RDF 数据库
任何我们能够定义自定义元数据字段并通过搜索功能存储信息的开源解决方案？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

热鲨 2024-09-13 20:10:43

免责声明：从未尝试过此类项目，

我已经看到 MSSQL 服务器的“Filestream”类型具有非常好的性能。它使用 NTFS 文件 API 来存储二进制数据，并在表的行中保留一个指针。

如果您没有元数据结构，您可以使用 XML，但如果您确实有重复结构，请将其推入关系数据，然后您可以使用索引等来帮助您获得性能。

文件流类型

回复收藏 0 原文

↘紸啶 2024-09-13 20:10:43

可以使用任何数据库和一些自定义代码创建这样的解决方案，但通过使用 CMS（内容管理系统）可能会变得更容易。 CMS 解决方案隐藏底层数据库的详细信息，并允许您使用一组可扩展的元数据来描述您的文档。

您使用哪种 CMS 系统取决于您的预算、内部专业知识和您的需求等因素。我一直在使用 Alfresco（商业开源），部分原因是我的公司已经决定使用它，但如果我要做一个低预算的网站，我可能会考虑非企业版本。哦，Alfresco 利用 Lucene 进行搜索。

如果您的需求非常基本，那么元数据的数据库、图像的文件系统和服务器的一些代码就足够了。避免尝试将图像存储在数据库中，因为根据我的经验，这不是数据库最擅长的。

回复收藏 0 原文

~没有更多了~

关于作者

烏雲後面有陽光

暂无简介

文章

27 人气

关注发私信

尘曦

文章 0 评论 0

关注

在梵高的星空下

文章 0 评论 0

关注

善良天后

文章 0 评论 0

关注

韬韬不绝

文章 0 评论 0

关注

qq_CgiN62

文章 0 评论 0

关注

不美如何

文章 0 评论 0

友情链接

文江博客

建议存储有关 2 亿张图像（100 万本书）元数据的数据库（NoSQL？SQL？）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

尘曦

在梵高的星空下

善良天后

韬韬不绝

qq_CgiN62

不美如何

友情链接

建议存储有关 2 亿张图像（100 万本书）元数据的数据库（NoSQL？SQL？）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

尘曦

在梵高的星空下

善良天后

韬韬不绝

qq_CgiN62

不美如何

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。