在 H2 中创建许多模式对于分片和性能来说是一个好的策略吗?
在邮件列表上,有人暴露了以下问题:
- 我们有数百万用户(每个用户 1 到 5 MB 数据)
- 给定的用户数据不会访问或修改其他用户数据
- 我们如何使用 H2 实现分片,同时保持性能?
其他人回答了以下问题:
- 您可以为每个用户创建 1 个架构
- 好处是用户数据将位于单独的表实例中
- 因此,这将提高更新这些表时的性能
我的问题是:
- 有人尝试过这样做吗?
- 这真的是一个有趣的数据分片和提高/保持性能的策略吗?
On a mailing list, someone exposed the following issue:
- We have millions of users (1 to 5 MB of data per user)
- A given user data does not access or modify other user data
- How can we implement sharding using H2 while remaining performant?
Someone else answered the following:
- You could create 1 schema per user
- The benefit is that user data would be located in separate table instances
- Hence, this would improve performance when updating those tables
My question is:
- has anyone attempted this?
- Is this really an interesting strategy to shard data and improve/keep performance?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
如果您有数百万用户,平均每个用户有 2 MB 数据,那么您将获得大约 2 TB。我认为存储在一个数据库文件中太多了。另一方面,您也不想使用数百万个数据库文件。
我会使用多个数据库,每个数据库最多可容纳 1000 个用户(取决于数据量)。
然后,您可以创建多个模式(但请注意,对于 H2,模式元数据保存在内存中),或者向每个表添加“userId”列。
If you have millions of users, and 2 MB data per user on average, then you get about 2 TB. I think it's too much to store in one single database file. On the other hand, you don't want to use millions of database files either.
I would use multiple databases, each database with up to 1000 users (depending on the amount of data).
You can then either create multiple schemas (but please note that for H2, the schema metadata is kept in memory), or add a 'userId' column to each table.