数百个表与单个大型表

发布于 2024-10-22 06:53:48 字数 610 浏览 6 评论 0原文

我正在尝试解决一个问题，我们正在分析表中的大量数据。我们需要提取这些数据的某些子集并进行分析。事实上，我认为最好对其进行多线程处理，并在最初引入尽可能多的数据，并对每个区域执行各种计算。假设要分析的每个数据子集都表示为 S1、S2...，因此每个子集都有一个线程。执行计算后，还可能会创建一些可视化结果，并且需要将结果存储回数据库中，因为分析结果中可能存在许多千兆字节的数据。假设结果用 R1、R2 等表示，

虽然这有点模糊，但我想知道我们是否应该为每个 R1、R2 等创建一个表，或者将所有结果存储在一个表中？我们可能希望多个线程同时存储结果（回想一下 S1、S2 的线程），因此如果只有一个表，我需要确保多个线程可以同时访问它。如果有帮助的话，当再次需要 R1、R2 等的数据时，所有这些数据都将按一定的顺序被拉出，如果 R1、R2 等每个都有一个表，那么这将很容易维护。，我在想，如果我们走这条路，我们可以为每个表设置一个对象来管理对该特定结果表的请求。本质上，我希望该对象就像一个 bean，只在必要时从该数据库加载数据（太多而无法一次保存在内存中）。另一点是，我们使用 InnoDB 作为存储引擎，以防多个线程是否可以访问特定表产生任何影响。

那么，有了这些信息，最好是为结果创建一组表，还是为每个结果区域（可能是 100 个）创建一个表？

谢谢

原文

分享到QQ

分享到微博