large-data-volumes

large-data-volumes

文章 0 浏览 7

大数据集、ProcessPoolExecutor 问题

问题 - ProcessPoolExecutor 没有提高速度。由 tqdm 确认 了解了足够的 Python 知识,可以复制和/或编写一个可以运行的程序。每个文件大约需要 40 秒…

短叹 2025-01-10 22:47:35 5 0

绘制散布大量地理数据

我尝试编写一段代码,创建 2021 年发生的所有森林火灾的可视化。包含数据的 CSV 文件约为 1.5Gb,该程序对我来说看起来是正确的,但当我尝试运行它时…

当梦初醒 2025-01-09 05:27:22 5 0

PHP 查询运行缓慢并截断非常大的 MySQL 数据库中的值

我正在处理一个包含大约 30 个表和 1000 万个唯一条目的数据库。 我正在尝试使用 PHP 使用 echo“函数”以某种格式呈现该数据,并使用 {$variable} 放…

久而酒知 2025-01-06 23:55:19 5 0

如何有效地搜索可能很大的数据库?

这更多的是一种讨论。 我们有一个多租户系统,并且具有可以包含数百万行的表。我们的 UI 允许用户使用许多不同的搜索条件对这些表执行搜索 - 因此他们…

韶华倾负 2025-01-05 09:42:35 4 0

仍然无法通过 WCF 传输大量数据 - 还有什么问题吗?

我在尝试从 WCF 服务传输大量对象时遇到问题。我必须将对象传输限制为 100 个,否则会出现某种通信错误。 我尝试了解决方案中的建议,在此处找到,但…

吖咩 2024-12-28 10:34:54 4 0

Apache Solr 能否处理 TB 大数据

我是 apache solr 用户大约一年了。我使用 solr 作为简单的搜索工具,但现在我想使用 solr 处理 5TB 的数据。我假设当 solr 根据我使用的过滤器对其进…

椒妓 2024-12-26 04:30:30 7 0

我有 100 万亿个元素,每个元素的大小从 1 字节到 1 万亿字节 (0.909 TiB)。如何有效地存储和访问它们?

这是一个面试问题: 假设: 我有 100 万亿个元素,每个元素的大小从 1 字节到 1 万亿字节 (0.909 TiB)。 如何有效地存储和访问它们? 我的想法: 他们…

风筝有风,海豚有海 2024-12-20 23:46:30 5 0

搜索重复的大型地理空间数据库

我正在 MySQL 中使用 maxmind geocities 表(参见此处) (视窗)。 该表有超过 270 万行(非常大)。 我正在尝试按照经度和纬度查找城市重复项(以便…

爱格式化 2024-12-18 09:29:59 5 0

琐碎的任务 - 复杂的解决方案?

有一个小问题: 将 uniqueidentifier 分配给任何 externalId 分配后不要覆盖 uniqueidentifier - 只需返回现有的 uniqueidentifier 想象一个表 Extern…

谜泪 2024-12-12 02:44:12 6 0

如何对很多很多页面进行页面导航?对数页面导航

显示许多页面的页面导航的最佳方式是什么? (最初这是作为操作提示发布的,我的答案包含在问题中。我现​​在将我的答案分成下面的“答案”部分)。 …

韶华倾负 2024-12-11 00:51:52 6 0

从记录集中获取特定行

我有一个很大的数据库结果集,我想通过 1 个查询从中获取特定行: 1.、60. 和 61.,120。 和121.,180。 ...并且每第 60 条和第 61 条记录,直到我拥有…

离旧人 2024-12-06 16:30:37 5 0

针对海量数据集的 SQL 数据库设计

我有一个客户,具有以下数据结构......对于每个患者,可能有多个样本,每个样本经过处理后可能有400万个数据对象。每个患者的最大样本数为 20。因此,…

原来是傀儡 2024-12-06 11:27:45 5 0

大数据处理技术与应用图书

我正在寻找有关如何有效查询大量数据的良好资源。 每个数据项都表示为许多不同的属性,例如数量、价格、历史信息等。客户端将提供不同的查询条件,但…

沩ん囻菔务 2024-12-05 12:33:54 5 0

适当的数据结构可加快检索过程(数据大小:约 200,000 个值,全部为字符串)

我有一个大约 200, 000 个值的大型数据集,它们都是字符串。我应该使用哪种数据结构,以便搜索和检索过程更快。插入是一次性的,所以即使插入速度慢也…

℉絮湮 2024-12-04 17:40:01 5 0

在大数据集中搜索多个字符串

我正在处理两组数据: 第一组在单列中有 500 个成员(所有字符串) 集合 2 在两列(制表符分隔)中包含 30,000 个成员,其中第 1 列是数字 ID 号,第 …

中性美 2024-12-01 17:26:35 3 0
更多

推荐作者

牛↙奶布丁

文章 0 评论 0

COSO

文章 0 评论 0

落叶

文章 0 评论 0

暗地喜欢

文章 0 评论 0

qq_i8qOEG

文章 0 评论 0

qq_Wl4Sbi

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文