第 2 页 - large-data - 文江博客

投稿关注

large-data

文章 0 浏览 5

Python：请求URL的大量有效载荷

我正在尝试使用Python从URL获取数据。我正在使用的代码是： response = requests.get( url="https://api.covalenthq.com/v1/"+Chain_id+"/address/"+A…

无人问我粥可暖 2025-01-25 02:52:18 3 0

Union-All PostgreSQL选择保留订单条款

与RDBMS PostgreSQL具有复杂的SQL查询，该查询由多个嵌套的联合全呈嵌套查询组成，类似的问题： ( ( ( UNION ALL ) UNION ALL ( UNION ALL ) UNION AL…

澉约 2025-01-24 10:32:58 4 0

Laravel验证大JSON太慢了

我正在研究酒店应用程序，在该应用程序中，我可以以JSON格式收到大量数据以更新数据库记录。 JSON结构如下（缩减示例）： [ { "combination_plan_id":…

听你说爱我 2025-01-22 15:37:05 2 0

Databricks社区版中的大数据预处理

我有16 GB数据集，并希望在数据链球键中使用它。但是，在社区版中，DBFS限制为10 GB。您可以帮助我预处理数据，以便能够将其从驱动程序转移到DBF。…

§普罗旺斯的薰衣草 2025-01-22 10:21:03 5 0

快捷方式使用Panda＆＃x27的重复（）带有厚CSV

我无法一次阅读整个5 GB CSV文件，但是使用pandas' read_csv（）带有 chuncksize set似乎是一种快速简便的方法 import pandas as panda def run_pand(…

薄凉少年不暖心 2025-01-21 17:06:58 1 0

无法使用Nestjs/nodejs读取和处理非常大的CSV文件

我正在尝试使用我的Nest API读取一个非常大的CSV文件，该文件具有30000001行，并有四列Timestamp（ number ），transaction_type（ string ），token…

与风相奔跑 2025-01-21 05:23:44 3 0

熊猫以最有效的方式求和两个日期之间的值？

我有一个数据集显示每周报告的产量，另一个数据集报告某些子生产每小时的产量。我现在想以最有效的方式将所有每小时子生产的总和与每周报告的值进行比…

暮年 2025-01-16 21:25:23 4 0

我收到一条消息“DevTools 已与页面断开连接”加载 PCD 模型后

我注意到有关 DevTools 的消息也存在类似问题。然而，在我加载由大约 1700 万个点组成的点云模型后，就发生了这种情况。将模型优化到 336'260 点后，…

海之角 2025-01-15 02:06:30 3 0

ivot_longer 具有非常大的 data.frame，内存有效的方法

我有一个包含 1100 万行医院数据的 data.frame。 Columns: ID (chr), outcome (1|0), 20x ICD-10 codes (chr). Rows: 10.6 million 我希望使数据整洁…

等风来 2025-01-14 07:59:33 3 0

加载大量 .obj 三纤维和 React 时出现问题

我正在尝试在三纤维和反应（@react-三/纤维）中创建一个由六边形组成的星球。我设法生成了 N 个六边形，每个六边形存储在 React 应用程序内的文件夹（…

千紇 2025-01-12 05:35:36 4 0

如何返回列表中多个项目的位置？（Python）

我正在使用一个大数据集（大约 3600 个 x 值和 3600 个 y 值），并且尝试返回与已从原始数据中提取的 y 值相对应的某些 x 值的位置。 for n in new_y:…

岁月流歌 2025-01-12 02:10:12 5 0

使用 Node.js 在 SQL Server 中为多个用户运行多个查询

我有大量的用户记录。我会解释我想要什么以及我做了什么。首先，我从数据库中获取活跃用户记录，然后在 for 循环中从另一个表中检查其详细信息，然后…

呆头 2025-01-10 08:25:49 6 0

如何在 Jenkins 作业之间传递大量文本？

我使用的 Jenkins 作业调用下游参数化作业，其参数是 JSON 格式的字符串。有时，下游作业会失败。错误文本量很大，我认为相关内容是： Caused by: ja…

却一份温柔 2025-01-10 00:42:14 4 0

使用 lapply 运行多个 Kruskal Wallis 测试需要很长时间。更简单的解决方案？

我有一个名为 KWR 的数据框，包含 90 个观测值和 124306 个变量，全部为数值数据。我想在组之间的每一列中运行 Kruskal Wallis 分析。我在名为“Group…

暗藏城府 2025-01-09 17:44:41 6 0

关于实施快速有效的方法来搜索非常大的数据集中的项目列表的建议/意见

请评论和批评该方法。场景：我在一个平面文件中有一个大型数据集（2 亿个条目）。数据的形式为 - 10 位数字电话号码后跟 5-6 个二进制字段。每周我…

两人的回忆 2025-01-08 06:16:56 5 0

共 9 页
上一页
1
2
3
4
5
下一页

友情链接

文江博客