large-data

large-data

文章 0 浏览 5

虚拟化大数据的最有效方法是什么?

我有一个包含图表和图像的卡列表。由于图表数据和图像请求放缓我的应用程序,因此我认为遵循虚拟化技术。我目前正在使用NGX-Perfect-Scrollbar,并且…

丢了幸福的猪 2025-02-11 05:59:48 1 0

将大数据从MongoDB迁移到不同服务器上的另一个MongoDB

我有两个MongoDB簇,它们在4个服务器上运行(每个群集上的2个服务器)。它们与集合模式相同。现在,我想将新数据从一个群集迁移到另一个群集的现有旧…

安静 2025-02-10 23:14:57 2 0

读取。部分文件

我正在建立一个模型,该模型在.csv文件(〜50GB)中使用了大型数据集。我的机器是Windows 10,带有16GB RAM。 由于我没有足够的RAM来加载整个数据集,…

天赋异禀 2025-02-07 16:29:18 2 0

如何在大型数据集中自动浏览当前日期

我创建了一个大型数据集,该数据集包含Excel中的年度日期(1个日期为1个单元格)。日期放在行中。每个日期都包含各个日期的时间表。 打开床单时,我想…

み零 2025-02-05 07:52:49 3 0

在PHP中阅读大型JSON文件

我正在使用此代码来加载一个大的JSON文件,这使我的网站非常慢。 还有其他方法可以阅读大型JSON文件并保持我的网站快速吗? $json = file_get_content…

神仙妹妹 2025-02-04 18:32:37 3 0

查询使用Python PyodBC的数据库,并将结果导出到HDF5文件(内存错误)

我最近一直在研究一个超过5000万行和40列的数据。我使用了pyodbc并通过块读取数据,这花费了将近40分钟。我的团队成员使用R(RODBC软件包)从MSSQL阅…

捂风挽笑 2025-02-02 21:20:59 3 0

MySQL分区的问题

我已经进行了一些测试来研究分区,以便可以将其实现到具有大数据的实时数据库。 步骤1: CREATE TABLE tr (id INT, name VARCHAR(50), purchased DATE…

你的他你的她 2025-02-02 19:07:18 2 0

Reindex Magento 2与Morethan 500000产品

我有一个拥有500000多个产品的网站,但是由于产品数量比平常高得多,因此我无法成功进行重新索引。 在SSH上获取超时错误。 ReIndex模式设置为按计划更…

扛起拖把扫天下 2025-02-02 17:22:52 6 0

R星际错误:DIMS评估代理时不匹配对象的长度

我正在从不适合Rstudio的内存中的全球气候模型中处理一个大数据集,因此我选择通过将其作为恒星代理对象加载并通过块评估它来分析它。 在全日制期间进…

诗化ㄋ丶相逢 2025-02-01 03:08:45 5 0

Apache Spark Writer partitionby造成OOM

可以使用大小超过700GB的镶木quet文件的数据集。镶板由2列组成,每个列都带有JSON文档。 我现在想转换这些镶木木材文件并用分区保存它们。阅读,转换…

悲凉≈ 2025-01-30 19:30:08 3 0

将LARGA数据加载到Amazon Sagemaker笔记本

我有2个文件夹,在每个文件夹上,每个文件夹都有70个CSV文件,每个文件的大小为3MB至5MB,因此一般而言,数据大约是20亿行,每个列有5列。 我使用Amaz…

上课铃就是安魂曲 2025-01-29 13:36:21 5 0

创建新列,其中包含使用bash中现有列的串联

我有一个大的tsv.gz文件(40GB),我想从现有变量 col3 中提取一个字符串,将其存储在新变量 new_var (放置在开始)并保存所有新文件。 我是新来的示…

浅紫色的梦幻 2025-01-29 09:06:30 4 0

如何证明表B中存在所有查询A中的所有记录,以获取数百万记录?

我编写了查询(在Microsoft SQL Server Management Studio V18中),该工作室进行了多个内部连接,以提供3列的结果:ZipCode,ID,收入。 该结果集包…

桃扇骨 2025-01-28 06:10:38 3 0

在文件txt文件中搜索单词,该文件包含100,000,000个单词,

我有一个TXT文件,每条新行中有100000000个单词。 我想编写一个函数,该函数获取单词的输入并搜索是否在txt文件中是否存在单词。 我已经使用地图和Tri…

灼痛 2025-01-27 11:01:57 6 0

比较多列上两个大文件的最佳方法

我正在研究一个功能,该功能将允许用户上传两个CSV文件,编写规则以比较行并将结果输出到文件中。 两个文件都可以具有任意数量的列,并且列名也未修复…

泼猴你往哪里跑 2025-01-26 11:27:30 3 0
更多

推荐作者

李珊平

文章 0 评论 0

Quxin

文章 0 评论 0

范无咎

文章 0 评论 0

github_ZOJ2N8YxBm

文章 0 评论 0

若言

文章 0 评论 0

南…巷孤猫

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文