HDFS

HDFS

文章 118 浏览 213

在HDFS中存储普通的JSON将在MongoDB中使用

我正在从不同的 API 获取 JSON 数据。我想将它们存储在 HDFS 中,然后在 MongoDB 中使用它们。 我是否需要将它们转换为 avro、序列文件、parquet 等,…

因为看清所以看轻 2025-01-18 22:17:05 2 0

尝试在Spark DataFrame上使用Johnnow预算管线,但无法在同一会话中读取Delta文件

我正在使用下面的代码从 hdfs 读取 Spark 数据帧: from delta import * from pyspark.sql import SparkSession builder= SparkSession.builder.appNa…

若能看破又如何 2025-01-18 16:36:55 3 0

loginuserfromkeytab用于用户组信息接受keytab文件的路径,在本地工作,但在捆绑为jar时不工作

我有所有4个文件需要在我的资源文件夹中从/写入到HDFS,而创建HDFS对象的方法如下。 public static FileSystem getHdfsOnPrem(String coreSiteXml, St…

终难愈 2025-01-18 12:02:06 2 0

shell脚本 - 遍历文本文件中的每一行,并重命名HDFS文件

我在HDFS中有一个文本文件,该文件将具有以下记录。文件中的行数可能每次都会有所不同。 hdfs://myfile.txt file_name_1 file_name_2 file_name_3 I…

记忆之渊 2025-01-17 23:34:44 2 0

如何递归搜索HDFS子文件夹中的术语?

我希望能够在HDFS中特定目录中的所有子目录和文件中搜索字符串模式。这就是它的外观-HADOOP FS -LS/MARCAC24/ DRWXRWXR-X用户超级组0 00:59 2022-03-2…

寄风 2025-01-17 09:01:03 5 0

HDFS中是否允许使用合并或重新分区来合并小文件(但合并后会很大)?

我正在使用 hdfs-sink-connector 将 Kafka 的数据消费到 HDFS 中。 Kafka连接器每10分钟写入一次数据,有时写入的文件非常小;它的大小从 2MB 到 100M…

你怎么敢 2025-01-16 11:45:20 3 0

从 ADLS gen2 上的增量表进行流式传输时出现 AzureBlobFileSystem FileNotFoundException

当我从 Azure Datalake Storage (ADLS) Gen2 上托管的 Delta 表流式传输数据时,流会运行一段时间,然后失败并出现以下错误。该错误表明该路径不存在…

日久见人心 2025-01-15 21:54:24 4 0

如何使用 KnoxSSO 访问 Namenode UI

我的目标 是通过 KnoxSSO 访问 Namenode UI 并在没有 Ambari 的情况下浏览 hdfs 文件。 我已经做了什么 我已经设置了 安全集群和HDFS HA 与 QJM。 Apa…

隔纱相望 2025-01-15 19:50:58 4 0

Hadoop HA ERROR: Exception in doCheckpoint (IOException) 图像上传 doCheckpoint 期间出现异常

我在基于 Windows 10 的集群中使用 Hadoop 3.2.2,并使用 Quorum Journal 管理器在 HDFS 上配置高可用性。 系统工作得很好,我能够毫无问题地将节点从…

断肠人 2025-01-15 08:02:01 1 0

如何删除hadoop目录中的文件(如果存在)?

我正在使用下面的命令来做到这一点。请注意,如果该文件夹中有任何内容,则此操作正常, hdfs dfs -rm -r /home/user/folder/* 但当文件夹为空时出现…

橘和柠 2025-01-14 23:17:02 3 0

从 S3 到 HDFS 的 Distcp

我正在尝试使用 distcp 工具将数据从 S3 复制到 HDFS。问题是,S3 集群使用 VPC 端点,我不知道如何正确配置 distcp。我已经尝试了几种配置,但没有一…

陌若浮生 2025-01-14 15:35:13 4 0

Docker 上的 Airflow 启动出现错误:类型错误:__init__() 收到意外的关键字参数“编码”;

我想通过提供商 hdfs 扩展 docker 上的气流: https://airflow.apache.org/ docs/docker-stack/build.html#examples-of-image-extending Dockerfile …

泅渡 2025-01-14 12:32:57 1 0

无法在路径上创建 Hive 外部表并出现错误(消息:索引 20 处的路径中存在非法字符)

我正在路径上创建一个 Hive 外部表。它给出了错误: hive> create external table mydb.ext_apps ( > a string, > b string > ) > location '/apps/sy…

一个人练习一个人 2025-01-13 21:53:20 2 0

NameNode 和 Datanode 未在 Hadoop 中的 start-dfs.cmd 上启动

所以我尝试使用此作为参考来设置Hadoop: Towardsdatascience.com 点击此处 现在出现错误: E:\RIYA\hadoop-env\hadoop-3.2.1\sbin>start-dfs.cmd 弹…

放赐 2025-01-13 14:49:45 3 0

如何将 Hive 表导出到 CSV 文件,其中我的文件包含警告非法字符的 CJK 单词

df = sol.spark.sql("SELECT * FROM mytable") df.write.csv("hdfs:///user/athena_ioc/mydata.csv") 在这种情况下我使用 pyspark,所以这里我使用 Sp…

撞了怀 2025-01-13 04:11:00 3 0
更多

推荐作者

眼泪淡了忧伤

文章 0 评论 0

corot39

文章 0 评论 0

守护在此方

文章 0 评论 0

github_3h15MP3i7

文章 0 评论 0

相思故

文章 0 评论 0

滥情空心

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文