第 2 页 - hadoop - 文江博客

投稿关注

hadoop

文章 899 浏览 343

部署时错误：org.apache.hadoop.fs.localfilesystem找不到

我正在尝试在Scala/SBT中编写一个镶木quet文件。我的代码在我的计算机上工作正常，但是与Jenkins一起部署在服务器上时始终失败。我有以下错误： java…

可可 2025-02-09 14:31:26 3 0

计算镶木中的行数

您知道在Scala中计算Parquet中的行数的任何方法吗？有hadoop库吗？还是镶木库？我想避免火花。我的意思是： number_rows（“ hdfs：//// tmp/parquet…

箹锭⒈辈孓 2025-02-09 11:05:06 2 0

Hadoop资源管理器页面无法从Windows WSL打开

我已经使用此页面在Windows WSL Ubuntu-22.04上安装和运行Hadoop：。看起来Hadoop已经开始了： hadoopuser@hostname:~$ jps 1840 NodeManager 993 Na…

如歌彻婉言 2025-02-09 11:01:04 2 0

用apache spark/prem hadoop撰写avro文件到Google Cloud Storage

我正在尝试使用“ Hadoop”上的Hadoop上的一些Spark Workfrows迁移到Google Cloud Storage。假设VPC，网络，云互连和防火墙都已井井有条，那么首…

单身狗的梦 2025-02-09 08:35:24 1 0

Hadoop ftpfilesystem未能列出文件并抛出SockettimeoutException

我正在使用apache hadoop ftpfilesystem 版本3.2.0列出并从FTP服务器读取文件。这是我的测试代码： public static void main(String[] args) throws …

梦一生花开无言 2025-02-09 06:37:36 1 0

Hive加入表并创建2个不同的表格

我正在使用Hive .14进行学校项目（因此不能使用更好的版本），目前我分析了纽约Uber获取的数据。我使用2个表：YellowTaxi22，以获取有关Uber旅行的信…

何以笙箫默 2025-02-09 02:32:55 2 0

关于使用start-dfs.sh和map降低任务的core-ste.xml文件条目-hadoop

是大数据模块的新手，并在Ubuntu上正在运行Hadoop。对于地图减少作业，以下条目需要抑制core-site.xml fs.default.name HDFS：// Localhost：8020 st…

你丑哭了我 2025-02-08 22:03:45 2 0

HBASE区域分裂出乎意料，每个区域大小小于1g

hbase.hregion.max.filesize 是10g。拆分策略是 SteppingsPlitPolicy 。该表由Phoenix与 salt_buckets = 6 创建。根据 steppingsplitpolicy 的源…

谈情不如逗狗 2025-02-08 10:11:48 2 0

字段不等于其他列的任何值

Table1只有一个列（customer_id），并包含我要从分析中排除的客户ID列表。卖出的销售也包含customer_id（我想排除的所有内容 +我想包括的其他属性）…

維他命╮ 2025-02-08 05:56:03 1 0

获取描述而不是Impala查询中的属性名称

在Impala（在Hadoop中使用色调）作为输出时 describe scheme1.table1 ，我正在获得带有列的表格 '名称' '类型' “评论” 字段中的“注释”我看到了属…

水中月 2025-02-07 19:27:11 2 0

apiversion v2无效

我正在尝试借助此帮助将Hadoop安装到K8S（Minikube）中： github link 每次我运行此命令安装helm -name hdfs bigdata-gradiant/hdfs 我都会得到此…

少跟Wǒ拽 2025-02-07 06:51:23 3 0

无法通过JDBC Java连接Hive

我试图通过Java（Eclipse）连接Hive。 Hive正在我安装它的Linux服务器上工作。我已经导入所有JAR文件。我正在使用此代码， BasicConfigurator.confi…

怪我入戏太深 2025-02-07 00:39:27 2 0

如何从Docker容器连接到HDFS？

我的目标是在气流中读取HDFS的文件并进行进一步的操作。研究之后，我发现我需要使用的URL如下： df = pd.read_parquet（'http：// localhost：9870/w…

长不大的小祸害 2025-02-06 21:41:44 3 0

使用作业文件运行时，Apache Nutch不读取新的配置文件

我已经配置了Apache Nutch 1.x用于网络爬行。有一个要求，我应该为每个域中的索尔尔文档添加一些额外信息。配置是一个JSON文件。我已经为此开发了遵循…

夏日浅笑〃 2025-02-06 20:09:22 2 0

阿帕奇猪的薪水总和

为可用文件emp1.csv和 dept.csv。 colnames：emp：empno，name，sal，did，branch，dno 部门：deptno，name，loc 检索为工作的员工支付的总薪水 “芝…

誰認得朕 2025-02-06 19:53:08 3 0

共 149 页
上一页
1
2
3
4
5
下一页

友情链接

文江博客