hadoop

hadoop

文章 899 浏览 343

部署时错误:org.apache.hadoop.fs.localfilesystem找不到

我正在尝试在Scala/SBT中编写一个镶木quet文件。我的代码在我的计算机上工作正常,但是与Jenkins一起部署在服务器上时始终失败。 我有以下错误: java…

可可 2025-02-09 14:31:26 3 0

计算镶木中的行数

您知道在Scala中计算Parquet中的行数的任何方法吗?有hadoop库吗?还是镶木库?我想避免火花。我的意思是: number_rows(“ hdfs://// tmp/parquet…

箹锭⒈辈孓 2025-02-09 11:05:06 2 0

Hadoop资源管理器页面无法从Windows WSL打开

我已经使用此页面在Windows WSL Ubuntu-22.04上安装和运行Hadoop:。 看起来Hadoop已经开始了: hadoopuser@hostname:~$ jps 1840 NodeManager 993 Na…

如歌彻婉言 2025-02-09 11:01:04 2 0

用apache spark/prem hadoop撰写avro文件到Google Cloud Storage

我正在尝试使用“ Hadoop”上的Hadoop上的一些Spark Workfrows迁​​移到Google Cloud Storage。 假设VPC,网络,云互连和防火墙都已井井有条,那么首…

单身狗的梦 2025-02-09 08:35:24 1 0

Hadoop ftpfilesystem未能列出文件并抛出SockettimeoutException

我正在使用apache hadoop ftpfilesystem 版本3.2.0列出并从FTP服务器读取文件。 这是我的测试代码: public static void main(String[] args) throws …

梦一生花开无言 2025-02-09 06:37:36 1 0

Hive加入表并创建2个不同的表格

我正在使用Hive .14进行学校项目(因此不能使用更好的版本),目前我分析了纽约Uber获取的数据。我使用2个表:YellowTaxi22,以获取有关Uber旅行的信…

何以笙箫默 2025-02-09 02:32:55 2 0

关于使用start-dfs.sh和map降低任务的core-ste.xml文件条目-hadoop

是大数据模块的新手,并在Ubuntu上正在运行Hadoop。 对于地图减少作业,以下条目需要抑制core-site.xml fs.default.name HDFS:// Localhost:8020 st…

你丑哭了我 2025-02-08 22:03:45 2 0

HBASE区域分裂出乎意料,每个区域大小小于1g

hbase.hregion.max.filesize 是10g。 拆分策略是 SteppingsPlitPolicy 。 该表由Phoenix与 salt_buckets = 6 创建。 根据 steppingsplitpolicy 的源…

谈情不如逗狗 2025-02-08 10:11:48 2 0

字段不等于其他列的任何值

Table1只有一个列(customer_id),并包含我要从分析中排除的客户ID列表。 卖出的销售也包含customer_id(我想排除的所有内容 +我想包括的其他属性)…

維他命╮ 2025-02-08 05:56:03 1 0

获取描述而不是Impala查询中的属性名称

在Impala(在Hadoop中使用色调)作为输出时 describe scheme1.table1 ,我正在获得带有列的表格 '名称' '类型' “评论” 字段中的“注释”我看到了属…

水中月 2025-02-07 19:27:11 2 0

apiversion v2无效

我正在尝试借助此帮助将Hadoop安装到K8S(​​Minikube)中: github link 每次我运行此命令安装helm -name hdfs bigdata-gradiant/hdfs 我都会得到此…

少跟Wǒ拽 2025-02-07 06:51:23 3 0

无法通过JDBC Java连接Hive

我试图通过Java(Eclipse)连接Hive。 Hive正在我安装它的Linux服务器上工作。 我已经导入所有JAR文件。 我正在使用此代码, BasicConfigurator.confi…

怪我入戏太深 2025-02-07 00:39:27 2 0

如何从Docker容器连接到HDFS?

我的目标是在气流中读取HDFS的文件并进行进一步的操作。 研究之后,我发现我需要使用的URL如下: df = pd.read_parquet('http:// localhost:9870/w…

长不大的小祸害 2025-02-06 21:41:44 3 0

使用作业文件运行时,Apache Nutch不读取新的配置文件

我已经配置了Apache Nutch 1.x用于网络爬行。有一个要求,我应该为每个域中的索尔尔文档添加一些额外信息。配置是一个JSON文件。我已经为此开发了遵循…

夏日浅笑〃 2025-02-06 20:09:22 2 0

阿帕奇猪的薪水总和

为可用文件emp1.csv和 dept.csv。 colnames:emp:empno,name,sal,did,branch,dno 部门:deptno,name,loc 检索为工作的员工支付的总薪水 “芝…

誰認得朕 2025-02-06 19:53:08 3 0
更多

推荐作者

夢野间

文章 0 评论 0

百度③文鱼

文章 0 评论 0

小草泠泠

文章 0 评论 0

zhuwenyan

文章 0 评论 0

weirdo

文章 0 评论 0

坚持沉默

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文