需要安装哪种模式的hadoop和HDFS?

发布于 2025-01-13 21:50:03 字数 2170 浏览 2 评论 0原文

我是 hadoop 和 HDFS 的初学者,现在我需要连接 3 台不同的具有文件的 PC,NIFI 和 Hadop+HDFS。 机器 1:将有一个 .csv 文件 机器 2(个人笔记本电脑):将运行我的 NIFI。 机器 3(在我的办公室运行):其中将包含 Hadoop+HDFS。

现在我想使用机器 2 上运行的 nifi 将 csv 文件从机器 1 发送到机器 3 上运行的数据库。

我使用 ssh 连接连接到机器 3,这基本上是我办公室的路由器。

问题:如何从具有 nifi 的机器 2 连接到机器 3,该机器可以将文件发送到我的 hadoop hbase。 我应该使用公钥作为配置还是应该使用不同的设置或服务器?

我的haddo和hdfs的文件配置如下

hbase-site.xml

<configuration>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
 <property>
<name>hbase.rootdir</name>
<value>hdfs://localhost:9000/hbase</value>
</property>

<property>
<name>hbase.zookeeper.property.clientPort</name>
<value>2222</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/home/hadoop/zookeeper</value>
  </property>
</configuration>
<property>
<name>hbase.wal.provider</name>
<value>filesystem</value>
</property>
 <property>
<name>hbase.tmp.dir</name>
<value>./tmp</value>
</property>
</configuration>

核心站点.xml

<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hdoop/tmpdata</value>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

hdfs-site.xml

<configuration>


<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>file:///home/hadoop/hdfs/namenode</value>
</property>
<property>
<name>dfs.data.dir</name>
 <value>file:///home/hadoop/hdfs/datanode</value>
</property>
</configuration>

查看配置文件,让我知道我需要在哪里更改属性,并且到目前为止我已经在机器 3 中安装了伪分布式模式 HDFS。

I am a beginner to hadoop and HDFS, Now I have a situation where I need to connect 3 different PC having a file, NIFI and Hadop+HDFS.
Machine 1 : Will have a .csv file
Machine 2(Personal laptop): Will have my NIFI running to it.
Machine 3(Running at my office) : will have Hadoop+HDFS in it.

Now I would like to send a csv file from machine 1 to my database running on machine 3 using nifi which is running on machine 2.

I connect to machine 3 using ssh connection which is basically a router at my office.

Question:How can I connect to machine 3 from machine 2 which has nifi which can send the file to my hadoop hbase.
Should I use public key as configuration or should I use a different setup or server?

My configuration of files of haddo and hdfs are as follows

hbase-site.xml

<configuration>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
 <property>
<name>hbase.rootdir</name>
<value>hdfs://localhost:9000/hbase</value>
</property>

<property>
<name>hbase.zookeeper.property.clientPort</name>
<value>2222</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/home/hadoop/zookeeper</value>
  </property>
</configuration>
<property>
<name>hbase.wal.provider</name>
<value>filesystem</value>
</property>
 <property>
<name>hbase.tmp.dir</name>
<value>./tmp</value>
</property>
</configuration>

core-site.xml

<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hdoop/tmpdata</value>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

hdfs-site.xml

<configuration>


<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>file:///home/hadoop/hdfs/namenode</value>
</property>
<property>
<name>dfs.data.dir</name>
 <value>file:///home/hadoop/hdfs/datanode</value>
</property>
</configuration>

Look in to the configuration files and let me know where I need to change the properties and also I have install til now the psudo distributed mode HDFS in machine 3.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

街角卖回忆 2025-01-20 21:50:04

伪分布式和完全分布式没有什么不同。

你说只有机器3有HDFS。因此,它只需要运行名称节点和数据节点,以分布式方式设置,这意味着外部客户端将能够与其通信。

更具体地说,配置文件不应使用 localhost,而应使用 LAN IP 或主机名

Pseudo distributed and fully distributed aren't any different.

You say only machine 3 has HDFS. Therefore only it needs to be running a Namenode and Datanode, setup in a distributed fashion, meaning that external clients will be able to communicate with it.

More specifically, no config file should be using localhost and should instead use LAN IP or hostnames

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文