无法使用pyarrrow中的hadoopfilesystem连接到hadoop服务器

发布于 2025-01-23 06:23:16 字数 1353 浏览 1 评论 0原文

我正在尝试使用Python代码,其中我正在使用Pyarrow,并尝试使用fs.hadoopfilesystem(host = host_value,port = port_value)尝试与Hadoop服务器建立

    self.parquet_writer = HDFSWriter(host_value='hdfs://10.110.8.239',port_value=9000)
    File "/app/aerial_server.py", line 54, in __init__
        self.hdfs_client = fs.HadoopFileSystem(host=host_value, port=port_value)
    File "pyarrow/_hdfs.pyx", line 89, in pyarrow._hdfs.HadoopFileSystem.__init__
    File "pyarrow/error.pxi", line 143, in pyarrow.lib.pyarrow_internal_check_status
    File "pyarrow/error.pxi", line 114, in pyarrow.lib.check_status
    OSError: HDFS connection failed

连接变量

    PYTHON_VERSION=3.7.13
    HADOOP_OPTS=-Djava.library.path=/app/hadoop-3.3.2/lib/nativ
    JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
    HADOOP_INSTALL=/app/hadoop-3.3.2
    ARROW_LIBHDFS_DIR=/app/hadoop-3.3.2/lib/nativeHADOOP_MAPRED_HOME=/app/hadoop-3.3.2
    HADOOP_COMMON_HOME=/app/hadoop-3.3.2
    HADOOP_HOME=/app/hadoop-3.3.2
    HADOOP_HDFS_HOME=/app/hadoop-3.3.2PYTHON_PIP_VERSION=22.0.4
    CLASSPATH=/app/hadoop-3.3.2/bin/hdfs classpath --glob
    HADOOP_COMMON_LIB_NATIVE_DIR=/app/hadoop-3.3.2/lib/native
    PATH=/usr/local/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/app/hadoop-3.3.2/sbin:/app/hadoop-3.3.2/bin
    _=/usr/bin/env

I am trying a python code in which I am using pyarrow and trying to make connection to hadoop server using fs.HadoopFileSystem(host=host_value, port=port_value) but everytime I am getting an error message:

    self.parquet_writer = HDFSWriter(host_value='hdfs://10.110.8.239',port_value=9000)
    File "/app/aerial_server.py", line 54, in __init__
        self.hdfs_client = fs.HadoopFileSystem(host=host_value, port=port_value)
    File "pyarrow/_hdfs.pyx", line 89, in pyarrow._hdfs.HadoopFileSystem.__init__
    File "pyarrow/error.pxi", line 143, in pyarrow.lib.pyarrow_internal_check_status
    File "pyarrow/error.pxi", line 114, in pyarrow.lib.check_status
    OSError: HDFS connection failed

env variables

    PYTHON_VERSION=3.7.13
    HADOOP_OPTS=-Djava.library.path=/app/hadoop-3.3.2/lib/nativ
    JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
    HADOOP_INSTALL=/app/hadoop-3.3.2
    ARROW_LIBHDFS_DIR=/app/hadoop-3.3.2/lib/nativeHADOOP_MAPRED_HOME=/app/hadoop-3.3.2
    HADOOP_COMMON_HOME=/app/hadoop-3.3.2
    HADOOP_HOME=/app/hadoop-3.3.2
    HADOOP_HDFS_HOME=/app/hadoop-3.3.2PYTHON_PIP_VERSION=22.0.4
    CLASSPATH=/app/hadoop-3.3.2/bin/hdfs classpath --glob
    HADOOP_COMMON_LIB_NATIVE_DIR=/app/hadoop-3.3.2/lib/native
    PATH=/usr/local/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/app/hadoop-3.3.2/sbin:/app/hadoop-3.3.2/bin
    _=/usr/bin/env

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文