从 pyspark 访问 s3 时，亚马逊存储桶的证书不匹配

发布于 2025-01-09 05:32:28 字数 533 浏览 0 评论 0原文

我有 EC2 实例，我试图将 PySpark 配置为从 S3 读取。我为 EC2 实例设置了完全访问 IAM 角色，并在 Spark 中使用了以下包：

com.amazonaws:aws-java-sdk-bundle:1.11.563,org.apache.hadoop:hadoop-aws:3.3.1

但是，我收到一些新错误，我不确定这是什么意思：

：org.apache.hadoop.fs.s3a.AWSClientIOException：getFileStatus on s3a://bucket_name.stuff/mycsv.csv：com.amazonaws.SdkClientException：无法执行 HTTP 请求：的证书不匹配任何主题备用名称：[*.s3.amazonaws.com, s3.amazonaws.com]

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

書生途 2025-01-16 05:32:28

所以问题是 pyspark、hadoop-aws 和 java-sdk 之间的版本不匹配（在找到正确的版本设置之前，我遇到了各种不同的错误）
对我有用的组合是：

pyspark 3.0.0
org.apache.hadoop:hadoop-aws:2.7.2
com.amazonaws:aws-java-sdk-pom:1.11.34

So the issue turned out to be a version mismatch between pyspark, hadoop-aws and java-sdk (I was getting all kind of different errors until I found a proper version setup)
The combination that worked for me was:

pyspark 3.0.0
org.apache.hadoop:hadoop-aws:2.7.2
com.amazonaws:aws-java-sdk-pom:1.11.34

回复收藏 0 原文

~没有更多了~

关于作者

泡沫很甜

暂无简介

文章

25 人气

关注发私信

卷耳

文章 0 评论 0

关注

佚名

文章 0 评论 0

关注

℉服软

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

凉宸

文章 0 评论 0

关注

gyhjy

文章 0 评论 0

友情链接

文江博客

从 pyspark 访问 s3 时，亚马逊存储桶的证书不匹配

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

从 pyspark 访问 s3 时，亚马逊存储桶的证书不匹配

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。