使用Pyspark和HDFS创建新的CSV文件并上传数据
我想使用pyspark在HDF中创建一个CSV文件,并在其中放置一些数据。
I want to create a csv file in hdfs using pyspark and put some data in it.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您可以使用写入方法将pyspark数据帧写入HDFS作为CSV。在Spark 2.0+中,您可以直接使用
CSV
数据源。You can write a pyspark DataFrame to hdfs as csv using the write method. From Spark 2.0+ you can use
csv
data source directly.