Spark

Spark

文章 222 浏览 116

Spark作业提交报错: Initial job has not accepted any resources; ...

我在本地使用IntelliJ IDEA进行spark开发,在提交到集群运行时报错。搜索一番之后,所有的答案都指向CPU/内存资源不足,但我已经设置了足够的CPU/内…

君勿笑 2022-09-07 08:44:03 32 0

sparksql操作csv排序时如何进行Int类型的排序, 而不是String类型的排序

Dataset df = spark.read().format("csv").load("C:\\develop\\intellij-workspace\\SparkSqlDemos\\resources\\down.csv"); df.createOrReplaceTemp…

情魔剑神 2022-09-07 08:27:58 14 0

流量分发方面有没有开源的中间件或者组件呢?

有没有一些中间件的开源产品,提供流量的打标和流量的的分发?就是说,http请求过来时候,根据header头里面或者ip的地理位置信息等各个维度的信息,…

深陷 2022-09-07 08:20:31 14 0

Zeppelin教程代码运行报错。

参照链接描述在zeppelin容器提供的网页笔记本中运行教程代码。导入本地文件: val bankText = sc.textFile("D:/Projects/Zeppelin/bank/bank-full.cs…

往昔成烟 2022-09-07 08:00:23 37 0

start-all 方式启动 spark 集群,没有出现 Master进程?

最开始启动了 spark,hdfs,yarn 成功,但是长时间后,发现无法正常提交 spark任务了,老是出现类似于如下错误。"INFO Client: Retrying connect to …

盛夏已如深秋| 2022-09-07 08:00:21 18 0

请问Spark'DataFrame只对一列进行编辑(截取一段)并返回新的DataFrame该怎么写

请问Spark'DataFrame只对一列进行编辑(截取一段)并返回新的DataFrame该怎么写…

这个俗人 2022-09-07 07:59:48 12 0

spark groupby 之后相同字段 的数据 是处于同一个分区吗?

假定一个RDD 存在十个分区, 当对这个RDD进行groupby之后得到一个新的RDD,相同字段的数据是否 处于同一个分区? 我测试结果查看是相同分组字段的数…

暮年慕年 2022-09-07 07:59:43 16 0

spark集群中的worker总是连接不到master, zookeeper集群实现master高可用?

1,spark0-2 三台主机是zookeeper集群 2,spark0-4五台主机是 spark集群 3 spark0-1 两台主机实现master高可用。 在spark0上运行start-all.sh启动spa…

笑着哭最痛 2022-09-07 07:37:16 18 0

Spark 中 关于scala 语法理解的问题

val lines: Dataset[String] = session.read.textFile("") val words: Dataset[String] = lines.flatMap(_.split(" ")) 上面lines是一个dataSet对象…

夜深人未静 2022-09-06 23:51:48 19 0

spark : scala的方法中为什么无法访问对象的属性?

如何理解 绿色部分的内容? 怎么感觉那么别扭啊,书中说的感觉也很含糊。 …

零度℉ 2022-09-06 22:11:49 14 0

Oozie运行Spark2 Action

使用Ambari 2.6, 安装的是HDP-2.6.4 最近想用Oozie执行Spark2,按照提示设置好了spark2 lib,并且从oozie和spark2两个share lib folder中删除了重复…

橘亓 2022-09-06 21:21:01 28 0

Spark的DataFrame做Map操作时怎么返回超过22个字段

val originInfoDF = spark.sql("select col1, col2, col3, col4 from table_T") val aggData = originInfoDF .groupBy("col1") .agg(collect_set(arra…

呢古 2022-09-06 20:22:20 18 0

spark mllib 可以将模型持久化到 hdfs 吗?

spark mllib 可以通过 model.save(hdfsPath) 将模型持久化吗?然后通过 xxxModel.load()将模型加载进来。ps:不是 spark mlps:spark ml 可以吗…

漆黑的白昼 2022-09-06 15:56:56 18 0

为什么spark ml 中没有基于测试数据的评估矩阵 Evaluation Metrics?

在 spark mllib 中有基于测试数据预测结果的评估矩阵 Evaluation Metrics,但是是不是 spark ml 库中却没有,我发现的是通过训练数据训练后的模型的 s…

花想c 2022-09-06 15:56:17 19 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文