第 5 页 - Spark - 文江博客

Spark

文章 222 浏览 119

Spark作业提交报错: Initial job has not accepted any resources; ...

我在本地使用IntelliJ IDEA进行spark开发，在提交到集群运行时报错。搜索一番之后，所有的答案都指向CPU/内存资源不足，但我已经设置了足够的CPU/内…

君勿笑 2022-09-07 08:44:03 35 0

sparksql操作csv排序时如何进行Int类型的排序, 而不是String类型的排序

Dataset df = spark.read().format("csv").load("C:\\develop\\intellij-workspace\\SparkSqlDemos\\resources\\down.csv"); df.createOrReplaceTemp…

情魔剑神 2022-09-07 08:27:58 18 0

流量分发方面有没有开源的中间件或者组件呢？

有没有一些中间件的开源产品，提供流量的打标和流量的的分发？就是说，http请求过来时候，根据header头里面或者ip的地理位置信息等各个维度的信息，…

深陷 2022-09-07 08:20:31 17 0

Zeppelin教程代码运行报错。

参照链接描述在zeppelin容器提供的网页笔记本中运行教程代码。导入本地文件： val bankText = sc.textFile("D:/Projects/Zeppelin/bank/bank-full.cs…

往昔成烟 2022-09-07 08:00:23 41 0

start-all 方式启动 spark 集群，没有出现 Master进程？

最开始启动了 spark，hdfs，yarn 成功，但是长时间后，发现无法正常提交 spark任务了，老是出现类似于如下错误。"INFO Client: Retrying connect to …

盛夏已如深秋| 2022-09-07 08:00:21 21 0

请问Spark'DataFrame只对一列进行编辑（截取一段）并返回新的DataFrame该怎么写

请问Spark'DataFrame只对一列进行编辑（截取一段）并返回新的DataFrame该怎么写…

这个俗人 2022-09-07 07:59:48 16 0

spark groupby 之后相同字段的数据是处于同一个分区吗？

假定一个RDD 存在十个分区，当对这个RDD进行groupby之后得到一个新的RDD，相同字段的数据是否处于同一个分区？我测试结果查看是相同分组字段的数…

暮年慕年 2022-09-07 07:59:43 20 0

spark集群中的worker总是连接不到master， zookeeper集群实现master高可用？

1，spark0-2 三台主机是zookeeper集群 2，spark0-4五台主机是 spark集群 3 spark0-1 两台主机实现master高可用。在spark0上运行start-all.sh启动spa…

笑着哭最痛 2022-09-07 07:37:16 22 0

Spark 中关于scala 语法理解的问题

val lines: Dataset[String] = session.read.textFile("") val words: Dataset[String] = lines.flatMap(_.split(" ")) 上面lines是一个dataSet对象…

夜深人未静 2022-09-06 23:51:48 22 0

spark : scala的方法中为什么无法访问对象的属性？

如何理解绿色部分的内容？怎么感觉那么别扭啊，书中说的感觉也很含糊。 …

零度℉ 2022-09-06 22:11:49 16 0

为什么启动spark集群的时候必须要在master启动start-all ,slave上启动start-all会出现启动失败？

运行start-all启动spark集群的流程是怎样的？…

梦中楼上月下 2022-09-06 21:55:40 18 0

Oozie运行Spark2 Action

使用Ambari 2.6，安装的是HDP-2.6.4 最近想用Oozie执行Spark2，按照提示设置好了spark2 lib，并且从oozie和spark2两个share lib folder中删除了重复…

橘亓 2022-09-06 21:21:01 32 0

Spark的DataFrame做Map操作时怎么返回超过22个字段

val originInfoDF = spark.sql("select col1, col2, col3, col4 from table_T") val aggData = originInfoDF .groupBy("col1") .agg(collect_set(arra…

呢古 2022-09-06 20:22:20 20 0

spark mllib 可以将模型持久化到 hdfs 吗？

spark mllib 可以通过 model.save(hdfsPath) 将模型持久化吗？然后通过 xxxModel.load()将模型加载进来。ps：不是 spark mlps：spark ml 可以吗…

漆黑的白昼 2022-09-06 15:56:56 24 0

为什么spark ml 中没有基于测试数据的评估矩阵 Evaluation Metrics？

在 spark mllib 中有基于测试数据预测结果的评估矩阵 Evaluation Metrics，但是是不是 spark ml 库中却没有，我发现的是通过训练数据训练后的模型的 s…

花想c 2022-09-06 15:56:17 24 0

共 15 页
上一页
3
4
5
6
7
下一页

友情链接

文江博客