Spark

Spark

文章 222 浏览 119

spark的开发环境应该是怎样的

在看spark的mlib包,用的是Java语言,发现把包导入后本地机器直接run就可以跑出结果,看日志感觉是每次都启动spark进程的,helloworld级别的跑一次也…

嘦怹 2022-09-04 15:33:31 20 0

并查集算法如何在spark中高效实现?

并查集算法参考链接地址这个算法可以实现多组不同的ID,比如说用户的mac与ip的关系,mac与订单号的关系,进行聚合构建出用户的标识集合来。但是在spark…

看春风乍起 2022-09-04 15:13:28 20 0

pyspark编程对如下两个dataframe进行查询操作,如何提高效率?

1、有两个DataFrame:df1,df2都有共同的字段ACCTNO,df1中每行的ACCTNO字段唯一,需要遍历df1中的ACCTNO字段,并根据这些ACCTNO字段查询df2中对应的…

美人迟暮 2022-09-04 15:12:22 34 0

spark streaming 集成 kafka,使用window时出现错误

当使用 spark streaming 2.0.0 集成 kafka 0.10.0时出现 KafkaConsumer 多线程争用的问题。部分代码如下: val ssc = new StreamingContext(sc, Seco…

此岸叶落 2022-09-04 14:59:13 21 0

spark core 有没有类似连表查询的操作

问题是这样的 val list= List((1,2),(3,5),(6,9)) val list2= List((3,4),(5,9),(9,12)) 这两个list我写入rdd,然后想让list每一个元素的value查找li…

七七 2022-09-04 12:57:10 13 0

spark yarn cluster 模式提交任务一直报错,求教

1、用 yarn cluster 模式提交任务一直报这个错误 错误: 找不到或无法加载主类 org.apache.spark.deploy.yarn.ApplicationMasterspark版本 2.0.2 hadoo…

甜妞爱困 2022-09-04 12:51:50 28 0

如何在SparkSQL的UDF中使用外部全局变量?

测试代码如下: object GuangBoTest { var y: Broadcast[String] = null def main(args: Array[String]): Unit = { val sparkSession = SparkSession…

清音悠歌 2022-09-04 12:30:51 29 0

spark读入文件,报错 java.io.IOException:No input paths specified in job

想尝试着处理一下文本,结果都载入不进来。。。文件路径肯定没问题求大神指教 fileName = "file:///Users/liuchong/Desktop/Animal Farm.txt" liuDF …

番薯 2022-09-04 12:30:47 25 0

Spark shuffle reducer 个数是怎么确定的?

Spark 菜鸟请教个问题..大牛轻拍~~ 下面是我的个人理解...好混乱, 想不通, 求高人引导下. reducer 的数量由 partition 决定, 假设我的数据有 1000 M,…

挖个坑埋了你 2022-09-04 09:43:22 22 0

不同机器上docker创建的虚拟机器怎么相互访问

我在A机器上用docker虚拟化创建了10台linux机器。B机器上同样虚拟化10台机器。我要搭建spark环境,B和A上的虚拟机可以相互通过ssh访问吗?…

岁月如刀 2022-09-04 08:57:05 17 0

一个简单的统计字母行号的代码打包后使用spark-submit提交会报错

编译器:IDEA 代码如下: 使用sbt compile和sbt package进行打包,过程如下图: 最后,我使用spark-submit提交我的jar,进行运行。就出现了报错,如…

眉黛浅 2022-09-04 08:17:45 19 0

Spark Distinct操作的DAG问题

问题 我创建了一个分成两个节点的List val list = sc.parallelize(List(1,1,1,1,2,2,2,3,3,4),2) 现在对其进行distinct操作 list.distinct.collect …

氛圍 2022-09-04 07:03:47 24 0

用IDEA提交spark程序,yarn-client模式报错!(用ambari搭建的环境)

在网上看了一些关于此类的文章,自己在调试的时候碰到了如下问题: 添加了相关属性,还是会做上传jar包的动作 conf.set("spark.yarn.preserve.stagin…

厌味 2022-09-04 06:55:29 22 0

求高手点拨一个Java SWING的IM系统实验的错误解决方案。

高手,您好: 小弟遇到的代码场景为: 制作了一个Java SWING技术结合Socket技术实现的IM通信实验。 通信为双向全双工通信,通信方分为S端和C端。 下…

你的笑 2022-09-04 06:20:04 34 0

谁能说明一下,oralce->hbase->redis->spark整个流程,如果可以,流程图说一下,万分感谢

万分感谢oralce->hbase->redis->spark整个流程,如果可以,流程图说一下…

寻找我们的幸福 2022-09-04 05:49:31 18 0
更多

推荐作者

眼泪淡了忧伤

文章 0 评论 0

corot39

文章 0 评论 0

守护在此方

文章 0 评论 0

github_3h15MP3i7

文章 0 评论 0

相思故

文章 0 评论 0

滥情空心

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文