大数据

大数据

文章 168 浏览 846

Ubuntu上熟悉HDFS,编写这个java文件一直报错,如何解决

编程实现一个类“MyFSDataInputStream”,该类继承“org.apache.hadoop.fs.FSDataInputStream”,要求如下:实现按行读取HDFS中指定文件的方法“readL…

地狱即天堂 2022-09-30 23:11:36 25 0

flume sink是logger的时候输出到哪儿去了?

sink是这样的a1.sinks.s1.type=logger终端没有输出,/usr/local/Cellar/flume/1.9.0_1/libexec/bin/logs目录下也没有输出结果输出到哪儿了?…

梦魇绽荼蘼 2022-09-13 01:06:34 37 0

如何高效计算排列组合中的组合问题

充分利用cpu的核心数计算组合5选31,2,3,4,51,2,31,2,41,2,51,3,41,3,51,4,52,3,42,3,52,4,53,4,5需要计算n选m的组合充分利用cpu,可以多台计算机同时…

日裸衫吸 2022-09-13 01:01:13 21 0

大数据杀熟定价的原理是什么?

大数据杀熟的原理和实现技术细节是什么?谢谢大佬…

来日方长 2022-09-13 00:56:56 45 0

Flink运行一段时间后报连接kafka错

运行一段时间大概18个小时就会出现这种报错,时间也不固定,是因为我配置参数的问题么#配置内容 properties.setProperty("bootstrap.servers", broker…

ゝ偶尔ゞ 2022-09-13 00:51:30 44 0

架设Hudi的docker项目,spark连接不上

RT 用docker架设了一个hudi。但是spark死活连不上,一直报错。这是测试代码SparkSession session = SparkSession.builder() .master("spark://sparkma…

靖瑶 2022-09-13 00:49:19 45 0

apache sqoop导出遇到了以下错误

错误信息:java.lang.Exception: java.io.IOException: java.lang.ClassNotFoundException: stu at org.apache.hadoop.mapred.LocalJobRunner$Job.run…

○闲身 2022-09-13 00:28:42 31 0

大数据实时分析和离线分析的区别是啥?

哪些数据是通过离线分析得到的?哪些数据是通过实时分析得到的?我的理解是 比如统计一天的总量 可以在固定时间(如12点)进行离线分析将得到的结果保…

萌无敌 2022-09-13 00:28:12 32 0

mapreduce如何输出指定的一列

请问下,mr如何输出指定的一列到output呢? 且输出到output里的数据每行末尾不能有\t。-jobconf reduce.output.key.value.fields.spec=0:0 这个参数可…

绮烟 2022-09-12 23:58:17 27 0

将Hive中数据处理之后存入MySQL,有什么好的方法或者第三方库吗?

最近接下来可能要做一些大数据相关的开发,这之前也自学了一段时间,但总感觉有点似懂非懂的,所以像结合可能的业务逻辑请教一下。其实主要就一个点,…

谜泪 2022-09-12 23:39:51 33 0

spark大数据分析 爬虫存到csv有的列是list 请问应该怎么存到hive?直接存list吗?该怎么分析呢?

完全没有头绪 目前自己定的流程是爬虫-》hdfs-》通过scala处理后存hive-》scala分析-》mysql…

一生独一 2022-09-12 23:10:55 34 0

springboot 整合 flink 处理Kafka数据 动态写入HDFS不同文件上

package cn.nucarf.tianyan.service.dwd;import cn.nucarf.tianyan.config.AB;import cn.nucarf.tianyan.config.ProYml;import cn.nucarf.tianyan.con…

吖咩 2022-09-12 23:00:03 27 0

pyspark下foreachPartition()向hbase中写数据,数据没有完全写入hbase中

1.问题描述在使用pyspark过程中,遇到了一个向hbase中写数据的问题,在foreachPartition()方法中使用happybase对每个partition中的数据进行写入hbase…

亢潮 2022-09-12 22:39:30 25 0

ux-grid

ux-grid 具体使用手册有没有知道在那的呢?…

梦途 2022-09-12 22:37:58 16 0

使用FlinkSQL查询MySQL写入Greenplum, 出现Java heap space问题,可以通过配置避免吗?

环境是本机用docker部署的1.11.2版flink集群,就一个task manager。尝试在SQL Client里查一张50w数据的mysql表并写入GP,结果task manager报Java heap…

俏︾媚 2022-09-12 22:15:50 42 0
更多

推荐作者

醉城メ夜风

文章 0 评论 0

远昼

文章 0 评论 0

平生欢

文章 0 评论 0

微凉

文章 0 评论 0

Honwey

文章 0 评论 0

qq_ikhFfg

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文