hive分区内部表分区删除问题
有一个内部表student,字段有name,sex,其中sex是分区字段,目前有两个分区,sex=1和sex=2.我在hdfs上hive内部表的默认目录中删除了sex=2的目录,然后执行s…
CDH5.7.2环境跑比较大的任务时候,其他任务一直等待
CDH5.7.2环境跑比较大的任务时候,其他任务一直等待,小任务可以并行, 关键这个大任务,其实也不大也就10G的数据,我的配置8台128G内存的,CPU和内存…
关于flume向hdfs写入文件的问题
flume通过spooldir向hdfs写入文件时,为了避免频繁产生新文件,设置了每128M产生一个新文件。 spooldir是每分钟产生大量小文件 但是运行过程中发现一…
Hadoop启动失败
分布式安装Hadoop出错,配置有一台master,三台slave。 master上namenode 和resourcemanager启动错误。jdk、环境变量和ssh无密码登陆均已设置。日志如…
hdfs 导入hive表失败,创建hive外部表失败了
FAILED: ParseException line 3:1 missing EOF at 'ROWFORMAT' near ')'      CREATE EXTERNAL TABLE wifite (time&nbs…
sqoop 从mysql数据迁移到hdfs中
我在连接数据库的时候显示都能连接上,list表的时候也能显示所有的表。但是我在导入数据的时候走到: guoyachao@master :~/software/hbase-0.94.11$ …
hbase存储手机通话记录,使用什么作为rowkey?
想用hbase存储业务数据,但业务数据的主键都是按时间递增的值 数据量很大,如果采用数据的主键作为rowkey?  因为一个region只能由一个服务器管理…
hadoop namenode能承受多大的访问量???
我现在有一个hadoop集群,但是只有一个namenode,我想知道我的namenode能承受多大的访问量?namenode一宕机整个集群都玩完了。或者有没有什么方案可以…
Hive向分区表导入数据File not found: File does not exist:reduce.xml
启动hdfs正常,NN、DN、SN都正常。 启动hive只有一个runjar进程,但查询、建本地表、查表都正常。 在从本地表tb3导入分区表tb4_p时出错: insert ove…
求大神!!使用Cloudera安装Hadoop,数据块自动检测与复制非常慢,平均副本不够3份,怎么破
求技术大神、Hadoop大牛: 使用Cloudera 5.2 安装了 Hadoop 平台,共15个节点,在同个私网,千兆带宽,目前数据量约为80T左右,但最近使用 hdfs fsck…
hive执行报错 cdh5.1.2中?
在cdh5.1.2中执行hive, 执行诸如select id,name from test的语句 只有使用hdfs用户能正常执行,使用其他用户不可以 另外,使用hive jdbc执行SQL时,…
hadoop的hdfs的文件系统里面有这个错误日志,信息,看看
!SESSION 2016-01-26 15:31:59.407 ----------------------------------------------- eclipse.buildId=4.5.1.M20150904-0015 java.version=1.8.0_60 …