如何让 Hive 与 bz2 一起工作?
由于 bz2 是可拆分的并且节省空间,因此我计划以 bzip2 格式存储表数据。 但它似乎无法识别压缩格式。 gzip 格式没问题。 我使用的代码如下所示:
CREATE TABLE IF NOT EXISTS image_bzip (
image_id STRING,
image_feature STRING,
other_stuff STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE LOCATION '/hivestore/bzip';
LOAD DATA LOCAL INPATH '/nfs/directory/*.bz2' OVERWRITE INTO TABLE image_bzip;
有人能指出我缺少什么吗?
谢谢。
Since bz2 is splittable and saves space, I'm planning to store the table data in bzip2 format.
However it seems it's not recognizing the compressed format. It was fine with gzip format.
The code I used looks like this:
CREATE TABLE IF NOT EXISTS image_bzip (
image_id STRING,
image_feature STRING,
other_stuff STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE LOCATION '/hivestore/bzip';
LOAD DATA LOCAL INPATH '/nfs/directory/*.bz2' OVERWRITE INTO TABLE image_bzip;
Can somebody point me what I'm missing ?
Thanks.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
如果我们正确设置压缩编解码器,它自然会起作用。
if we set the compression codec correctly, it works naturally.
为什么不尝试在 HDFS 上使用 bz2 压缩文件创建外部表?
why don't you try creating external table with bz2 compressed files on HDFS?