hive

hive

文章 63 浏览 55

Hive 中的更新、设置选项

我知道 Hadoop 中没有文件更新,但在 Hive 中,可以使用语法糖将新值与表中的旧数据合并,然后使用合并的输出重写表,但如果我在另一个表中有新值那么…

扮仙女 2024-11-11 15:08:44 2 0

Hive 上的自定义 MapReduce 程序,规则是什么?输入和输出怎么样?

我被困了几天,因为我想根据我对 hive 的查询创建一个自定义的地图缩减程序,在谷歌搜索后我发现没有太多例子,而且我仍然对规则感到困惑。 创建自定…

迟月 2024-11-10 15:44:38 2 0

在 R 和 Hive (Hadoop) 数据库之间建立连接

有谁知道如何实现这一目标? 我假设 RJDBC 会有所帮助;但根据我(可能很天真的)的理解,为此编写或调整 Hive 驱动程序需要进行一些调整。 相关文档…

蒗幽 2024-11-08 02:59:06 3 0

Hive - 如何为可变长度的现有 hdfs 文件编写创建语句?

所以,我有一个现有的 hdfs 目录,其中包含一堆文件。这些文件都是制表符分隔的。 我有一个配置单元声明...... create external table mytable( key s…

冷情妓 2024-11-06 08:39:52 2 0

Hive / Hadoop / Flatfile:组合和连接行的有效方法是什么

id col1 col2 ... coln --------------------- foo barA barB ... foo barD barX boo barA barC foo barC barC 我想将其组合成“折叠”行,如下所示:…

揽清风入怀 2024-11-05 05:17:30 2 0

使用 Ruby 生成 SQL 查询

我想要一种在 Ruby 中生成 SQL 查询的简单方法。我了解 ActiveRecord、Sequel 和 DataMapper。我不是在寻找 ORM,而是在寻找一种更简单的生成 SQL 语…

萌酱 2024-11-04 20:16:07 2 0

hive 表达式不在按键分组中

我在 HIVE 中创建了一个表。 它有以下列: id bigint, rank bigint, date string 我想获得每月的平均(排名)。我可以使用这个命令。有用。 select a.…

木緿 2024-11-03 01:07:43 3 0

对 Hive 中存储的数据运行 Pig 查询

我想知道如何运行以 Hive 格式存储的 Pig 查询。我已将 Hive 配置为存储压缩数据(使用本教程 http://wiki.apache.org/ hadoop/Hive/压缩存储)。 在…

怪我闹别瞎闹 2024-11-02 22:42:34 3 0

从HDFS导入数据到Hive表

我的数据位于 HDFS 中的 data/2011/01/13/0100/file 中,每个文件都包含制表符分隔的数据,例如名称、ip 和 url。 我想在 Hive 中创建一个表并从 hdfs…

九歌凝 2024-11-02 16:22:46 2 0

Hadoop Hive - 分割字符串

我是新蜂巢。 我的查询:在日志文件中,我们有一个像这样的请求字段“GET /img/home/search-user-ico.jpg HTTP/1.1”。有超过 10,000 条记录可用。 示…

浅浅 2024-11-02 03:50:11 2 0

Hive:将列标题写入本地文件?

Hive 文档再次缺失: 我想将查询结果以及列名写入本地文件。 Hive 支持这个吗? Insert overwrite local directory 'tmp/blah.blah' select * from ta…

故事↓在人 2024-11-01 08:00:56 3 0

在 Hive 中,“加载数据本地路径”是否有效?覆盖现有数据还是追加?

我希望在 cron 上运行到 Hive 的导入,并且希望仅使用 “将数据本地路径‘/tmp/data/x’加载到表 X”到表中就足够了。 后续命令会覆盖表中已有的内容…

伴我老 2024-10-30 16:46:21 4 0

如何将 .txt 文件转换为 Hadoop 的序列文件格式

为了有效利用Hadoop中的map-reduce作业,我需要将数据存储在hadoop 的序列文件格式。但是,目前数据仅采用平面 .txt 格式。任何人都可以建议一种将 .t…

黑寡妇 2024-10-25 06:00:35 5 0

hive 中的分区列

我必须使用也是表一部分的列对 hive 中的表进行分区。 例如: 表:员工 列:员工Id、员工名称、员工Salary 我必须使用employeeSalary 对表进行分区。 …

謸气贵蔟 2024-10-22 06:16:24 2 0

如何使 hive 从特定路径加载元存储而不是在当前目录中创建?

我正在使用 Hive 进行一些数据处理。但是每当我启动 Hive-Shell 时,它都会在当前目录中创建一个元存储,并且我无法访问在另一个目录中创建的表。这对…

奢欲 2024-10-21 04:02:05 2 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文