返回介绍

Hive 安装(基于 Ubuntu 系统)

发布于 2024-06-23 16:10:22 字数 7503 浏览 0 评论 0 收藏 0

为了学习 Hive 的相关操作,必须先安装 Hive。这样方便后续的实践。

基于 Ubuntu 系统安装 Hive

为了在 Ubuntu 成功安装 Apache Hive,请按照下面的步骤一步一步操作。

下载 Hive

在本教程我们将使用的 hive 版本是:hive-0.13.1-cdh5.3.2。你可以使用 hive 最新的版本。可以通过下面链接下载 hive:
http://archive.cloudera.com/cdh5/cdh/5/hive-0.13.1-cdh5.3.2.tar.gz

成功下载之后,得到下面的压缩包:
apache-hive-0.13.1-cdh5.3.2 hive-0.13.1-cdh5.3.2.tar.gz

解压它:
tar zxvf hive-0.13.1-cdh5.3.2.tar.gz

设置 Hive 环境变量

在 home 目录下编辑 .bashrc 文件,并在该文件的末尾增加以下语句:

  1. export HADOOP_USER_CLASSPATH_FIRST=true
  2. export PATH=$PATH:$HIVE_HOME/bin
  3. export HADOOP_HOME=/home/dataflair/hadoop-2.6.0-cdh5.5.1
  4. export HIVE_HOME=/home/dataflair/hive-0.13.1-cdh5.3.2

注意:这里需要输入你自己的 hive 版本和名称,以及正确的 Hive 文件地址。 “/home/dataflair/hive-0.13.1-cdh5.3.2” 这个是我自己的 hive 文件路径,“hive-0.13.1-cdh5.3.2” 是文件名。你需要根据自己的具体情况做修改。确认无误之后保存 .bashrc 文件。

使环境变量生效:
$ source ~/.bashrc

执行 Hive

在 linux shell 输入 hive 可以进入到 hive 的命令模式:

  1. $ hive

如下所示:
hive安装

退出 Hive

如果想要退出命令行模式,可以用下面命令:

  1. hive> exit;

现在你可以在 hive 上执行命令了。
在使用 hive 之前,你需要修改一下 hive 的元数据存储层。https://data-flair.training/blogs/configure-hive-metastore-to-mysql/

Hive 命令

下面是 Hive 的一些基本命令。

show databases 命令

该命令会返回 hive 里面的数据库列表。如果你是新安装的 Hive,并且还没有创建任何数据库,那么此时会返回一个默认的数据库,数据库名称为 “default” 。
语法:

  1. show databases;

示例:

  1. show databases;

create database 命令

该命令用来为 Hive 创建数据库。
语法:

  1. create database 数据库名;

示例:

  1. create database test;

use 命令

use 命令用于把当前环境切换到对应数据库。
语法:

  1. use 数据库名;

示例:

  1. use test;

显示当前数据库

为了知道当前环境是在哪个数据库下,可以使用下面命令:

  1. set hive.cli.print.current.db=true;

hive.cli.print.current.db 这个值默认为 false,设置为 true 之后,会显示当前所在的数据库名。如下所示:
hive命令

drop 命令

drop 命令用于删除数据库或者表。
语法:

  1. drop database 库名;
  2. drop table 表名;

示例:

  1. drop database test;
  2. drop table test;

create table 命令

这个命令用于创建新表。
语法:

  1. CREATE TABLE TABLE_NAME (Parameters)
  2. COMMENT ‘Employee details’
  3. ROW FORMAT DELIMITED
  4. FIELDS TERMINATED BY ‘\t’
  5. LINES TERMINATED BY ‘\n’
  6. STORED AS TEXTFILE;

示例:

  1. create table employee (
  2. Name String comment ‘Employee Name’,
  3. Id int,
  4. MobileNumber String,
  5. Salary Float
  6. )
  7. row format delimited fields terminated by ‘,’
  8. lines terminated by ‘\n’
  9. stored as textfile;

查看当前库的所有表

这个命令可以查看当前库下面的所有表。
语法:

  1. show tables;

alter table 命令

该命令通常用于修改表的属性。比如修改表名,修改列名等。
语法:

  1. ALTER TABLE TableName RENAME TO new_name
  2. ALTER TABLE TableName ADD COLUMNS (col_spec[, col_spec ...])
  3. ALTER TABLE TableName DROP [COLUMN] column_name
  4. ALTER TABLE TableName CHANGE column_name new_name new_type
  5. ALTER TABLE TableName REPLACE COLUMNS (col_spec[, col_spec ...])

示例:

  1. ALTER TABLE employee RENAME TO demo1;

把 employee 表的名称改成 demo1。

加载数据

可以使用 load data 命令把文件里面的数据加载到 hive 表。
语法:

  1. LOAD DATA LOCAL INPATH 'Path of the File' OVERWRITE INTO TABLE 'Name of the Table';

示例:

  1. LOAD DATA LOCAL INPATH '/home/dataflair/Desktop/details.txt' OVERWRITE INTO TABLE employee;

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文