Hive 之 UDF 及 MR

发布于 2024-09-27 18:05:22 字数 1285 浏览 8 评论 0

UDF UDTF UDAF

Hive 自定义函数包括三种 UDF、UDAF、UDTF。使用方式 :在 HIVE 会话中 add 自定义函数的 jar 文件,然后创建 function 继而使用函数

  • UDF(User-Defined-Function): 一进一出
  • UDAF(User- Defined Aggregation Funcation): 聚集函数,多进一出。Count/max/min
  • UDTF(User-Defined Table-Generating Functions): 一进多出,如 lateral view explore()

编写 UDF

编写 Hive UDF 有两种方式:

  • extends UDF ,重写 evaluate 方法
  • extends GenericUDF ,重写 initialize getDisplayString evaluate 方法

注册 UDF

临时 UDF

  • 编写 udf,打包
  • add jar /path/to/jar
  • create temporary function <function_name> as 'com.ly.udf.HelloWorld'
  • select <function_name>(param);

永久 UDF

将 udf 的 jar 包上传到 hdfs 中,创建的时候指定 hdfs 中的路径

  • hadoop fs -put /local/path /hdfs/path
  • create function default.add as 'com.bigdata.add' using jar 'hdfs:///service/add.jar'

查看添加 jar 包相关

  • add jar /path/to/jar :将指定位置的 jar 包添加到 classpath ,可以是本地文件也可以是 hdfs 文件
  • list jar :显示已经添加到 classpath 的变量

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据

关于作者

古镇旧梦

暂无简介

0 文章
0 评论
23 人气
更多

推荐作者

謌踐踏愛綪

文章 0 评论 0

开始看清了

文章 0 评论 0

高速公鹿

文章 0 评论 0

alipaysp_PLnULTzf66

文章 0 评论 0

热情消退

文章 0 评论 0

白色月光

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文