【Hive 运维】JDBC使用Hive UDF：Hive UDF打通hiveserver2

🕗 发布于 2024-09-24 11:25 hive 运维 hadoop

文章目录

一. 问题描述与方案分析
二. 实现与操作

一. 问题描述与方案分析

1. 问题描述

用户需要创建永久的Hive UDF供JDBC连接使用，一开始先通过hive client的方式注册（输入hive，进入hive交互界面）发现，udf存在，但是通过jdbc连接的时候无法找到此函数。

如下相关操作：

-- 1. 上传包到文件系统中
hadoop fs -put /home/hadoop/lib/hive-1.0-SNAPSHOT.jar /lib/
 
-- 创建永久函数
-- a.进入hive终端
hive
-- b. 注册hive永久函数
-- 注意：函数是绑定到某个库下的，此时是绑定到default库下。
CREATE FUNCTION sayhello AS 'com.gao.bigdata.HelloUDF' USING JAR 'hdfs://hadoop002:9000/lib/hive-1.0-SNAPSHOT.jar';
 
 
-- 查看函数列表 
show functions like '*sayhello*';

2. 方案分析

通过重启hiveserver2之后通过jdbc连接找到了此函数。

![[Pasted image 20240923104321.png]]

从上截图可以知道有两个要点

要将所有的jar都放到各个节点的hiveserver2下
重启所有的hiveserver

通过操作之后发现方案可行

3. 方案优化

上面的解决方案虽然可行，但运维成本较高，现进行优化。

3.1. 通过文件系统，来保证jar包的节点一致性

首先将所有的jar都放到各个hiveserver2节点下的原因是add jar使用了本地路径，导致每个jdbc连接hiveserver2的时候都是从本地找jar。我们可以把jar放到hdfs上，这样add jar每个hiveserver2都能够从远端拉去jar，这就是文件的状态一致性。

3.2. hiveserver2 session的更新优化

其次要重启所有的hiveserver2，这也造成一定的运维问题，甚至会影响正在运行任务的jdbc连接。
先看下hive架构图：
![[Pasted image 20240923105823.png]]

如果我们通过hive终端添加UDF函数，那Hiveserver2中的session就不会同步到，需要你重启才能加载最新的Hive session。

如上架构图我们通过beeline或者jdbc的方式注册，添加的UDF函数就直接会存在于HiveServer2中，这样就不用重启。

但另外需要注意的是，JDBC连接不同的Hiveserver2（这里我们称之为H2）时，因为只在H1上注册了UDF，所以H2需要重启，或需要再通过JDBC连接测试一遍。

到这里我们就得到了较为简化后的执行方案，具体操作见下节。

二. 实现与操作

通过beeline方式登录hive

beeline -u jdbc:hive2://hiveserver2-hostname:10000 -n user -p password

udf绑定到某个库下

use databaseA

添加udf

ADD JAR hdfs:///xxx/hive-demo-1.0-SNAPSHOT.jar;
CREATE FUNCTION to_upper_xxx AS 'com.gao.udf.UpperCaseUDF' USING JAR 'hdfs:///xxx/hive-demo-1.0-SNAPSHOT.jar';

测试：
上述创建的udf是绑定到databaseA库下。

![[Pasted image 20240923110810.png]]

原文地址：https://blog.csdn.net/hiliang521/article/details/142453529

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Spring MVC参数接收总结
下一篇：[go] 迭代器模式

Java项目实战II基于Java+Spring Boot+MySQL的共享汽车管理系统(源码+数据库+文档)
在共享经济蓬勃发展的背景下，共享汽车作为一种新型的出行方式，正逐渐改变着人们的出行习惯。然而，随着共享汽车市场规模的不断扩大，车辆管理、用户服务、数据安全等问题日益凸显，传统的管理方式已难以满足当前的
阅读更多2024-11-19
【青牛科技】汽车收音机调频中频放大器——D1145
无线麦克风对讲机。
阅读更多2024-11-19
鸿蒙中位置权限和相机权限
State permissionsMessage: string | Resource = "\"获取当前位置\"需获取定位权限才能正常使用"this.perm
阅读更多2024-11-19
UE5 第一人称射击项目学习（二）
然后，把子弹的向前向量提升（在ue5的标准向量是以1cm为单位，所以虽然子弹跟随视角发射，但是速度太慢），从生成Actor的return Value处拉一根线，获取向前向量乘1000.运行程序，按
阅读更多2024-11-19
【软考】系统架构设计师-数据库设计基础
数据库设计基础知识
阅读更多2024-11-19
MongoDB 监控：确保数据库性能和可靠性
MongoDB 是一个流行的开源 NoSQL 数据库，以其灵活的文档模型和强大的查询语言而闻名。然而，为了确保 MongoDB 的性能和可靠性，监控是至关重要的。本文将讨论 MongoDB 监控的重要
阅读更多2024-11-19
电脑插入U盘，电脑显示新增了，但是双击却显示请将磁盘插入
`CHKDSK 无法供 RAW 驱动器使用` 表明内存卡的文件系统已损坏或丢失，当前处于 **RAW 文件系统** 状态。RAW 表示文件系统无法识别，可能由以下原因导致：
阅读更多2024-11-19
【论文阅读】InstructIR: High-Quality Image Restoration Following Human Instructions
图像恢复是一个基本问题，旨在从退化的图像中恢复出高质量的清晰图像。All-In-One 图像恢复模型能够利用退化特定的信息作为提示，引导恢复模型有效地恢复多种类型和不同程度的退化图像。本研究提出了首个
阅读更多2024-11-19
【Next】字体修改
next/font 包括任何字体文件的内置自动自托管。首先从 next/font/google 导入您想要使用的字体作为函数。（可以按住 ctrl 点进去 google 查看所有字体）然后导入该字体函
阅读更多2024-11-19
Springboot基于GIS的旅游信息管理系统
项目编号：springbootA100基于GIS的旅游信息管理系统是在旅游业迅速发展、旅游需求日益多样化的背景下应运而生的一套综合性信息管理平台，它通过整合旅游资源、提供实时信息、优化服务流程，旨在为
阅读更多2024-11-19