百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

0711-6.3.0-如何将CM的外部PostgreSQL数据库迁移至MySQL服务

toyiye 2024-06-21 12:23 10 浏览 0 评论

文档编写目的

在前面的文章《6.3.0-如何将CM内嵌PostgreSQL服务迁移至外部PostgreSQL服务》介绍了将CM内嵌的PostgreSQL迁移至外部PostgreSQL,因为CM内嵌的PostgreSQL数据库不支持直接迁移至MySQL。本篇文章Fayson主要介绍如何将集群使用的外部PostgreSQL迁移至MySQL数据库。

注意:不支持直接从Cloudera Manager嵌入式PostgreSQL迁移到MySQL / Oracle数据库。您必须首先从Cloudera Manager嵌入式PostgreSQL数据库服务器迁移到外部PostgreSQL数据库服务器。

只有在成功从嵌入式PostgreSQL数据库服务器迁移到外部PostgreSQL数据库服务器后,才能迁移到外部MySQL或Oracle数据库。

  • 内容概述
  1. 安装Mariadb服务
  2. 数据库迁移
  3. 验证
  4. 总结
  • 测试环境
  1. CM和CDH版本均为6.3.0
  2. 采用root用户

迁移前集群环境确认

CM元数据库类型为postgresql

cat /etc/cloudera-scm-server/db.properties

Hue用户及用户组

Hue的数据库类型为PostgreSQL

用户信息

用户组信息

管理员信息

Hive数据库及表信息

Hive的数据库类型为PostgreSQL

如下所示,当前hive中有default和test两个数据库;default数据库中有两个表。

查看table_partitioned表的数据

Sentry授权信息

Sentry的数据库类型为PostgreSQL

Sentry的授权信息如下

安装MySQL

选一台节点安装MariaDB服务

yum -y install mariadb mariadb-server

启动mariadb服务并设置为开机自启动

systemctl start mariadb
systemctl enable mariadbsystemctl status mariadb | grep Active

初始化MariaDB数据库

/usr/bin/mysql_secure_installation

使用root用户登录查看当前数据库

安装MySQL JDBC驱动

将mysql驱动上传至/usr/share/java目录,并以软链接的方式去掉驱动版本号

迁移CM元数据库

导出Cloudera Manager配置文件

获取当前支持的API版本

curl -u admin:admin "http://192.168.0.204:7180/api/version"

导出json格式配置文件

curl -u admin:admin "http://192.168.0.204:7180/api/v33/cm/deployment" > /root/cm/cm-deployment.json

执行如下命令,保留Cloudera Manager的GUID号

sudo -u postgres psql -qtAX scm -c "select GUID from CM_VERSION" > /etc/cloudera-scm-server/uuid

停止集群和Cloudera Management Service服务

在CM节点上执行如下命令停止cloudera-scm-server服务

systemctl stop cloudera-scm-serversystemctl status cloudera-scm-server | grep Active

登录MySQL执行如下SQL语句创建scm数据库及用户并授权

create database scm default character set utf8;CREATE USER 'scm'@'%' IDENTIFIED BY 'password';GRANT ALL PRIVILEGES ON scm.* TO 'scm'@'%';FLUSH PRIVILEGES;

执行如下命令,初始化Cloudera Manager数据库配置

/opt/cloudera/cm/schema/scm_prepare_database.sh mysql scm scm password

清空所有节点的/var/run/cloudera-scm-agent/process/目录

使用批量命令,停止集群所有节点的agent和supervisor服务

sh ssh_do_all.sh node.list 'systemctl stop supervisord'sh ssh_do_all.sh node.list 'systemctl stop cloudera-scm-agent'

查看进程是否已被停止

ps -ef | grep cmf-agentps -ef | grep supervisord

使用批量命令,使用mv命令将集群所有节点的agent目录备份

sh ssh_do_all.sh node.list 'mv /var/run/cloudera-scm-agent /var/run/cloudera-scm-agent-BU'

sh ssh_do_all.sh node.list 'ls /var/run | grep cloudera-scm-agent*'

使用批量命令,启动集群所有节点的cloudera-scm-agent服务

sh ssh_do_all.sh node.list 'systemctl start cloudera-scm-agent'sh ssh_do_all.sh node.list 'systemctl status cloudera-scm-agent | grep Active'

启动Cloudera Manager Server

systemctl start cloudera-scm-servernetstat -lnpt | grep 7180

使用超级管理员用户登录CM

接收许可条款,【继续】

如果有许可证,上传许可证,没有许可证选择企业试用版,【继续】,然后单击左上角返回CM主页

注意:必须要上传许可证或者选择试用版继续之后再返回主页,否则会导致使用curl导入集群配置时失败。

单击左上角返回CM主页

当前CM主页状态如下:

执行如下命令调用CM API接口,恢复Cloudera Manager配置

curl -v -H "Content-Type: application/json" --upload-file /root/cm/cm-deployment.json -u admin:admin "http://192.168.0.204:7180/api/v33/cm/deployment?deleteCurrentDeployment=true"

再次查看CM主页,CM配置已导入成功

启动服务

启动Cloudera Mangement Service

Cloudera Management Service启动成功后,等待parcel分发完成,然后启动集群服务并分发客户端配置。

查看集群CM元数据库使用的数据库服务器,如下所示,此时已迁移至MySQL

cat /etc/cloudera-scm-server/db.properties

迁移集群其他服务元数据库

此时只有CM的数据库scm迁移到了MySQL,集群其他服务的元数据库(Hive、Sentry、Hue、Oozie等)仍然配置的为PostgreSQL,接下来主要介绍通过使用工具将PostgreSQL数据库迁移至MySQL数据库,如下示例以迁移Hive元数据库为例。

下载安装数据库转换工具 DBConvert for MySQL & PostgreSQL,下载地址如下:

https://dbconvert.com/downloads/dbconvert_mysql_postgresql.zip

下载完成之后解压,执行dbconvert_mysql_postgresql文件夹下的setup.exe进行安装

安装完成后打开该软件,选择【Try】使用版

这里以hive元数据库转换为例,配置PostgreSQL数据库连接信息

测试连接成功,单击下一步

此时会显示数据库中的所有表,全部勾选;然后单击【OK】

配置目标数据库连接信息(即我们要迁移的MySQL信息)

测试连接成功后单击【Next】

自定义要转换的表,然后单击【Next】

单击【commit】开始进行转换

转换成功后显示如下

然后依次转换其他数据库即可

注意:转换hue数据库时,有些表因为外键的原因不能被转换,根据提示取消相关外键即可

数据库迁移完成后,登录mysql查看数据库如下:

创建用户并授予数据库上的权限

CREATE USER 'hive'@'%' IDENTIFIED BY 'password';GRANT ALL PRIVILEGES ON hive.* TO 'hive'@'%';FLUSH PRIVILEGES;CREATE USER 'sentry'@'%' IDENTIFIED BY 'password'; GRANT ALL PRIVILEGES ON sentry. * TO 'sentry'@'%'; FLUSH PRIVILEGES;CREATE USER 'rman'@'%' IDENTIFIED BY 'password'; GRANT ALL PRIVILEGES ON rman. * TO 'rman'@'%'; FLUSH PRIVILEGES;CREATE USER 'hue'@'%' IDENTIFIED BY 'password'; GRANT ALL PRIVILEGES ON hue. * TO 'hue'@'%'; FLUSH PRIVILEGES;CREATE USER 'oozie'@'%' IDENTIFIED BY 'password'; GRANT ALL PRIVILEGES ON oozie. * TO 'oozie'@'%'; FLUSH PRIVILEGES;

更换数据库服务器

进入Hive配置页面,修改Hive的Metastore数据库类型为MySQL,然后修改其在 MySQL中的数据库名称

完成上述修改后,然后回到CM主页,根据提示重启相关服务

服务重启完成后,此时数据库已迁移至MySQL数据库服务器。

迁移后验证

Hue验证

查看Hue当前数据库类型为MySQL

使用管理员账号admin登录Hue验证数据是否完整

admin用户的管理员权限与迁移前一致

迁移后的用户信息与迁移前数据一致

用户组信息与迁移前信息一致

Hive验证

查看Hive当前数据库类型为MySQL

通过Hue查看Hive数据库以及表信息如下:

查看分区表数据如下:

查看分区表结构如下:

由上图可知,数据库迁移完成后Hive的数据库、表、表结构以及表数据均迁移成功。

Sentry验证

查看Sentry当前数据库类型为MySQL

通过Hue查看Sentry的授权信息如下:

使用hive用户进行建表测试

建表成功

向表中插入数据,数据插入成功

执行查询操作,查询成功

总结

  1. 将Cloudera Manager服务使用的PostgreSQL迁移至MySQL时,主要通过CM API接口导出集群配置信息json文件,再通过CM API接口导入完成数据库的迁移。
  2. 集群其它服务(Hive、Sentry、Oozie、Hue等)在迁移时并未相应的API接口实现,主要是通过DBConvert for MySQL & PostgreSQL工具将PostgreSQL数据的数据转换为MySQL数据库的方式解决。
  3. 在进行Hue数据库转换的过程中由于部分表外键的问题,导致转换失败,需要将报错的外键取消勾选。

相关推荐

Asterisk通道和ARI接口的通信(aau通道数)

Asterisk通道和ARI详解什么是通道Asterisk中,通道是介于终端和Asterisk自己本身的一个通信媒介。它包含了所有相关信息传递到终端,或者从终端传递到Asterisk服务器端。这些信...

Python GUI-长链转短链(长链接转化成短链接java)

当我们要分享某一个链接给别人,或是要把某个链接放入帖子中时,如果链接太长,则会占用大量空间,而且很不美观。这时候,我们可以结束长链转短链工具进行转换。当然可以直接搜索在线的网站进行转换,但我们可以借此...

Python 的hash 函数(python的hash函数)

今天在看python的hash函数源码的时候,发现针对不同的数据类型python实现了不同的hash函数,今天简单介绍源码中提到的hash函数。(https://github.com/pyth...

8款Python GUI开源框架,谁才是你的菜?

作为Python开发者,你迟早都会用到图形用户界面来开发应用。本文千锋武汉Python培训小编将推荐一些PythonGUI框架,希望对你有所帮助。1、Python的UI开发工具包Kivy...

python适合开发桌面软件吗?(python可不可以开发桌面应用软件)

其实Python/Java/PHP都不适合用来做桌面开发,Java还是有几个比较成熟的产品的,比如大名鼎鼎的Java集成开发环境IntelliJIDEA、Eclipse就是用Java开发的,不过PH...

CryptoChat:一款功能强大的纯Python消息加密安全传输工具

关于CryptoChatCryptoChat是一款功能强大的纯Python消息加密安全传输工具,该工具专为安全研究专家、渗透测试人员和红蓝队专家设计,该工具可以完全保证数据传输中的隐私安全。该工具建立...

为什么都说Python简单,但我觉得难?

Python普遍被大家认为是编程语言中比较简单的一种,但有一位电子信息的学生说自己已经学了C语言,但仍然觉得Python挺难的,感觉有很多疑问,像迭代器、装饰器什么的……所以他提出疑问:Python真...

蓝牙电话-关联FreeSwitch中继SIP账号通过Rest接口

蓝牙电话-关联FreeSwitch中继SIP账号通过Rest接口前言上一篇章《蓝牙电话-与FreeSwitch服务器和UA坐席的通话.docx》中,我们使用开源的B2B-UA当中经典的FreeSWIT...

技术分享|Sip与WebRTC互通-SRProxy开源库讲解

SRProxy介绍目前WebRTC协议跟SIP协议互通场景主要运用在企业呼叫中心、企业内部通信、电话会议(PSTN)、智能门禁等场景,要想让WebRTC与SIP互通,要解决两个层面的...

全网第N篇SIP协议之GB28181注册 JAVA版本

鉴于网上大部分关于SIP注册服务器编写都是C/C++/python,故开此贴,JAVA实现也贴出分享GB28181定义了了基于SIP架构的视频监控互联规范,而对于多数私有协议实现的监控系统...

「linux专栏」top命令用法详解,再也不怕看不懂top了

在linux系统中,我们经常使用到的一个命令就是top,它主要是用来显示系统运行中所有的进程和进程对应资源的使用等信息,所有的用户都可以使用top命令。top命令内容量丰富,可令使用者头疼的是无法全部...

Linux 中借助 perf 对 php 程序模拟CPU高的案例分析

导语本文是一篇Linux借助工具分析CPU高的优化案例,没有任何干货内容,很详细的展示了优化CPU高的具体步骤,非常适合初中级读者阅读!...

centos漏洞处理方法(centos podman)

centos服务器最近有诸多漏洞,修复命令及对应的漏洞整理后,分享给大家RHSA-2020:1176-低危:avahi安全更新yumupdateavahi-libsRHSA-2017:326...

Linux上的free命令详解(Buffer和Cache)

解释一下Linux上free命令的输出。下面是free的运行结果,一共有4行。为了方便说明,我加上了列号。这样可以把free的输出看成一个二维数组FO(FreeOutput)。例如:FO[2][1]...

linux 命令行之你真的会用吗?--free 基本用法篇

free命令行统计内存使用率及swap交换分区的使用率数据。是由sourceforge负责维护的,在ubuntu上其包名为procps,这个源码包中,除了free还有ps,top,vmstat,ki...

取消回复欢迎 发表评论:

请填写验证码