1. 引言

1.1. 编写目的

本文档为恒生电子股份有限公司LightDB Enterprise Manager用户手册说明书,本文档主要阐述LightDB Enterprise Manager的详细功能介绍,完整的数据库功能请参考《LightDB用户手册》,完整 LightDB Enterprise Manager 安装过程请参考 安装包中的readme.md。LightDB Enterprise Manager(即 LightDB数据库监控管理平台,下文均简称为LightDB EM)是一个综合性的数据库监控和管理系统,旨在满足数据库用户的需求,提供强大的图形界面,简化了对LightDB数据库的维护和使用。

1.2. 预期读者

数据库管理员 开发工程师 测试工程师 技术支持工程师

1.3. 参考文献

《LightDB数据库安装手册》

2. LightDB安装

安装完整的LightDB数据库请参考 LightDB数据库安装手册

3. LightDB EM功能介绍

3.1. 登录页面

LightDB EM默认登录地址http://your_em_server_ip:17331/em/login.html。首次成功安装,登录用户名是system,密码是hs123456。首次成功安装登录进去后会提示要修改密码。密码修改后再登录就直接进入首页。

image-2022122300001

3.2. 首页

登录成功后进入首页。首页为平台介绍页,包含平台功能和平台功能性描述。

image-2022122300003

3.3. 功能模块

功能模块可以展示系统所有功能清单,同时展示用户最新操作的功能,可以根据功能名称关键字查询快速查询到功能,通过点击对应的功能可以进入功能的详细页面。

image-2022122300002

3.4. 执行计划解析器

执行计划解析器提供在页面顶部第一位,点击后可打开添加计划窗口

image-2022122300004

输入所需的标题和计划json,查询语句(可选填)后,点击确定即可打开对于的执行计划解析器。

image-2022122300005

执行计划解析器页面存在三个tab页,分别是html表格解析结果,source解析原格式,query查询语句,html页面中包含中间的表格数据和下方的planing time、execution time数据。

image-2022122300006

执行计划解析器html中存在7列数据,分别是序列号,exclusive独占时间、inclusive所有时间,rowsx行数x,rows行数,loops循环数,node节点信息。前四个节点有四种背景颜色,依次为红色,棕色,黄色,白色,分别对应严重到不严重的等级,带有↓的值表示计划被低估了给定的次数,带有↑的值表示它被高估了。 其中exclusive,inclusiveb的比例取决当前数值占总时间的比例,依次为90%/50%/10%,rowsx依据当前值的大小依次为1000/100/10,rows取决的移除数的比例,计算规则为rows/(rows+remove),比例依次为90%/50%/10%. 同时提供自定义展示值的功能,可自定义解析出的展示结果

3.5. 集群管控

集群管控用于统一管理主机、代理、实例

3.5.1. 集群列表

通过添加集群来管控集群下的主机和数据库实例。点击新增主机可跳转至主机管理。点击拓扑图可跳转至集群拓扑图查看集群下主机角色关联关系。

3.5.1.1. 查询集群列表

集群列表展示用户添加的集群信息,可以根据部署模式、数据库类型、集群名称、首选集群进行查询,同时提供增删改操作功能。

image-2022122300010

3.5.1.2. 添加集群

用户可以添加要监控的集群,添加成功后可通过添加主机、实例进行关联。

注意

EM添加集群初始化实例仅用于开发和测试人员使用, 生产环境请使用LightDB发布的安装包或客户端工具进行操作。

image-2022122300011

数据库类型:要监控的集群数据库类型包含LightDB、PostgreSQL等。 部署模式:Single单机模式、HA高可用模式、Distribute分布式模式。 集群名称:定义部署的集群名称,不可重复。 首选集群:平台默认展示的监控集群。 数据库版本:可不填,由agent后台监控并填充。 集群LVS:分布式预留字段,可不填写。 集群类型:打开可在线安装数据库实例。 开发者模式:可选是否为开发者模式。 字符集编码格式:可选UTF8,GBK,GB18030。 兼容模式: 可选LightDB、Oracle、MySQL。 启用归档:可选是否启用归档模式。 启用增量检查点:可选是否启用增量检查点。

注意

开发者模式开启之后,启用增量检查点开关不可见,默认开启。实例化LightDB-23.1版本以前,不显示启用归档开关。实例化LightDB-23.4版本以前,不显示启用增量检查点开关。 其中具体参数和含义见 LightDB数据库安装手册

3.5.1.3. 修改集群

修改集群不可修改数据库类型、部署模式。其余均可修改。

image-2022122300012

3.5.1.4. 删除集群

不想要监控集群可进行删除。删除前必须先删除所监控的数据库实例。

image-2022122300013

3.5.1.5. 主从切换

高可用模式下,主节点能够切换成备节点,备节点切换成主节点。

image-2022122300014

现主节点:现在高可用模式下的主节点ip。 现备节点:现在高可用模式下的备节点ip。

3.5.1.6. 实例启停

该功能需要配置SSH免密互通

# 免密认证,所有服务器都要执行
ssh-keygen -t rsa -P "" -f ~/.ssh/id_rsa
# 证书同步,所有服务器都要执行,包括自身,例如
# 192.168.10.128服务器上执行
ssh-copy-id lightdb@192.168.10.128
ssh-copy-id lightdb@192.168.10.110
# 192.168.10.110服务器上执行
ssh-copy-id lightdb@192.168.10.110
ssh-copy-id lightdb@192.168.10.128

实例启停操作可对整个集群中的节点进行启动,停止,重启操作。

image-2022122300015

选择集群操作:可选择启动,停止,重启操作。 选择操作范围:可选择整个集群,所有primary节点,所有standby节点,自定义节点。

3.5.1.7. 集群卸载

集群卸载包括卸载单实例,高可用集群,卸载方式可以选择全部卸载和仅卸载实例,卸载高可用的时候可以选择一个,或者多个实例进行卸载。

image-2022122300016

3.5.2. 主机管理

通过添加主机部署监控实例代理。点击代理状态可跳转至监控代理日志。点击概览可以跳转到主机概览。

3.5.2.1. 添加主机

安装前需要修改服务器/var/log/messages 默认权限 修改/etc/logrotate.d/syslog 文件,将原有/var/log/messages 一行改为:

/var/log/messages
{
create 0644
postrotate
/bin/kill -HUP `cat /var/run/syslogd.pid 2> /dev/null` 2> /dev/null || true
endscript
}

然后执行如下命令,使设置生效。

logrotate --force /etc/logrotate.d/syslog

用户可以添加要监控的主机,添加成功后系统自动把代理安装到配置的目录中

重要

当前版本,添加主机监控的同时支持添加主机上多实例监控(最多支持4个实例)

host_instance_add_2023-09-14_11-05-12

主机IP: 主机IP地址
主机名: 方便识别主机
SSH端口: 主机的ssh端口
主机用户名: 登录主机的用户名
主机密码: 登录主机用户名对应的密码

host_instance_add_host_2023-09-14_11-05-12

代理端口: 要监控主机中未使用的端口,默认17334。建议1733X未占用相关端口。
代理安装路径: 代理安装的路径,需要主机用户名有RWX权限的空目录。
agent包上传: 上传打包好的agent的zip包, 根据服务器的版本选择对应的zip包。

host_instance_add_agent_2023-09-14_11-05-12

允许在添加主机监控的同时监控实例信息

所属集群:所要监控的数据库实例对应的集群。
所属主机:所要监控的数据库实例安装在哪个主机上。
实例角色: 所要监控的数据库实例对应的角色。
数据库家目录:数据库实例的家目录。默认 /usr/local/lightdb/lightdb-x/13.8-23.1
数据库: 默认postgres,不可修改。
数据库端口: 数据库实例对应端口。默认5434
数据库用户:登录数据库的用户名
数据库密码:登录数据库的密码

host_instance_add_instances_2023-09-14_11-05-12

添加主机后代理部署可能需要1~2分钟,代理状态为运行正常时部署成功。

3.5.2.2. 修改主机

注意

修改主机,只能修改主机密码、端口。

修改主机上多实例,目前只支持修改数据库用户密码。

host_instance_update_2023-09-14_11-05-12

3.5.2.3. 删除主机

如果不需要监控可以删除主机。删除前必须先删除部署在主机上的数据库实例监控。

image-2022122300021

image-2022122300022

3.5.2.4. 主机代理日志下载

在主机管理列表中,点击代理日志下载可进行下载代理日志操作。 image-2022122300169

3.5.2.5. 安装软件

安装软件是指安装数据库,主机管理填写数据库安装目录,需要主机用户名有RWX权限的空目录,上传操作系统版本相匹配的lightdb-x安装包。

image-2022122300025

集群列表中点击新增集群可以基于已安装数据库软件的主机,在线安装数据库实例。

image-2022122300026

image-2022122300027

3.5.2.6. 卸载软件

卸载软件是指卸载通过em安装的数据库

image-2022122300171

3.5.3. 实例列表

备注

1、实例列表展示用户添加集群下主机对应部署的数据库实例信息。

2、包含所属集群、实例角色、主机IP、数据库端口、数据库用户名、数据库实例状态。

3、可以根据所属集群、实例角色、主机IP和实例状态进行查询,同时提供点击概览跳转至数据库概览界面功能。

3.5.3.1. 添加实例

重要

1、支持添加多实例。

2、支持多实例和主机共用一个主机代理。

3、也支持新增一个只监控实例的代理。

添加实例,共用一个主机代理 instance_add_same_host_2023-09-14_13-39-43 instance_add_same_host_instance_2023-09-14_13-39-43

添加实例,实例和主机不共用一个代理 instance_add_not_same_host_2023-09-14_13-39-43 instance_add_not_same_host_instances_2023-09-14_13-39-43

3.5.3.2. 修改实例

注意

修改实例,目前只支持修改单实例的数据库密码

instance_update_single_password_2023-09-14_14-01-47

3.5.3.3. 删除实例

注意

1、删除实例前,若存在实例的备份定时任务,先删除实例的备份定时任务。 2、删除实例前,若当前被监控实例是通过em在线安装的,请先卸载对应实例,卸载数据库软件之后,再执行删除实例操作。

instance_delete_single_2023-09-14_14-22-34

3.5.3.4. 实例代理日志下载

在实例列表中,点击代理日志下载可进行下载代理日志操作。

image-2022122300170

3.6. 集群拓扑图

集群拓扑图展示数据库实例之间的关系,内容包含以下三部分:实例角色,实例状态,代理状态。 image-2022122300172

3.7. 主机监控与管理

主机监控与管理展示了数据库服务器的主机概览信息。

3.7.1. 主机概览

主机概览包括数据时间范围统一选择、自动刷新、主机信息、主机配置、CPU使用率、网络流量分析、内存使用率、交换空间使用量、文件系统、磁盘活动和性能测试。

3.7.1.1. 时间范围统一选择

时间范围统一选择提供的选择范围有0.5小时、1小时、6小时、12小时、24小时和自定义范围。通过选择不同的时间范围,页面下面的图表就可以展示不同时间范围的数据,除了自定义时间范围外,其他的时间范围都是以服务器当前时间作为结束时间向前推导开始时间来查询数据。

image-2022122300034

自定义范围是用户根据实际需要可以选择图表数据范围的起止时间。确定后,页面上展示选择的时间范围,同时图表数据按照选定的时间范围进行加载。首先选择日期范围

image-2022122300035

日期范围选择后,可以选择时间范围

image-2022122300036

3.7.1.2. 自动刷新

自动刷新默认是开启的且刷新频率为5秒,用户可以根据需要开启。自动刷新频率选择的范围有1秒、3秒、5秒、15秒、30秒、1分钟和5分钟。开启自动刷新,选择频率后,页面会根据选择的时间频率加载图表的数据。

image-2022122300037

3.7.1.3. 主机信息和主机配置

主机概览展示监控的数据库主机信息,包括主机名、Liunx版本、内核版本、启动时间和内核参数入口。

image-2022122300038

点击内核参数入口进入内核参数列表

image-2022122300039

内核参数项介绍.

image-2022122300173

image-2022122300174

主机概览展示监控的数据库主机配置,包括 CPU、存储、内存和Swap交换区。

image-2022122300040

3.7.1.4. CPU使用率

目前系统每10秒采集一次CPU使用时间信息,主要采集包括user、nice、system、idle、iowait、irq、softirq和steal。采集数据项介绍:

image-2022122300041

image-2022122300042

CPU使用率计算公式,以user项为例: user使用率=user/(system+user+iowait+irq+nice+softirq+steal)

3.7.1.5. 网络流量分析

网络流量每10秒采集一次,采集每个网卡的发送和接受流量速率。采集数据项介绍:

数据项

说明

TX速率

从网卡发出的流量速率

RX速率

网卡接收流量速率

image-2022122300043

同时提供针对网卡进程的实时流量监控,页面端提供自动刷新功能:

image-2022122300044

3.7.1.6. 内存使用率

内存使用每10秒采集一次,每次展示的是当前采集时间点的系统内存使用情况。

image-2022122300045

3.7.1.7. 交换空间使用量

交换空间使用每10秒采集一次,每次展示的是当前采集时间点的系统交换空间使用情况。

image-2022122300046

3.7.1.8. 文件系统

文件系统展示最新的文件系统名称、类型、挂载点和最新的使用情况。

image-2022122300047

3.7.1.9. 磁盘活动

磁盘活动展示磁盘每秒读写次数、每秒读写容量、IO消耗CPU占比和平均IO等待时间

image-2022122300048

同时展示 Top10进程详情

image-2022122300049

3.7.1.10. 性能测试

此处生成磁盘性能测试报告:

image-2022122300050

3.8. 数据库监控与管理

数据库监控与管理监控数据库的一些核心功能,展示数据库的运行状态,方便用户查看数据库运行是否监控,如果出现问题,用户也可以及时的根据这些功能分析定位数据库存在的问题。数据库监控与管理包括 PWR管理、数据库概览、代理监控状态和 TOP SQL。

3.8.1. PWR管理

数据库每10秒定时生成数据库快照。PWR管理功能真是所有快照,根据时间范围可以查询快照列表。

image-2022122300051

image-2022122300052

用户选择2个快照可以生成 PWR报告

image-2022122300053

用户可以设置快照保存时间期限

image-2022122300054

用户可以自己创建快照

image-2022122300055

3.8.2. 数据库概览

数据库概览展示了数据库核心的配置和运行信息。包括动态修改GUC参数、冻结事务比例、节点信息、上次备份、活跃会话数、事务数、缓存命中率、DML影响行数、等待事件、表膨胀监控、临时文件、WAL数据量信息和数据库物理写信息、SQL审核

image-2022122300056

image-2022122300057

3.8.2.1. 数据库实例切换

数据库实例切换功能计划针对所有数据库实例进行监控。目前只实现了针对主节点的监控。

image-2022122300058

3.8.2.2. 时间范围统一选择

时间范围统一选择提供的选择范围有0.5小时、1小时、6小时、12小时、24小时和自定义范围。通过选择不同的时间范围,页面下面的图表就可以展示不同时间范围的数据,除了自定义时间范围外,其他的时间范围都是以服务器当前时间作为结束时间向前推导开始时间来查询数据。

image-2022122300059

自定义范围是用户根据实际需要可以选择图表数据范围的起止时间。确定后,页面上展示选择的时间范围,同时图表数据按照选定的时间范围进行加载。首先选择日期

image-2022122300060

日期范围选好后,可以选择时间范围

image-2022122300061

3.8.2.3. 自动刷新

自动刷新默认是开启的且刷新频率为5秒,用户可以根据需要开启。自动刷新频率选择的范围有1秒、3秒、5秒、10秒、15秒、30秒、1分钟和5分钟。开启自动刷新,选择频率后,页面会根据选择的时间频率加载图表的数据。

image-2022122300061

image-2022122300062

3.8.2.4. GUC参数

GUC: Grand Unified Configuration 指的是Lightdb数据库的一种对数据库变量进行设置对数据库进行控制的机制。可通过页面修改GUC参数信息,本质是对lightdb.conf文件中变量进行修改,或通过set命令对参数进行设置。具体以数据库配置为准。 image-2022122300063

3.8.2.5. 冻结事务比例

image-2022122300064

3.8.2.6. 数据库表年龄信息

点击冻结事务比例中数据库可查看具体表年龄信息,并且可根据表格列名排序 image-2023040316479

3.8.2.7. 主节点信息

主节点信息展示数据库集群信息。数据库集群通过ltcluster来实现,集群状态通过执行ltcluster命令来查询ltcluster -f $ltcluster_config_path cluster show

image-2022122300065

通过查看详情,可以查看集群主节点复制延迟和LSN状态

image-2022122300066

image-2022122300178

3.8.2.8. 上次备份

本实例在集中备份模块最后一次执行备份的时间。 活跃会话数 ‘’’’’’’’’’’’’’’’’’’ 活跃会话数统计视图lt_stat_activity总连接数,然后根据条件state like’idle%’查询空闲连接数,根据总连接数-空闲连接数=活跃连接数

image-2022122300068

3.8.2.9. 事务数

数据库事务数从视图pg_stat_database中获取xact_commit的值,xact_commit代表此数据库中已提交的事务数。

image-2022122300069

3.8.2.10. 缓存命中率

缓存命中率从视图pg_statio_all_tables中数据。pg_statio_all_table视图中当前数据库每个表一行(包括TOAST表),显示:表OID、模式名、表名、 从该表中读取的磁盘块总数、缓冲区命中次数、该表上所有索引的磁盘块读取总数、 该表上所有索引的缓冲区命中总数、在该表的辅助TOAST表(如果存在)上的磁盘块读取总数、 在该表的辅助TOAST表(如果存在)上的缓冲区命中总数、TOAST表的索引的磁盘块读 取总数、TOAST表的索引的缓冲区命中总数。 当前数据库中的每个表一行,显示有关在指定表上 I/O 的统计信息。 缓存命中率图表展示总的命中率数据,计算公式:

sum(COALESCE(t.heap_blks_hit,0)
+COALESCE(t.idx_blks_hit,0)
+COALESCE(t.toast_blks_hit,0)
+COALESCE(t.tidx_blks_hit,0)) over() *100
/                                                                           sum(COALESCE(t.heap_blks_read,0)
+COALESCE(t.heap_blks_hit,0)
+COALESCE(t.idx_blks_read,0)
+COALESCE(t.idx_blks_hit,0)
+COALESCE(t.toast_blks_read,0)
+COALESCE(t.toast_blks_hit,0)
+COALESCE(t.tidx_blks_read,0)
+COALESCE(t.tidx_blks_hit,0)) over() as  decimal(10,2)

image-2022122300070

点击命中率图表上的每个点,可以查看缓存命中率明细:

image-2022122300071

pg_statio_all_tables视图列说明:

image-2022122300072

3.8.2.11. DML影响行数

DML影响行数从视图pg_stat_all_tables中数据。pg_stat_all_tables视图将为当前数据库中的每一个表(包括 TOAST 表)包含一行,该行显示与对该表的访问相关的统计信息。

image-2022122300073

点击DML影响行数图表上的每个点,可以查看DML影响行数明细: image-2022122300074

pg_stat_all_tables视图列说明:

image-2022122300075

等待事件

3.8.2.12. DML影响行数

等待事件从表sample_activity_profile关联sample_activity_history表获取数据

image-2022122300076

通过等待事件图表上的点可以访问等待事件明细:

image-2022122300077

等待事件类型:

image-2022122300078

3.8.2.13. 表膨胀监控

表膨胀也是从视图pg_stat_all_tables中获取数据计算出来结果。 表膨胀采集逻辑较为苛刻,页面没数据是正常的情况。获取表膨胀逻辑:

with tmp as(select schemaname,relname as tablename,pg_relation_size(''||schemaname||'.'||relname||'') tab_size,
   n_dead_tup,
   n_live_tup,
   coalesce(round(n_dead_tup * 100 / (case when n_live_tup + n_dead_tup = 0 then null else n_live_tup + n_dead_tup end ),2),0.00) as dead_tup_ratio,
   round( case when (sum(n_live_tup + n_dead_tup) over())=0 then 0
               else  (sum( n_dead_tup) over())*100/(sum(n_live_tup + n_dead_tup) over()) end ,2) dead_tup_ratio_total
from pg_stat_all_tables)
SELECT * FROM tmp WHERE schemaname not in ('pg_catalog','lt_catalog')
and tab_size > 100*1024*1024
and n_dead_tup > 1000
and n_live_tup > 1000
and dead_tup_ratio > 20
ORDER BY dead_tup_ratio DESC LIMIT 1000;

image-2022122300079

通过表膨胀监控图表上的点可以访问表膨胀明细:

image-2022122300080

3.8.2.14. 临时文件

数据库临时文件信息是从数据库日志中解析出来的数据。系统会把数据库日志定时采集到lem_db_temp_file_log表中,通过解析lem_db_temp_file_log中的数据即得到临时文件信息。临时文件数据获取逻辑: select db_log_time_minute as minuteTime , round(sum(temp_file_size) /(1024*1024),2) as size from lem_db_temp_file_log group by db_log_time_minute order by 1 asc

image-2022122300081

通过点击临时文件图表中的柱子,可以查看临时文件日志明细:

image-2022122300082

3.8.2.15. WAL数据量信息

WAL数据量信息从视图pg_stat_statements中获取数据。WAL汇总数据获取逻辑:

select pd.datname as dbName, sum(pss.wal_bytes) as walAmount
from Pg_stat_statements pss
join pg_database pd on pss.dbid = pd.oid
where pss.wal_bytes > 0 and datname != 'template1'
group by pd.datname
order by datname;

image-2022122300083

通过WAL数据量信息图表上的点可以访问WAL增量明细:

image-2022122300084

3.8.2.16. 数据库物理写信息

数据库物理写从视图pg_stat_statements中获取数据。 从节点无物理写信息。

image-2022122300085

通过数据库物理写信息图表上的点可以访问物理写明细:

image-2022122300086

3.8.3. 实时 SQL

实时SQL展示实时活动的sql。通过表lt_stat_activity得到实时SQL,得到的数据中文化展示。

image-2022122300087

实时SQL搜索条件数据也是中文化展示。

image-2022122300088

锁详情页面

image-2022122300089

实时SQL表和数据项说明:

image-2022122300090

image-2022122300091

3.8.4. TOP SQL

TOP SQL 是对最近 24h 查询语句的多维统计排行榜; 基于 query md5 来对语句分组, 主要排行维度有:总调用次数、总执行耗时、最小执行时间、最大执行时间、平均执行时间、总体时间标准差、总影响行数、总读取时间、总写入时间。

image-2022122300092

3.8.5. 顶级活动

顶级活动展示不同等待事件的平均活跃会话情况,横轴为时间,每10秒一个间隔,竖轴为活跃会话数。 image-2023040316431

TOP SQL列表展示一定时间内SQL活动占比,平均活跃会话说,TOP SQL列表和平均活跃会话筛选的时间范围联动,点击具体SQL ID可以下钻获取具体的SQL内容,同时可在线获取该SQL的执行计划。 image-2023040316432

3.8.6. TOP 对象

TOP对象是对数据库大小,数据库表大小,索引大小进行排行;

image-2022122300093

3.8.7. 索引监控

合理的索引能大幅提升性能,但冗余的索引也会降低数据库性能,索引监控模块会扫描数据库中存在无效的索引,可对索引组织提供一定的参考。 image-2023040416501

3.8.8. 创建租户

创建租户功能是可以通过em在线创建database。

创建租户具有以下限制 :

  1. 在线创建租户,当数据库版本号小于22.4,可以填写数据库名称;

  2. 数据库版本号大于等于22.4小于23.3,可以填写数据库名称和选择兼容模式;

  3. 数据库版本号大于等于23.3可以填写数据库名称和选择兼容模式并在选择mysql模式后可以选择是否开始表名大小写敏感按钮;

  4. 当在分布式的cn节点创建数据库,会同步到dn节点上,当在dn节点在创建数据库,则只在dn上创建租户。

  5. 数据库实例角色为standby和witness不支持创建租户。

host_instance_log_2023-12-14_14-35-12

3.8.9. SQL审核

SQL审核功能是可以通过新建数据库连接信息,然后新增SQL申请的时候可以指定数据库连接信息提交审核工单,后面可以通过人工来审核SQL工单是否通过。

1,新增数据库连接信息,目前支持 POSTGRESQL、ORACLE、MYSQL(5.7、8.0)、OCEANBASE(mysql、oracle)、TDSQL(5.7、8.0)、DM、OPENGAUSS,lightdb-mysql,lightdb-oracle这些类型的数据库

host_instance_log_2023-12-14_13-34-12

2,新增SQL审核申请,指定数据库连接信息新增SQL审核工单

host_instance_log_2023-12-14_13-37-12

3,人工审核,审核新增的SQL工单

host_instance_log_2023-12-14_13-43-12

3.8.10. 实例巡检

由于巡检工具使用python3编写,需要访问lightdb查询GUC参数以及节点状态,故务必确保系统安装了python3。 注:自LightDB 22.4版本开始,LightDB依赖python3版本。 1、 生成实例的巡检报告

image-2022122300094

2、 查看实例巡检报告内容

image-2022122300095

image-2022122300096

注:该巡检报告支持下载

3.8.11. 对象倾斜率情况

如果代理监控的实例是分布式数据库实例,则可以查看每个数据库的倾斜率信息,以及分片信息。

host_instance_log_2023-09-14_17-15-12

host_instance_log_2023-09-14_17-16-12

点击查看分片情况查看分片信息 host_instance_log_2023-09-14_18-16-12

3.9. 集中备份

集中备份基于 lt_probackup 实现数据库实例的数据备份和WAL归档; 一个备份服务器配备一个备份实例,目前仅支持备份服务器的备份实例与被备份实例同版本的情况。一个备份服务器可以初始化多个备份目录,一个备份目录下可以添加多个实例(一个实例只允许被添加一次),一个实例可以执行多次备份,增量备份之前必须有成功的全量备份。

3.9.1. 备份服务器

备份服务器是用于存储备份文件的服务器,系统提供自定义存储告警阈值,触发阈值将会发送告警通知。 添加备份服务器前准备: 1. 参与备份的服务器平台要一致,如el7.x87或者KylinV10sp1.arm。 2. 预先在备份服务器安装lightdb,版本与备份实例需一致。

image-2022122300097

image-2022122300098

注意:【lt_probackup路径】表示lt_probackup这个命令在备份服务器上的绝对路径(该路径为目录不包含lt_probackup)

3.9.2. 备份定时任务

备份定时任务开放定时上线,仅支持手动执行备份(增量备份前需要已成功全量备份),支持手动删除备份。 添加备份任务前准备: 1. 已部署备份实例。 2. 在备份实例配置数据库用户lt_probackup的访问权限和免密,编辑 $LTDATA/lt_hba.conf 添加如下内容: host all lt_probackup 10.20.128.128/32 trust 字段内容说明: host:此记录匹配使用 TCP/IP 进行的连接尝试。 all: 匹配所有的数据库 lt_probackup: 特定的数据库用户名称(该用户用于备份) 10.20.128.128/32: 客户端计算机地址。该地址下的客户端允许访问数据库 trust: 无条件允许连接。即允许客户端地址为10.20.128.128/32的数据库用户lt_probackbap访问(不需要密码)。

image-2022122300099

提示: 未在数据库实例的$LTDATA/lt_hba.conf文件中配置数据库用户lt_probackup访问免密,则为该数据库实例添加备份定时任务失败,失败提示信息为“需要在$LTDATA/lt_hba.conf配置备份用户lt_probackup的访问权限和免密”。 22.1版本的数据库实例,为该实例添加备份定时任务失败,错误提示信息中$LTDATA对应22.1版本的数据库实例为$PGDATA。lt_hba.conf对应22.1版本的数据库实例为pg_hba.conf。 3.em为备份实例配置持续WAL归档(备份基于持续WAL归档)。需要重启数据库实例服务保证配置的持续WAL归档生效。 4.使用命令行ltsql连接到数据库实例,查看配置项(archive_mode、wal_level、archive_command、archive_timeout)内容:

show archive_mode;
show wal_level;
show archive_timeout;
show archive_command;
  1. 配置备份服务器主机 与 备份实例主机之间SSH双向免密互通;

ssh-keygen -t rsa -P "" -f ~/.ssh/id_rsa
ssh-copy-id lightdb@backup_server_ip

ssh-keygen -t rsa -P "" -f ~/.ssh/id_rsa
ssh-copy-id lightdb@instance_server_ip

6. 远程备份的并行数受SSH 连接限制,因为SSH连接数默认上限为10,当备份并行数超过10时,需要修改被备份实例所在主机的SSH 连接数限制,参考如下(超级用户执行): vim /etc/ssh/sshd_config 修改 MaxStartup、MaxSessions参数,将最小连接数设置为 80(建议值为最大并行数+10)。保存后退出。 重启 sshd 服务:systemctl restart sshd 或者 service sshd reload。 MaxSessions 80 MaxStartup 80

image-2022122300100

备份模式(增量)说明: DELTA: 在这种模式下,lt_procackup命令 读取 数据库实例的DATA目录中的所有数据文件,并仅复制自上次备份以来发生更改的那些页面。 PAGE: lt_procackup命令会从前一次完整备份或增量备份开始扫描归档文件中的所有 WAL 文件。新创建的备份只包含 WAL 记录中提到的页面。这要求自上一次备份以来的所有 WAL 文件都存在于 WAL 存档中。要求配置持续WAL归档。

image-2022122300101

3.9.3. 手工执行备份接入日志与进度

image-2022122300102

image-2022122300103

image-2022122300104

3.9.4. 备份列表

备份列表页面展示备份服务器-备份目录下的备份列表,点击“详情”可以查看备份详情。

image-2022122300105

备份状态说明: OK : 备份完成并且有效 DONE: 备份已完成,但尚未验证。 RUNNING: 备份正在进行中。 MERGING : 备份正在合并。 MERGED: 备份数据文件已成功合并,但其元数据正在更新过程中。只有全量备份才能具有此状态。 CORRUPT : 一些备份文件已经破坏。 DELETING : 正在删除备份文件。 ERROR: 备份由于意外错误而中止。 ORPHAN: 备份无效,因为其父备份之一已损坏或丢失。

image-2022122300106

3.9.5. 备份删除

备份删除策略: 仅合并过期备份。删除wal文档(可选) 仅删除过期备份。删除wal文档(可选) 指定备份状态删除。删除wal文档(可选) CORRUPT : 一些备份文件已经破坏。 ERROR: 备份由于意外错误而中止。 ORPHAN: 备份无效,因为其父备份之一已损坏或丢失。 指定备份id记录删除。删除wal文档(可选)

image-2022122300107

image-2022122300108

3.9.6. 恢复列表

恢复前准备: 恢复实例所在服务器、备份服务器,需要满足以下条件: 1. 主机之间配置SSH双向免密互通;

ssh-keygen -t rsa -P "" -f ~/.ssh/id_rsa
ssh-copy-id lightdb@backup_server_ip

ssh-keygen -t rsa -P "" -f ~/.ssh/id_rsa
ssh-copy-id lightdb@restore_instance_server_ip
  1. 远程还原的并行线程数受SSH 连接限制,因为SSH连接数默认上限为10,当并行数超过10时,需要修改被恢复实例所在主机的SSH 连接数限制,参考如下(超级用户执行):

vim /etc/ssh/sshd_config
#修改 MaxStartup、MaxSessions参数,将最小连接数设置为 80(建议值为最大并行数+10)。保存后退出。
MaxSessions 80
MaxStartup 80

#重启 sshd 服务: systemctl restart sshd 或者 service sshd reload。

执行恢复: 恢复方式有两种:基于时间点恢复、基于备份恢复,选择基于时间点,则需要指定恢复的时间点,选择基于备份,则需要指定恢复的备份ID; 基于备份ID的恢复方式如下:

image-2022122300109

新建恢复已接入日志与进度

image-2022122300110

在当前页面可以查询本次执行恢复的状态:

image-2022122300111

3.9.7. 恢复后立即启动

可以针对执行恢复成功的情况,执行恢复后立即启动,基于恢复后实例目录启动一个单实例,该实例可以后续再添加到em监控

image-2022122300112

image-2022122300113

3.10. 日志检索

3.10.1. 数据库日志

数据库日志定时从LightDB数据库日志文件中采集。日志文件地址$LTDATA/log/。

image-2022122300114

数据库日志采集以行为单位进行读取,以段为单位进行采集。每段的规定是以日期开头 到下一个日期开头之前的所有行的内容为一段。

image-2022122300115

日志搜索查询过滤条件如下: 日志搜索:根据关键词进行搜索,关键词实现了全文检索;

image-2022122300116

日志信息详情:双击单条日志可查看日志消息详情

image-2022122300117

慢sql查询计划:可通过点击慢日志在表格最右一栏的解析按钮查询该条慢日志的查询计划

image-2022122300118

image-2022122300119

该查询计划包含source数据和该条日志包含的query语句

image-2022122300120

image-2022122300121

日志时间:可以选择日志时间范围进行搜索,先选择日期;

image-2022122300122

再选择时间

image-2022122300123

日志级别:日志级别包括fatal、notice、info、error和 log

image-2022122300124

日志类型:日志类型包括临时文件、慢 SQL、其他、auto vacuum和自动检查点

image-2022122300125

数据库节点:根据实例IP和实例端口进行精确搜索

image-2022122300126

应用名:连接数据库的应用名称

image-2022122300127

数据库名:连接的数据库名称

image-2022122300128

后端类型:后端类型对应视图 pg_stat_activity中的backend_type列。 但是其他类型可能会出现在日志中而不显示在该视图中。

image-2022122300129

日志全屏功能: 点击上方 按钮可以使当前窗口全屏展示

image-2022122300130

点击右上角的 或者esc都可以退出全屏状态。

3.10.2. 系统日志

系统日志从/var/log/messages中采集所有日志。

image-2022122300131

3.10.3. ltcluster日志

ltcluster日志记录ltcluster组件生成的日志,ltcluster日志只有在集群环境才有。非集群环境看不到ltcluster日志菜单。

image-2022122300132

ltcluster用于管理 LightDB 服务器集群中的复制和故障转移。它通过设置备用服务器、监控复制和执行管理任务(如故障转移或手动切换操作)的工具增强了 LightD 的内置热备用功能。ltcluster为 LightDB 的内置复制机制提供了高级支持,例如通过复制协议的级联复制、时间线切换和基本备份。

3.10.4. HA日志

HA日志记录keeplived组件生成的日志,HA日志只有在集群环境才有。非集群环境看不到keepalived日志菜单。

image-2022122300133

3.10.5. 监控代理日志

监控代理日志记录主机的agent采集定时任务执行过程中出现的错误。系统捕获 agent采集定时任务逻辑执行时的异常,记录主机IP、时间和异常信息Exception e.getMessage()

image-2022122300134

3.10.6. 审计日志

审计是对个人或组织账目的正式检查,通常由独立机构进行。ltAudit扩展支持为Lightdb用户提供生成审计日志的能力,通常需要符合政府、金融或ISO认证。生成的审计日志是记录在数据库日志文件中的,分散且不易读。 在数据库日志中,如果日志级别冒号后的第一个冒号之前的内容如果是AUDIT则是审计日志。

image-2022122300135

支持用户在 EM 界面查看审计信息进行审计

image-2022122300136

日志搜索查询过滤条件如下: 日志搜索:根据关键词进行搜索,关键词实现了全文检索;

image-2022122300137

3.10.7. EM日志

Em日志是记录我们em系统本身的功能,其中记录的日志是我们日志em日志中的lightdb-em.log的日志。 数据库日志采集以行为单位进行读取,以段为单位进行采集。每段的规定是以日期开头 到下一个日期开头之前的所有行的内容为一段。

image-2022122300138

其中支持根据时间范围,日志级别,线程名称,日志关键字查找日志,

image-2022122300139

3.10.8. 数据库启动日志

数据库启动日志采集以行为单位进行读取,以段为单位进行采集。每段的规定是以日期开头 到下一个日期开头之前的所有行的内容为一段。在数据库日志中,如果日志内容是以starting LightDB 开头则是数据库启动日志。

host_instance_log_2023-09-14_16-40-12

3.11. 通知中心

通知中心目前展示告警待办发送的告警通知列表。

3.11.1. 告警通知

告警通知主要展示的是主机或数据库超过配置阈值,系统给用户发送待办告警的记录信息

image-2022122300140

主机和数据库告警阈值配置表:

image-2022122300175

image-2022122300176

image-2022122300177

3.12. 系统管理

系统管理模块主要包括LightDB EM全局设置的功能。

3.12.1. EM定时任务

EM定时任务配置的是采集和数据库定时任务外的其它定时任务。目前定时任务有获取最新的消息通知、收集统计信息、定时vacuum、定时获取agent心跳和定时备份任务。

image-2022122300141

image-2022122300142

通过查看日志可以查看定时任务执行的日志明细:

image-2022122300143

3.12.2. 图表参数设置

图表参数配置的是LightDB EM每个图表的滑轨最小值和最大值,滑轨大小目前都是以毫秒为单位。

image-2022122300144

滑轨最小值代表图标的滑轨可以缩放的最小时间间隔,滑轨最大值代表图标的滑轨可以放大的最大时间间隔。

image-2022122300145

3.12.3. 采集监控定时任务

采集监控定时任务配置了LigthDB EM中监控的主机和数据库采集业务点的定时任务信息。Agent根据这些配置定时采集主机和数据库的信息

image-2022122300146

通过编辑操作,我们可以调整定时任务的采集周期和状态。采集定时任务目前使用Spring Schedule来实现,采集周期是标准的cron表达式。

image-2022122300147

采集周期Cron表达式是一个字符串,字符串以5或6个空格隔开,分为6或7个域,每一个域代表一个含义,Cron有如下两种语法格式:

Seconds Minutes Hours DayofMonth Month DayofWeek Year或 Seconds Minutes Hours DayofMonth Month DayofWeek

每一个域可出现的字符如下: Seconds:可出现”, - * /”四个字符,有效范围为0-59的整数 Minutes:可出现”, - * /”四个字符,有效范围为0-59的整数 Hours:可出现”, - * /”四个字符,有效范围为0-23的整数 DayofMonth:可出现”, - * / ? L W C”八个字符,有效范围为0-31的整数 Month:可出现”, - * /”四个字符,有效范围为1-12的整数或JAN-DEc DayofWeek:可出现”, - * / ? L C #”四个字符,有效范围为1-7的整数或SUN-SAT两个范围。1表示星期天,2表示星期一, 依次类推 Year:可出现”, - * /”四个字符,有效范围为1970-2099年

3.12.4. 数据库定时任务

数据库定时任务配置在表cron.job,需要在postgres库中查询。目前主要四个定时任务。

image-2022122300148

image-2022122300149

通过查看运行详情可以查看数据库定时任务执行的日志详情,方便定位问题:

image-2022122300150

3.12.5. 代理配置管理

代理配置管理是可以让我们可以通过em手动配置我们的告警,支持配置邮箱以及钉钉两种告警方式。 其中钉钉告警信息是从钉钉群的智能机器人中获取

image-2022122300151

邮箱服务器信息例如qq邮箱获取方式是开启如下三项后获取

image-2022122300152

配置好钉钉以及邮箱的告警信息

image-2022122300153

配置成功后会在我们配置的钉钉群以及邮箱收到发送成功接入告警配置信息

image-2022122300154

其中邮箱接收方是在em的system修改信息处填写的邮箱地址

image-2022122300155

配置的接受邮箱也收到成功接入告警配置的信息如下

image-2022122300156

3.12.6. 日志列表

日志列表展示的是用户的敏感操作,比如备份恢复、新增集群、修改集群、删除集群,不会记录查询操作。

host_instance_log_2023-12-14_13-47-12

3.12.7. 角色列表

角色列表查看当前角色信息

_images/role_list_2024-04-17_19-18-17.png

3.12.8. 用户列表

用户列表,新增用户,选择角色权限

_images/add_user_2024-04-17_19-34-27.png

3.12.9. 配置管理

全局参数项配置管理,需要em版本>=24.1

1)配置参数类型:”忽略表字段”,无需重启em服务即可在线操作生效

_images/global_parameter_settings.png

新增参数类型:”忽略表字段”

_images/add_global_parameter_settings.png
参数类型:"忽略表字段"
参数名:配置项名称,唯一
参数值:配置项具体内容
参数描述:描述参数名和参数值,比如描述参数值的规则

修改参数类型:”忽略表字段”

_images/edit_global_parameter_settings.png
参数类型:"忽略表字段"
参数名:配置项名称,唯一
参数值:配置项具体内容
参数描述:描述参数名和参数值,比如描述参数值的规则

删除参数类型:”忽略表字段”

_images/delete_confirm_global_parameter_settings.png
删除配置项,弹窗确认

2)配置参数类型:”IP映射字段”,目前新增IP映射记录会存储1条到本地缓存,缓存失效时间为2小时,若删除IP映射后想立即生效当前须通过重启服务来解决;若不涉及IP迁移情况则无须添加”IP映射字段”类型参数,否则会导致系统访问异常。

em-images/global_ip_mapping_settings.png

新增参数类型:”IP映射字段”

em-images/add_global_ip_mapping_settings.png
参数类型:"IP映射字段"
参数名:为用户的原始IP,参数名需要符合IPv4的规范
参数值:为用户的迁移后IP,参数值需要符合IPv4的规范
参数描述:描述参数名和参数值,比如描述参数值的规则

修改参数类型:”IP映射字段”

em-images/modify_global_ip_mapping_settings.png
参数类型:"IP映射字段"
参数名:为用户的原始IP,参数名需要符合IPv4的规范
参数值:为用户的迁移后IP,参数值需要符合IPv4的规范
参数描述:描述参数名和参数值,比如描述参数值的规则

删除参数类型:”IP映射字段”

_images/delete_confirm_global_parameter_settings.png
删除配置项,弹窗确认

3.13. 告警待办

告警待办展示所有待处理的告警待办信息 ,数据库及主机信息如果超过阈值或者异常,就会自动生成告警待办。在实际运维过程中,我们需要特别关注告警待办,一般待办表示数据库及主机出现了问题,需要及时处理。

image-2022122300157

问题真正解决后,点击对应的告警待办输入确认信息保存,告警待办状态即为处理成功,并且会在顶部不再展示,只展示在已办告警列表中。

image-2022122300158

点击查看全部进入待办列表

image-2022122300159

3.14. 用户中心

登录用户信息栏展示当前登录用户名,鼠标移动到用户信息上会展示用户对系统信息及修改操作。

image-2022122300160

3.14.1. 修改信息

修改信息可以修改当前用户的信息

image-2022122300161

3.14.2. 修改密码

修改密码可以修改当前用户的密码,密码强度是根据包含类型(支持大写字母、小写字母、数字、其他字符)和长度,建议使用8位字符串、至少包含两种字符类型;

image-2022122300162

3.14.3. 锁屏

锁屏可以遮盖当前系统防止其他用户操作界面,解除锁屏需要输入当前用户的密码。

image-2022122300163

3.14.4. 主题皮肤

主题皮肤可以选择2种皮肤中的一种,咖啡色和蓝色

image-2022122300164

image-2022122300165

3.14.5. 系统信息

系统信息目前展示的是DBPaas的版本系统和缓存

image-2022122300166

3.14.6. 设置密保问题

设置好密保问题,用户可以根据密保问题找回密码

image-2022122300167

3.14.7. 在线帮助

在线帮助展示的是DBPaaS的用户手册

image-2022122300168

3.14.8. 安全退出

安全退出既退出当前用户登录,进入到系统登录页面。

4. LightDB EM 注意事项

4.1. Lightdb EM 集群相关

  1. Single(单实例)部署模式下只能添加一套主机;

  2. HA(高可用)部署模式下,HA Primary只能有一个;

  3. 添加主机时需要进行测试SSH连接校验,测试数据库连接校验;

  4. 代理路径目录必须为空目录且需有可执行权限;

  5. 实例角色需要选择实际部署的角色;

  6. 一个主机只能部署一个代理监控。

5. EM参数

本节列出了LightDB-EM中系统参数的信息。

EM参数展示

参数名

参数值说明

运维调整情况

app.name

应用名称,默认em

无需调整

app.alias

应用别名,默认lightdb em

无需调整

app.version

应用版本号,每次发版会把版本号调整好

无需调整

app.group

应用组,每次发版会把组调整好

无需调整

server.port

应用端口,默认17333

无需调整

ta.noWebLogUrls

不记录日志URL

无需调整

app.web.home

应用web路径,一般是http://ip:port/em

无需调整

app.web.domain

应用域名或IP

无需调整

install.path

实际安装路径,需确保填写到安装包内部的/em为止。例如: /data/lightdb/wuxj/LightDB1.0-em-V202302-00-000-el7-x86_64/em

无需调整

logging.config

日志配置文件路径,默认classpath:log4j2.xml

按需调整

mybatis.mapperLocations

Mybatis mapper xml路径

不能调整

mybatis.typeAliasesPackage

Mybatis对象对应的包路径

不能调整

mybatis.configLocation

Mybatis 配置路径

不能调整

mybatis.basePackage

Mybatis基础包路径

不能调整

ta.noSecurityUrls

EM调用AGENT校验URL

不能调整

ta.needSignatureUrls

EM调用AGENT签名校验URL

不能调整

dyn.spring.datasources[0].name

默认值default,对应em数据库信息

不能调整

dyn.spring.datasources[0].driverClassName

数据库驱动org.postgresql.Driver

不能调整

dyn.spring.datasources[0].url

对应em数据库jdbc url地址

按需调整

dyn.spring.datasources[0].username

对应em数据库用户名,默认lightdb

按需调整

dyn.spring.datasources[0].password

对应em数据库密码

按需调整

dyn.spring.datasources[0].maxActive

对应em数据库连接池中的最大连接数,默认208

按需调整

dyn.spring.datasources[0].maxWait

从em数据库连接池中获取连接的最大等待时间,单位ms,运维可以根据实际调整优化

按需调整

dyn.spring.datasources[0].maxIdle

对应em数据库最大空闲连接数,默认1

按需调整

dyn.spring.datasources[0].removeAbandoned

超过时间限制是否回收,默认true

按需调整

dyn.spring.datasources[0].removeAbandonedTimeout

超过时间限制多长,默认600s,

按需调整

dyn.spring.datasources[0].logAbandoned

指定发生removeabandoned的时候,是否记录当前线程的堆栈信息到日志中,默认true

按需调整

spring.redis.database

redis库序号,默认0

无需调整

spring.redis.host

redis主机ip

无需调整

spring.redis.port

redis端口port

无需调整

spring.redis.password

redis密码

无需调整

spring.redis.timeout

redis超时时间,默认60000

无需调整

notify.mail.host

邮件告警的邮件服务器

按需调整

notify.mail.account

邮件告警的发送邮箱账号

按需调整

notify.mail.password

邮件告警的发送邮箱密码

按需调整

notify.dingding.baseurl

钉钉告警的机器人地址如:https://oapi.dingtalk.com/robot/send?access_token=3b9eb5e97ec0ab32c39a1c0709321440cf211573455da1a00af5e56b31896d95

按需调整

notify.dingding.secret

钉钉告警的机器人的加签秘钥,如: SEC5720e84b2c0a2694255237b99375a2a83e5dfe02dfff146bcd57ff63431a56df

按需调整

6. AGENT参数

本节列出了LightDB-EM中AGENT代理系统参数相关信息。

AGENT代理参数展示

参数名

参数值说明

运维调整情况

app.name

应用名称,默认em

无需调整

app.alias

应用别名,默认lightdb em

无需调整

app.version

应用版本号,每次发版会把版本号调整好

无需调整

app.group

应用组,每次发版会把组调整好

无需调整

server.port

应用端口,默认17333

无需调整

ta.noWebLogUrls

不记录日志URL

无需调整

app.web.home

应用web路径,一般是http://ip:port/em

无需调整

app.web.domain

应用域名或IP

无需调整

install.path

实际安装路径,需确保填写到安装包内部的/em为止。例如: /data/lightdb/wuxj/LightDB1.0-em-V202302-00-000-el7-x86_64/em

无需调整

logging.config

日志配置文件路径,默认classpath:log4j2.xml

按需调整

mybatis.mapperLocations

Mybatis mapper xml路径

不能调整

mybatis.typeAliasesPackage

Mybatis对象对应的包路径

不能调整

mybatis.configLocation

Mybatis 配置路径

不能调整

mybatis.basePackage

Mybatis基础包路径

不能调整

ta.noSecurityUrls

EM调用AGENT校验URL

不能调整

ta.needSignatureUrls

EM调用AGENT签名校验URL

不能调整

dyn.spring.datasources[0].name

默认值default,对应em数据库信息

不能调整

dyn.spring.datasources[0].driverClassName

数据库驱动org.postgresql.Driver

不能调整

dyn.spring.datasources[0].url

对应em数据库jdbc url地址

按需调整

dyn.spring.datasources[0].username

对应em数据库用户名,默认lightdb

按需调整

dyn.spring.datasources[0].password

对应em数据库密码

按需调整

dyn.spring.datasources[0].maxActive

对应em数据库连接池中的最大连接数,默认208

按需调整

dyn.spring.datasources[0].maxWait

从em数据库连接池中获取连接的最大等待时间,单位ms,运维可以根据实际调整优化

按需调整

dyn.spring.datasources[0].maxIdle

对应em数据库最大空闲连接数,默认1

按需调整

dyn.spring.datasources[0].removeAbandoned

超过时间限制是否回收,默认true

按需调整

dyn.spring.datasources[0].removeAbandonedTimeout

超过时间限制多长,默认600s,

按需调整

dyn.spring.datasources[0].logAbandoned

指定发生removeabandoned的时候,是否记录当前线程的堆栈信息到日志中,默认true

按需调整

dyn.spring.datasources[1].name

对应被监控数据库实例信息。默认格式为IP:PORT

按需调整

dyn.spring.datasources[1].driverClassName

数据库驱动org.postgresql.Driver

按需调整

dyn.spring.datasources[1].url

对应被监控数据库实例jdbc url地址

按需调整

dyn.spring.datasources[1].username

对应被监控数据库实例用户名,默认lightdb

按需调整

dyn.spring.datasources[1].password

对应被监控数据库实例密码

按需调整

dyn.spring.datasources[1].maxActive

对应被监控数据库实例连接池中的最大连接数,默认208

按需调整

dyn.spring.datasources[1].maxWait

被监控数据库实例连接池中获取连接的最大等待时间,单位ms,运维可以根据实际调整优化

按需调整

dyn.spring.datasources[1].maxIdle

被监控数据库实例最大空闲连接数,默认1

按需调整

dyn.spring.datasources[1].removeAbandoned

超过时间限制是否回收,默认true

按需调整

dyn.spring.datasources[1].removeAbandonedTimeout

超过时间限制多长,默认600s,

按需调整

dyn.spring.datasources[1].logAbandoned

指定发生removeabandoned的时候,是否记录当前线程的堆栈信息到日志中,默认true

按需调整

host.ip

被监控主机IP

不能调整

host.hostname

被监控主机名

不能调整

host.user

被监控主机用户名

不能调整

database.server.url

被监控数据库URL。默认为IP:PORT格式

不能调整

database.server.username

被监控数据库名称

不能调整

database.server.type

数据库类型1:lightdb 2:postgresql

不能调整

database.server.cluster.mode

数据库部署类型,0 单实例 1 高可用 2分布式

不能调整

database.server.cluster.nodetype

数据库节点类型,Single Only、HA Primary、HA Standby、HA Witness、Distribute Coordinator Primary、Distribute Coordinator Standby、Distribute Coordinator Witness、Distribute Worker Primary、Distribute Worker Standby、Distribute Worker Witness

不能调整

lightdb.agent.monitorType

代理监控类型,1:监控主机 2:监控实例 3:em定时任务

不能调整

spring.redis.database

redis库序号,默认0

按需调整

spring.redis.host

redis主机ip。如果从安装包拷贝部署,需要替换${em_host}为当前服务器IP

按需调整

spring.redis.port

redis端口port。如果从安装包拷贝部署,需要替换${redis_port}为redis提供服务的端口

按需调整

spring.redis.password

redis密码。如果从安装包拷贝部署,需要替换${redis_password}为redis配置的密码

按需调整

spring.redis.timeout

redis超时时间,默认60000

按需调整

notify.mail.host

邮件告警的邮件服务器

按需调整

notify.mail.account

邮件告警的发送邮箱账号

按需调整

notify.mail.password

邮件告警的发送邮箱密码

按需调整

notify.dingding.baseurl

钉钉告警的机器人地址如:https://oapi.dingtalk.com/robot/send?access_token=3b9eb5e97ec0ab32c39a1c0709321440cf211573455da1a00af5e56b31896d95

按需调整

notify.dingding.secret

钉钉告警的机器人的加签秘钥,如: SEC5720e84b2c0a2694255237b99375a2a83e5dfe02dfff146bcd57ff63431a56df

按需调整

lightdb.jieba.noneStopChars

非停止符,默认为 :,-,_,= 多个符号使用‘,’分割 用于在分词时将由非停止符连接的多个单次拼接成一个单词进行搜索,必须在 agent 和 em 同时配置。

按需调整

7. EM错误码

本节列出了LightDB-EM中错误码相关信息。

EM错误码展示

错误码

中文描述

原因

解决方法

LEG01

请求参数校验异常

通用参数校验不通过

传入正确的请求参数

LEG02

请求参数为空

请求参数为空

传入正确的请求参数

LEG03

文件上传失败

文件大于默认上传大小1024M

修改jrescloud.properties配置文件中 spring.http.multipart.maxFileSize=1024MB spring.http.multipart.maxRequestSize=1024MB spring.servlet.multipart.max-file-size=1024MB spring.servlet.multipart.max-request-size=1024MB

LEG04

文件下载失败

没有权限

为文件存储目录赋予lightdb用户权限以及可读写权限

LEG05

文件不存在

文件不存在

确保文件真实存在

LEG06

目录不存在

目录不存在

创建目录

LEG07

创建目录失败

没有权限/磁盘空间不足

为文件存储目录赋予lightdb用户权限以及可读写权限

LEG08

文件关闭失败

文件不存在或无法访问/文件已被其他进程打开/操作系统资源限制

确保文件路径存在、能正常访问且有权限/释放文件锁或资源

LEG09

文件打开失败

文件打开失败

确保文件路径存在、能正常访问且有权限/释放文件锁或资源

LEG10

文件写入失败

文件写入失败

确保文件路径存在、能正常访问且有权限/释放文件锁或资源

LEG11

内部服务调用失败(em调用agent接口)

agent异常或已停止

检查agent状态重启agent代理

LEG12

无操作权限,请联系管理员授权

用户未赋权

用管理员账号赋予用户菜单等权限

LEG13

HTTP请求失败(外部服务web调用em接口)

未授予访问权限

开放鉴权秘钥

LEG14

服务器时间不同步

服务器之间时间不同步,存在偏差

手动调整服务器时间/使用 NTP(Network Time Protocol)

LEG15

agent故障,请检查agent的状态

agent异常或已停止

检查agent状态重启agent代理

LEG16

查询失败,//统一处理查询操作

数据库连接异常/网络故障导致与数据库之间的连接断开

检查数据库状态网络状态内存资源等

LEG17

修改失败,//统一处理更新操作

数据库连接异常/网络故障导致与数据库之间的连接断开

检查数据库状态网络状态内存资源等

LEG18

删除失败,//统一处理删除操作

数据库连接异常/网络故障导致与数据库之间的连接断开

检查数据库状态网络状态内存资源等

LEG19

添加失败,//统一处理添加操作

数据库连接异常/网络故障导致与数据库之间的连接断开

检查数据库状态网络状态内存资源等

LEG20

字段排序不支持,//统一处理添加操作

该字段不支持排序

请选择其他字段进行排序

LEG21

解析失败!,//统一处理解析操作

转码解码异常

检查编码格式和字符集utf-8

LEG22

将文件scp到远程服务器报错

目录不存在/没有权限/磁盘空间不足

确保目录赋予lightdb用户权限以及可读写权限/磁盘空间充足

LEG23

在远程服务器执行命令出错

没有权限/没有那个文件或目录

确保目录赋予lightdb用户权限以及可读写权限/确保文件存在且有权限执行

LEG24

数据库表记录已存在

主键/唯一键冲突

确保数据是否已经添加,无需重复添加/更换内容再次添加

LEG25

数据字典编码dictCode不能为空

数据字典code为空

确保传入的字典key为非空

LEG26

shell脚本在em本地执行失败

创建脚本lt_probackup_for_em.sh,并将lt_probackup子命令archive-push附加到脚本中异常/创建脚本lt_probackup_for_em.sh并清空脚本异常

确保目录赋予lightdb用户权限以及可读写权限/确保文件存在且有权限执行

LEG27

执行shell脚本的所需参数个数不对

执行shell脚本的所需参数个数不对

传入正确的请求参数

LEG28

hostIp为空

hostIp为空

传入正确的ip

LEG29

hostIp不合法

hostIp不合法

传入正确的ip

LEG30

contactType为空

contactType为空

传入正确的联系人类型

LEG31

contactType内容不合法

contactType内容不合法

传入正确的联系人类型

LEG32

order字段内容只能为asc或者desc

order字段内容只能为asc或者desc

order字段内容只能为asc或者desc

LEG33

该sort字段不支持排序

该sort字段不支持排序

请选择其他字段进行排序

LEG34

未给操作用户配置sudo免密

未给lightdb操作用户配置sudo免密

给lightdb用户配置sudo免密

LEG35

上传的文件类型不支持,请上传zip文件

上传的文件类型不支持,请上传zip文件

上传的文件类型不支持,请上传zip文件

LEG36

配置项:单个文件大小配置得不准确,格式为xxxxMB

配置项:单个文件大小配置得不准确,格式为xxxxMB

修改配置项:格式为xxxxMB

LEG37

上传的文件过大

文件大于默认上传大小1024M

修改jrescloud.properties配置文件中 spring.http.multipart.maxFileSize=1024MB spring.http.multipart.maxRequestSize=1024MB spring.servlet.multipart.max-file-size=1024MB spring.servlet.multipart.max-request-size=1024MB

LEG38

上传的文件总大小过大

文件大于默认上传大小1024M

修改jrescloud.properties配置文件中 spring.http.multipart.maxFileSize=1024MB spring.http.multipart.maxRequestSize=1024MB spring.servlet.multipart.max-file-size=1024MB spring.servlet.multipart.max-request-size=1024MB

LEG39

上传的文件名称不合法

上传的文件名称不合法

NO USE

LEG40

agentId不能为空

agentId不能为空

确认代理id不为空

LEG41

agent无效

代理信息不存在

确认正确添加代理

LEG42

agent路径不能为空

agent路径不能为空

请传入正确的绝对路径

LEG43

agent路径不合法

agent路径不合法

请传入正确的绝对路径

LEG44

agent端口不能为空

agent端口不能为空

请传入正确的代理端口(1024,65535]

LEG45

agent压缩包路径不能为空

agent压缩包路径不能为空

请确认传入正确的agent压缩包路径

LEG46

agent压缩包路径不合法

agent压缩包路径不合法

请传入正确的绝对路径

LEG47

agent_stop脚本在主机上不存在!

agent_stop脚本在主机上不存在!

请确认是否删除了代理安装路径下的系统文件,如果被人为删除,请手动停止代理,删除em库下lem_instance、lem_host、lem_agent相关数据,重新安装代理。

LEG48

文件不存在

文件不存在

请确认服务器上文件是否存在,如果被人为删除,请手动停止代理,删除em库下lem_instance、lem_host、lem_agent相关数据,重新安装代理

LEG49

agent状态为空,不再执行后续动作

agent状态为空,不再执行后续停止实例代理,删除服务器上代理目录和删除代理表记录动作

确认代理状态是否为空,如为空请重新添加代理

LEG50

服务器空闲内存不足

服务器空闲内存不足

确保服务器内存大于1G

LEG51

只支持22.3及以上版本

只支持22.3及以上版本数据库

如要使用该功能请升级lightdb数据库大于22.3版本

LEG52

实例巡检报错

没有权限/没有python3环境

请检查代理路径下所有文件的权限/安装python3环境

LEG53

读取实例检测文件失败

读取实例检测文件失败/没有权限/文件不存在

请检查代理路径下所有文件的权限/确保实例检测文件没有被删除lightdb_maa_checklist_xxx.html

LEG54

instanceIp为空

instanceIp为空

请传入正确的实例IP

LEG55

instancePort为空

instancePort为空

请传入正确的实例端口

LEG56

pwr报告生成,不支持实例角色witness

pwr报告生成,不支持实例角色witness

请用主备节点生成pwr报告

LEG57

实例巡检报告名称为空

实例巡检报告名称为空

请传入正确的实例巡检报告名称/xxx/xxx/lightdb_maa_checklist_xxx.html

LEG58

获取实例巡检报告列表失败

获取实例巡检报告列表失败

确保该命令能正常执行cd agentHomePath/check_list;ls lightdb_maa_checklist*.html -lr | head -n 100 | awk ‘{printf “%sn”,$9;}’

LEG59

当前lightdb数据库版本不支持

当前lightdb数据库版本不支持

如要使用该功能请升级lightdb数据库大于22.4版本

LEG60

集群下数据库实例版本为空

集群下数据库实例版本为空

请确认集群下添加的数据库版本一致

LEG61

判断python环境失败

判断python环境失败

确保该命令能正常执行python -V 2>&1

LEG62

需要python2环境

需要python2环境

需要python2环境

LEG63

需要python3环境

需要python3环境

需要python3环境

LEG64

根据cn节点信息获取dn列表失败

根据cn节点信息获取dn列表失败

确保数据库集群正常

LEG65

分布式集群备份不支持单机多实例

分布式集群备份不支持单机多实例

分布式集群备份不支持单机多实例,如要使用备份功能请升级为多服务器分布式模式

LEG66

危险路径,不允许删除

危险路径,不允许删除

确保路径是绝对路径没有*等

LEG67

当前实例不是原生PG

当前实例不是原生PG

请安装原生PG

LEG68

原生PG不支持数据库定时任务

原生PG不支持数据库定时任务

请使用lightdb数据库

LEG69

原生PG未安装lightdb提供的插件

原生PG未安装lightdb提供的插件

NO USE

LEG70

原生PG插件冲突

原生PG插件冲突

NO USE

LEG71

原生PG安装了部分lightdb插件

原生PG安装了部分lightdb插件

NO USE

LEG72

执行远程命令判断实例是否是原生PG失败

执行远程命令判断实例是否是原生PG失败

NO USE

LEG73

执行远程命令判断数据库类型失败

执行远程命令判断数据库类型失败

NO USE

LEG74

检查原生PG安装lightdb插件情况

检查原生PG安装lightdb插件情况

NO USE

LEG75

实例巡检文件名不合法

实例巡检文件名不合法

文件名需满足正则^lightdb_maa_checklist_.*.html$

LEG76

上传的agent文件名不合法

上传的agent文件名不合法

文件名需满足正则^(LightDBd.d-agent-V.*|lightdb-agent-.*).zip$

LEG99

其他异常

系统异常

请联系运维人员处理

LEC01

集群查询失败!

数据库连接异常/网络故障导致与数据库之间的连接断开

检查数据库状态网络状态内存资源等

LEC02

集群修改失败!

数据库连接异常/网络故障导致与数据库之间的连接断开

检查数据库状态网络状态内存资源等

LEC03

集群删除失败!

数据库连接异常/网络故障导致与数据库之间的连接断开

检查数据库状态网络状态内存资源等

LEC04

集群添加失败!

数据库连接异常/网络故障导致与数据库之间的连接断开

检查数据库状态网络状态内存资源等

LEC05

集群不存在!

集群不存在!

该集群是否已被删除,已删除则忽略

LEC06

集群已存在!

集群已存在!

唯一键冲突,请重新命名集群名称

LEC07

集群已关联实例,请先删除实例再删集群!

集群已关联实例,请先删除实例再删集群!

删除集群前先删除集群下的实例信息

LEC08

集群已关联实例,无法修改部署模式与数据库类型!

集群已关联实例,无法修改部署模式与数据库类型!

如要修改请重新部署

LEC09

集群id不能为空

集群id不能为空

请传入正确的集群id

LEC10

集群名称已存在

集群名称已存在

集群名称必须唯一,请重新命名

LEC11

集群的数据库版本为空

集群的数据库版本为空

NO USE

LEC12

集群高可用部署,节点的数据库版本不一致

集群高可用部署,节点的数据库版本不一致

确保各个节点上部署的数据库是相同的版本

LEC13

集群高可用部署,节点的LTHOME或者LTDATA不一致

节点的LTHOME或者LTDATA不一致

确保各个节点上对应的LTHOME或者LTDATA是相同的

LEC14

集群高可用部署,集群节点的LTDATA目录不空

集群节点的LTDATA目录不空

集群高可用部署之前确保各个节点的LTDATA是空的

LEC15

集群高可用部署,不符合一主(primary)至少一从(standby),witness可选的原则

不符合一主(primary)至少一从(standby),witness可选的原则

注意各个节点角色分配,要符合一主(primary)至少一从(standby),witness可选的原则

LEC20

检查keepalived和ltclusterd进程是否存在出错

keepalived和ltclusterd进程是否存在检查失败

确认各节点keepalived和ltclusterd进程存在且状态是正常的

LEC21

新增操作系统用户lightdb的bash环境变量出错

新增操作系统用户lightdb的bash环境变量出错

EM通过ssh协议连接到集群节点,请确认当前用户有操作权限

LEC22

初始化数据库出错

初始化数据库出错

EM通过ssh协议连接到集群节点,请确认当前用户有操作权限,配置的数据库初始化参数正确

LEC23

修改$LTDATA/lightdb.conf文件中配置项出错

修改$LTDATA/lightdb.conf文件中配置项出错

确认配置文件存在,当前用户有读写权限

LEC24

启动数据库实例出错

启动数据库实例出错

确认ltbase/script/ha/6_lightdb_start.sh脚本存在,且当前用户有执行权限

LEC25

验证数据库实例启动出错

验证数据库实例启动出错

确认ltbase/script/ha/7_lightdb-validate-start.sh脚本存在,且当前用户有执行权限

LEC26

初始化一个ltcluster安装并注册集群主节点,手动启动一个ltclusterd守护进程。出错

初始化一个ltcluster安装并注册集群主节点,手动启动一个ltclusterd守护进程。出错

确认脚本ltabse/script/ha/9.1_start_primary_ltclusterd.sh存在且当前用户有操作权限,可尝试手动执行,确认异常点

LEC27

遍历集群从节点,从该LightDB主节点克隆一个LightDB备份节点出错

从LightDB主节点克隆一个LightDB备份节点出错

确认脚本ltabse/script/ha/9.2_start_standby_ltcluster.sh存在且当前用户有操作权限,可尝试手动执行,确认异常点

LEC28

高可用集群主节点(实例角色primary)重新启动。出错

高可用集群主节点(实例角色primary)重新启动。出错

请确认脚本ltabse/script/ha/9.3_restart_primary.sh存在且当前用户有操作权限,可尝试手动执行,确认异常点

LEC29

在集群从节点(实例角色standby)启动ltcluster服务。出错

在集群从节点(实例角色standby)启动ltcluster服务。出错

请确认脚本ltabse/script/ha/9.4_start_standby_ltclusterd.sh存在且当前用户有操作权限,可尝试手动执行,确认异常点

LEC30

启动集群witness节点出错

启动集群witness节点出错

请确认脚本ltabse/script/ha/9.5_start_witness.sh存在且当前用户有操作权限,可尝试手动执行,确认异常点

LEC31

在集群非witness节点安装和配置keepalived出错

在集群非witness节点安装和配置keepalived出错

请确认脚本ltabse/script/ha/10_generate_keepalived_conf.sh存在且当前用户有操作权限,可尝试手动执行,确认异常点

LEC32

遍历高可用集群从节点,em执行shell脚本,数据库base目录/ha/12_generate_sql_detector.sh,启动探针失败

em执行脚本失败

请确认脚本ltabse/script/ha/12_generate_sql_detector.sh存在且当前用户有操作权限,可尝试手动执行,确认异常点

LEC33

em在集群节点检测ntp服务失败

em在集群节点检测ntp服务失败

确认ltabse/script/ha/10.2_ntp_check.sh脚本存在,且当前用户有相应执行权限,可尝试手动执行,确认异常点

LEC34

集群节点部分有ntp服务,部分没有ntp服务

集群节点部分有ntp服务,部分没有ntp服务

确认集群各个节点ntp服务正常

LEC35

在集群节点生成hba文件失败

在集群节点生成hba文件失败

确认ltabse/script/ha/0.0.3_generate_pg_hba.sh脚本存在,且当前用户有相应执行权限,可尝试手动执行,确认异常点

LEC36

创建用于数据库实例备份的数据库用户lt_probackup出错

创建用于数据库实例备份的数据库用户lt_probackup出错

确认ltabse/script/ha/8.1_create_lt_probackup.sh脚本存在,且当前用户有相应执行权限,可尝试手动执行,确认异常点

LEC37

集群节点角色(role)不能为空

集群节点角色(role)不能为空

确认为集群中的节点选定了角色

LEC38

节点角色(role)错误,role范围(primary,standby,witness)

节点角色(role)错误,role范围(primary,standby,witness)

确认集群中的节点角色是(primary,standby,witness)中的一个

LEC39

priority不能为空

priority不能为空

确认为集群中的节点设定了优先级

LEC40

priority错误,范围0或者100

priority错误,范围0或者100

确认优先级设定的是0或者100

LEC41

sync字段不能为空

sync字段不能为空

确认勾选是否同步选项

LEC42

sync字段错误,sync取值范围[sync,async,none]

sync取值范围[sync,async,none]

是否同步选项范围为[sync,async,none]

LEC43

集群高可用部署,节点的ip需要均不同

集群高可用部署,节点的ip需要均不同

确认集群中节点IP没有重复的

LEC44

在集群节点生成ntp.conf文件失败

在集群节点生成ntp.conf文件失败

确认当前用户有对应节点上的读写权限

LEC45

实例启停,不支持原生PG

实例启停,不支持原生PG

不支持原生PG的在线启停,可以根据需要手动启停

LEC46

实例卸载,不支持原生PG

实例卸载,不支持原生PG

不支持原生PG的在线卸载,可以根据需要手动卸载

LEC47

新建集群,不支持原生PG

新建集群,不支持原生PG

不支持原生PG集群的在线部署

LEC48

数据库实例所属集群类型不支持

数据库实例所属集群类型不支持

NO USE

LEH01

暂无主机

暂无主机

新增一个主机

LEH02

主机故障

主机故障

请检查主机是否存在异常

LEH03

主机查询失败!

主机查询失败!

主机信息查询失败,确认EM连接的数据库正常

LEH04

主机修改失败!

主机修改失败!

NO USE

LEH05

主机删除失败!

删除主机agent记录,删除主机记录,删除主机采集定时任务失败

确认EM连接的数据库正常

LEH06

主机添加失败!

主机添加失败!

EM通过ssh协议连接到主机,请确认所操作主机可达,且有相应的操作权限

LEH07

主机不存在!

主机不存在!

确认想要操作的主机是否正常添加

LEH08

主机已存在!

主机已存在!

不要重复添加同一个主机

LEH09

主机连接失败!

主机连接失败!

EM通过ssh协议连接到主机,请确认所操作主机可达

LEH10

主机密码解密失败!

主机密码解密失败!

EM通过ssh协议连接到主机,请确认所操作主机密码是正确的

LEH11

agent部署失败!

agent部署失败!

主机代理部署异常,请尝试重新添加

LEH12

主机代理已存在!

主机代理已存在!

不要重复添加相同的主机代理

LEH13

agent上传失败!

agent上传失败!

代理包上传失败,确认服务器可达,上传路径正确且有相应权限

LEH14

端口已被占用!

端口已被占用!

切换一个未被占用的端口号

LEH15

agent路径无权限!

agent路径无权限!

确认上传路径有写入读写权限

LEH16

agent停止失败!

agent停止失败!

确认代理进程存活正常,或者手动停止异常代理进程

LEH17

agent校验脚本上传失败!

agent校验脚本上传失败!

确认服务器可达且有执行权限

LEH18

agent路径校验失败!

agent路径校验失败!

确认代理路径存在

LEH19

agent路径下存在文件或目录,请更换路径!

agent路径下存在文件或目录,请更换路径!

确认主机代理存放路径下是空的

LEH20

agent线程已存在,请先停止旧线程!

agent线程已存在,请先停止旧线程!

主机代理进程已经存在,可以先停止旧进程,再重新添加

LEH21

主机、代理、实例信息无变化!

主机、代理、实例信息无变化!

确认主机、代理、实例信息至少有一个变化

LEH22

single,模式只能添加一个主机!

single,模式只能添加一个主机!

确认single模式下只添加了一个主机

LEH23

高可用模式只能添加一个主节点!

高可用模式只能添加一个主节点!

确认高可用模式部署下,只添加了一个主节点(primary)

LEH24

agent端口为空

agent端口为空

确认代理端口不要为空

LEH25

主机或代理异常

主机或代理异常

确认主机或者代理状态是否正常

LEH26

获取主机检验信息失败!

获取主机检验信息失败!

确认agentPath/scripts/check_host_param.sh存在且有相应的执行权限

LEH27

该主机上存在实例信息,请先删除实例!

该主机上存在实例信息

确认删除旧实例之后再添加新的实例

LEH28

主机上有数据库安装目录,请先删除数据库安装目录

数据库安装目录为空

确认先删除数据库安装目录

LEH29

主机和主机代理信息无变化!

主机和主机代理信息无变化!

确认修改时主机和代理信息要和原有信息不同

LEH30

hostId不能为空

hostId不能为空

确认主机ID不能为空

LEH31

hostIp不能为空

hostIp不能为空

确认主机IP不能为空

LEH32

hostIp不合法

hostIp不合法

确认主机IP要合法

LEH33

ssh端口不能为空

ssh端口为空

确认SSH端口不为空

LEH34

主机用户不能为空

主机用户为空

确认主机用户不能为空

LEH35

主机用户密码不能为空

主机用户密码为空

确认主机用户密码不能为空

LEH36

主机id与主机ip不匹配

主机id与主机ip不匹配

确认操作的主机ID和主机IP相匹配

LEH37

主机开机时间不能为空

主机开机时间为空

确认主机开机时间不能为空

LEH38

主机记录创建时间不能为空

主机记录创建时间为空

确认主机记录创建时间不能为空

LEH39

agent启动失败!

agent启动失败!

agent启动失败!,可根据启动失败的提示确认原因

LEH40

删除实例代理和实例采集定时任务!

删除实例代理和实例采集定时任务失败

确认EM系统运行正常,可稍后重试

LED00

采集记录不存在

采集记录不存在

确认EM系统运行正常且所查询的主机正常被监控

LED01

数据库实例不存在

数据库实例不存在

确认EM系统运行正常且所查询的数据库实例正常被监控,

LED02

数据库不存在

NO USE

LED03

数据库表不存在

NO USE

LED04

数据库列不存在

NO USE

LED05

数据源连接失败

数据源连接失败

确认数据库链接信息正确且可访问

LED06

数据库备份执行失败

NO USE

LED07

数据库清理执行失败

NO USE

LED08

数据库统计执行失败

NO USE

LED9

数据库正在备份,不允许执行DML操作

NO USE

LED10

数据库正在恢复,不允许执行任何操作

数据库正在恢复,不允许执行任何操作

确认数据库恢复过程中无其他影响数据库的操作

LED11

快照已合并被清理,请查看最新快照再操作

快照已合并被清理

确认最新快照,根据需要进行后续操作,或者修改快照合并规则

LED12

不存在HA或者分布式

NO USE

LED13

实例查询失败!

实例查询失败!

确认EM系统运行正常,可稍后重试

LED14

实例修改失败!

实例修改失败!

根据修改失败提示进行相应操作

LED15

实例删除失败!

实例删除失败!

根据删除失败提示进行相应操作

LED16

实例添加失败!

实例添加失败!

根据添加失败提示进行相应操作

LED17

实例角色与实际部署不相符!请选择正确的部署模式与实例角色!

实例角色与实际部署不相符

确认实例角色与实际部署要相同

LED18

实例角色检验失败!

实例添加,em页面选择的实例角色与实例真实角色不同

执行命令获取实例真实角色

LED19

获取实例检验信息失败!

在实例所在主机器执行check_instance_param.sh报错

1、em日志查看执行check_instance_param.sh完整命令和失败原因 1.1 排查实例所在主机的主机用户/主机密码是否修改。 1.2 排查实例所在主机check_instance_param.sh脚本是否存在。

LED20

获取实例信息失败!

按照ip和端口从em数据库表lem_instance获取记录失败

在em数据库表lem_instance没有ip和端口对应的记录。

LED21

存在多个主节点!

高可用集群主节点已经被监控了

当前高可用集群主节点已经被监控了

LED22

数据库用户密码解密失败!

数据库密码aes解密失败

java使用em类方法com.hundsun.lightdb.utils.AesDecryptUtils#encryptString来加密

LED23

主机代理已存在!

根据代理条件(host_id,agent_port)查询lem_agent表已存在

不必再添加主机代理

LED24

jdbc直连被监控实例获取实例DATA目录失败

根据ip,端口,数据库用户,数据库密码, 利用jdbc执行sql“select setting from pg_settings where name=’data_directory’”失败

1、排查ip,端口,数据库用户,数据库密码是否准确 2、使用数据库用户执行sql“select setting from pg_settings where name=’data_directory’”是否报错

LED25

数据库实例安装目录没有权限

主机用户在数据库家目录(LTHOME)没有权限

使用在数据库家目录(LTHOME)有权限的主机用户

LED26

数据库家目录无效

数据库家目录(LTHOME)是无效的

选择有效的数据库家目录(LTHOME)

LED26

数据库实例DATA目录没有权限

主机用户在数据库实例DATA目录(LTDATA)没有权限

使用在数据库实例DATA目录(LTDATA)有权限的主机用户

LED27

代理表记录已存在!

根据代理条件(host_id,agent_port)查询lem_agent表已存在

不必再重复添加这个代理

LED28

实例信息无变化

代理状态正常,数据库用户密码也没有变。

实例信息没有变化

LED29

主机实例下存在备份服务器定时任务,请先删除定时任务!

根据实例id(即instance_id对应lem_instance表主键)查询lem_backup_task(备份定时任务表)记录不空。

在”集中备份>>备份定时任务“页面删除实例的备份定时任务

LED30

主机实例下存在安装数据库目录,请先删除安装数据库目录

实例是通过em在线安装的,实例在em数据库表lem_install_database(数据库安装表)有记录

在主机管理页面,选择主机记录,执行卸载软件操作。

LED31

实例id不能为空

入参instanceId(实例id)不能为空

LED32

实例运行状态异常,无法进行角色切换!

1、高可用集群主节点状态不正常(不是 in production) 2、高可用集群备节点状态不正常(不是 in archive recovery)

1、查看高可用集群中节点状态 ($LTHOME/bin/lt_controldata -D $LTDATA | grep ‘Database cluster state’ | cut -d ‘:’ -f 2) 2、恢复高可用集群中状态异常的节点

LED33

获取实例运行状态脚本执行异常!

在实例所在主机执行获取实例运行状态的命令 ($LTHOME/bin/lt_controldata -D $LTDATA | grep ‘Database cluster state’ | cut -d ‘:’ -f 2)出现异常

1、检查主机ip,ssh端口,主机用户,主机密码是否准确。 2、LTHOME(数据库家目录)是否在主机存在且有效且当前主机用户有权限。 3、LTDATA(数据库实例DATA目录)是否在主机存在且有效

LED34

角色切换失败!

在高可用集群执行实例角色切换命令(sh $LTHOME/bin/switchover.sh $LTHOME)失败

1、通过em日志或者角色切换的日志与进度,查看实例角色切换报错的具体命令。 2、根据步骤1报错的内容执行修复动作。

LED35

实例启动失败!

执行实例一键启停脚本,启动失败

1、通过em日志或者一键启停的日志与进度, 查看执行一键启动失败的完整命令($LTHOME/bin/lightdb_service.py -c start )和失败原因 2、根据步骤1的报错内容,修复后,再执行一键启动。

LED36

实例停止失败!

执行实例一键启停脚本,停止失败

1、通过em日志或者一键启停的日志与进度,查看执行一键停止失败的完整命令($LTHOME/bin/lightdb_service.py -c stop )和失败原因 2、根据步骤1的报错内容,修复后,再执行一键停止。

LED37

实例重启失败!

执行实例一键启停脚本,重启失败

1、通过em日志或者一键启停的日志与进度, 查看执行一键重启失败的完整命令($LTHOME/bin/lightdb_service.py -c restart)和失败原因 2、根据步骤1的报错内容,修复后,再执行一键重启。

LED38

请至少选择一个节点!

在实例管理页面,执行一键启停,没有选择集群中的节点

执行实例启停,选择集群中的节点

LED39

实例信息不存在!

按照实例id(instanceId)查询em数据库表lem_instance不存在。

实例信息已经不存在了

LED40

校验是否分布式高可用模式脚本执行异常!

执行命令(if cat $LTHOME/../../uninstall/uninstallFile.json | grep ‘clusterInsideDtoList’) 校验实例的部署模式是否是分布式高可用失败。

1、通过em日志或者日志与进度查看报错的命令。 2、查看实例的uninstallFile.json文件校验当前实例的部署模式是否是分布式高可用。 3、检查实例所在主机ip,主机ssh端口,主机用户和主机密码是否正确。

LED41

实例一键启停脚本执行异常!

执行实例一键启停脚本,启动/停止/重启失败

1、通过em日志或者一键启停的日志与进度,查看执行一键启停的完整命令($LTHOME/bin/lightdb_service.py -c start )和失败原因 2、根据步骤1的报错内容,修复后,再在实例管理页面执行一键启停。

LED42

实例端口不能为空!

入参实例端口(instancePort)不能为空

入参实例端口(instancePort)不能为空

LED43

角色一键切换脚本执行异常!

在高可用集群备节点执行实例角色切换命令(sh $LTHOME/bin/switchover.sh $LTHOME)失败

1、检查实例(备节点)所在主机的主机ip,主机ssh端口,主机用户和主机密码是否正确。 2、通过em日志或者角色切换的日志与进度,查看实例角色切换报错的具体命令。 3、根据步骤1报错的内容执行修复动作。

LED44

获取HA当前节点角色脚本执行异常!

NO USE

LED45

主节点角色切换未成功!

NO USE

LED46

备节点角色切换未成功!

NO USE

LED47

实例节点不在监控范围!

根据主机ip和实例端口执行关联查询( lem_instance li JOIN lem_host lh ON li.host_id = lh.host_id JOIN lem_cluster lc ON li.cluster_id = lc.cluster_id WHERE lh.host_ip = #{hostIp} and li.instance_port = #{instancePort}),查询结果为空

根据主机ip和实例端口查看实例信息,实例的主机信息和实例的集群信息是否存在。

LED48

实例安装目录不能为空

入参实例的安装目录不能为空

入参实例的安装目录不能为空

LED49

实例版本与集群中已有实例的数据库版本不一致

已被em监控的集群的实例数据库版本 与 待添加的集群实例数据库版本不一致。

查看待添加集群实例的数据库版本,执行Sql“SELECT version() as version”

LED50

代理不存在!

按照hostIp和实例Port条件执行关联查询( FROM lem_agent la inner join lem_instance li on la.agent_id = li.agent_id where li.host_ip = #{hostIp} and li.instance_port = #{instancePort}),实例的agent不存在

1、检查hostIp和实例端口是否在em数据库实例表lem_instance有记录 2、再检查步骤1实例的agent_id字段内容在lem_agent表是否有记录。

LED51

原生PG不支持实时SQL!

原生PG未安装插件pg_stat_activity和插件pg_stat_statements

为原生pg安装lightdb插件”lt_profile”, “lt_stat_activity”, “lt_stat_statements”, “lt_cron”

LED52

原生PG不支持TOP,SQL!

原生PG未安装插件pg_profile和插件pg_stat_statements

为原生pg安装lightdb插件”lt_profile”, “lt_stat_activity”, “lt_stat_statements”, “lt_cron”

LED53

原生PG不支持等待事件查询

原生PG未安装插件pg_profile

为原生pg安装lightdb插件”lt_profile”, “lt_stat_activity”, “lt_stat_statements”, “lt_cron”

LED54

原生PG不支持PWR查询

原生PG未安装插件pg_profile和插件pg_cron

为原生pg安装lightdb插件”lt_profile”, “lt_stat_activity”, “lt_stat_statements”, “lt_cron”

LED55

原生PG不支持PWR报告生成

原生PG未安装插件pg_profile和插件pg_cron

为原生pg安装lightdb插件”lt_profile”, “lt_stat_activity”, “lt_stat_statements”, “lt_cron”

LED56

原生PG不支持PWR手动生成快照

原生PG未安装插件pg_profile和插件pg_cron

为原生pg安装lightdb插件”lt_profile”, “lt_stat_activity”, “lt_stat_statements”, “lt_cron”

LED57

原生PG不支持PWR快照设置

原生PG未安装插件pg_profile和插件pg_cron

为原生pg安装lightdb插件”lt_profile”, “lt_stat_activity”, “lt_stat_statements”, “lt_cron”

LED58

原生PG不支持实例巡检

原生PG不支持实例巡检

原生PG不支持实例巡检

LED59

添加实例,实例所属数据库类型不支持

添加实例,实例所属的数据库类型不在范围[1:Lightdb,2:PostgreSQL]

当前支持的数据库类型范围[1:Lightdb,2:PostgreSQL]

LED60

添加实例,实例角色不支持

添加实例,实例角色不在范围[ Single Only,HA Primary,HA Standby,HA Witness,Distribute Coordinator Primary,Distribute Coordinator Standby, Distribute Coordinator Witness,Distribute Worker Primary,Distribute Worker Standby,Distribute Worker Witness ]

添加实例,实例角色不在范围[ Single Only,HA Primary,HA Standby,HA Witness, Distribute Coordinator Primary,Distribute Coordinator Standby, Distribute Coordinator Witness,Distribute Worker Primary, Distribute Worker Standby,Distribute Worker Witness ]

LED61

实例的数据库类型与集群的数据库类型不符

实例的数据库类型与集群的数据库类型不符

实例的数据库类型与集群的数据库类型不符

LED62

jdbc连接被监控实例获取数据库版本失败

通过jdbc连接被监控实例执行SQL(“SELECT version() as version;”)获取数据库版本失败

1、排查ip,端口,数据库用户,数据库密码是否准确 2、使用数据库用户执行sql“SELECT version() as version;”是否报错

LED63

被监控原生PG实例的数据库版本小于13

被监控原生PG实例的数据库版本小于13

EM不支持原生PG版本小于13

LED64

密码安全性较弱!请修改密码,密码必须包含数字、小写字母、大写字母、特殊字符(@#$%^&+=),并且长度至少为8个字符!

密码安全性较弱!请修改密码,密码必须包含数字、小写字母、大写字母、特殊字符(@#$%^&+=),并且长度至少为8个字符!

密码必须包含数字、小写字母、大写字母、特殊字符(@#$%^&+=),并且长度至少为8个字符!

LEA01

告警不存在

NO USE

LEA02

待办告警不存在

NO USE

LEA03

告警通知方式设置异常

NO USE

LEA04

告警阈值格式校验失败

NO USE

LEA05

告警内部业务异常,//告警内部业务处理时出现异常

NO USE

LEA06

待办告警处理失败

未查询到待处理的告警(根据id查询表sys_task)

未查询到待处理的告警(根据id查询表sys_task)

LEA07

待办告警未选择或确认信息为空

处理待办任务,未选择待办告警或者确认信息为空

处理待办任务,未选择待办告警或者确认信息为空

LEM01

任务周期格式校验异常,//

NO USE

LEM02

任务创建失败,//

NO USE

LEM03

任务修改失败,//

NO USE

LEM04

任务查询失败,//

NO USE

LEM05

任务删除失败,//

NO USE

LEM06

任务执行失败,//

NO USE

LEM07

任务不存在,//

NO USE

LEM08

任务日志不存在,//

NO USE

LEL01

无锁详情

NO USE

LEL02

分布式锁释放失败!

某些业务操作比如删除主机会释放分布式锁,

redis进程不存在了,在em所在服务器检查redis进程是否存在

LEL03

该集群正在角色切换或实例启停,请稍后再试!

1、集群正在角色切换 2、集群正在实例启停

稍后再试,等待集群角色切换完成 或者 等待实例启停完成

LEB01

上线失败!

备份定时任务添加到调度失败

1、查看em日志查看备份定时任务添加到调度失败的异常信息。 2、在集中备份>>备份定时任务页面,重新执行备份定时任务上线。

LEB02

下线失败!

备份定时任务移除失败

1、备份定时任务已经在执行了无法被移除。 2、查看em日志中记录的备份定时任务移除失败的日志信息。

LEB03

获取存储阈值信息失败!

执行命令(df -B 1g $backup_directory | awk ‘{print $2,$4,$5}’ | sed -n ‘2p’) 判断备份服务器上备份目录的可用空间大小(GB)失败

查看备份服务器ip,备份服务器用户,ssh端口,备份服务器用户密码是否准确。

LEB04

备份目录未初始化!

备份定时任务执行,备份服务器上备份目录没有初始化。

重新在集中备份>>备份定时任务页面添加备份定时任务

LEB05

执行备份启动脚本失败!

执行单机,高可用主节点,或者分布式备份失败。

不论分布式备份失败,还是单机,高可用主节点备份失败, 1、在备份定时任务启动过程中,查看日志与进度输出的失败信息并修复。 2、在备份服务器的备份目录下的备份日志(${backup_dir}/backup_logs/${instance_name}/backup.log)查看单机,高可用主节点备份失败日志信息。 3、在备份服务器查看分布式备份日志文件(${backup_dir}/log/lt_distributed_probackup-%Y-%m-%d.log)中分布式备份失败信息并修复。

LEB06

执行备份清理脚本失败!

1、执行命令(lt_probackup delete)清理过期备份数据失败 2、执行命令(lt_probackup delete)按照备份id删除数据失败

1、查看删除过期备份数据日志文件 ${backup_dir}/backup_logs/${instance_name}/backup_delete.log内容并修复 2、查看按照备份id删除备份数据日志文件 ${backup_dir}/backup_logs/${instance_name}/backup_delete_id.log内容并修复。

LEB07

执行备份列表脚本失败!

查看单机,高可用或者是分布式备份列表失败。

1、查看备份服务器ip,备份服务器ssh端口,备份服务器用户,备份服务器用户密码是否变化。 2、查看备份服务器上备份目录是否还存在。 3、查看备份服务器上备份目录下备份实例目录是否存在。

LEB08

执行备份列表详情脚本失败!

查看单机,高可用或者是分布式备份列表中某次备份id的详情失败。

1、查看备份服务器ip,备份服务器ssh端口,备份服务器用户,备份服务器用户密码是否变化。 2、查看备份服务器上备份目录是否还存在。 3、查看备份服务器上备份目录/备份实例目录是否存在。 4、查看备份服务器上备份目录/备份实例目录/某次备份id目录是否存在。

LEB09

备份服务器为空!

根据ip无法在em数据库备份服务器表lem_backup_server找到记录。

备份服务器需要重新添加。

LEB10

备份服务器列表数据解析失败!

备份实例的备份列表查询,返回的行列数据解析失败。

在备份服务器查询备份实例的备份列表并解析。

LEB11

备份服务器列表详情数据解析失败!

备份实例的备份列表中备份id的详情查询,返回的行列数据解析失败。

备份实例的备份列表中备份id的详情查询并解析。

LEB12

工具lt_probackup的目录在备份服务器不存在

lt_probackup的目录在备份服务器不存在

在备份服务器定位lt_probackup所在目录绝对路径

LEB13

备份目录已经初始化过了

备份服务器上备份目录已经完成了初始化

备份服务器上备份目录已经完成了初始化,不必再次初始化,或者 更换别的备份目录。

LEB14

当前用户没有权限操作该备份目录

主机用户在备份服务器上没有备份目录操作权限

选择备份服务器上主机用户有权限操作的目录作为备份目录。

LEB15

当前用户不能创建该备份目录

当前用户不能在备份服务器上创建该备份目录

更换一个有权限的备份目录。

LEB16

为备份目录添加实例失败

在备份服务器的备份目录添加实例失败(lt_probackup add-instance )

1、若是在备份服务器的备份目录为远程主机上实例添加备份, 备份服务器与远程实例所在服务器没有ssh相互免密。 2、备份服务器上备份目录不存在。 3、备份实例的DATA目录在主机上不存在。

LEB17

为lt_probackup添加配置失败

为lt_probackup添加配置失败

1、若是在备份服务器的备份目录为远程主机上实例添加备份, 备份服务器与远程实例所在服务器没有ssh相互免密。 2、备份服务器上备份目录不存在。 3、备份实例的DATA目录在主机上不存在。 4、备份实例进程在主机上不存在。 5、备份实例不存在数据库用户lt_probakcup

LEB18

备份定时任务查询失败

根据备份定时任务id无法在em数据库备份定时任务表lem_backup_task查询到记录

备份定时任务已被删除,需要重新添加备份定时任务

LEB19

备份定时任务在线不允许删除

备份定时任务在线不允许删除

备份定时任务在线不允许删除,需要先下线再删除。

LEB20

备份定时任务删除失败

根据备份定时任务id删除em数据库备份定时任务表lem_backup_task记录失败

em数据库已经崩了

LEB21

备份目录查询失败

根据备份目录id无法在em数据库备份目录表lem_backup_directory查询到记录

备份目录记录在em数据库备份目录表lem_backup_directory已经被删除了

LEB22

备份日志删除失败!

NO USE

LEB23

备份定时任务id不能为空

入参备份定时任务id不能为空

入参备份定时任务id不能为空

LEB24

备份定时任务上下线不能为空

入参定时任务上下线(cronOnline)不能为空

入参定时任务上下线(cronOnline)不能为空

LEB25

备份定时任务上下线值不合法

入参定时任务上下线(cronOnline)内容不合法

入参定时任务上下线(cronOnline)内容范围[0:下线,1:上线]

LEB26

备份定时任务备份失败!

NO USE

LEB26

备份服务器id不能为空

备份服务器id不能为空

确保备份服务器id不能为空

LEB27

不能删除,需清空备份服务器的所有备份定时任务

不能删除,需清空备份服务器的所有备份定时任务

确保清空备份服务器的所有备份定时任务才能删除备份服务器

LEB28

备份定时任务添加失败

备份定时任务添加失败

插入表记录到备份目录表lem_backup_task失败

LEB29

获取备份列表为空!

获取备份列表为空!

确保执行备份的时候备份服务器的备份目录的备份实例下的脚本backup_list.sh执行不为空

LEB30

获取备份列表详情为空!

获取备份列表详情为空!

确保执行备份的时候备份服务器上备份脚本backup_listDetail.sh执行不为空

LEB31

该备份服务器上面有跑着数据库实例,不能在该服务器上添加备份定时任务!

该备份服务器上面有跑着数据库实例,不能在该服务器上添加备份定时任务!

确保备份服务器上面有跑着数据库实例,不在该服务器上添加备份定时任务

LEB32

备份服务器已存在

备份服务器已存在

备份服务器已存在,则不重复添加

LEB33

主机实例下存在备份服务器定时任务,请先删除定时任务!

主机实例下存在备份服务器定时任务,请先删除定时任务!

删除主机的时候确保该主机下没有备份服务器定时任务

LEB34

备份服务器ip不能为空

备份服务器ip不能为空

备份服务器ip不能为空

LEB35

备份服务器ip不合法

备份服务器ip不合法

确保备份服务器ip合法

LEB36

备份服务器用户不能为空

备份服务器用户不能为空

备份服务器用户不能为空

LEB37

lt_probackup路径不能为空

lt_probackup路径不能为空

lt_probackup路径不能为空

LEB38

ssh端口不能为空

ssh端口不能为空

ssh端口不能为空

LEB39

剩余空间大小不能为空

剩余空间大小不能为空

剩余空间大小不能为空

LEB40

剩余空间占比不能为空

剩余空间占比不能为空

剩余空间占比不能为空

LEB41

获取lt_probackup工具版本为空

获取lt_probackup工具版本为空

查看备份服务器上备份脚本目录(backup)所在目录(backup_scripts)下lt_probackup_version.sh的执行结果是否为空

LEB42

备份服务器用户密码不能为空

备份服务器用户密码不能为空

备份服务器用户密码不能为空

LEB43

lt_probackup路径下没有工具lt_probackup

lt_probackup路径下没有工具lt_probackup

lt_probackup路径下没有工具lt_probackup

LEB44

备份并行数不能为空

备份并行数不能为空

备份并行数不能为空

LEB45

备份并行数不合法,范围[1,64]

备份并行数不合法,范围[1,64]

备份并行数不合法,范围[1,64]

LEB46

备份周期天数不合法,范围[7,90]

备份周期天数不合法,范围[7,90]

备份周期天数不合法,范围[7,90]

LEB47

备份用户不能为空

备份用户不能为空

备份用户不能为空

LEB48

备份用户只支持lt_probackup

备份用户只支持lt_probackup

备份用户只支持lt_probackup

LEB49

备份每天执行时间不能为空

备份每天执行时间不能为空

备份每天执行时间不能为空

LEB50

备份每天执行时间格式不合法,格式为HH:mm

备份每天执行时间格式不合法,格式为HH:mm

备份每天执行时间格式不合法,格式为HH:mm

LEB51

备份存储目录不能为空

备份存储目录不能为空

备份存储目录不能为空

LEB52

备份数据库实例id不能为空

备份数据库实例id不能为空

备份数据库实例id不能为空

LEB53

增量备份类型不能为空

增量备份类型不能为空

增量备份类型不能为空

LEB54

增量备份类型目前只支持取值为DELTA,PAGE

增量备份类型目前只支持取值为DELTA,PAGE

增量备份类型目前只支持取值为DELTA,PAGE

LEB55

压缩算法不能为空

压缩算法不能为空

压缩算法不能为空

LEB56

不选择压缩算法(none),压缩级别只能为0

不选择压缩算法(none),压缩级别只能为0

确保选择了压缩算法

LEB57

该数据库实例已有备份定时任务无需再添加

该数据库实例已有备份定时任务无需再添加

该数据库实例已有备份定时任务无需再添加

LEB58

本地数据库实例备份,配置文件postgresql配置项archive_command内容需要去除remote,option

本地数据库实例备份,配置文件postgresql配置项archive_command内容需要去除remote,option

确保本地数据库实例备份,配置文件postgresql配置项archive_command内容需要去除remote,option

LEB33

该实例下不存在OK的全量备份,请先执行全量备份,后续可执行增量备份!

该实例下不存在OK的全量备份,请先执行全量备份,后续可执行增量备份!

确保实例下存在OK的全量备份,然后再执行增量备份

LEB59

远程实例备份,配置文件postgresql.conf中配置项arvhive_command的内容需要remote,option

远程实例备份,配置文件postgresql.conf中配置项arvhive_command的内容需要remote,option

确保远程实例备份,配置文件postgresql.conf中配置项arvhive_command的内容需要remote,option

LEB60

需要在$LTDATA/lt_hba.conf配置备份用户lt_probackup的访问权限和免密

需要在$LTDATA/lt_hba.conf配置备份用户lt_probackup的访问权限和免密

在$LTDATA/lt_hba.conf配置备份用户lt_probackup的访问权限和免密

LEB61

备份服务器上工具lt_probackup版本与数据库实例工具lt_probackup版本不同

备份服务器上工具lt_probackup版本与数据库实例工具lt_probackup版本不同

确保备份服务器上工具lt_probackup版本与数据库实例工具lt_probackup版本相同

LEB62

执行备份目录初始化失败

执行备份目录初始化失败

手动执行备份实例下的make_backup_directory_initial.sh,查看报错日志

LEB163

待初始化的目录不空

待初始化的目录不空

确保待初始化的目录为空

LEB34

手动执行备份失败!

手动执行备份失败!

请检查日志和相关实例!

LEB63

备份存储目录不是linux绝对路径,路径支持.-_数字和英文字母大小写

备份存储目录不是linux绝对路径,路径支持.-_数字和英文字母大小写

确保备份存储目录是linux绝对路径,路径格式是.-_数字和英文字母大小写

LEB99

备份未知异常

备份未知异常

请检查日志和相关实例!

LER101

备份删除记录不存在

备份删除记录不存在

确保备份删除记录存在

LER102

备份任务不存在

备份任务不存在

请检查日志和相关实例!

LER103

备份服务器密码解密失败

备份服务器密码解密失败

确保备份服务器密码未被修改

LEB104

备份删除策略为[3-指定备份状态删除]但备份状态为空

备份删除策略为[3-指定备份状态删除]但备份状态为空

确保备份删除策略为[3-指定备份状态删除]但备份状态不为空

LEB105

备份删除策略为[4-指定备份记录删除]但备份ID为空

备份删除策略为[4-指定备份记录删除]但备份ID为空

确保备份删除策略为[4-指定备份记录删除]但备份ID不为空

LEB106

备份删除入参并行线程数不合法(允许范围为[1,64])

备份删除入参并行线程数不合法(允许范围为[1,64])

确保备份删除入参并行线程数合法(允许范围为[1,64])

LEB107

备份删除入参状态暂不支持(允许状态为,CORRUPT、ERROR、ORPHAN)

备份删除入参状态暂不支持(允许状态为,CORRUPT、ERROR、ORPHAN)

确保入参状态为,CORRUPT、ERROR、ORPHAN

LEB108

搜索项【备份服务器/备份目录/备份实例】不能为空

搜索项【备份服务器/备份目录/备份实例】不能为空

搜索项【备份服务器/备份目录/备份实例】不能为空

LEB109

在备份服务器执行检查lt_probackup是否存在的命令出错,添加备份服务器失败

在备份服务器执行检查lt_probackup是否存在的命令出错,添加备份服务器失败

请检查日志和相关实例!

LEB110

lt_probackup在备份服务器不存在,添加备份服务器失败

lt_probackup在备份服务器不存在,添加备份服务器失败

检查lt_probackup在备份服务器是否存在

LEB111

备份服务器上lt_probackup版本与用于备份的数据库实例的lt_probackup版本不同

备份服务器上lt_probackup版本与用于备份的数据库实例的lt_probackup版本不同

请检查日志和相关实例!

LEB112

在主机备份实例DATA目录执行脚本modify_para_continuous_wal_archiving.sh执行失败

在主机备份实例DATA目录执行脚本modify_para_continuous_wal_archiving.sh执行失败

LEB113

备份服务器通过ssh协议连接不上

备份服务器通过ssh协议连接不上

检查网络以及服务器的用户名密码是否正确

LEB114

恢复实例启动失败

恢复实例启动失败

请检查日志和相关实例!

LEB115

手工重启恢复实例

手工重启恢复实例

手工重启恢复实例

LEB116

初始化备份服务器备份目录失败

初始化备份服务器备份目录失败

手动执行备份服务器下的belt_distributed_probackup.py查看报错原因

LEB117

在备份服务器备份目录添加分布式集群实例信息失败

在备份服务器备份目录添加分布式集群实例信息失败

请检查日志和相关实例!

LEB118

在分布式集群节点设置持续WAL归档失败

在分布式集群节点设置持续WAL归档失败

请检查数据库日志查看归档失败原因

LEB119

在分布式集群执行备份失败

在分布式集群执行备份失败

请检查日志和相关实例!

LEB120

恢复后启动,恢复后的实例必须为CN主节点

恢复后启动,恢复后的实例必须为CN主节点

确保恢复后启动,恢复后的实例为CN主节点

LEB121

分布式集群恢复,Lightdb数据库版本需要>=22.4

分布式集群恢复,Lightdb数据库版本需要>=22.4

确保分布式集群恢复,Lightdb数据库版本需要>=22.4

LEB122

分布式集群cn节点下面没有dn节点

分布式集群cn节点下面没有dn节点

请检查日志和相关实例!

LEB123

备份实例与恢复实例需要均为分布式集群cn主节点

备份实例与恢复实例需要均为分布式集群cn主节点

确保备份实例与恢复实例均为分布式集群cn主节点

LEB124

分布式集群备份配置lt_probackup失败

分布式集群备份配置lt_probackup失败

请检查日志和相关实例!

LEB125

暂不支持分布式备份

暂不支持分布式备份

NO USE

LEB126

原生PG不支持集中备份

原生PG不支持集中备份

原生PG不支持集中备份

LEB127

恢复实例的DATA目录不空

恢复实例的DATA目录不空

确保恢复实例的DATA目录初始为空

LEB128

主机用户没有权限创建恢复实例的DATA目录

主机用户没有权限创建恢复实例的DATA目录

确保主机用户有权限创建恢复实例的DATA目录

LEB129

分布式集群节点数量不一致

分布式集群节点数量不一致

分布式集群节点数量不一致

LEB130

恢复后CN节点更新恢复后端口失败

恢复后CN节点更新恢复后端口失败

NO USE

LEB131

备份实例需要为分布式集群cn主节点

备份实例需要为分布式集群cn主节点

确保备份实例为分布式集群cn主节点

LEB132

清除CN节点的元数据信息

清除CN节点的元数据信息

查看实例日志执行truncate pg_dist_node;失败的原因

LEB133

设置恢复后CN节点的元数据信息

设置恢复后CN节点的元数据信息

设置恢复后CN节点的元数据信息

LEB134

设置恢复后DN节点的元数据信息

设置恢复后DN节点的元数据信息

设置恢复后DN节点的元数据信息

LEI01

LightDB安装包命名不规范,请使用初始安装包名!

LightDB安装包命名不规范,请使用初始安装包名!

确保LightDB安装包命名不规范,请使用初始安装包名!

LEI02

LightDB安装包上传失败,存储磁盘可用容量小于3G

LightDB安装包上传失败,存储磁盘可用容量小于3G

确保存储磁盘可用容量大于3G

LEI03

LightDB安装包上传失败

LightDB安装包上传失败

请检查日志和相关实例!

LEI04

LightDB安装包不存在,请重新上传

LightDB安装包不存在,请重新上传

确保LightDB安装包存在

LEI05

路径存在文件或目录,请更换路径!

路径存在文件或目录,请更换路径!

路径存在文件或目录,请更换路径!

LEI06

路径无权限!

路径无权限!

确保路径有权限

LEI07

无法获取远程主机CPU和操作系统信息,LightDB无法适配远程主机!

无法获取远程主机CPU和操作系统信息,LightDB无法适配远程主机!

请检查日志和相关实例!

LEI08

LightDB安装包无法适配远程主机CPU和操作系统,请重新上传或选择正确的安装包!

LightDB安装包无法适配远程主机CPU和操作系统,请重新上传或选择正确的安装包!

确保选择正确的安装包!

LEI09

无法获取该路径可用存储磁盘空间大小!

无法获取该路径可用存储磁盘空间大小!

无法获取该路径可用存储磁盘空间大小!

LEI10

LightDB安装检测系统参数错误,请阅读最新的安装手册并设置正确的系统参数!

LightDB安装检测系统参数错误,请阅读最新的安装手册并设置正确的系统参数!

LightDB安装检测系统参数错误,请阅读最新的安装手册并设置正确的系统参数!

LEI11

LightDB安装检测未安装的依赖包,请阅读最新的安装手册并安装正确的依赖包!

LightDB安装检测未安装的依赖包,请阅读最新的安装手册并安装正确的依赖包!

LightDB安装检测未安装的依赖包,请阅读最新的安装手册并安装正确的依赖包!

LEI12

路径可用存储磁盘空间较小,无法继续操作,请检查磁盘空间!

路径可用存储磁盘空间较小,无法继续操作,请检查磁盘空间!

路径可用存储磁盘空间较小,无法继续操作,请检查磁盘空间!

LEI13

无法获取系统依赖包,请检查远程主机状态!

无法获取系统依赖包,请检查远程主机状态!

无法获取系统依赖包,请检查远程主机状态!

LEI14

无法获取系统参数,请检查远程主机状态!

无法获取系统参数,请检查远程主机状态!

无法获取系统参数,请检查远程主机状态!

LEI15

;系统依赖包未安装:

;系统依赖包未安装:

安装系统依赖包

LEI16

;系统参数设置有误:

;系统参数设置有误:

修改系统参数设置

LEI17

正在安装检测中,请稍后重试!

对同一个ip和目录 同一时刻无法多次安装数据库

等该主机和目录下的 数据库安装完毕之后再安装

LEI18

请求参数缺少,请检查接口参数!

数据库安装的 信息封装的实体类信息缺失

按照要求添加 数据库安装等信息

LEI19

LightDB安装目录缺少,请填写LightDB安装目录缺少!

数据库安装的 安装目录等信息封装的实体类信息缺失

按照要求添加数据库安装的 安装目录等信息

LEI20

缺少ip信息,请选择主机!

数据库安装的 主机的ip信息丢失

数据库安装的 主机的ip信息丢失,要选择正确的主机

LEI21

主机信息缺失,请先添加主机!

数据库安装的 主机的其他信息丢失

数据库安装的 主机的其他信息丢失,选择正确的主机

LEI25

无法获取集群机器操作系统和CPU信息,请检查SSH连接!

无法获取集群机器操作系统和CPU信息,请检查SSH连接!

无法通过ssh 连接远程主机,获取远程主机的信息,请检查网络通信、防火墙等是否正常

LEI26

LightDB安装包无法适配集群机器,请上传正确安装包!

LightDB安装包无法适配集群机器

请上传正确LightDB安装包!

LEI30

LightDB安装包解压失败,请检查磁盘空间等!

安装包是个压缩包,需要在机器上面解压,em的目录空间不足

保证em的工作目录磁盘容量充足

LEI31

LightDB安装包安装失败,请检查磁盘空间等!

安装lightDB需要一定的磁盘空间,而实际目录的磁盘容量不足

保证LightDB的安装目录 磁盘容量充足

LEI35

LightDB实例路径空间不足,请检查磁盘空间等!

实例化LightDB 需要一定的磁盘空间,而实际目录的磁盘容量不足

保证实例化LightDB 的目录 磁盘容量充足

LEI36

LightDB实例初始化失败,请检查内存!

LightDB实例初始化失败,实例化机器的可用内存不足

保证实例化LightDB的机器 可用内存充足

LEI50

无法校验远程机器字符集,请检查远程机器数据库软件!

获取实例化LightDB的机器字符集失败

检查远程主机网络连接是否正常

LEI51

数据库只支持UTF8,GBK,请更换机器!

LightDB支持的机器字符为UTF8,GBK

这个主机不支持安装LightDB,换个主机

LEI56

无法获得机器端口信息,请检查远程机器!

LightDB 安装的机器端口信息获取不到

检查远程主机网络连接是否正常

LEI57

无法获得可用端口,请检查远程机器!

安装的主机机器无可用端口

释放被占用的主机端口

LEI60

无法获取主机内存信息!

无法获取内存信息

保证远程主机连接信息正常

LEI65

主机数据库实例化失败,请查看日志!

数据库实例化失败

查看实例的日志

LEI66

主机数据库实例化设置参数失败,请查看日志!

数据库实例化失败

查看实例的相关日志

LEI70

主机数据库实例启动失败,请查看具体日志!

数据库实例启动失败

查看实例的运行日志

LEI71

主机数据库实例安装插件失败,请查具体看日志!

数据库实例安装插件失败

查看实例的相关日志

LEI72

主机数据库hba设置错误,请查看具体日志!

数据库安装的hba设置错误

查看实例安装的相关日志

LEI80

集群类型仅支持在线安装,请重新选择!

集群类型仅支持在线安装,请重新选择!

选择在线安装

LEI81

部署模式暂只支持单机部署和高可用部署,敬请期待!

部署模式暂只支持单机部署和高可用部署

部署模式暂只支持单机部署和高可用部署

LEI82

单机部署模式暂只支持单个实例,请重新选择填写!

单机部署模式暂只支持单个实例

单机部署模式暂只支持单个实例

LEI83

请选择主机IP!

未选择主机IP

选择主机IP

LEI84

保存实例信息失败,请查看日志!

保存实例信息失败

查看实例的日志

LEI90

正在实例化中,请稍后重试!

正在实例化中

实例化完毕,再重试!

LEI91

生成uninstallFile文件失败!

生成卸载文件失败

查看实例安装的相关日志

LEI92

安装数据库的版本不能小于22.3

安装数据库的版本小于22.3

选择大于22.3版本的LightDB 安装包

LEU01

请选择卸载节点等信息!

未选择卸载节点的信息

选择卸载节点等信息

LEU02

实例存在Agent,请先删除实例Agent!

卸载实例请先卸载agent

请先删除实例Agent!

LEU03

实例的LTHOME信息丢失,请先维护对应的数据库软件信息!

实例的LTHOME信息丢失

请先维护对应的数据库软件信息!

LEU04

实例停止失败,请检查日志和相关实例!

实例停止失败

请检查日志和相关实例!

LEU04

实例删除失败,请检查日志和相关实例!

实例删除失败

请检查日志和相关实例

LEU05

实例的ltcluster停止失败,请检查日志和相关实例!

实例的ltcluster停止失败

请检查日志和相关实例!

LEU10

数据库存在其他实例,请先将其他实例删除!

数据库存在其他实例

请先将其他实例删除!

LEU011

数据库删除失败,请检查日志和相关实例!

数据库删除失败

请检查日志和相关实例!

LEU012

缺少installDatabaseId信息

缺少installDatabaseId信息

维护存储的installDatabaseId信息

LEU013

缺少hostIP信息

缺少hostIP信息

维护存储的hostIP信息

LEU014

缺少ltBase信息

缺少ltBase信息

维护存储的ltBase信息

LEU015

待卸载实例运行状态异常

待卸载实例运行状态异常

维护实例运行状态正常

LER01

无效的恢复方式(恢复方式:1-基于备份,2-基于时间点)

恢复方式不对

选择以下恢复方式:1-基于备份,2-基于时间点

LER02

恢复方式为[1-基于备份]但传入的备份ID为空

传入的备份ID为空

传入正确的备份ID为空

LER03

恢复方式为[2-基于时间点]但传入的时间点为空

传入的时间点为空

传入正确的时间点

LER04

入参备份实例不存在

备份实例不存在

维护正确的备份实例信息

LER05

入参恢复实例不存在

恢复实例不存在

维护正确的恢复实例信息

LER06

备份服务器主机密码解密失败

备份服务器主机密码解密失败

密码错误,维护正确的加密的密码信息

LER07

SSH连接失败

SSH连接失败

检查主机网络信息、防火墙信息

LER08

恢复实例主机密码解密失败

恢复实例主机密码解密失败

密码错误,维护正确的加密的密码信息

LER09

备份服务器和恢复实例服务器ntp一致性校验失败

备份服务器和恢复实例服务器ntp一致性校验失败

查看集群ntp是否正常

LER10

备份或还原服务器ntp异常

备份或还原服务器ntp异常

查看集群ntp是否正常

LER11

备份服务器和恢复实例服务器ntp一致性校验失败

备份服务器和恢复实例服务器ntp一致性校验失败

查看集群ntp是否正常

LER15

恢复实例,probackup,版本获取失败

恢复实例,probackup,版本获取失败

检查probackup 版本等

LER16

备份服务器和恢复实例,probackup,版本不一致

备份服务器和恢复实例,probackup,版本不一致

保持备份服务器和恢复实例,probackup,版本一致

LER17

恢复添加入参并行线程数不合法(允许范围为[1,64])

恢复添加入参并行线程数不合法

并行线程数目为允许范围为[1,64]

LER18

备份实例与恢复实例的数据库版本不一致

备份实例与恢复实例的数据库版本不一致

保证备份实例与恢复实例的数据库版本一致

LER14

指定的还原备份记录不存在

指定的还原备份记录不存在

保证还原备份记录存在

LPR01

新增日志与进度记录失败

新增日志与进度记录失败

检查相应的日志是否存在、存储空间是否够用

LPR02

更新日志与进度记录失败

更新日志与进度记录失败

检查相应的日志是否存在、存储空间是否够用

LEH1

redis获取的启动keepalived和ntp命令为空

redis获取的启动keepalived和ntp命令为空

缓存丢失了

LEH2

启动keepalived和ntp命令失败

启动keepalived和ntp命令失败

手动启动keepalived和ntp

LEK1

获取告警配置信息失败

获取告警配置信息失败

检查网络等

LEM1

修改配置文件告警信息失败

修改配置文件告警信息失败

检查网络

LEM2

邮箱账户格式不正确

邮箱账户格式不正确

配置正确的邮箱账号

LEM3

邮箱服务器配置不正确

邮箱服务器配置不正确

配置邮箱服务器配置

LEM4

邮箱告警配置错误或网络不通

邮箱告警配置错误或网络不通

检查网络和防火墙

LEM5

钉钉告警配置错误或网络不通

钉钉告警配置错误或网络不通

检查网络和防火墙

LEM6

配置文件不存在

配置文件不存在

检查代理的配置文件

LEM7

agentType类型只能是instance或者host

agentType类型只能是instance或者host

仅仅选择instance或者host

LEM8

钉钉参数配置不全

钉钉参数配置不全

保证钉钉参数正确

LEM9

邮箱参数配置不全

邮箱参数配置不全

保证邮箱参数配置正确

LEJ1

一键确认所有告警信息失败

一键确认所有告警信息失败

重试

LEJ10

备份服务器的版本应该大于等于13.8-22.4

备份服务器的版本应该大于等于13.8-22.4

检查备份服务器的版本信息

LEK10

data输入为空

data输入为空

保证data信息正确

EK11

dbName为空

dbName为空

保证dbName信息正确

EK12

tableName为空

tableName为空

保证tableName信息正确

EK13

sqlContent为空

sqlContent为空

保证sqlContent信息正确

EK14

manualProcessResult为空

manualProcessResult为空

保证manualProcessResult信息正确

EK15

审核工单内容重复,一分钟内不能重复提交,请稍后再试

审核工单内容重复,一分钟内不能重复提交,请稍后再试

一分钟后重试

EK16

工单已被人工审核,请勿重复审核

工单已被人工审核,请勿重复审核

请勿重复审核

EK17

该id不存在工单

该id不存在工单

保证该id信息正确

EK18

clusterId不能为空

clusterId不能为空

保证clusterId信息为空

EK19

查询实例拥有的数据库失败,请检查数据库实例和数据库实例代理是否正常

查询实例拥有的数据库失败

请检查数据库实例和数据库实例代理是否正常

EK20

SQL文本字符长度超过4000

SQL文本字符长度超过4000

保证SQL文本字符长度不超过4000

EK21

数据库名称字符长度超过100

数据库名称字符长度超过100

保证数据库名称字符长度不超过100

EK22

分隔符为单个字符,不能为空,且分隔符不支持.$|()[{^?*+\类型

分隔符为单个字符,不能为空,且分隔符不支持.$|()[{^?*+\类型

分隔符为单个字符,不能为空,且分隔符不支持.$|()[{^?*+\类型

EK23

EXPLAIN失败,请检查SQL

EXPLAIN失败

请检查SQL

LEK24

重载数据库配置文件失败

重载数据库配置文件失败

查看数据库配置文件,查看数据库日志

LEK25

入参不合法,包含不可修改的guc参数

入参不合法,包含不可修改的guc参数

查看数据库文档,检查参数是否合法

LEK26

guc参数修改失败

guc参数修改失败

查看数据库文档,检查参数是否合法

LEK27

部分guc参数修改失败,且恢复到原参数值失败

部分guc参数修改失败,且恢复到原参数值失败

查看数据库文档,检查参数是否合法

LEK28

guc参数集合为空

guc参数集合为空

保证正确的guc参数集合

8. 版本发布历史

8.1. 版本发布时间线

本节列出了所有已发布的LightDB-EM版本,按发布时间倒序呈现。

LightDB-EM版本

发布日期

23.4

2023-12-29

23.3

2023-09-30

23.2

2023-06-30

23.1

2023-03-31

22.4

2022-12-31

22.3

2022-09-30

8.2. 发布记录

8.2.1. LightDB-EM 23.4版本升级内容

  1. 基于em13.8-23.3版本,添加兼容22.1版本lightdb的备份与恢复;

  2. EM-记录所有操作日志;

  3. EM-SQL上线支持任意数据库;

  4. 高可用集群和分布式常规模式下所有Witness节点不校验keepalived状态;

  5. 支持在线创建租户(选择oracle/mysql模式);

  6. 在线创建数据库支持选择字符集编码,并可支持开发者模式;

  7. EM在线部署lightdb实例增加开发者选项和增量检查点;

8.2.2. LightDB-EM 23.3版本升级内容

  1. 主机代理支持同时监控数据库实例,最多监控4个数据库实例,便于资源的合理利用,减少管理的复杂性。

  2. 数据库日志中慢日志支持根据时延进行过滤和排序,便于分析执行时长较久的慢日志。

  3. 分布式集群支持查看节点倾斜,分片倾斜情况,便于分析性能是否均衡,保证资源的合理利用。

  4. 支持查看数据库重启日志,便于分析数据库何时重启,是否发生故障等。

8.2.3. LightDB-EM 23.2版本升级内容

  1. 支持单机HA模式监控。

8.2.4. LightDB-EM 23.1版本升级内容

  1. 新增索引监控,查看数据库中的无效索引。

  2. 新增顶级活动,可查看不同等待事件平均活跃会话,一定时间内TOP SQL占比,获取具体SQL内容,在线获取执行计划。

  3. 新增动态修改guc参数,可通过页面修改guc参数信息。

  4. 新增深度钻取数据库表年龄信息页面。

  5. 新增角色,用户菜单,可通过添加角色,让不同用户拥有不同菜单权限。

  6. 新增sql审核,可以系统审核sql文本,并且人工审核sql是否到指定的数据库实例执行。

8.2.5. LightDB-EM 22.4版本升级内容

  1. 支持配置邮件、钉钉告警。

  2. 集成lightdb提供的最大可用性checklist及巡检项。

  3. 内嵌支持绿色版Lightdb。

  4. EM日志采集与检索。

  5. 增加恢复后立即启动功能。

  6. 支持pwr禁用witness。

  7. 高可用多从支持某些节点不提升。

  8. 日志分析模块增加SQL审计。

  9. 增加日志与进度。

  10. 在集群列表部署高可用数据库实例。

8.2.6. LightDB-EM 22.3版本升级内容

  1. 主机监控和数据库实例监控分开部署;

  2. 集群列表添加实例启停和主从切换,主机管理新增安装软件,配合集群管理可以初始化数据库实例;

  3. 新增top对象,可查看数据库,数据库表,索引大小;

  4. 采集监控添加下拉列表区分主机还是数据库实例的定时任务;

  5. 新增备份恢复功能。

9. FAQ

1, 上传文件时,出现上传失败的错误

errupload——1

解决方法 :

a :通过浏览器控制台查看上传接口提示:Processing of multipart/form-data request failed. 设备上没有空间 b: em配置文件jrescloud.properties配置server.tomcat.basedir的地址为em服务所在路径

2, em内嵌的绿色版本的lightdb的版本(13.8-22.4)已支持单机分布式,默认启动后监听端口为5434, 如果手动修改了em内嵌的绿色版本的lightdb监听端口(配置文件${LTDATA}/lightdb.conf中配置项port)为5436,在em启动后(em启动过程中会启动绿色版本lightdb数据库)需要进行如下操作:

1[lightdb@192_168_76_128 scripts]$ ltsql -h localhost -p5436 -d postgres -c 'update cron.job set nodeport=5436;'
UPDATE 5
2[lightdb@192_168_76_128 scripts]$ ltsql -h localhost -p5436 -d postgres -c "update servers set connstr='dbname=postgres port=5436';"
UPDATE 1
3[lightdb@192_168_76_128 scripts]$ ltsql -h localhost -p5436 -d em -c "update pg_dist_node set nodeport=5436;"
UPDATE 1

验证是否操作成功:

1[lightdb@192_168_76_128 scripts]$ ltsql -h localhost -p5436 -d em -c "select * from pg_dist_node;"
 nodeid | groupid | nodename  | nodeport | noderack | hasmetadata | isactive | noderole | nodecluster | metadatasynced | shouldhaveshards
--------+---------+-----------+----------+----------+-------------+----------+----------+-------------+----------------+------------------
          1 |       0 | localhost |     5436 | default  | t           | t        | primary  | default     | t              | t
(1 row)

2[lightdb@192_168_76_128 scripts]$ ltsql -h localhost -p5436 -d postgres -c "select connstr from servers;"
                  connstr
---------------------------
 dbname=postgres port=5436
(1 row)

                                 |                  |
(1 row)
3[lightdb@192_168_76_128 scripts]$ ltsql -h localhost -p5436 -d postgres -c "select * from cron.job;"
 jobid |   schedule    |              command              | nodename  | nodeport | database | username | active |         jobname
-------+---------------+-----------------------------------+-----------+----------+----------+----------+--------+--------------------------
         1 | */5 * * * *   | SELECT lt_catalog.pg_show_plans() | localhost |     5436 | postgres | lightdb  | t      | lt_show_plans
         2 | */1 * * * * * | SELECT collect_activity_history() | localhost |     5436 | postgres | lightdb  | t      | collect_activity_history
         3 | */1 * * * *   | SELECT collect_activity_profile() | localhost |     5436 | postgres | lightdb  | t      | collect_activity_profile
         4 | 0 0 * * *     | SELECT clean_activity_profile()   | localhost |     5436 | postgres | lightdb  | t      | clean_activity_profile
         5 | */10 * * * *  | SELECT lt_catalog.take_sample()   | localhost |     5436 | postgres | lightdb  | t      | take_sample
(5 rows)