可获得性
本特性自V300R002C00版本开始引入。
特性简介
集群内某节点出现硬件故障造成节点不可用或者实例状态不正常,当集群没有加锁,通过节点替换或修复故障实例来恢复集群的过程中,支持用户DML操作,有限场景支持用户DDL操作。
客户价值
随着企业数据规模不断增大,节点数量急剧增加,硬件损坏概率相应增加,物理节点替换修复成为日常运维工作的常态。传统的离线节点替换方式无法满足客户业务不中断需求,日常运维操作中,经常的业务中断将给客户带来重大损失。而目前业界数据库产品在节点替换的过程中,或者需要中断业务,或者只允许部分操作,均不能满足大规模数据情况下,常态物理节点替换的需求。在线节点替换特性解决了以上问题,提升了数据库运行的可靠性,可为用户提供更加稳定的数据服务。
特性描述
如果数据库集群内某节点因为出现硬件故障而造成节点不可用或者实例不正常时,且集群未上锁的前提下,在通过节点替换或修复故障实例来恢复集群的过程中,支持用户DML操作,有限场景支持用户DDL操作。
特性增强
无。
特性约束
目前集群未上锁的前提下,节点替换已支持用户业务在线DDL:
- 在节点替换窗口期内,支持用户DML操作,有限场景支持用户DDL操作。
现有方案,所替换节点中包含CN时,存在如下约束:
- 在CN实例修复阶段,分为Base修复阶段与增量修复阶段,在增量修复阶段会短暂阻塞用户DDL操作(平均时长在1到5分钟内,最长为20分钟),DML不会阻塞。
- 节点修复阶段,用户应选择DDL业务相对不密集的阶段实施,可有效缩短增量修复阶段用户DDL阻塞时长。
- 增量修复阶段用户的DDL操作会被阻塞,如用户事务块跨CN数量变化窗口(增量修复阶段)会报错回滚,业务侧增加重试机制可解决此问题。
依赖关系
无。