快盘下载:好资源、好软件、快快下载吧!

快盘排行|快盘最新

当前位置:首页软件教程电脑软件教程 → TiDB 集群服务器宕机怎么办?

TiDB 集群服务器宕机怎么办?

时间:2022-09-18 21:05:27人气:作者:快盘下载我要评论

TiDB集群某台服务器宕机怎么办?

今天在线上遇到了一个TiDB服务器宕机的问题。这里总结下。

01

场景描述

TiDB集群中,某一台服务器宕机,这台服务器上部署的集群组件有PD、TiKV、TiDB。

宕机之后,服务器SSH不通了,其他机器无法登陆上去。我们使用下面的命令:

tiup cluster display cluster_name

查看拓扑的时候,发现拓扑中的Status一栏中显示Down,如下:

TiDB 集群服务器宕机怎么办?

其实这种情况下,由于节点不可达,所以:

对于TiKV来说,会将这个节点上的Region Leader重新选举,而那些不是Leader的Region只是会少一个副本,影响相对较小;

对于TiDB来说,由于它是无状态的,业务可以通过其他的TiDB组件访问集群,没有什么影响;

对于PD来说,PD本身具有高可用,如果挂掉的机器是PD的Leader,那么会自动发生选举,如果不是Leader,那么对PD的影响也比较小,只是少了一个副本;

通常情况下,我们会使用prune命令来驱逐这些下线的节点,而在这种情况下,当我们使用:

tiup cluster prune cluster_name 命令

驱逐这个节点的时候,发现执行过后,这个Down的状态,还是没有消失。

此时查看TiDB的Dashboard,发现这个标记为Down状态的节点,不在TiDB的Dashboard中,如下:

那么到底如何去掉display命令中这个Down的状态呢?

02

服务器宕机处理方法

正确的姿势是应该先使用scale-in来缩容这个TiDB节点。

你可能会说服务器都宕机了,SSH肯定不通了,缩容不会报错吗?答案确实是会报错,而且会提示我们这个节点已经无法通过SSH连接,集群无法直接摘掉了。

正确的处理方法如下:

这种情况下,需要借助scale-in操作里面的--force参数来将这个节点强制下线,因为节点宕机之后已经无法修复了。命令如下:

tiup cluster scale-in cluster_name --node xxxx --force

下线的时候,会提示如下:

数据库

我们需要按照提示,输入图中蓝色字体部分:

Yes,I know my data might be lost.

否则无法执行--force操作。

针对这个服务器,分别执行完TiKV、TiDB、PD的scale-in操作之后,可以发现再次使用display命令查看,标志Down 状态的节点就彻底下掉了。

相关文章

  • 影刀连接Mysql数据库

    影刀连接Mysql数据库,影刀配置连接mysql数据库基础版...
  • ssh登录linux

    ssh登录linux,上一篇提到用ssh登录centos好处很多,许多linux系统管理员都在用ssh。在windows下ssh客户端主要有puTTY、Xshell、secureCR......

网友评论

快盘下载暂未开通留言功能。

关于我们| 广告联络| 联系我们| 网站帮助| 免责声明| 软件发布

Copyright 2019-2029 【快快下载吧】 版权所有 快快下载吧 | 豫ICP备10006759号公安备案:41010502004165

声明: 快快下载吧上的所有软件和资料来源于互联网,仅供学习和研究使用,请测试后自行销毁,如有侵犯你版权的,请来信指出,本站将立即改正。