mysql-高可用-keepalived
目录
I.概述
生产环境中一台mysql
主机存在单点故障,所以我们要确保mysql
的高可用性,即两台MySQL
服务器如果其中有一台MySQL服务器挂掉后,另外一台能立马接替其进行工作。
i.MySQL
的高可用方案
MySQL
的高可用方案一般有如下几种:
keepalived+双主
MHA
PXC
MMM
Heartbeat+DRBD
等
比较常用的是keepalived+双主
,MHA
和PXC
。
本节主要介绍了利用keepalived
实现 MySQL
数据库的高可用。
Keepalived+mysql
双主来实现MySQL-HA
,我们必须保证两台MySQL
数据库的数据完全一样,基本思路是两台MySQL
互为主从关系,通过Keepalived
配置虚拟IP
,实现当其中的一台MySQL
数据库宕机后,应用能够自动切换到另外一台MySQL
数据库,保证系统的高可用。
ii.拓扑环境
操作系统 | 版本 |
---|---|
OS |
centos6.5 x86_64 |
软件 | 版本 |
---|---|
Mysql版本 |
mysql 5.5.38 |
Keepalived |
keepalived-1.2.20 |
服务 | ip地址 |
---|---|
Mysql-vip |
192.168.1.100 |
Mysql-master1 |
192.168.1.101 |
Mysql-master2 |
192.168.1.102 |
II.配置两台mysql主主同步
该过程的第一部分就是master
记录二进制日志。在每个事务更新数据完成之前,master
在二日志记录这些改变。MySQL
将事务写入二进制日志。在事件写入二进制日志完成后,master
通知存储引擎提交事务。
下一步就是slave
将master
的binary log
拷贝到它自己的中继日志。首先,slave
开始一个工作线程I/O线程
。I/O线程
在master
上打开一个普通的连接,然后开始binlog dump process
。Binlog dump process
从master
的二进制日志中读取事件,如果已经同步了master
,它会睡眠并等待master
产生新的事件。I/O线程
将这些事件写入中继日志。
SQL slave thread
(SQL从线程
)处理该过程的最后一步。SQL线程
从中继日志
读取事件,并重放其中的事件而更新slave
的数据,使其与master
中的数据一致。只要该线程与I/O线程
保持一致,中继日志通常会位于OS
的缓存中,所以中继日志的开销很小。
主主同步就是两台机器互为主的关系,在任何一台机器上写入都会同步。
若mysql
主机开启了防火墙,需要关闭防火墙或创建规则。
i.修改MySQL
配置文件
两台MySQL
均要开启binlog
日志功能,开启方法:在MySQL
配置文件[MySQLd]
段中加上log-bin=MySQL-bin
选项,两台MySQL的server-ID
不能一样,默认情况下两台MySQL
的serverID
都是1
,需将其中一台修改为2
即可。
1.master1
中有关复制的配置如下
log-bin = mysql-bin
binlog_format = mixed
server-id = 1
relay-log = relay-bin
relay-log-index = slave-relay-bin.index
auto-increment-increment = 2
auto-increment-offset = 1
重启mysqld服务
#service mysqld restart
2.master2
中有关复制的配置如下
log-bin = mysql-bin
binlog_format = mixed
server-id = 2
relay-log = relay-bin
relay-log-index = slave-relay-bin.index
auto-increment-increment = 2
auto-increment-offset = 2
重启mysqld
服务
#service mysqld restart
注:master1
和master2
只有server-id
不同和 auto-increment-offset
不同。
mysql
中有自增长字段,在做数据库的主主同步时需要设置自增长的两个相关配置:auto_increment_offset
和auto_increment_increment
。
auto-increment-increment
表示自增长字段每次递增的量,其默认值是1
。它的值应设为整个结构中服务器的总数,本案例用到两台服务器,所以值设为2
。
auto-increment-offset
是用来设定数据库中自动增长的起点(即初始值),因为这两能服务器都设定了一次自动增长值2
,所以它们的起点必须得不同,这样才能避免两台服务器数据同步时出现主键冲突,
注:可以在my.cnf
文件中添加binlog_do_db=数据库名
配置项(可以添加多个)来指定要同步的数据库
ii.将master1
设为master2
的主服务器
在master1
主机上创建授权账户,允许在master2
(192.168.1.102
)主机上连接
查看master1
的当前binlog
状态信息
在master2
上将master1
设为自已的主服务器并开启slave
功能。
查看从的状态,以下两个值必须为yes
,代表从服务器能正常连接主服务器
Slave_IO_Running:Yes
Slave_SQL_Running:Yes
iii.将master2
设为master1
的主服务器
在master2
主机上创建授权账户,允许在master1
(192.168.1.101
)主机上连接
查看master2
的当前binlog
状态信息
在master1
上将master2
设为自已的主服务器并开启slave
功能。
查看从的状态,以下两个值必须为yes
,代表从服务器能正常连接主服务器
Slave_IO_Running:Yes
Slave_SQL_Running:Yes
iv.测试主主同步
在master1
上创建要同步的数据库如test_db
,并在test_db
中创建一张测试表如tab1
查看master2
主机是否同步了master1
上的数据变化
从上图可以看出master2
同步了master
的数据变化
在master2
主机上向tab1
表中插入数据
查看master1
主机是否同步了master2
上的数据变化
现在任何一台MySQL
上更新数据都会同步到另一台MySQL
,MySQL同步完成。
注:若主MYSQL服务器已经存在,只是后期才搭建从MYSQL服务器,在置配数据同步前应先将主MYSQL服务器的要同步的数据库拷贝到从MYSQL服务器上(如先在主MYSQL上备份数据库,再用备份在从MYSQL服务器上恢复)
下面我们就完成keepalived的高可用性。
keepalived是集群管理中保证集群高可用的一个软件解决方案,其功能类似于heartbeat,用来防止单点故障
keepalived是以VRRP协议为实现基础的,VRRP全称Virtual Router Redundancy Protocol,即虚拟路由冗余协议。
虚拟路由冗余协议,可以认为是实现路由器高可用的协议,即将N台提供相同功能的路由器组成一个路由器组,这个组里面有一个master和多个backup,master上面有一个对外提供服务的vip,master会发组播(组播地址为224.0.0.18),当backup收不到vrrp包时就认为master宕掉了,这时就需要根据VRRP的优先级来选举一个backup当master。这样的话就可以保证路由器的高可用了。
keepalived主要有三个模块,分别是core、check和vrrp。core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析。check负责健康检查,包括常见的各种检查方式。vrrp模块是来实现VRRP协议的。
III.keepalived
的安装配置
i.在master1
和master2
上安装软件包keepalived
安装keepalived软件包与服务控制
在编译安装Keepalived之前,必须先安装内核开发包kernel-devel以及openssl-devel、popt-devel等支持库。
若没有安装则通过rpm或yum工具进行安装
编译安装Keepalived
使用指定的linux内核位置对keepalived进行配置,并将安装路径指定为根目录,这样就无需额外创建链接文件了,配置完成后,依次执行make、make install进行安装。
注意:如不知道keepalived需要哪些依赖包,可到下载后的源码解压目录下查看INSTALL 文件内容,安装需要的依赖包,源码安装任何一个软件都要养成查看源码包文档的习惯,比如INSTALL,README,doc等文档,可以获得很多有用的信息
使用keepalived服务
执行make install操作之后,会自动生成/etc/init.d/keepalived脚本文件,但还需要手动添加为系统服务,这样就可以使用service、chkconfig工具来对keepalived服务程序进行管理了。
Master2主机也完成keepalived安装,与master1一样,安装过程略
注:若开启了防火墙,需要关闭防火墙或创建规则。
ii.修改Keepalived的配置文件
keepalived只有一个配置文件keepalived.conf,里面主要包括以下几个配置区域,分别是global_defs、vrrp_instance和virtual_server。
global_defs:主要是配置故障发生时的通知对象以及机器标识。
vrrp_instance:用来定义对外提供服务的VIP区域及其相关属性。
virtual_server:虚拟服务器定义
master1主机上的keepalived.conf文件的修改:
vi /etc/keepalived/keepalived.conf:
! Configuration File for keepalived //!表示注释
global_defs {
router_id MYSQL-1 //表示运行keepalived服务器的一个标识
}
vrrp_instance VI_1 {
state BACKUP //指定keepalived的角色, 两台配置此处均是BACKUP,设为BACKUP将根据优先级决定主或从
interface eth0 //指定HA监测网络的接口
virtual_router_id 51 //虚拟路由标识,这个标识是一个数字(取值在0-255之间,用来区分多个instance的VRRP组播),同一个vrrp实例使用唯一的标识,确保和master2相同,同网内不同集群此项必须不同,否则发生冲突。
priority 100 //用来选举master的,要成为master,该项取值范围是1-255(在此范围之外会被识别成默认值100),此处master2上设置为50
advert_int 1 //发VRRP包的时间间隔,即多久进行一次master选举(可以认为是健康查检时间间隔)
nopreempt //不抢占,即允许一个priority比较低的节点作为master,即使有priority更高的节点启动
authentication { //认证区域,认证类型有PASS和HA(IPSEC),推荐使用PASS(密码只识别前8位)
auth_type PASS
auth_pass 1111
}
virtual_ipaddress { //VIP区域,指定vip地址
192.168.1.100
}
}
virtual_server 192.168.1.100 3306 { //设置虚拟服务器,需要指定虚拟IP地址和服务端口,IP与端口之间用空格隔开
delay_loop 2 //设置运行情况检查时间,单位是秒
lb_algo rr //设置后端调度算法,这里设置为rr,即轮询算法
lb_kind DR //设置LVS实现负载均衡的机制,有NAT、TUN、DR三个模式可选
persistence_timeout 60 //会话保持时间,单位是秒。这个选项对动态网页是非常有用的,为集群系统中的session共享提供了一个很好的解决方案。有了这个会话保持功能,用户的请求会被一直分发到某个服务节点,直到超过这个会话的保持时间。
protocol TCP //指定转发协议类型,有TCP和UDP两种
real_server 192.168.1.101 3306 { //配置服务节点1,需要指定real server的真实IP地址和端口,IP与端口之间用空格隔开
注:master 2上此处改为192.168.1.102(即master2本机ip)
weight 3 //配置服务节点的权值,权值大小用数字表示,数字越大,权值越高,设置权值大小为了区分不同性能的服务器
notify_down /etc/keepalived/bin/mysql.sh //检测到realserver的mysql服务down后执行的脚本
TCP_CHECK {
connect_timeout 3 //连接超时时间
nb_get_retry 3 //重连次数
delay_before_retry 3 //重连间隔时间
connect_port 3306 //健康检查端口
}
}
}
master1主机上有关keepalived.conf文件的具体配置如下:
启动keepalived 服务
#/etc/init.d/keepalived start
Master2主机上的keepalived.conf文件的修改:
Master2主机的keepalived.conf文件配置与master1基本相同,只是router_id ,priority,real_server三处不同,其他配置都相同
可以使用scp命令把server1主机上配置好的keepalived.conf文件拷贝到server2主机,只要做简单修改即可,如下图所示:
启动keepalived 服务
#/etc/init.d/keepalived start
iii.实现将故障机器踢出
master1
和master2
上都添加此检测脚本,作用是当mysql停止工作时自动关闭本机的keepalived
,从而实现将故障机器踢出(因每台机器上keepalived
只添加了本机为realserver).
当mysqld正常启动起来后,要手动启动keepalived服务。
#mkdir /etc/keepalived/bin
vi /etc/keepalived /bin/mysql.sh,内容如下:
Master2主机完成相同的操作
iv.测试
在master1和master2分别执行ip addr show dev eth0命令查看master1和master2对VIP(群集虚拟IP)的控制权。
Master1主的查看结果:
Master2主的查看结果:
从上图可以看出master1是主服务器,master2为备用服务器。
停止MySQL服务,看keepalived健康检查程序是否会触发我们编写的脚本
停止master1主机的mysql服务
Master2主的查看结果:
这说明在主服务上停止MySQL服务,触发了我们编写的脚本,进行自动故障切换。
MySQL远程登录测试
我们找一台安装有MySQL客户端,然后登录VIP,看是否能登录,在登录之两台MySQL服务器都要授权允许从远程登录。例如:
在客户端上测试登录
上图显示说明在客户端访问VIP地址,由master1主机提供响应的,因为master1当前是主服务器,将master1的mysql服务停止,在客户端执行show variables like ‘server_id’;
上图显示说明在客户端的查询请求是由master2主机响应的。故障切换成功。
IV.总结
Keepalived+mysql双主一般来说,中小型规模的时候,采用这种架构是最省事的。
在master节点发生故障后,利用keepalived的高可用机制实现快速切换到备用节点。
在这个方案里,有几个需要注意的地方:
1.采用keepalived作为高可用方案时,两个节点最好都设置成BACKUP模式,避免因为意外情况下(比如脑裂)相互抢占导致往两个节点写入相同数据而引发冲突;
2.把两个节点的auto_increment_increment(自增步长)和auto_increment_offset(自增起始值)设成不同值。其目的是为了避免master节点意外宕机时,可能会有部分binlog未能及时复制到slave上被应用,从而会导致slave新写入数据的自增值和原先master上冲突了,因此一开始就使其错开;当然了,如果有合适的容错机制能解决主从自增ID冲突的话,也可以不这么做;
3.slave节点服务器配置不要太差,否则更容易导致复制延迟。作为热备节点的slave服务器,硬件配置不能低于master节点;
4.如果对延迟问题很敏感的话,可考虑使用MariaDB分支版本,或者直接上线MySQL 5.7最新版本,利用多线程复制的方式可以很大程度降低复制延迟;