伴随着业务的不断更新迭代,容器启动的和停止经常发生,当容器停止时,如果容器内的程序未执行完,那么将会造成数据不完整,特别是一些分布式事务,可能会导致数据不一致,为此,容器引入优雅关闭功能。
当我们执行docker stop命令后,docker会向容器中进程ID为1的进程发送SIGTERM(kill -15)信号,当等待一段时间后程序仍然没有退出后,将发送SIGKILL(kill -9)信号强制杀死进程。等待时间可以通过参数设置:
1 |
但如果使用docker kill命令的话,则不会有等待时间,直接发送SIGKILL信号。Kubernetes在容器关闭时候也是通过docker stop命令优雅关闭容器,当容器内应用接收到SIGTERM信号后将拒绝新的访问请求并且执行完未处理的任务,回收占用的资源。下面通过一段Go的代码举例如何获取SIGTERM信号并优雅退出。
1 | term := make(chan os.Signal) |
如果其他编程语言也相似,但这里有个坑需要需要注意,由于Docker关闭时候只给进程号是1的进程发送信号,也就是说如果应用程序的进程ID不是1,那么将不会收到信号Docker发出的信号。下面举例说明,先看一个正常的JAVA程序:Kill.java 。
1 | class Kill { |
执行”Javac Kill.java”编译代码并打包到Docker镜像中,Dockerfile如下:
1 | FROM openjdk:8-jre-alpine |
启动容器,进入容器可以看到”java Kill”进程号为1,当执行docker stop命令后程序将接收到TERM信号,并优雅退出。
然后我们再修改一下Dockerfile,添加一个启动脚本start.sh,脚本非常简单就两行,如下:
1 |
|
重新构建镜像并启动,新的Dockerfile如下:
1 | FROM openjdk:8-jre-alpine |
启动容器后,进入容器会发现,JAVA进程的ID变成7,成为shell(进程ID为1)的子进程。
1 | # ps -ef |
此时再次执行docker stop命令,容器将不会收的TERM信号,并在默认的10秒优雅关闭时间后,直接退出(其实是被SIGKILL直接干掉了)。所以当需要优雅退出时必须保证应用程序的进程ID为1。
那有没有别的方法,能够在保证PID不为1的时候也能优雅退出呢?当然可以,有两种常见的办法:
(1)我们可以在容器关闭前执行prestop脚本,脚本里面首先动态获取JAVA进程的ID,然后通过kill直接对这个进程发送TERM信号,从而优雅关闭程序。如下所示:
1 | PID=`pidof java` && kill -SIGTERM $PID |
(2)可以通过tini容器启动应用,tini的作为ID为1的进程,当他收到信号后就会转发信号给子进程,那么子进程就可以执行优雅退出操作了。而且tini本身还具有回收僵尸进程的能力。
(3)shell 脚本修改为exec执行
1 |
|
shell 中添加一个 exec 即可让应用进程替代当前 shell 进程,可将 SIGTERM 信号传递到业务层,让业务实现优雅关闭。
或者直接修改dockerfile,自己试一下行不行:
1 | FROM openjdk:8-jre-alpine |