Docker容器:如何让应用程序优雅退出

伴随着业务的不断更新迭代,容器启动的和停止经常发生,当容器停止时,如果容器内的程序未执行完,那么将会造成数据不完整,特别是一些分布式事务,可能会导致数据不一致,为此,容器引入优雅关闭功能。

当我们执行docker stop命令后,docker会向容器中进程ID为1的进程发送SIGTERM(kill -15)信号,当等待一段时间后程序仍然没有退出后,将发送SIGKILL(kill -9)信号强制杀死进程。等待时间可以通过参数设置:

1
# docker stop --time=30 foo

但如果使用docker kill命令的话,则不会有等待时间,直接发送SIGKILL信号。Kubernetes在容器关闭时候也是通过docker stop命令优雅关闭容器,当容器内应用接收到SIGTERM信号后将拒绝新的访问请求并且执行完未处理的任务,回收占用的资源。下面通过一段Go的代码举例如何获取SIGTERM信号并优雅退出。

1
2
3
4
5
6
7
8
term := make(chan os.Signal)
signal.Notify(term, os.Interrupt, syscall.SIGTERM)
cancel := make(chan struct{})
select {
case <-term:
   level.Warn(logger).Log("msg""Received SIGTERM, exiting gracefully...")
  #执行具体回收动作
}

如果其他编程语言也相似,但这里有个坑需要需要注意,由于Docker关闭时候只给进程号是1的进程发送信号,也就是说如果应用程序的进程ID不是1,那么将不会收到信号Docker发出的信号。下面举例说明,先看一个正常的JAVA程序:Kill.java 。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
class Kill {
    private static Thread main;
    public static void main(String[] a) throws Exception {
        Runtime.getRuntime().addShutdownHook(new Thread(new Runnable() {
            public void run() {
                System.out.println("TERM");
                main.interrupt();
                for (int i = 0; i < 4; i++) {
                    System.out.println("busy");
                    try {
                        Thread.sleep(1000);
                    } catch (Exception e) {}
                }
                System.out.println("exit");
            }
        }));
        main = Thread.currentThread();
        while (true) {
            Thread.sleep(1000);
            System.out.println("run");
        }
    }
}

执行”Javac Kill.java”编译代码并打包到Docker镜像中,Dockerfile如下:

1
2
3
FROM openjdk:8-jre-alpine
ADD Kill*.class /
ENTRYPOINT ["java","Kill"]

启动容器,进入容器可以看到”java Kill”进程号为1,当执行docker stop命令后程序将接收到TERM信号,并优雅退出。

然后我们再修改一下Dockerfile,添加一个启动脚本start.sh,脚本非常简单就两行,如下:

1
2
#! /bin/sh
java Kill

重新构建镜像并启动,新的Dockerfile如下:

1
2
3
4
FROM openjdk:8-jre-alpine
ADD Kill*.class /
ADD start.sh /
ENTRYPOINT ["sh","-c","/start.sh"]

启动容器后,进入容器会发现,JAVA进程的ID变成7,成为shell(进程ID为1)的子进程。

1
2
3
4
# ps -ef
ID   USER     TIME  COMMAND
1    root     0:00  {start.sh} /bin/sh /start.sh
     root     0:00  java Kill

此时再次执行docker stop命令,容器将不会收的TERM信号,并在默认的10秒优雅关闭时间后,直接退出(其实是被SIGKILL直接干掉了)。所以当需要优雅退出时必须保证应用程序的进程ID为1。

那有没有别的方法,能够在保证PID不为1的时候也能优雅退出呢?当然可以,有两种常见的办法:

(1)我们可以在容器关闭前执行prestop脚本,脚本里面首先动态获取JAVA进程的ID,然后通过kill直接对这个进程发送TERM信号,从而优雅关闭程序。如下所示:

1
PID=`pidof java` && kill -SIGTERM $PID

(2)可以通过tini容器启动应用,tini的作为ID为1的进程,当他收到信号后就会转发信号给子进程,那么子进程就可以执行优雅退出操作了。而且tini本身还具有回收僵尸进程的能力。

(3)shell 脚本修改为exec执行

1
2
#! /bin/sh
exec java Kill

shell 中添加一个 exec 即可让应用进程替代当前 shell 进程,可将 SIGTERM 信号传递到业务层,让业务实现优雅关闭。

或者直接修改dockerfile,自己试一下行不行:

1
2
3
4
FROM openjdk:8-jre-alpine
ADD Kill*.class /
ADD start.sh /
ENTRYPOINT ["sh","-c","exec /start.sh"]