2022-11-09

Docker容器：如何让应用程序优雅退出

伴随着业务的不断更新迭代，容器启动的和停止经常发生，当容器停止时，如果容器内的程序未执行完，那么将会造成数据不完整，特别是一些分布式事务，可能会导致数据不一致，为此，容器引入优雅关闭功能。

当我们执行docker stop命令后，docker会向容器中进程ID为1的进程发送SIGTERM(kill -15)信号，当等待一段时间后程序仍然没有退出后，将发送SIGKILL(kill -9)信号强制杀死进程。等待时间可以通过参数设置:

1	# docker stop --time=30 foo

但如果使用docker kill命令的话，则不会有等待时间，直接发送SIGKILL信号。Kubernetes在容器关闭时候也是通过docker stop命令优雅关闭容器，当容器内应用接收到SIGTERM信号后将拒绝新的访问请求并且执行完未处理的任务，回收占用的资源。下面通过一段Go的代码举例如何获取SIGTERM信号并优雅退出。

term := make(chan os.Signal)
signal.Notify(term, os.Interrupt, syscall.SIGTERM)
cancel := make(chan struct{})
select {
case <-term:
   level.Warn(logger).Log("msg", "Received SIGTERM, exiting gracefully...")
  #执行具体回收动作
}

如果其他编程语言也相似，但这里有个坑需要需要注意，由于Docker关闭时候只给进程号是1的进程发送信号，也就是说如果应用程序的进程ID不是1，那么将不会收到信号Docker发出的信号。下面举例说明，先看一个正常的JAVA程序：Kill.java 。

class Kill {
    private static Thread main;
    public static void main(String[] a) throws Exception {
        Runtime.getRuntime().addShutdownHook(new Thread(new Runnable() {
            public void run() {
                System.out.println("TERM");
                main.interrupt();
                for (int i = 0; i < 4; i++) {
                    System.out.println("busy");
                    try {
                        Thread.sleep(1000);
                    } catch (Exception e) {}
                }
                System.out.println("exit");
            }
        }));
        main = Thread.currentThread();
        while (true) {
            Thread.sleep(1000);
            System.out.println("run");
        }
    }
}

执行”Javac Kill.java”编译代码并打包到Docker镜像中，Dockerfile如下：

1
2
3

FROM openjdk:8-jre-alpine
ADD Kill*.class /
ENTRYPOINT ["java","Kill"]

启动容器，进入容器可以看到”java Kill”进程号为1，当执行docker stop命令后程序将接收到TERM信号，并优雅退出。

然后我们再修改一下Dockerfile，添加一个启动脚本start.sh，脚本非常简单就两行，如下:

1 2	#! /bin/sh java Kill

重新构建镜像并启动，新的Dockerfile如下：

FROM openjdk:8-jre-alpine
ADD Kill*.class /
ADD start.sh /
ENTRYPOINT ["sh","-c","/start.sh"]

启动容器后，进入容器会发现，JAVA进程的ID变成7，成为shell(进程ID为1)的子进程。

# ps -ef
ID   USER     TIME  COMMAND
1    root     0:00  {start.sh} /bin/sh /start.sh
     root     0:00  java Kill

此时再次执行docker stop命令，容器将不会收的TERM信号，并在默认的10秒优雅关闭时间后，直接退出(其实是被SIGKILL直接干掉了)。所以当需要优雅退出时必须保证应用程序的进程ID为1。

那有没有别的方法，能够在保证PID不为1的时候也能优雅退出呢?当然可以，有两种常见的办法：

(1)我们可以在容器关闭前执行prestop脚本，脚本里面首先动态获取JAVA进程的ID，然后通过kill直接对这个进程发送TERM信号，从而优雅关闭程序。如下所示：

1	PID=`pidof java` && kill -SIGTERM $PID

(2)可以通过tini容器启动应用，tini的作为ID为1的进程，当他收到信号后就会转发信号给子进程，那么子进程就可以执行优雅退出操作了。而且tini本身还具有回收僵尸进程的能力。

(3)shell 脚本修改为exec执行

1 2	#! /bin/sh exec java Kill

shell 中添加一个 exec 即可让应用进程替代当前 shell 进程,可将 SIGTERM 信号传递到业务层，让业务实现优雅关闭。

或者直接修改dockerfile，自己试一下行不行：

FROM openjdk:8-jre-alpine
ADD Kill*.class /
ADD start.sh /
ENTRYPOINT ["sh","-c","exec /start.sh"]