BUG/MEDIUM: check: Requeue healthchecks on I/O events to handle check timeout
authorChristopher Faulet <cfaulet@haproxy.com>
Tue, 3 Jun 2025 12:50:38 +0000 (14:50 +0200)
committerChristopher Faulet <cfaulet@haproxy.com>
Tue, 17 Jun 2025 06:04:00 +0000 (08:04 +0200)
When a healthchecks is processed, once the first wakeup passed to start the
check, and as long as the expiration timer is not reached, only I/O events
are able to wake it up. It is an issue when there is a check timeout
defined.  Especially if the connect timeout is high and the check timeout is
low. In that case, the healthcheck's task is never requeue to handle any
timeout update. When the connection is established, the check timeout is set
to replace the connect timeout. It is thus possible to report a success
while a timeout should be reported.

So, now, when an I/O event is handled, the healthcheck is requeue, except if
an success or an abort is reported.

Thanks to Thierry Fournier for report and the reproducer.

This patch must be backported to all stable versions.

(cherry picked from commit 7c788f0984623f727a71ae4aee9917ddeac1b59d)
Signed-off-by: Christopher Faulet <cfaulet@haproxy.com>
(cherry picked from commit 73b733e2e0bf6d6e9914c3b58a632f2b4dcb2d8d)
Signed-off-by: Christopher Faulet <cfaulet@haproxy.com>
(cherry picked from commit 2341a3c06afd1ec3a92d0df5766daf30360374d6)
Signed-off-by: Christopher Faulet <cfaulet@haproxy.com>

src/check.c

index b499b3b..dc62d7a 100644 (file)
@@ -1088,6 +1088,11 @@ int wake_srv_chk(struct stconn *sc)
                ret = -1;
                task_wakeup(check->task, TASK_WOKEN_IO);
        }
+       else {
+               /* Check in progress. Queue it to eventually handle timeout
+                * update */
+               task_queue(check->task);
+       }
 
        if (check->server)
                HA_SPIN_UNLOCK(SERVER_LOCK, &check->server->lock);