Support gring as a first-class conversion specifier in internal string-formatting
[exim.git] / src / src / daemon.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) The Exim Maintainers 2020 - 2022 */
6 /* Copyright (c) University of Cambridge 1995 - 2023 */
7 /* See the file NOTICE for conditions of use and distribution. */
8 /* SPDX-License-Identifier: GPL-2.0-or-later */
9
10 /* Functions concerned with running Exim as a daemon */
11
12
13 #include "exim.h"
14
15
16 /* Structure for holding data for each SMTP connection */
17
18 typedef struct smtp_slot {
19   pid_t         pid;            /* pid of the spawned reception process */
20   uschar *      host_address;   /* address of the client host */
21 } smtp_slot;
22
23 typedef struct runner_slot {
24   pid_t         pid;            /* pid of spawned queue-runner process */
25   const uschar *queue_name;     /* pointer to the name in the qrunner struct */
26 } runner_slot;
27
28 /* An empty slot for initializing (Standard C does not allow constructor
29 expressions in assignments except as initializers in declarations). */
30
31 static smtp_slot empty_smtp_slot = { .pid = 0, .host_address = NULL };
32
33 /*************************************************
34 *               Local static variables           *
35 *************************************************/
36
37 static SIGNAL_BOOL sigchld_seen;
38 static SIGNAL_BOOL sighup_seen;
39 static SIGNAL_BOOL sigterm_seen;
40
41 static int   accept_retry_count = 0;
42 static int   accept_retry_errno;
43 static BOOL  accept_retry_select_failed;
44
45 static int   queue_run_count = 0;       /* current runners */
46
47 static unsigned queue_runner_slot_count = 0;
48 static runner_slot * queue_runner_slots = NULL;
49 static smtp_slot * smtp_slots = NULL;
50
51 static BOOL  write_pid = TRUE;
52
53 #ifndef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
54 static uschar * notifier_socket_name;
55 #endif
56
57
58 /*************************************************
59 *             SIGHUP Handler                     *
60 *************************************************/
61
62 /* All this handler does is to set a flag and re-enable the signal.
63
64 Argument: the signal number
65 Returns:  nothing
66 */
67
68 static void
69 sighup_handler(int sig)
70 {
71 sighup_seen = TRUE;
72 signal(SIGHUP, sighup_handler);
73 }
74
75
76
77 /*************************************************
78 *     SIGCHLD handler for main daemon process    *
79 *************************************************/
80
81 /* Don't re-enable the handler here, since we aren't doing the
82 waiting here. If the signal is re-enabled, there will just be an
83 infinite sequence of calls to this handler. The SIGCHLD signal is
84 used just as a means of waking up the daemon so that it notices
85 terminated subprocesses as soon as possible.
86
87 Argument: the signal number
88 Returns:  nothing
89 */
90
91 static void
92 main_sigchld_handler(int sig)
93 {
94 os_non_restarting_signal(SIGCHLD, SIG_DFL);
95 sigchld_seen = TRUE;
96 }
97
98
99 /* SIGTERM handler.  Try to get the daemon pid file removed
100 before exiting. */
101
102 static void
103 main_sigterm_handler(int sig)
104 {
105 sigterm_seen = TRUE;
106 }
107
108
109
110
111 /*************************************************
112 *          Unexpected errors in SMTP calls       *
113 *************************************************/
114
115 /* This function just saves a bit of repetitious coding.
116
117 Arguments:
118   log_msg        Text of message to be logged
119   smtp_msg       Text of SMTP error message
120   was_errno      The failing errno
121
122 Returns:         nothing
123 */
124
125 static void
126 never_error(uschar *log_msg, uschar *smtp_msg, int was_errno)
127 {
128 uschar *emsg = was_errno <= 0
129   ? US"" : string_sprintf(": %s", strerror(was_errno));
130 log_write(0, LOG_MAIN|LOG_PANIC, "%s%s", log_msg, emsg);
131 if (smtp_out) smtp_printf("421 %s\r\n", FALSE, smtp_msg);
132 }
133
134
135
136
137 /*************************************************
138 *************************************************/
139
140 static void
141 unlink_notifier_socket(void)
142 {
143 #ifndef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
144 DEBUG(D_any) debug_printf("unlinking notifier socket %s\n", notifier_socket_name);
145 Uunlink(notifier_socket_name);
146 #endif
147 }
148
149
150 static void
151 close_daemon_sockets(int daemon_notifier_fd,
152   struct pollfd * fd_polls, int listen_socket_count)
153 {
154 if (daemon_notifier_fd >= 0)
155   {
156   (void) close(daemon_notifier_fd);
157   daemon_notifier_fd = -1;
158   }
159
160 for (int i = 0; i < listen_socket_count; i++) (void) close(fd_polls[i].fd);
161 }
162
163
164 /*************************************************
165 *            Handle a connected SMTP call        *
166 *************************************************/
167
168 /* This function is called when an SMTP connection has been accepted.
169 If there are too many, give an error message and close down. Otherwise
170 spin off a sub-process to handle the call. The list of listening sockets
171 is required so that they can be closed in the sub-process. Take care not to
172 leak store in this process - reset the stacking pool at the end.
173
174 Arguments:
175   fd_polls        sockets which are listening for incoming calls
176   listen_socket_count   count of listening sockets
177   accept_socket         socket of the current accepted call
178   accepted              socket information about the current call
179
180 Returns:            nothing
181 */
182
183 static void
184 handle_smtp_call(struct pollfd *fd_polls, int listen_socket_count,
185   int accept_socket, struct sockaddr *accepted)
186 {
187 pid_t pid;
188 union sockaddr_46 interface_sockaddr;
189 EXIM_SOCKLEN_T ifsize = sizeof(interface_sockaddr);
190 int dup_accept_socket = -1;
191 int max_for_this_host = 0;
192 int save_log_selector = *log_selector;
193 gstring * whofrom;
194
195 rmark reset_point = store_mark();
196
197 /* Make the address available in ASCII representation, and also fish out
198 the remote port. */
199
200 sender_host_address = host_ntoa(-1, accepted, NULL, &sender_host_port);
201 DEBUG(D_any) debug_printf("Connection request from %s port %d\n",
202   sender_host_address, sender_host_port);
203
204 /* Set up the output stream, check the socket has duplicated, and set up the
205 input stream. These operations fail only the exceptional circumstances. Note
206 that never_error() won't use smtp_out if it is NULL. */
207
208 if (!(smtp_out = fdopen(accept_socket, "wb")))
209   {
210   never_error(US"daemon: fdopen() for smtp_out failed", US"", errno);
211   goto ERROR_RETURN;
212   }
213
214 if ((dup_accept_socket = dup(accept_socket)) < 0)
215   {
216   never_error(US"daemon: couldn't dup socket descriptor",
217     US"Connection setup failed", errno);
218   goto ERROR_RETURN;
219   }
220
221 if (!(smtp_in = fdopen(dup_accept_socket, "rb")))
222   {
223   never_error(US"daemon: fdopen() for smtp_in failed",
224     US"Connection setup failed", errno);
225   goto ERROR_RETURN;
226   }
227
228 /* Get the data for the local interface address. Panic for most errors, but
229 "connection reset by peer" just means the connection went away. */
230
231 if (getsockname(accept_socket, (struct sockaddr *)(&interface_sockaddr),
232      &ifsize) < 0)
233   {
234   log_write(0, LOG_MAIN | ((errno == ECONNRESET)? 0 : LOG_PANIC),
235     "getsockname() failed: %s", strerror(errno));
236   smtp_printf("421 Local problem: getsockname() failed; please try again later\r\n", FALSE);
237   goto ERROR_RETURN;
238   }
239
240 interface_address = host_ntoa(-1, &interface_sockaddr, NULL, &interface_port);
241 DEBUG(D_interface) debug_printf("interface address=%s port=%d\n",
242   interface_address, interface_port);
243
244 /* Build a string identifying the remote host and, if requested, the port and
245 the local interface data. This is for logging; at the end of this function the
246 memory is reclaimed. */
247
248 whofrom = string_append(NULL, 3, "[", sender_host_address, "]");
249
250 if (LOGGING(incoming_port))
251   whofrom = string_fmt_append(whofrom, ":%d", sender_host_port);
252
253 if (LOGGING(incoming_interface))
254   whofrom = string_fmt_append(whofrom, " I=[%s]:%d",
255     interface_address, interface_port);
256
257 /* Check maximum number of connections. We do not check for reserved
258 connections or unacceptable hosts here. That is done in the subprocess because
259 it might take some time. */
260
261 if (smtp_accept_max > 0 && smtp_accept_count >= smtp_accept_max)
262   {
263   DEBUG(D_any) debug_printf("rejecting SMTP connection: count=%d max=%d\n",
264     smtp_accept_count, smtp_accept_max);
265   smtp_printf("421 Too many concurrent SMTP connections; "
266     "please try again later.\r\n", FALSE);
267   log_write(L_connection_reject,
268             LOG_MAIN, "Connection from %Y refused: too many connections",
269     whofrom);
270   goto ERROR_RETURN;
271   }
272
273 /* If a load limit above which only reserved hosts are acceptable is defined,
274 get the load average here, and if there are in fact no reserved hosts, do
275 the test right away (saves a fork). If there are hosts, do the check in the
276 subprocess because it might take time. */
277
278 if (smtp_load_reserve >= 0)
279   {
280   load_average = OS_GETLOADAVG();
281   if (!smtp_reserve_hosts && load_average > smtp_load_reserve)
282     {
283     DEBUG(D_any) debug_printf("rejecting SMTP connection: load average = %.2f\n",
284       (double)load_average/1000.0);
285     smtp_printf("421 Too much load; please try again later.\r\n", FALSE);
286     log_write(L_connection_reject,
287               LOG_MAIN, "Connection from %Y refused: load average = %.2f",
288       whofrom, (double)load_average/1000.0);
289     goto ERROR_RETURN;
290     }
291   }
292
293 /* Check that one specific host (strictly, IP address) is not hogging
294 resources. This is done here to prevent a denial of service attack by someone
295 forcing you to fork lots of times before denying service. The value of
296 smtp_accept_max_per_host is a string which is expanded. This makes it possible
297 to provide host-specific limits according to $sender_host address, but because
298 this is in the daemon mainline, only fast expansions (such as inline address
299 checks) should be used. The documentation is full of warnings. */
300
301 if (smtp_accept_max_per_host)
302   {
303   uschar *expanded = expand_string(smtp_accept_max_per_host);
304   if (!expanded)
305     {
306     if (!f.expand_string_forcedfail)
307       log_write(0, LOG_MAIN|LOG_PANIC, "expansion of smtp_accept_max_per_host "
308         "failed for %Y: %s", whofrom, expand_string_message);
309     }
310   /* For speed, interpret a decimal number inline here */
311   else
312     {
313     uschar *s = expanded;
314     while (isdigit(*s))
315       max_for_this_host = max_for_this_host * 10 + *s++ - '0';
316     if (*s)
317       log_write(0, LOG_MAIN|LOG_PANIC, "expansion of smtp_accept_max_per_host "
318         "for %Y contains non-digit: %s", whofrom, expanded);
319     }
320   }
321
322 /* If we have fewer connections than max_for_this_host, we can skip the tedious
323 per host_address checks. Note that at this stage smtp_accept_count contains the
324 count of *other* connections, not including this one. */
325
326 if (max_for_this_host > 0 && smtp_accept_count >= max_for_this_host)
327   {
328   int host_accept_count = 0;
329   int other_host_count = 0;    /* keep a count of non matches to optimise */
330
331   for (int i = 0; i < smtp_accept_max; ++i)
332     if (smtp_slots[i].host_address)
333       {
334       if (Ustrcmp(sender_host_address, smtp_slots[i].host_address) == 0)
335        host_accept_count++;
336       else
337        other_host_count++;
338
339       /* Testing all these strings is expensive - see if we can drop out
340       early, either by hitting the target, or finding there are not enough
341       connections left to make the target. */
342
343       if (  host_accept_count >= max_for_this_host
344          || smtp_accept_count - other_host_count < max_for_this_host)
345        break;
346       }
347
348   if (host_accept_count >= max_for_this_host)
349     {
350     DEBUG(D_any) debug_printf("rejecting SMTP connection: too many from this "
351       "IP address: count=%d max=%d\n",
352       host_accept_count, max_for_this_host);
353     smtp_printf("421 Too many concurrent SMTP connections "
354       "from this IP address; please try again later.\r\n", FALSE);
355     log_write(L_connection_reject,
356               LOG_MAIN, "Connection from %Y refused: too many connections "
357       "from that IP address", whofrom);
358     search_tidyup();
359     goto ERROR_RETURN;
360     }
361   }
362
363 /* OK, the connection count checks have been passed. Before we can fork the
364 accepting process, we must first log the connection if requested. This logging
365 used to happen in the subprocess, but doing that means that the value of
366 smtp_accept_count can be out of step by the time it is logged. So we have to do
367 the logging here and accept the performance cost. Note that smtp_accept_count
368 hasn't yet been incremented to take account of this connection.
369
370 In order to minimize the cost (because this is going to happen for every
371 connection), do a preliminary selector test here. This saves ploughing through
372 the generalized logging code each time when the selector is false. If the
373 selector is set, check whether the host is on the list for logging. If not,
374 arrange to unset the selector in the subprocess. */
375
376 if (LOGGING(smtp_connection))
377   {
378   uschar *list = hosts_connection_nolog;
379   memset(sender_host_cache, 0, sizeof(sender_host_cache));
380   if (list && verify_check_host(&list) == OK)
381     save_log_selector &= ~L_smtp_connection;
382   else
383     log_write(L_smtp_connection, LOG_MAIN, "SMTP connection from %Y "
384       "(TCP/IP connection count = %d)", whofrom, smtp_accept_count + 1);
385   }
386
387 /* Now we can fork the accepting process; do a lookup tidy, just in case any
388 expansion above did a lookup. */
389
390 search_tidyup();
391 pid = exim_fork(US"daemon-accept");
392
393 /* Handle the child process */
394
395 if (pid == 0)
396   {
397   int queue_only_reason = 0;
398   int old_pool = store_pool;
399   int save_debug_selector = debug_selector;
400   BOOL local_queue_only;
401   BOOL session_local_queue_only;
402 #ifdef SA_NOCLDWAIT
403   struct sigaction act;
404 #endif
405
406   smtp_accept_count++;    /* So that it includes this process */
407
408   /* If the listen backlog was over the monitoring level, log it. */
409
410   if (smtp_listen_backlog > smtp_backlog_monitor)
411     log_write(0, LOG_MAIN, "listen backlog %d I=[%s]:%d",
412                 smtp_listen_backlog, interface_address, interface_port);
413
414   /* May have been modified for the subprocess */
415
416   *log_selector = save_log_selector;
417
418   /* Get the local interface address into permanent store */
419
420   store_pool = POOL_PERM;
421   interface_address = string_copy(interface_address);
422   store_pool = old_pool;
423
424   /* Check for a tls-on-connect port */
425
426   if (host_is_tls_on_connect_port(interface_port)) tls_in.on_connect = TRUE;
427
428   /* Expand smtp_active_hostname if required. We do not do this any earlier,
429   because it may depend on the local interface address (indeed, that is most
430   likely what it depends on.) */
431
432   smtp_active_hostname = primary_hostname;
433   if (raw_active_hostname)
434     {
435     uschar * nah = expand_string(raw_active_hostname);
436     if (!nah)
437       {
438       if (!f.expand_string_forcedfail)
439         {
440         log_write(0, LOG_MAIN|LOG_PANIC, "failed to expand \"%s\" "
441           "(smtp_active_hostname): %s", raw_active_hostname,
442           expand_string_message);
443         smtp_printf("421 Local configuration error; "
444           "please try again later.\r\n", FALSE);
445         mac_smtp_fflush();
446         search_tidyup();
447         exim_underbar_exit(EXIT_FAILURE);
448         }
449       }
450     else if (*nah) smtp_active_hostname = nah;
451     }
452
453   /* Initialize the queueing flags */
454
455   queue_check_only();
456   session_local_queue_only = queue_only;
457
458   /* Close the listening sockets, and set the SIGCHLD handler to SIG_IGN.
459   We also attempt to set things up so that children are automatically reaped,
460   but just in case this isn't available, there's a paranoid waitpid() in the
461   loop too (except for systems where we are sure it isn't needed). See the more
462   extensive comment before the reception loop in exim.c for a fuller
463   explanation of this logic. */
464
465   close_daemon_sockets(daemon_notifier_fd, fd_polls, listen_socket_count);
466
467   /* Set FD_CLOEXEC on the SMTP socket. We don't want any rogue child processes
468   to be able to communicate with them, under any circumstances. */
469   (void)fcntl(accept_socket, F_SETFD,
470               fcntl(accept_socket, F_GETFD) | FD_CLOEXEC);
471   (void)fcntl(dup_accept_socket, F_SETFD,
472               fcntl(dup_accept_socket, F_GETFD) | FD_CLOEXEC);
473
474 #ifdef SA_NOCLDWAIT
475   act.sa_handler = SIG_IGN;
476   sigemptyset(&(act.sa_mask));
477   act.sa_flags = SA_NOCLDWAIT;
478   sigaction(SIGCHLD, &act, NULL);
479 #else
480   signal(SIGCHLD, SIG_IGN);
481 #endif
482   signal(SIGTERM, SIG_DFL);
483   signal(SIGINT, SIG_DFL);
484
485   /* Attempt to get an id from the sending machine via the RFC 1413
486   protocol. We do this in the sub-process in order not to hold up the
487   main process if there is any delay. Then set up the fullhost information
488   in case there is no HELO/EHLO.
489
490   If debugging is enabled only for the daemon, we must turn if off while
491   finding the id, but turn it on again afterwards so that information about the
492   incoming connection is output. */
493
494   if (f.debug_daemon) debug_selector = 0;
495   verify_get_ident(IDENT_PORT);
496   host_build_sender_fullhost();
497   debug_selector = save_debug_selector;
498
499   DEBUG(D_any)
500     debug_printf("Process %d is handling incoming connection from %s\n",
501       (int)getpid(), sender_fullhost);
502
503   /* Now disable debugging permanently if it's required only for the daemon
504   process. */
505
506   if (f.debug_daemon) debug_selector = 0;
507
508   /* If there are too many child processes for immediate delivery,
509   set the session_local_queue_only flag, which is initialized from the
510   configured value and may therefore already be TRUE. Leave logging
511   till later so it will have a message id attached. Note that there is no
512   possibility of re-calculating this per-message, because the value of
513   smtp_accept_count does not change in this subprocess. */
514
515   if (smtp_accept_queue > 0 && smtp_accept_count > smtp_accept_queue)
516     {
517     session_local_queue_only = TRUE;
518     queue_only_reason = 1;
519     }
520
521   /* Handle the start of the SMTP session, then loop, accepting incoming
522   messages from the SMTP connection. The end will come at the QUIT command,
523   when smtp_setup_msg() returns 0. A break in the connection causes the
524   process to die (see accept.c).
525
526   NOTE: We do *not* call smtp_log_no_mail() if smtp_start_session() fails,
527   because a log line has already been written for all its failure exists
528   (usually "connection refused: <reason>") and writing another one is
529   unnecessary clutter. */
530
531   if (!smtp_start_session())
532     {
533     mac_smtp_fflush();
534     search_tidyup();
535     exim_underbar_exit(EXIT_SUCCESS);
536     }
537
538   for (;;)
539     {
540     int rc;
541     message_id[0] = 0;            /* Clear out any previous message_id */
542     reset_point = store_mark();   /* Save current store high water point */
543
544     DEBUG(D_any)
545       debug_printf("Process %d is ready for new message\n", (int)getpid());
546
547     /* Smtp_setup_msg() returns 0 on QUIT or if the call is from an
548     unacceptable host or if an ACL "drop" command was triggered, -1 on
549     connection lost, and +1 on validly reaching DATA. Receive_msg() almost
550     always returns TRUE when smtp_input is true; just retry if no message was
551     accepted (can happen for invalid message parameters). However, it can yield
552     FALSE if the connection was forcibly dropped by the DATA ACL. */
553
554     if ((rc = smtp_setup_msg()) > 0)
555       {
556       BOOL ok = receive_msg(FALSE);
557       search_tidyup();                    /* Close cached databases */
558       if (!ok)                            /* Connection was dropped */
559         {
560         cancel_cutthrough_connection(TRUE, US"receive dropped");
561         mac_smtp_fflush();
562         smtp_log_no_mail();               /* Log no mail if configured */
563         exim_underbar_exit(EXIT_SUCCESS);
564         }
565       if (!message_id[0]) continue;     /* No message was accepted */
566       }
567     else                                /* bad smtp_setup_msg() */
568       {
569       if (smtp_out)
570         {
571         int fd = fileno(smtp_in);
572         uschar buf[128];
573
574         mac_smtp_fflush();
575         /* drain socket, for clean TCP FINs */
576         if (fcntl(fd, F_SETFL, O_NONBLOCK) == 0)
577           for(int i = 16; read(fd, buf, sizeof(buf)) > 0 && i > 0; ) i--;
578         }
579       cancel_cutthrough_connection(TRUE, US"message setup dropped");
580       search_tidyup();
581       smtp_log_no_mail();                 /* Log no mail if configured */
582
583       /*XXX should we pause briefly, hoping that the client will be the
584       active TCP closer hence get the TCP_WAIT endpoint? */
585       DEBUG(D_receive) debug_printf("SMTP>>(close on process exit)\n");
586       exim_underbar_exit(rc ? EXIT_FAILURE : EXIT_SUCCESS);
587       }
588
589     /* Show the recipients when debugging */
590
591     DEBUG(D_receive)
592       {
593       if (sender_address)
594         debug_printf("Sender: %s\n", sender_address);
595       if (recipients_list)
596         {
597         debug_printf("Recipients:\n");
598         for (int i = 0; i < recipients_count; i++)
599           debug_printf("  %s\n", recipients_list[i].address);
600         }
601       }
602
603     /* A message has been accepted. Clean up any previous delivery processes
604     that have completed and are defunct, on systems where they don't go away
605     by themselves (see comments when setting SIG_IGN above). On such systems
606     (if any) these delivery processes hang around after termination until
607     the next message is received. */
608
609     #ifndef SIG_IGN_WORKS
610     while (waitpid(-1, NULL, WNOHANG) > 0);
611     #endif
612
613     /* Reclaim up the store used in accepting this message */
614
615       {
616       int r = receive_messagecount;
617       BOOL q = f.queue_only_policy;
618       smtp_reset(reset_point);
619       reset_point = NULL;
620       f.queue_only_policy = q;
621       receive_messagecount = r;
622       }
623
624     /* If queue_only is set or if there are too many incoming connections in
625     existence, session_local_queue_only will be TRUE. If it is not, check
626     whether we have received too many messages in this session for immediate
627     delivery. */
628
629     if (!session_local_queue_only &&
630         smtp_accept_queue_per_connection > 0 &&
631         receive_messagecount > smtp_accept_queue_per_connection)
632       {
633       session_local_queue_only = TRUE;
634       queue_only_reason = 2;
635       }
636
637     /* Initialize local_queue_only from session_local_queue_only. If it is not
638     true, and queue_only_load is set, check that the load average is below it.
639     If local_queue_only is set by this means, we also set if for the session if
640     queue_only_load_latch is true (the default). This means that, once set,
641     local_queue_only remains set for any subsequent messages on the same SMTP
642     connection. This is a deliberate choice; even though the load average may
643     fall, it doesn't seem right to deliver later messages on the same call when
644     not delivering earlier ones. However, the are special circumstances such as
645     very long-lived connections from scanning appliances where this is not the
646     best strategy. In such cases, queue_only_load_latch should be set false. */
647
648     if (  !(local_queue_only = session_local_queue_only)
649        && queue_only_load >= 0
650        && (local_queue_only = (load_average = OS_GETLOADAVG()) > queue_only_load)
651        )
652       {
653       queue_only_reason = 3;
654       if (queue_only_load_latch) session_local_queue_only = TRUE;
655       }
656
657     /* Log the queueing here, when it will get a message id attached, but
658     not if queue_only is set (case 0). */
659
660     if (local_queue_only) switch(queue_only_reason)
661       {
662       case 1: log_write(L_delay_delivery,
663                 LOG_MAIN, "no immediate delivery: too many connections "
664                 "(%d, max %d)", smtp_accept_count, smtp_accept_queue);
665               break;
666
667       case 2: log_write(L_delay_delivery,
668                 LOG_MAIN, "no immediate delivery: more than %d messages "
669                 "received in one connection", smtp_accept_queue_per_connection);
670               break;
671
672       case 3: log_write(L_delay_delivery,
673                 LOG_MAIN, "no immediate delivery: load average %.2f",
674                 (double)load_average/1000.0);
675               break;
676       }
677
678     /* If a delivery attempt is required, spin off a new process to handle it.
679     If we are not root, we have to re-exec exim unless deliveries are being
680     done unprivileged. */
681
682     else if (  (!f.queue_only_policy || f.queue_smtp)
683             && !f.deliver_freeze)
684       {
685       pid_t dpid;
686
687       /* We used to flush smtp_out before forking so that buffered data was not
688       duplicated, but now we want to pipeline the responses for data and quit.
689       Instead, hard-close the fd underlying smtp_out right after fork to discard
690       the data buffer. */
691
692       if ((dpid = exim_fork(US"daemon-accept-delivery")) == 0)
693         {
694         (void)fclose(smtp_in);
695         (void)close(fileno(smtp_out));
696         (void)fclose(smtp_out);
697         smtp_in = smtp_out = NULL;
698
699         /* Don't ever molest the parent's SSL connection, but do clean up
700         the data structures if necessary. */
701
702 #ifndef DISABLE_TLS
703         tls_close(NULL, TLS_NO_SHUTDOWN);
704 #endif
705
706         /* Reset SIGHUP and SIGCHLD in the child in both cases. */
707
708         signal(SIGHUP,  SIG_DFL);
709         signal(SIGCHLD, SIG_DFL);
710         signal(SIGTERM, SIG_DFL);
711         signal(SIGINT, SIG_DFL);
712
713         if (geteuid() != root_uid && !deliver_drop_privilege)
714           {
715           signal(SIGALRM, SIG_DFL);
716           delivery_re_exec(CEE_EXEC_PANIC);
717           /* Control does not return here. */
718           }
719
720         /* No need to re-exec; SIGALRM remains set to the default handler */
721
722         (void) deliver_message(message_id, FALSE, FALSE);
723         search_tidyup();
724         exim_underbar_exit(EXIT_SUCCESS);
725         }
726
727       if (dpid > 0)
728         {
729         release_cutthrough_connection(US"passed for delivery");
730         DEBUG(D_any) debug_printf("forked delivery process %d\n", (int)dpid);
731         }
732       else
733         {
734         cancel_cutthrough_connection(TRUE, US"delivery fork failed");
735         log_write(0, LOG_MAIN|LOG_PANIC, "daemon: delivery process fork "
736           "failed: %s", strerror(errno));
737         }
738       }
739     }
740   }
741
742
743 /* Carrying on in the parent daemon process... Can't do much if the fork
744 failed. Otherwise, keep count of the number of accepting processes and
745 remember the pid for ticking off when the child completes. */
746
747 if (pid < 0)
748   never_error(US"daemon: accept process fork failed", US"Fork failed", errno);
749 else
750   {
751   for (int i = 0; i < smtp_accept_max; ++i)
752     if (smtp_slots[i].pid <= 0)
753       {
754       smtp_slots[i].pid = pid;
755       /* Connection closes come asyncronously, so we cannot stack this store */
756       if (smtp_accept_max_per_host)
757         smtp_slots[i].host_address = string_copy_malloc(sender_host_address);
758       smtp_accept_count++;
759       break;
760       }
761   DEBUG(D_any) debug_printf("%d SMTP accept process%s running\n",
762     smtp_accept_count, smtp_accept_count == 1 ? "" : "es");
763   }
764
765 /* Get here via goto in error cases */
766
767 ERROR_RETURN:
768
769 /* Close the streams associated with the socket which will also close the
770 socket fds in this process. We can't do anything if fclose() fails, but
771 logging brings it to someone's attention. However, "connection reset by peer"
772 isn't really a problem, so skip that one. On Solaris, a dropped connection can
773 manifest itself as a broken pipe, so drop that one too. If the streams don't
774 exist, something went wrong while setting things up. Make sure the socket
775 descriptors are closed, in order to drop the connection. */
776
777 if (smtp_out)
778   {
779   if (fclose(smtp_out) != 0 && errno != ECONNRESET && errno != EPIPE)
780     log_write(0, LOG_MAIN|LOG_PANIC, "daemon: fclose(smtp_out) failed: %s",
781       strerror(errno));
782   smtp_out = NULL;
783   }
784 else (void)close(accept_socket);
785
786 if (smtp_in)
787   {
788   if (fclose(smtp_in) != 0 && errno != ECONNRESET && errno != EPIPE)
789     log_write(0, LOG_MAIN|LOG_PANIC, "daemon: fclose(smtp_in) failed: %s",
790       strerror(errno));
791   smtp_in = NULL;
792   }
793 else (void)close(dup_accept_socket);
794
795 /* Release any store used in this process, including the store used for holding
796 the incoming host address and an expanded active_hostname. */
797
798 log_close_all();
799 interface_address = sender_host_name = sender_host_address = NULL;
800 store_reset(reset_point);
801 }
802
803
804
805
806 /*************************************************
807 *       Check wildcard listen special cases      *
808 *************************************************/
809
810 /* This function is used when binding and listening on lists of addresses and
811 ports. It tests for special cases of wildcard listening, when IPv4 and IPv6
812 sockets may interact in different ways in different operating systems. It is
813 passed an error number, the list of listening addresses, and the current
814 address. Two checks are available: for a previous wildcard IPv6 address, or for
815 a following wildcard IPv4 address, in both cases on the same port.
816
817 In practice, pairs of wildcard addresses should be adjacent in the address list
818 because they are sorted that way below.
819
820 Arguments:
821   eno            the error number
822   addresses      the list of addresses
823   ipa            the current IP address
824   back           if TRUE, check for previous wildcard IPv6 address
825                  if FALSE, check for a following wildcard IPv4 address
826
827 Returns:         TRUE or FALSE
828 */
829
830 static BOOL
831 check_special_case(int eno, ip_address_item *addresses, ip_address_item *ipa,
832   BOOL back)
833 {
834 ip_address_item *ipa2;
835
836 /* For the "back" case, if the failure was "address in use" for a wildcard IPv4
837 address, seek a previous IPv6 wildcard address on the same port. As it is
838 previous, it must have been successfully bound and be listening. Flag it as a
839 "6 including 4" listener. */
840
841 if (back)
842   {
843   if (eno != EADDRINUSE || ipa->address[0] != 0) return FALSE;
844   for (ipa2 = addresses; ipa2 != ipa; ipa2 = ipa2->next)
845     {
846     if (ipa2->address[1] == 0 && ipa2->port == ipa->port)
847       {
848       ipa2->v6_include_v4 = TRUE;
849       return TRUE;
850       }
851     }
852   }
853
854 /* For the "forward" case, if the current address is a wildcard IPv6 address,
855 we seek a following wildcard IPv4 address on the same port. */
856
857 else
858   {
859   if (ipa->address[0] != ':' || ipa->address[1] != 0) return FALSE;
860   for (ipa2 = ipa->next; ipa2 != NULL; ipa2 = ipa2->next)
861     if (ipa2->address[0] == 0 && ipa->port == ipa2->port) return TRUE;
862   }
863
864 return FALSE;
865 }
866
867
868
869
870 /*************************************************
871 *         Handle terminating subprocesses        *
872 *************************************************/
873
874 /* Handle the termination of child processes. Theoretically, this need be done
875 only when sigchld_seen is TRUE, but rumour has it that some systems lose
876 SIGCHLD signals at busy times, so to be on the safe side, this function is
877 called each time round. It shouldn't be too expensive.
878
879 Arguments:  none
880 Returns:    nothing
881 */
882
883 static void
884 handle_ending_processes(void)
885 {
886 int status;
887 pid_t pid;
888
889 while ((pid = waitpid(-1, &status, WNOHANG)) > 0)
890   {
891   DEBUG(D_any)
892     {
893     debug_printf("child %d ended: status=0x%x\n", (int)pid, status);
894 #ifdef WCOREDUMP
895     if (WIFEXITED(status))
896       debug_printf("  normal exit, %d\n", WEXITSTATUS(status));
897     else if (WIFSIGNALED(status))
898       debug_printf("  signal exit, signal %d%s\n", WTERMSIG(status),
899           WCOREDUMP(status) ? " (core dumped)" : "");
900 #endif
901     }
902
903   /* If it's a listening daemon for which we are keeping track of individual
904   subprocesses, deal with an accepting process that has terminated. */
905
906   if (smtp_slots)
907     {
908     int i;
909     for (i = 0; i < smtp_accept_max; i++)
910       if (smtp_slots[i].pid == pid)
911         {
912         if (smtp_slots[i].host_address)
913           store_free(smtp_slots[i].host_address);
914         smtp_slots[i] = empty_smtp_slot;
915         if (--smtp_accept_count < 0) smtp_accept_count = 0;
916         DEBUG(D_any) debug_printf("%d SMTP accept process%s now running\n",
917           smtp_accept_count, (smtp_accept_count == 1)? "" : "es");
918         break;
919         }
920     if (i < smtp_accept_max) continue;  /* Found an accepting process */
921     }
922
923   /* If it wasn't an accepting process, see if it was a queue-runner
924   process that we are tracking. */
925
926   if (queue_runner_slots)
927     for (unsigned i = 0; i < queue_runner_slot_count; i++)
928       {
929       runner_slot * r = queue_runner_slots + i;
930       if (r->pid == pid)
931         {
932         r->pid = 0;                     /* free up the slot */
933
934         if (--queue_run_count < 0) queue_run_count = 0;
935         DEBUG(D_any) debug_printf("%d queue-runner process%s now running\n",
936           queue_run_count, queue_run_count == 1 ? "" : "es");
937
938         for (qrunner ** p = &qrunners, * q = qrunners; q; p = &q->next, q = *p)
939           if (q->name == r->queue_name)
940             {
941             if (q->interval)            /* a periodic queue run */
942               q->run_count--;
943             else                        /* a one-time run */
944               *p = q->next;             /* drop this qrunner */
945             break;
946             }
947         break;
948         }
949       }
950   }
951 }
952
953
954 static void
955 set_pid_file_path(void)
956 {
957 if (override_pid_file_path)
958   pid_file_path = override_pid_file_path;
959
960 if (!*pid_file_path)
961   pid_file_path = string_sprintf("%s/exim-daemon.pid", spool_directory);
962
963 if (pid_file_path[0] != '/')
964   log_write(0, LOG_PANIC_DIE, "pid file path %s must be absolute\n", pid_file_path);
965 }
966
967
968 enum pid_op { PID_WRITE, PID_CHECK, PID_DELETE };
969
970 /* Do various pid file operations as safe as possible. Ideally we'd just
971 drop the privileges for creation of the pid file and not care at all about removal of
972 the file. FIXME.
973 Returns: true on success, false + errno==EACCES otherwise
974 */
975
976 static BOOL
977 operate_on_pid_file(const enum pid_op operation, const pid_t pid)
978 {
979 char pid_line[sizeof(int) * 3 + 2];
980 const int pid_len = snprintf(pid_line, sizeof(pid_line), "%d\n", (int)pid);
981 BOOL lines_match = FALSE;
982 uschar * path, * base, * dir;
983
984 const int dir_flags = O_RDONLY | O_NONBLOCK;
985 const int base_flags = O_NOFOLLOW | O_NONBLOCK;
986 const mode_t base_mode = 0644;
987 struct stat sb;
988 int cwd_fd = -1, dir_fd = -1, base_fd = -1;
989 BOOL success = FALSE;
990 errno = EACCES;
991
992 set_pid_file_path();
993 if (!f.running_in_test_harness && real_uid != root_uid && real_uid != exim_uid) goto cleanup;
994 if (pid_len < 2 || pid_len >= (int)sizeof(pid_line)) goto cleanup;
995
996 path = string_copy(pid_file_path);
997 if ((base = Ustrrchr(path, '/')) == NULL)       /* should not happen, but who knows */
998   log_write(0, LOG_MAIN|LOG_PANIC_DIE, "pid file path \"%s\" does not contain a '/'", pid_file_path);
999
1000 dir = base != path ? path : US"/";
1001 *base++ = '\0';
1002
1003 if (!dir || !*dir || *dir != '/') goto cleanup;
1004 if (!base || !*base || Ustrchr(base, '/') != NULL) goto cleanup;
1005
1006 cwd_fd = open(".", dir_flags);
1007 if (cwd_fd < 0 || fstat(cwd_fd, &sb) != 0 || !S_ISDIR(sb.st_mode)) goto cleanup;
1008 dir_fd = open(CS dir, dir_flags);
1009 if (dir_fd < 0 || fstat(dir_fd, &sb) != 0 || !S_ISDIR(sb.st_mode)) goto cleanup;
1010
1011 /* emulate openat */
1012 if (fchdir(dir_fd) != 0) goto cleanup;
1013 base_fd = open(CS base, O_RDONLY | base_flags);
1014 if (fchdir(cwd_fd) != 0)
1015   log_write(0, LOG_MAIN|LOG_PANIC_DIE, "can't return to previous working dir: %s", strerror(errno));
1016
1017 if (base_fd >= 0)
1018   {
1019   char line[sizeof(pid_line)];
1020   ssize_t len = -1;
1021
1022   if (fstat(base_fd, &sb) != 0 || !S_ISREG(sb.st_mode)) goto cleanup;
1023   if ((sb.st_mode & 07777) != base_mode || sb.st_nlink != 1) goto cleanup;
1024   if (sb.st_size < 2 || sb.st_size >= (off_t)sizeof(line)) goto cleanup;
1025
1026   len = read(base_fd, line, sizeof(line));
1027   if (len != (ssize_t)sb.st_size) goto cleanup;
1028   line[len] = '\0';
1029
1030   if (strspn(line, "0123456789") != (size_t)len-1) goto cleanup;
1031   if (line[len-1] != '\n') goto cleanup;
1032   lines_match = len == pid_len && strcmp(line, pid_line) == 0;
1033   }
1034
1035 if (operation == PID_WRITE)
1036   {
1037   if (!lines_match)
1038     {
1039     if (base_fd >= 0)
1040       {
1041       int error = -1;
1042       /* emulate unlinkat */
1043       if (fchdir(dir_fd) != 0) goto cleanup;
1044       error = unlink(CS base);
1045       if (fchdir(cwd_fd) != 0)
1046         log_write(0, LOG_MAIN|LOG_PANIC_DIE, "can't return to previous working dir: %s", strerror(errno));
1047       if (error) goto cleanup;
1048       (void)close(base_fd);
1049       base_fd = -1;
1050      }
1051     /* emulate openat */
1052     if (fchdir(dir_fd) != 0) goto cleanup;
1053     base_fd = open(CS base, O_WRONLY | O_CREAT | O_EXCL | base_flags, base_mode);
1054     if (fchdir(cwd_fd) != 0)
1055         log_write(0, LOG_MAIN|LOG_PANIC_DIE, "can't return to previous working dir: %s", strerror(errno));
1056     if (base_fd < 0) goto cleanup;
1057     if (fchmod(base_fd, base_mode) != 0) goto cleanup;
1058     if (write(base_fd, pid_line, pid_len) != pid_len) goto cleanup;
1059     DEBUG(D_any) debug_printf("pid written to %s\n", pid_file_path);
1060     }
1061   }
1062 else
1063   {
1064   if (!lines_match) goto cleanup;
1065   if (operation == PID_DELETE)
1066     {
1067     int error = -1;
1068     /* emulate unlinkat */
1069     if (fchdir(dir_fd) != 0) goto cleanup;
1070     error = unlink(CS base);
1071     if (fchdir(cwd_fd) != 0)
1072         log_write(0, LOG_MAIN|LOG_PANIC_DIE, "can't return to previous working dir: %s", strerror(errno));
1073     if (error) goto cleanup;
1074     }
1075   }
1076
1077 success = TRUE;
1078 errno = 0;
1079
1080 cleanup:
1081 if (cwd_fd >= 0) (void)close(cwd_fd);
1082 if (dir_fd >= 0) (void)close(dir_fd);
1083 if (base_fd >= 0) (void)close(base_fd);
1084 return success;
1085 }
1086
1087
1088 /* Remove the daemon's pidfile.  Note: runs with root privilege,
1089 as a direct child of the daemon.  Does not return. */
1090
1091 void
1092 delete_pid_file(void)
1093 {
1094 const BOOL success = operate_on_pid_file(PID_DELETE, getppid());
1095
1096 DEBUG(D_any)
1097   debug_printf("delete pid file %s %s: %s\n", pid_file_path,
1098     success ? "success" : "failure", strerror(errno));
1099
1100 exim_exit(EXIT_SUCCESS);
1101 }
1102
1103
1104 /* Called by the daemon; exec a child to get the pid file deleted
1105 since we may require privs for the containing directory */
1106
1107 static void
1108 daemon_die(void)
1109 {
1110 int pid;
1111
1112 DEBUG(D_any) debug_printf("SIGTERM/SIGINT seen\n");
1113 #if !defined(DISABLE_TLS) && (defined(EXIM_HAVE_INOTIFY) || defined(EXIM_HAVE_KEVENT))
1114 tls_watch_invalidate();
1115 #endif
1116
1117 if (daemon_notifier_fd >= 0)
1118   {
1119   close(daemon_notifier_fd);
1120   daemon_notifier_fd = -1;
1121   unlink_notifier_socket();
1122   }
1123
1124 if (f.running_in_test_harness || write_pid)
1125   {
1126   if ((pid = exim_fork(US"daemon-del-pidfile")) == 0)
1127     {
1128     if (override_pid_file_path)
1129       (void)child_exec_exim(CEE_EXEC_PANIC, FALSE, NULL, FALSE, 3,
1130         "-oP", override_pid_file_path, "-oPX");
1131     else
1132       (void)child_exec_exim(CEE_EXEC_PANIC, FALSE, NULL, FALSE, 1, "-oPX");
1133
1134     /* Control never returns here. */
1135     }
1136   if (pid > 0)
1137     child_close(pid, 1);
1138   }
1139 exim_exit(EXIT_SUCCESS);
1140 }
1141
1142
1143 /*************************************************
1144 *       Listener socket for local work prompts   *
1145 *************************************************/
1146
1147 ssize_t
1148 daemon_client_sockname(struct sockaddr_un * sup, uschar ** sname)
1149 {
1150 #ifdef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
1151 sup->sun_path[0] = 0;  /* Abstract local socket addr - Linux-specific? */
1152 return offsetof(struct sockaddr_un, sun_path) + 1
1153   + snprintf(sup->sun_path+1, sizeof(sup->sun_path)-1, "exim_%d", getpid());
1154 #else
1155 *sname = string_sprintf("%s/p_%d", spool_directory, getpid());
1156 return offsetof(struct sockaddr_un, sun_path)
1157   + snprintf(sup->sun_path, sizeof(sup->sun_path), "%s", CS *sname);
1158 #endif
1159 }
1160
1161 ssize_t
1162 daemon_notifier_sockname(struct sockaddr_un * sup)
1163 {
1164 #ifdef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
1165 sup->sun_path[0] = 0;  /* Abstract local socket addr - Linux-specific? */
1166 return offsetof(struct sockaddr_un, sun_path) + 1
1167   + snprintf(sup->sun_path+1, sizeof(sup->sun_path)-1, "%s",
1168               CS expand_string(notifier_socket));
1169 #else
1170 notifier_socket_name = expand_string(notifier_socket);
1171 return offsetof(struct sockaddr_un, sun_path)
1172   + snprintf(sup->sun_path, sizeof(sup->sun_path), "%s",
1173               CS notifier_socket_name);
1174 #endif
1175 }
1176
1177
1178 static void
1179 daemon_notifier_socket(void)
1180 {
1181 int fd;
1182 const uschar * where;
1183 struct sockaddr_un sa_un = {.sun_family = AF_UNIX};
1184 ssize_t len;
1185
1186 if (!f.notifier_socket_en)
1187   {
1188   DEBUG(D_any) debug_printf("-oY used so not creating notifier socket\n");
1189   return;
1190   }
1191 if (override_local_interfaces && !override_pid_file_path)
1192   {
1193   DEBUG(D_any)
1194     debug_printf("-oX used without -oP so not creating notifier socket\n");
1195   return;
1196   }
1197 if (!notifier_socket || !*notifier_socket)
1198   {
1199   DEBUG(D_any) debug_printf("no name for notifier socket\n");
1200   return;
1201   }
1202
1203 DEBUG(D_any) debug_printf("creating notifier socket\n");
1204
1205 #ifdef SOCK_CLOEXEC
1206 if ((fd = socket(PF_UNIX, SOCK_DGRAM|SOCK_CLOEXEC, 0)) < 0)
1207   { where = US"socket"; goto bad; }
1208 #else
1209 if ((fd = socket(PF_UNIX, SOCK_DGRAM, 0)) < 0)
1210   { where = US"socket"; goto bad; }
1211 (void)fcntl(fd, F_SETFD, fcntl(fd, F_GETFD) | FD_CLOEXEC);
1212 #endif
1213
1214 len = daemon_notifier_sockname(&sa_un);
1215
1216 #ifdef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
1217 DEBUG(D_any) debug_printf(" @%s\n", sa_un.sun_path+1);
1218 #else                   /* filesystem-visible and persistent; will neeed removal */
1219 DEBUG(D_any) debug_printf(" %s\n", sa_un.sun_path);
1220 #endif
1221
1222 if (bind(fd, (const struct sockaddr *)&sa_un, (socklen_t)len) < 0)
1223   { where = US"bind"; goto bad; }
1224
1225 #ifdef SO_PASSCRED              /* Linux */
1226 if (setsockopt(fd, SOL_SOCKET, SO_PASSCRED, &on, sizeof(on)) < 0)
1227   { where = US"SO_PASSCRED"; goto bad2; }
1228 #elif defined(LOCAL_CREDS)      /* FreeBSD-ish */
1229 if (setsockopt(fd, 0, LOCAL_CREDS, &on, sizeof(on)) < 0)
1230   { where = US"LOCAL_CREDS"; goto bad2; }
1231 #endif
1232
1233 /* debug_printf("%s: fd %d\n", __FUNCTION__, fd); */
1234 daemon_notifier_fd = fd;
1235 return;
1236
1237 bad2:
1238 #ifndef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
1239   Uunlink(sa_un.sun_path);
1240 #endif
1241 bad:
1242   log_write(0, LOG_MAIN|LOG_PANIC, "%s %s: %s",
1243     __FUNCTION__, where, strerror(errno));
1244   close(fd);
1245   return;
1246 }
1247
1248
1249 /* Data for notifier-triggered queue runs */
1250
1251 static uschar queuerun_msgid[MESSAGE_ID_LENGTH+1];
1252 static const uschar * queuerun_msg_qname;
1253
1254
1255 /* The notifier socket has something to read. Pull the message from it, decode
1256 and do the action.
1257
1258 Return TRUE if a sigalrm should be emulated */
1259
1260 static BOOL
1261 daemon_notification(void)
1262 {
1263 uschar buf[256], cbuf[256];
1264 struct sockaddr_un sa_un;
1265 struct iovec iov = {.iov_base = buf, .iov_len = sizeof(buf)-1};
1266 struct msghdr msg = { .msg_name = &sa_un,
1267                       .msg_namelen = sizeof(sa_un),
1268                       .msg_iov = &iov,
1269                       .msg_iovlen = 1,
1270                       .msg_control = cbuf,
1271                       .msg_controllen = sizeof(cbuf)
1272                     };
1273 ssize_t sz;
1274
1275 buf[sizeof(buf)-1] = 0;
1276 if ((sz = recvmsg(daemon_notifier_fd, &msg, 0)) <= 0) return FALSE;
1277 if (sz >= sizeof(buf)) return FALSE;
1278
1279 #ifdef notdef
1280 debug_printf("addrlen %d\n", msg.msg_namelen);
1281 #endif
1282 DEBUG(D_queue_run)
1283   if (msg.msg_namelen > 0)
1284     {
1285     BOOL abstract = !*sa_un.sun_path;
1286     char * name = sa_un.sun_path + (abstract ? 1 : 0);
1287     int namelen =  (int)msg.msg_namelen - abstract ? 1 : 0;
1288     if (*name)
1289       debug_printf("%s from addr '%s%.*s'\n", __FUNCTION__,
1290         abstract ? "@" : "",
1291         namelen, name);
1292     else
1293       debug_printf("%s (from unknown addr)\n", __FUNCTION__);
1294     }
1295   else
1296     debug_printf("%s (from unknown addr)\n", __FUNCTION__);
1297
1298 /* Refuse to handle the item unless the peer has good credentials */
1299 #ifdef SCM_CREDENTIALS
1300 # define EXIM_SCM_CR_TYPE SCM_CREDENTIALS
1301 #elif defined(LOCAL_CREDS) && defined(SCM_CREDS)
1302 # define EXIM_SCM_CR_TYPE SCM_CREDS
1303 #else
1304         /* The OS has no way to get the creds of the caller (for a unix/datagram socket.
1305         Punt; don't try to check. */
1306 #endif
1307
1308 #ifdef EXIM_SCM_CR_TYPE
1309 for (struct cmsghdr * cp = CMSG_FIRSTHDR(&msg);
1310      cp;
1311      cp = CMSG_NXTHDR(&msg, cp))
1312   if (cp->cmsg_level == SOL_SOCKET && cp->cmsg_type == EXIM_SCM_CR_TYPE)
1313   {
1314 # ifdef SCM_CREDENTIALS                                 /* Linux */
1315   struct ucred * cr = (struct ucred *) CMSG_DATA(cp);
1316   if (cr->uid && cr->uid != exim_uid)
1317     {
1318     DEBUG(D_queue_run) debug_printf("%s: sender creds pid %d uid %d gid %d\n",
1319       __FUNCTION__, (int)cr->pid, (int)cr->uid, (int)cr->gid);
1320     }
1321 # elif defined(LOCAL_CREDS)                             /* BSD-ish */
1322   struct sockcred * cr = (struct sockcred *) CMSG_DATA(cp);
1323   if (cr->sc_uid && cr->sc_uid != exim_uid)
1324     {
1325     DEBUG(D_queue_run) debug_printf("%s: sender creds pid ??? uid %d gid %d\n",
1326       __FUNCTION__, (int)cr->sc_uid, (int)cr->sc_gid);
1327     }
1328 # endif
1329   break;
1330   }
1331 #endif
1332
1333 buf[sz] = 0;
1334 switch (buf[0])
1335   {
1336 #ifndef DISABLE_QUEUE_RAMP
1337   case NOTIFY_MSG_QRUN:
1338     /* this should be a message_id */
1339     DEBUG(D_queue_run)
1340       debug_printf("%s: qrunner trigger: %s\n", __FUNCTION__, buf+1);
1341
1342     memcpy(queuerun_msgid, buf+1, MESSAGE_ID_LENGTH+1);
1343
1344     for (qrunner * q = qrunners; q; q = q->next)
1345       if (q->name
1346           ? Ustrcmp(q->name, buf+1+MESSAGE_ID_LENGTH+1) == 0
1347           : !buf[1+MESSAGE_ID_LENGTH+1]
1348          )
1349         { queuerun_msg_qname = q->name; break; }
1350     return TRUE;
1351 #endif
1352
1353   case NOTIFY_QUEUE_SIZE_REQ:
1354     {
1355     uschar buf[16];
1356     int len = snprintf(CS buf, sizeof(buf), "%u", queue_count_cached());
1357
1358     DEBUG(D_queue_run)
1359       debug_printf("%s: queue size request: %s\n", __FUNCTION__, buf);
1360
1361     if (sendto(daemon_notifier_fd, buf, len, 0,
1362                 (const struct sockaddr *)&sa_un, msg.msg_namelen) < 0)
1363       log_write(0, LOG_MAIN|LOG_PANIC,
1364         "%s: sendto: %s\n", __FUNCTION__, strerror(errno));
1365     break;
1366     }
1367
1368   case NOTIFY_REGEX:
1369     regex_at_daemon(buf);
1370     break;
1371   }
1372 return FALSE;
1373 }
1374
1375
1376
1377 static void
1378 daemon_inetd_wtimeout(time_t last_connection_time)
1379 {
1380 time_t resignal_interval = inetd_wait_timeout;
1381
1382 if (last_connection_time == (time_t)0)
1383   {
1384   DEBUG(D_any)
1385     debug_printf("inetd wait timeout expired, but still not seen first message, ignoring\n");
1386   }
1387 else
1388   {
1389   time_t now = time(NULL);
1390   if (now == (time_t)-1)
1391     {
1392     DEBUG(D_any) debug_printf("failed to get time: %s\n", strerror(errno));
1393     }
1394   else if ((now - last_connection_time) >= inetd_wait_timeout)
1395     {
1396     DEBUG(D_any)
1397       debug_printf("inetd wait timeout %d expired, ending daemon\n",
1398           inetd_wait_timeout);
1399     log_write(0, LOG_MAIN, "exim %s daemon terminating, inetd wait timeout reached.\n",
1400         version_string);
1401     daemon_die();               /* Does not return */
1402     }
1403   else
1404     resignal_interval -= (now - last_connection_time);
1405   }
1406
1407 sigalrm_seen = FALSE;
1408 ALARM(resignal_interval);
1409 }
1410
1411
1412 /* Re-sort the qrunners list, and return the shortest interval.
1413 That could be negatime.
1414 The next-tick times should have been updated by any runs initiated,
1415 though will not be when the global limit on runners was reached.
1416
1417 Unlikely to have many queues, so insertion-sort.
1418 */
1419
1420 static int
1421 next_qrunner_interval(void)
1422 {
1423 qrunner * sorted = NULL;
1424 for (qrunner * q = qrunners, * next; q; q = next)
1425   {
1426   next = q->next;
1427   q->next = NULL;
1428   if (sorted)
1429     {
1430     qrunner ** p = &sorted;
1431     for (qrunner * qq; qq = *p; p = &(qq->next))
1432       if (  q->next_tick < qq->next_tick
1433          || q->next_tick == qq->next_tick && q->interval < qq->interval
1434          )
1435         {
1436         *p = q;
1437         q->next = qq;
1438         goto INSERTED;
1439         }
1440     *p = q;
1441   INSERTED: ;
1442     }
1443   else
1444     sorted = q;
1445   }
1446 qrunners = sorted;
1447 return qrunners ? qrunners->next_tick - time(NULL) : 0;
1448 }
1449
1450 static int
1451 daemon_qrun(int local_queue_run_max, struct pollfd * fd_polls, int listen_socket_count)
1452 {
1453 DEBUG(D_any) debug_printf("%s received\n",
1454 #ifndef DISABLE_QUEUE_RAMP
1455   *queuerun_msgid ? "qrun notification" :
1456 #endif
1457   "SIGALRM");
1458
1459 /* Do a full queue run in a child process, if required, unless we already have
1460 enough queue runners on the go. If we are not running as root, a re-exec is
1461 required. In the calling process, restart the alamr timer for the next run.  */
1462
1463 if (is_multiple_qrun())
1464   if (local_queue_run_max <= 0 || queue_run_count < local_queue_run_max)
1465     {
1466     qrunner * q = NULL;
1467
1468 #ifndef DISABLE_QUEUE_RAMP
1469     if (*queuerun_msgid)        /* See if we can start another runner for this queue */
1470       {
1471       for (qrunner * qq = qrunners; qq; qq = qq->next)
1472         if (qq->name == queuerun_msg_qname)
1473           {
1474           q = qq->run_count < qq->run_max ? qq : NULL;
1475           break;
1476           }
1477       }
1478     else
1479 #endif
1480       /* In order of run priority, find the first queue for which we can start
1481       a runner */
1482
1483       for (q = qrunners; q; q = q->next)
1484         if (q->run_count < q->run_max) break;
1485
1486     if (q)
1487       {
1488       pid_t pid;
1489
1490       /* Bump this queue's next-tick by it's interval */
1491
1492       if (q->interval)
1493         {
1494         time_t now = time(NULL);
1495         do ; while ((q->next_tick += q->interval) <= now);
1496         }
1497
1498       if ((pid = exim_fork(US"queue-runner")) == 0)
1499         {
1500         /* Disable debugging if it's required only for the daemon process. We
1501         leave the above message, because it ties up with the "child ended"
1502         debugging messages. */
1503
1504         if (f.debug_daemon) debug_selector = 0;
1505
1506         /* Close any open listening sockets in the child */
1507
1508         close_daemon_sockets(daemon_notifier_fd,
1509           fd_polls, listen_socket_count);
1510
1511         /* Reset SIGHUP and SIGCHLD in the child in both cases. */
1512
1513         signal(SIGHUP,  SIG_DFL);
1514         signal(SIGCHLD, SIG_DFL);
1515         signal(SIGTERM, SIG_DFL);
1516         signal(SIGINT, SIG_DFL);
1517
1518         /* Re-exec if privilege has been given up, unless deliver_drop_
1519         privilege is set. Reset SIGALRM before exec(). */
1520
1521         if (geteuid() != root_uid && !deliver_drop_privilege)
1522           {
1523           uschar opt[8];
1524           uschar *p = opt;
1525           uschar *extra[7];
1526           int extracount = 1;
1527
1528           signal(SIGALRM, SIG_DFL);
1529           queue_name = US"";
1530
1531           *p++ = '-';
1532           *p++ = 'q';
1533           if (  q->queue_2stage
1534 #ifndef DISABLE_QUEUE_RAMP
1535              && !*queuerun_msgid
1536 #endif
1537              ) *p++ = 'q';
1538           if (q->queue_run_first_delivery) *p++ = 'i';
1539           if (q->queue_run_force) *p++ = 'f';
1540           if (q->deliver_force_thaw) *p++ = 'f';
1541           if (q->queue_run_local) *p++ = 'l';
1542           *p = 0;
1543
1544           extra[0] = q->name
1545             ? string_sprintf("%sG%s", opt, q->name) : opt;
1546
1547 #ifndef DISABLE_QUEUE_RAMP
1548           if (*queuerun_msgid)
1549             {
1550             log_write(0, LOG_MAIN, "notify triggered queue run");
1551             extra[extracount++] = queuerun_msgid;       /* Trigger only the */
1552             extra[extracount++] = queuerun_msgid;       /* one message      */
1553             }
1554 #endif
1555
1556           /* If -R or -S were on the original command line, ensure they get
1557           passed on. */
1558
1559           if (deliver_selectstring)
1560             {
1561             extra[extracount++] = f.deliver_selectstring_regex ? US"-Rr" : US"-R";
1562             extra[extracount++] = deliver_selectstring;
1563             }
1564
1565           if (deliver_selectstring_sender)
1566             {
1567             extra[extracount++] = f.deliver_selectstring_sender_regex
1568               ? US"-Sr" : US"-S";
1569             extra[extracount++] = deliver_selectstring_sender;
1570             }
1571
1572           /* Overlay this process with a new execution. */
1573
1574           (void)child_exec_exim(CEE_EXEC_PANIC, FALSE, NULL, FALSE, extracount,
1575             extra[0], extra[1], extra[2], extra[3], extra[4], extra[5], extra[6]);
1576
1577           /* Control never returns here. */
1578           }
1579
1580         /* No need to re-exec; SIGALRM remains set to the default handler */
1581
1582 #ifndef DISABLE_QUEUE_RAMP
1583         if (*queuerun_msgid)
1584           {
1585           log_write(0, LOG_MAIN, "notify triggered queue run");
1586           f.queue_2stage = FALSE;
1587           queue_run(q, queuerun_msgid, queuerun_msgid, FALSE);
1588           }
1589         else
1590 #endif
1591           queue_run(q, NULL, NULL, FALSE);
1592         exim_underbar_exit(EXIT_SUCCESS);
1593         }
1594
1595       if (pid < 0)
1596         {
1597         log_write(0, LOG_MAIN|LOG_PANIC, "daemon: fork of queue-runner "
1598           "process failed: %s", strerror(errno));
1599         log_close_all();
1600         }
1601       else
1602         {
1603         for (int i = 0; i < local_queue_run_max; ++i)
1604           if (queue_runner_slots[i].pid <= 0)
1605             {
1606             queue_runner_slots[i].pid = pid;
1607             queue_runner_slots[i].queue_name = q->name;
1608             q->run_count++;
1609             queue_run_count++;
1610             break;
1611             }
1612         DEBUG(D_any) debug_printf("%d queue-runner process%s running\n",
1613           queue_run_count, queue_run_count == 1 ? "" : "es");
1614         }
1615       }
1616     }
1617
1618 sigalrm_seen = FALSE;
1619 #ifndef DISABLE_QUEUE_RAMP
1620 if (*queuerun_msgid)            /* it was a fast-ramp kick */
1621   *queuerun_msgid = 0;
1622 else                            /* periodic or one-time queue run */
1623 #endif
1624   {             /* Impose a minimum 1s tick, even when a run was outstanding */
1625   int interval = next_qrunner_interval();
1626   if (interval <= 0) interval = 1;
1627
1628   if (qrunners)                 /* there are still periodic qrunners */
1629     {
1630     ALARM(interval);
1631     return interval;
1632     }
1633   }
1634 return 0;
1635 }
1636
1637
1638
1639
1640 const uschar *
1641 describe_queue_runners(void)
1642 {
1643 gstring * g = NULL;
1644
1645 if (!is_multiple_qrun()) return US"no queue runs";
1646
1647 for (qrunner * q = qrunners; q; q = q->next)
1648   {
1649   g = string_catn(g, US"-q", 2);
1650   if (q->name) g = string_append(g, 3, US"G", q->name, US"/");
1651   g = string_cat(g, readconf_printtime(q->interval));
1652   g = string_catn(g, US" ", 1);
1653   }
1654 gstring_trim(g, 1);
1655 gstring_release_unused(g);
1656 return string_from_gstring(g);
1657 }
1658
1659
1660 /*************************************************
1661 *              Exim Daemon Mainline              *
1662 *************************************************/
1663
1664 /* The daemon can do two jobs, either of which is optional:
1665
1666 (1) Listens for incoming SMTP calls and spawns off a sub-process to handle
1667 each one. This is requested by the -bd option, with -oX specifying the SMTP
1668 port on which to listen (for testing).
1669
1670 (2) Spawns a queue-running process every so often. This is controlled by the
1671 -q option with a an interval time. (If no time is given, a single queue run
1672 is done from the main function, and control doesn't get here.)
1673
1674 Root privilege is required in order to attach to port 25. Some systems require
1675 it when calling socket() rather than bind(). To cope with all cases, we run as
1676 root for both socket() and bind(). Some systems also require root in order to
1677 write to the pid file directory. This function must therefore be called as root
1678 if it is to work properly in all circumstances. Once the socket is bound and
1679 the pid file written, root privilege is given up if there is an exim uid.
1680
1681 There are no arguments to this function, and it never returns. */
1682
1683 void
1684 daemon_go(void)
1685 {
1686 struct passwd * pw;
1687 struct pollfd * fd_polls, * tls_watch_poll = NULL, * dnotify_poll = NULL;
1688 int listen_socket_count = 0, poll_fd_count;
1689 ip_address_item * addresses = NULL;
1690 time_t last_connection_time = (time_t)0;
1691 int local_queue_run_max = 0;
1692
1693 if (is_multiple_qrun())
1694
1695   /* Nuber of runner-tracking structs needed:  If the option queue_run_max has
1696   no expandable elements then it is the overall maximum; else we assume it
1697   depends on the queue name, and add them up to get the maximum.
1698   Evaluate both that and the individual limits. */
1699
1700   if (Ustrchr(queue_run_max, '$') != NULL)
1701     {
1702     for (qrunner * q = qrunners; q; q = q->next)
1703       {
1704       queue_name = q->name;
1705       local_queue_run_max +=
1706         (q->run_max = atoi(CS expand_string(queue_run_max)));
1707       }
1708     queue_name = US"";
1709     }
1710   else
1711     {
1712     local_queue_run_max = atoi(CS expand_string(queue_run_max));
1713     for (qrunner * q = qrunners; q; q = q->next)
1714       q->run_max = local_queue_run_max;
1715     }
1716
1717 process_purpose = US"daemon";
1718
1719 /* If any debugging options are set, turn on the D_pid bit so that all
1720 debugging lines get the pid added. */
1721
1722 DEBUG(D_any|D_v) debug_selector |= D_pid;
1723
1724 /* Allocate enough pollstructs for inetd mode plus the ancillary sockets;
1725 also used when there are no listen sockets. */
1726
1727 fd_polls = store_get(sizeof(struct pollfd) * 3, GET_UNTAINTED);
1728
1729 if (f.inetd_wait_mode)
1730   {
1731   listen_socket_count = 1;
1732   (void) close(3);
1733   if (dup2(0, 3) == -1)
1734     log_write(0, LOG_MAIN|LOG_PANIC_DIE,
1735         "failed to dup inetd socket safely away: %s", strerror(errno));
1736
1737   fd_polls[0].fd = 3;
1738   fd_polls[0].events = POLLIN;
1739   (void) close(0);
1740   (void) close(1);
1741   (void) close(2);
1742   exim_nullstd();
1743
1744   if (debug_file == stderr)
1745     {
1746     /* need a call to log_write before call to open debug_file, so that
1747     log.c:file_path has been initialised.  This is unfortunate. */
1748     log_write(0, LOG_MAIN, "debugging Exim in inetd wait mode starting");
1749
1750     fclose(debug_file);
1751     debug_file = NULL;
1752     exim_nullstd(); /* re-open fd2 after we just closed it again */
1753     debug_logging_activate(US"-wait", NULL);
1754     }
1755
1756   DEBUG(D_any) debug_printf("running in inetd wait mode\n");
1757
1758   /* As per below, when creating sockets ourselves, we handle tcp_nodelay for
1759   our own buffering; we assume though that inetd set the socket REUSEADDR. */
1760
1761   if (tcp_nodelay)
1762     if (setsockopt(3, IPPROTO_TCP, TCP_NODELAY, US &on, sizeof(on)))
1763       log_write(0, LOG_MAIN|LOG_PANIC_DIE, "failed to set socket NODELAY: %s",
1764         strerror(errno));
1765   }
1766
1767
1768 if (f.inetd_wait_mode || f.daemon_listen)
1769   {
1770   /* If any option requiring a load average to be available during the
1771   reception of a message is set, call os_getloadavg() while we are root
1772   for those OS for which this is necessary the first time it is called (in
1773   order to perform an "open" on the kernel memory file). */
1774
1775 #ifdef LOAD_AVG_NEEDS_ROOT
1776   if (queue_only_load >= 0 || smtp_load_reserve >= 0 ||
1777        (deliver_queue_load_max >= 0 && deliver_drop_privilege))
1778     (void)os_getloadavg();
1779 #endif
1780   }
1781
1782
1783 /* Do the preparation for setting up a listener on one or more interfaces, and
1784 possible on various ports. This is controlled by the combination of
1785 local_interfaces (which can set IP addresses and ports) and daemon_smtp_port
1786 (which is a list of default ports to use for those items in local_interfaces
1787 that do not specify a port). The -oX command line option can be used to
1788 override one or both of these options.
1789
1790 If local_interfaces is not set, the default is to listen on all interfaces.
1791 When it is set, it can include "all IPvx interfaces" as an item. This is useful
1792 when different ports are in use.
1793
1794 It turns out that listening on all interfaces is messy in an IPv6 world,
1795 because several different implementation approaches have been taken. This code
1796 is now supposed to work with all of them. The point of difference is whether an
1797 IPv6 socket that is listening on all interfaces will receive incoming IPv4
1798 calls or not. We also have to cope with the case when IPv6 libraries exist, but
1799 there is no IPv6 support in the kernel.
1800
1801 . On Solaris, an IPv6 socket will accept IPv4 calls, and give them as mapped
1802   addresses. However, if an IPv4 socket is also listening on all interfaces,
1803   calls are directed to the appropriate socket.
1804
1805 . On (some versions of) Linux, an IPv6 socket will accept IPv4 calls, and
1806   give them as mapped addresses, but an attempt also to listen on an IPv4
1807   socket on all interfaces causes an error.
1808
1809 . On OpenBSD, an IPv6 socket will not accept IPv4 calls. You have to set up
1810   two sockets if you want to accept both kinds of call.
1811
1812 . FreeBSD is like OpenBSD, but it has the IPV6_V6ONLY socket option, which
1813   can be turned off, to make it behave like the versions of Linux described
1814   above.
1815
1816 . I heard a report that the USAGI IPv6 stack for Linux has implemented
1817   IPV6_V6ONLY.
1818
1819 So, what we do when IPv6 is supported is as follows:
1820
1821  (1) After it is set up, the list of interfaces is scanned for wildcard
1822      addresses. If an IPv6 and an IPv4 wildcard are both found for the same
1823      port, the list is re-arranged so that they are together, with the IPv6
1824      wildcard first.
1825
1826  (2) If the creation of a wildcard IPv6 socket fails, we just log the error and
1827      carry on if an IPv4 wildcard socket for the same port follows later in the
1828      list. This allows Exim to carry on in the case when the kernel has no IPv6
1829      support.
1830
1831  (3) Having created an IPv6 wildcard socket, we try to set IPV6_V6ONLY if that
1832      option is defined. However, if setting fails, carry on regardless (but log
1833      the incident).
1834
1835  (4) If binding or listening on an IPv6 wildcard socket fails, it is a serious
1836      error.
1837
1838  (5) If binding or listening on an IPv4 wildcard socket fails with the error
1839      EADDRINUSE, and a previous interface was an IPv6 wildcard for the same
1840      port (which must have succeeded or we wouldn't have got this far), we
1841      assume we are in the situation where just a single socket is permitted,
1842      and ignore the error.
1843
1844 Phew!
1845
1846 The preparation code decodes options and sets up the relevant data. We do this
1847 first, so that we can return non-zero if there are any syntax errors, and also
1848 write to stderr. */
1849
1850 if (f.daemon_listen && !f.inetd_wait_mode)
1851   {
1852   int *default_smtp_port;
1853   int sep;
1854   int pct = 0;
1855   uschar *s;
1856   const uschar * list;
1857   uschar *local_iface_source = US"local_interfaces";
1858   ip_address_item *ipa;
1859   ip_address_item **pipa;
1860
1861   /* If -oX was used, disable the writing of a pid file unless -oP was
1862   explicitly used to force it. Then scan the string given to -oX. Any items
1863   that contain neither a dot nor a colon are used to override daemon_smtp_port.
1864   Any other items are used to override local_interfaces. */
1865
1866   if (override_local_interfaces)
1867     {
1868     gstring * new_smtp_port = NULL;
1869     gstring * new_local_interfaces = NULL;
1870
1871     if (!override_pid_file_path) write_pid = FALSE;
1872
1873     list = override_local_interfaces;
1874     sep = 0;
1875     while ((s = string_nextinlist(&list, &sep, NULL, 0)))
1876       {
1877       uschar joinstr[4];
1878       gstring ** gp = Ustrpbrk(s, ".:") ? &new_local_interfaces : &new_smtp_port;
1879
1880       if (!*gp)
1881         {
1882         joinstr[0] = sep;
1883         joinstr[1] = ' ';
1884         *gp = string_catn(*gp, US"<", 1);
1885         }
1886
1887       *gp = string_catn(*gp, joinstr, 2);
1888       *gp = string_cat (*gp, s);
1889       }
1890
1891     if (new_smtp_port)
1892       {
1893       daemon_smtp_port = string_from_gstring(new_smtp_port);
1894       DEBUG(D_any) debug_printf("daemon_smtp_port overridden by -oX:\n  %s\n",
1895         daemon_smtp_port);
1896       }
1897
1898     if (new_local_interfaces)
1899       {
1900       local_interfaces = string_from_gstring(new_local_interfaces);
1901       local_iface_source = US"-oX data";
1902       DEBUG(D_any) debug_printf("local_interfaces overridden by -oX:\n  %s\n",
1903         local_interfaces);
1904       }
1905     }
1906
1907   /* Create a list of default SMTP ports, to be used if local_interfaces
1908   contains entries without explicit ports. First count the number of ports, then
1909   build a translated list in a vector. */
1910
1911   list = daemon_smtp_port;
1912   sep = 0;
1913   while ((s = string_nextinlist(&list, &sep, NULL, 0)))
1914     pct++;
1915   default_smtp_port = store_get((pct+1) * sizeof(int), GET_UNTAINTED);
1916   list = daemon_smtp_port;
1917   sep = 0;
1918   for (pct = 0;
1919        (s = string_nextinlist(&list, &sep, NULL, 0));
1920        pct++)
1921     {
1922     if (isdigit(*s))
1923       {
1924       uschar *end;
1925       default_smtp_port[pct] = Ustrtol(s, &end, 0);
1926       if (end != s + Ustrlen(s))
1927         log_write(0, LOG_PANIC_DIE|LOG_CONFIG, "invalid SMTP port: %s", s);
1928       }
1929     else
1930       {
1931       struct servent *smtp_service = getservbyname(CS s, "tcp");
1932       if (!smtp_service)
1933         log_write(0, LOG_PANIC_DIE|LOG_CONFIG, "TCP port \"%s\" not found", s);
1934       default_smtp_port[pct] = ntohs(smtp_service->s_port);
1935       }
1936     }
1937   default_smtp_port[pct] = 0;
1938
1939   /* Check the list of TLS-on-connect ports and do name lookups if needed */
1940
1941   list = tls_in.on_connect_ports;
1942   sep = 0;
1943   /* the list isn't expanded so cannot be tainted.  If it ever is we will trap here */
1944   while ((s = string_nextinlist(&list, &sep, big_buffer, big_buffer_size)))
1945     if (!isdigit(*s))
1946       {
1947       gstring * g = NULL;
1948
1949       list = tls_in.on_connect_ports;
1950       tls_in.on_connect_ports = NULL;
1951       sep = 0;
1952       while ((s = string_nextinlist(&list, &sep, big_buffer, big_buffer_size)))
1953         {
1954         if (!isdigit(*s))
1955           {
1956           struct servent * smtp_service = getservbyname(CS s, "tcp");
1957           if (!smtp_service)
1958             log_write(0, LOG_PANIC_DIE|LOG_CONFIG, "TCP port \"%s\" not found", s);
1959           s = string_sprintf("%d", (int)ntohs(smtp_service->s_port));
1960           }
1961         g = string_append_listele(g, ':', s);
1962         }
1963       if (g)
1964         tls_in.on_connect_ports = g->s;
1965       break;
1966       }
1967
1968   /* Create the list of local interfaces, possibly with ports included. This
1969   list may contain references to 0.0.0.0 and ::0 as wildcards. These special
1970   values are converted below. */
1971
1972   addresses = host_build_ifacelist(local_interfaces, local_iface_source);
1973
1974   /* In the list of IP addresses, convert 0.0.0.0 into an empty string, and ::0
1975   into the string ":". We use these to recognize wildcards in IPv4 and IPv6. In
1976   fact, many IP stacks recognize 0.0.0.0 and ::0 and handle them as wildcards
1977   anyway, but we need to know which are the wildcard addresses, and the shorter
1978   strings are neater.
1979
1980   In the same scan, fill in missing port numbers from the default list. When
1981   there is more than one item in the list, extra items are created. */
1982
1983   for (ipa = addresses; ipa; ipa = ipa->next)
1984     {
1985     if (Ustrcmp(ipa->address, "0.0.0.0") == 0)
1986       ipa->address[0] = 0;
1987     else if (Ustrcmp(ipa->address, "::0") == 0)
1988       {
1989       ipa->address[0] = ':';
1990       ipa->address[1] = 0;
1991       }
1992
1993     if (ipa->port > 0) continue;
1994
1995     if (daemon_smtp_port[0] <= 0)
1996       log_write(0, LOG_MAIN|LOG_PANIC_DIE, "no port specified for interface "
1997         "%s and daemon_smtp_port is unset; cannot start daemon",
1998         ipa->address[0] == 0 ? US"\"all IPv4\"" :
1999         ipa->address[1] == 0 ? US"\"all IPv6\"" : ipa->address);
2000
2001     ipa->port = default_smtp_port[0];
2002     for (int i = 1; default_smtp_port[i] > 0; i++)
2003       {
2004       ip_address_item * new = store_get(sizeof(ip_address_item), GET_UNTAINTED);
2005
2006       memcpy(new->address, ipa->address, Ustrlen(ipa->address) + 1);
2007       new->port = default_smtp_port[i];
2008       new->next = ipa->next;
2009       ipa->next = new;
2010       ipa = new;
2011       }
2012     }
2013
2014   /* Scan the list of addresses for wildcards. If we find an IPv4 and an IPv6
2015   wildcard for the same port, ensure that (a) they are together and (b) the
2016   IPv6 address comes first. This makes handling the messy features easier, and
2017   also simplifies the construction of the "daemon started" log line. */
2018
2019   pipa = &addresses;
2020   for (ipa = addresses; ipa; pipa = &ipa->next, ipa = ipa->next)
2021     {
2022     ip_address_item *ipa2;
2023
2024     /* Handle an IPv4 wildcard */
2025
2026     if (ipa->address[0] == 0)
2027       for (ipa2 = ipa; ipa2->next; ipa2 = ipa2->next)
2028         {
2029         ip_address_item *ipa3 = ipa2->next;
2030         if (ipa3->address[0] == ':' &&
2031             ipa3->address[1] == 0 &&
2032             ipa3->port == ipa->port)
2033           {
2034           ipa2->next = ipa3->next;
2035           ipa3->next = ipa;
2036           *pipa = ipa3;
2037           break;
2038           }
2039         }
2040
2041     /* Handle an IPv6 wildcard. */
2042
2043     else if (ipa->address[0] == ':' && ipa->address[1] == 0)
2044       for (ipa2 = ipa; ipa2->next; ipa2 = ipa2->next)
2045         {
2046         ip_address_item *ipa3 = ipa2->next;
2047         if (ipa3->address[0] == 0 && ipa3->port == ipa->port)
2048           {
2049           ipa2->next = ipa3->next;
2050           ipa3->next = ipa->next;
2051           ipa->next = ipa3;
2052           ipa = ipa3;
2053           break;
2054           }
2055         }
2056     }
2057
2058   /* Get a vector to remember all the sockets in.
2059   Two extra elements for the ancillary sockets */
2060
2061   for (ipa = addresses; ipa; ipa = ipa->next)
2062     listen_socket_count++;
2063   fd_polls = store_get(sizeof(struct pollfd) * (listen_socket_count + 2),
2064                             GET_UNTAINTED);
2065   for (struct pollfd * p = fd_polls; p < fd_polls + listen_socket_count + 2;
2066        p++)
2067     { p->fd = -1; p->events = POLLIN; }
2068
2069   } /* daemon_listen but not inetd_wait_mode */
2070
2071 if (f.daemon_listen)
2072   {
2073
2074   /* Do a sanity check on the max connects value just to save us from getting
2075   a huge amount of store. */
2076
2077   if (smtp_accept_max > 4095) smtp_accept_max = 4096;
2078
2079   /* There's no point setting smtp_accept_queue unless it is less than the max
2080   connects limit. The configuration reader ensures that the max is set if the
2081   queue-only option is set. */
2082
2083   if (smtp_accept_queue > smtp_accept_max) smtp_accept_queue = 0;
2084
2085   /* Get somewhere to keep the list of SMTP accepting pids if we are keeping
2086   track of them for total number and queue/host limits. */
2087
2088   if (smtp_accept_max > 0)
2089     {
2090     smtp_slots = store_get(smtp_accept_max * sizeof(smtp_slot), GET_UNTAINTED);
2091     for (int i = 0; i < smtp_accept_max; i++) smtp_slots[i] = empty_smtp_slot;
2092     }
2093   }
2094
2095 /* The variable background_daemon is always false when debugging, but
2096 can also be forced false in order to keep a non-debugging daemon in the
2097 foreground. If background_daemon is true, close all open file descriptors that
2098 we know about, but then re-open stdin, stdout, and stderr to /dev/null.  Also
2099 do this for inetd_wait mode.
2100
2101 This is protection against any called functions (in libraries, or in
2102 Perl, or whatever) that think they can write to stderr (or stdout). Before this
2103 was added, it was quite likely that an SMTP connection would use one of these
2104 file descriptors, in which case writing random stuff to it caused chaos.
2105
2106 Then disconnect from the controlling terminal, Most modern Unixes seem to have
2107 setsid() for getting rid of the controlling terminal. For any OS that doesn't,
2108 setsid() can be #defined as a no-op, or as something else. */
2109
2110 if (f.background_daemon || f.inetd_wait_mode)
2111   {
2112   log_close_all();    /* Just in case anything was logged earlier */
2113   search_tidyup();    /* Just in case any were used in reading the config. */
2114   (void)close(0);           /* Get rid of stdin/stdout/stderr */
2115   (void)close(1);
2116   (void)close(2);
2117   exim_nullstd();     /* Connect stdin/stdout/stderr to /dev/null */
2118   log_stderr = NULL;  /* So no attempt to copy paniclog output */
2119   }
2120
2121 if (f.background_daemon)
2122   {
2123   /* If the parent process of this one has pid == 1, we are re-initializing the
2124   daemon as the result of a SIGHUP. In this case, there is no need to do
2125   anything, because the controlling terminal has long gone. Otherwise, fork, in
2126   case current process is a process group leader (see 'man setsid' for an
2127   explanation) before calling setsid().
2128   All other forks want daemon_listen cleared. Rather than blow a register, jsut
2129   restore it here. */
2130
2131   if (getppid() != 1)
2132     {
2133     BOOL daemon_listen = f.daemon_listen;
2134     pid_t pid = exim_fork(US"daemon");
2135     if (pid < 0) log_write(0, LOG_MAIN|LOG_PANIC_DIE,
2136       "fork() failed when starting daemon: %s", strerror(errno));
2137     if (pid > 0) exit(EXIT_SUCCESS);      /* in parent process, just exit */
2138     (void)setsid();                       /* release controlling terminal */
2139     f.daemon_listen = daemon_listen;
2140     }
2141   }
2142
2143 /* We are now in the disconnected, daemon process (unless debugging). Set up
2144 the listening sockets if required. */
2145
2146 daemon_notifier_socket();
2147
2148 if (f.daemon_listen && !f.inetd_wait_mode)
2149   {
2150   int sk;
2151   ip_address_item *ipa;
2152
2153   /* For each IP address, create a socket, bind it to the appropriate port, and
2154   start listening. See comments above about IPv6 sockets that may or may not
2155   accept IPv4 calls when listening on all interfaces. We also have to cope with
2156   the case of a system with IPv6 libraries, but no IPv6 support in the kernel.
2157   listening, provided a wildcard IPv4 socket for the same port follows. */
2158
2159   for (ipa = addresses, sk = 0; sk < listen_socket_count; ipa = ipa->next, sk++)
2160     {
2161     BOOL wildcard;
2162     ip_address_item * ipa2;
2163     int fd, af;
2164
2165     if (Ustrchr(ipa->address, ':') != NULL)
2166       {
2167       af = AF_INET6;
2168       wildcard = ipa->address[1] == 0;
2169       }
2170     else
2171       {
2172       af = AF_INET;
2173       wildcard = ipa->address[0] == 0;
2174       }
2175
2176     if ((fd_polls[sk].fd = fd = ip_socket(SOCK_STREAM, af)) < 0)
2177       {
2178       if (check_special_case(0, addresses, ipa, FALSE))
2179         {
2180         log_write(0, LOG_MAIN, "Failed to create IPv6 socket for wildcard "
2181           "listening (%s): will use IPv4", strerror(errno));
2182         goto SKIP_SOCKET;
2183         }
2184       log_write(0, LOG_PANIC_DIE, "IPv%c socket creation failed: %s",
2185         af == AF_INET6 ? '6' : '4', strerror(errno));
2186       }
2187
2188     /* If this is an IPv6 wildcard socket, set IPV6_V6ONLY if that option is
2189     available. Just log failure (can get protocol not available, just like
2190     socket creation can). */
2191
2192 #ifdef IPV6_V6ONLY
2193     if (af == AF_INET6 && wildcard &&
2194         setsockopt(fd, IPPROTO_IPV6, IPV6_V6ONLY, &on, sizeof(on)) < 0)
2195       log_write(0, LOG_MAIN, "Setting IPV6_V6ONLY on daemon's IPv6 wildcard "
2196         "socket failed (%s): carrying on without it", strerror(errno));
2197 #endif  /* IPV6_V6ONLY */
2198
2199     /* Set SO_REUSEADDR so that the daemon can be restarted while a connection
2200     is being handled.  Without this, a connection will prevent reuse of the
2201     smtp port for listening. */
2202
2203     if (setsockopt(fd, SOL_SOCKET, SO_REUSEADDR, &on, sizeof(on)) < 0)
2204       log_write(0, LOG_MAIN|LOG_PANIC_DIE, "setting SO_REUSEADDR on socket "
2205         "failed when starting daemon: %s", strerror(errno));
2206
2207     /* Set TCP_NODELAY; Exim does its own buffering. There is a switch to
2208     disable this because it breaks some broken clients. */
2209
2210     if (tcp_nodelay) setsockopt(fd, IPPROTO_TCP, TCP_NODELAY, &on, sizeof(on));
2211
2212     /* Now bind the socket to the required port; if Exim is being restarted
2213     it may not always be possible to bind immediately, even with SO_REUSEADDR
2214     set, so try 10 times, waiting between each try. After 10 failures, we give
2215     up. In an IPv6 environment, if bind () fails with the error EADDRINUSE and
2216     we are doing wildcard IPv4 listening and there was a previous IPv6 wildcard
2217     address for the same port, ignore the error on the grounds that we must be
2218     in a system where the IPv6 socket accepts both kinds of call. This is
2219     necessary for (some release of) USAGI Linux; other IP stacks fail at the
2220     listen() stage instead. */
2221
2222 #ifdef TCP_FASTOPEN
2223     f.tcp_fastopen_ok = TRUE;
2224 #endif
2225     for(;;)
2226       {
2227       uschar *msg, *addr;
2228       if (ip_bind(fd, af, ipa->address, ipa->port) >= 0) break;
2229       if (check_special_case(errno, addresses, ipa, TRUE))
2230         {
2231         DEBUG(D_any) debug_printf("wildcard IPv4 bind() failed after IPv6 "
2232           "listen() success; EADDRINUSE ignored\n");
2233         (void)close(fd);
2234         goto SKIP_SOCKET;
2235         }
2236       msg = US strerror(errno);
2237       addr = wildcard
2238         ? af == AF_INET6
2239         ? US"(any IPv6)"
2240         : US"(any IPv4)"
2241         : ipa->address;
2242       if (daemon_startup_retries <= 0)
2243         log_write(0, LOG_MAIN|LOG_PANIC_DIE,
2244           "socket bind() to port %d for address %s failed: %s: "
2245           "daemon abandoned", ipa->port, addr, msg);
2246       log_write(0, LOG_MAIN, "socket bind() to port %d for address %s "
2247         "failed: %s: waiting %s before trying again (%d more %s)",
2248         ipa->port, addr, msg, readconf_printtime(daemon_startup_sleep),
2249         daemon_startup_retries, (daemon_startup_retries > 1)? "tries" : "try");
2250       daemon_startup_retries--;
2251       sleep(daemon_startup_sleep);
2252       }
2253
2254     DEBUG(D_any)
2255       if (wildcard)
2256         debug_printf("listening on all interfaces (IPv%c) port %d\n",
2257           af == AF_INET6 ? '6' : '4', ipa->port);
2258       else
2259         debug_printf("listening on %s port %d\n", ipa->address, ipa->port);
2260
2261     /* Start listening on the bound socket, establishing the maximum backlog of
2262     connections that is allowed. On success, add to the set of sockets for select
2263     and continue to the next address. */
2264
2265 #if defined(TCP_FASTOPEN) && !defined(__APPLE__)
2266     if (  f.tcp_fastopen_ok
2267        && setsockopt(fd, IPPROTO_TCP, TCP_FASTOPEN,
2268                     &smtp_connect_backlog, sizeof(smtp_connect_backlog)))
2269       {
2270       DEBUG(D_any) debug_printf("setsockopt FASTOPEN: %s\n", strerror(errno));
2271       f.tcp_fastopen_ok = FALSE;
2272       }
2273 #endif
2274     if (listen(fd, smtp_connect_backlog) >= 0)
2275       {
2276 #if defined(TCP_FASTOPEN) && defined(__APPLE__)
2277       if (  f.tcp_fastopen_ok
2278          && setsockopt(fd, IPPROTO_TCP, TCP_FASTOPEN, &on, sizeof(on)))
2279         {
2280         DEBUG(D_any) debug_printf("setsockopt FASTOPEN: %s\n", strerror(errno));
2281         f.tcp_fastopen_ok = FALSE;
2282         }
2283 #endif
2284       fd_polls[sk].fd = fd;
2285       continue;
2286       }
2287
2288     /* Listening has failed. In an IPv6 environment, as for bind(), if listen()
2289     fails with the error EADDRINUSE and we are doing IPv4 wildcard listening
2290     and there was a previous successful IPv6 wildcard listen on the same port,
2291     we want to ignore the error on the grounds that we must be in a system
2292     where the IPv6 socket accepts both kinds of call. */
2293
2294     if (!check_special_case(errno, addresses, ipa, TRUE))
2295       log_write(0, LOG_PANIC_DIE, "listen() failed on interface %s: %s",
2296         wildcard
2297         ? af == AF_INET6 ? US"(any IPv6)" : US"(any IPv4)" : ipa->address,
2298         strerror(errno));
2299
2300     DEBUG(D_any) debug_printf("wildcard IPv4 listen() failed after IPv6 "
2301       "listen() success; EADDRINUSE ignored\n");
2302     (void)close(fd);
2303
2304     /* Come here if there has been a problem with the socket which we
2305     are going to ignore. We remove the address from the chain, and back up the
2306     counts. */
2307
2308   SKIP_SOCKET:
2309     sk--;                          /* Back up the count */
2310     listen_socket_count--;         /* Reduce the total */
2311     if (ipa == addresses) addresses = ipa->next; else
2312       {
2313       for (ipa2 = addresses; ipa2->next != ipa; ipa2 = ipa2->next);
2314       ipa2->next = ipa->next;
2315       ipa = ipa2;
2316       }
2317     }          /* End of bind/listen loop for each address */
2318   }            /* End of setup for listening */
2319
2320
2321 /* If we are not listening, we want to write a pid file only if -oP was
2322 explicitly given. */
2323
2324 else if (!override_pid_file_path)
2325   write_pid = FALSE;
2326
2327 /* Write the pid to a known file for assistance in identification, if required.
2328 We do this before giving up root privilege, because on some systems it is
2329 necessary to be root in order to write into the pid file directory. There's
2330 nothing to stop multiple daemons running, as long as no more than one listens
2331 on a given TCP/IP port on the same interface(s). However, in these
2332 circumstances it gets far too complicated to mess with pid file names
2333 automatically. Consequently, Exim 4 writes a pid file only
2334
2335   (a) When running in the test harness, or
2336   (b) When -bd is used and -oX is not used, or
2337   (c) When -oP is used to supply a path.
2338
2339 The variable daemon_write_pid is used to control this. */
2340
2341 if (f.running_in_test_harness || write_pid)
2342   {
2343   const enum pid_op operation = (f.running_in_test_harness
2344      || real_uid == root_uid
2345      || (real_uid == exim_uid && !override_pid_file_path)) ? PID_WRITE : PID_CHECK;
2346   if (!operate_on_pid_file(operation, getpid()))
2347     DEBUG(D_any) debug_printf("%s pid file %s: %s\n", (operation == PID_WRITE) ? "write" : "check", pid_file_path, strerror(errno));
2348   }
2349
2350 /* Set up the handler for SIGHUP, which causes a restart of the daemon. */
2351
2352 sighup_seen = FALSE;
2353 signal(SIGHUP, sighup_handler);
2354
2355 /* Give up root privilege at this point (assuming that exim_uid and exim_gid
2356 are not root). The third argument controls the running of initgroups().
2357 Normally we do this, in order to set up the groups for the Exim user. However,
2358 if we are not root at this time - some odd installations run that way - we
2359 cannot do this. */
2360
2361 exim_setugid(exim_uid, exim_gid, geteuid()==root_uid, US"running as a daemon");
2362
2363 /* Update the originator_xxx fields so that received messages as listed as
2364 coming from Exim, not whoever started the daemon. */
2365
2366 originator_uid = exim_uid;
2367 originator_gid = exim_gid;
2368 originator_login = (pw = getpwuid(exim_uid))
2369   ? string_copy_perm(US pw->pw_name, FALSE) : US"exim";
2370
2371 /* Get somewhere to keep the list of queue-runner pids if we are keeping track
2372 of them (and also if we are doing queue runs). */
2373
2374 if (is_multiple_qrun() && local_queue_run_max > 0)
2375   {
2376   queue_runner_slot_count = local_queue_run_max;
2377   queue_runner_slots = store_get(local_queue_run_max * sizeof(runner_slot), GET_UNTAINTED);
2378   memset(queue_runner_slots, 0, local_queue_run_max * sizeof(runner_slot));
2379   }
2380
2381 /* Set up the handler for termination of child processes, and the one
2382 telling us to die. */
2383
2384 sigchld_seen = FALSE;
2385 os_non_restarting_signal(SIGCHLD, main_sigchld_handler);
2386
2387 sigterm_seen = FALSE;
2388 os_non_restarting_signal(SIGTERM, main_sigterm_handler);
2389 os_non_restarting_signal(SIGINT, main_sigterm_handler);
2390
2391 /* If we are to run the queue periodically, pretend the alarm has just gone
2392 off. This will cause the first queue-runner to get kicked off straight away.
2393 Get an initial sort of the list of queues, to prioritize the initial q-runs */
2394
2395
2396 if ((sigalrm_seen = is_multiple_qrun()))
2397   (void) next_qrunner_interval();
2398
2399 /* Log the start up of a daemon - at least one of listening or queue running
2400 must be set up. */
2401
2402 if (f.inetd_wait_mode)
2403   {
2404   uschar *p = big_buffer;
2405
2406   if (inetd_wait_timeout >= 0)
2407     sprintf(CS p, "terminating after %d seconds", inetd_wait_timeout);
2408   else
2409     sprintf(CS p, "with no wait timeout");
2410
2411   log_write(0, LOG_MAIN,
2412     "exim %s daemon started: pid=%d, launched with listening socket, %s",
2413     version_string, getpid(), big_buffer);
2414   set_process_info("daemon(%s): pre-listening socket", version_string);
2415
2416   /* set up the timeout logic */
2417   sigalrm_seen = TRUE;
2418   }
2419
2420 else if (f.daemon_listen)
2421   {
2422   int smtp_ports = 0;
2423   int smtps_ports = 0;
2424   ip_address_item * ipa;
2425   uschar * p;
2426   const uschar * qinfo = describe_queue_runners();
2427
2428   /* Build a list of listening addresses in big_buffer, but limit it to 10
2429   items. The style is for backwards compatibility.
2430
2431   It is possible to have some ports listening for SMTPS (as opposed to TLS
2432   startted by STARTTLS), and others listening for standard SMTP. Keep their
2433   listings separate. */
2434
2435   for (int j = 0, i; j < 2; j++)
2436     for (i = 0, ipa = addresses; i < 10 && ipa; i++, ipa = ipa->next)
2437       {
2438       /* First time round, look for SMTP ports; second time round, look for
2439       SMTPS ports. Build IP+port strings. */
2440
2441       if (host_is_tls_on_connect_port(ipa->port) == (j > 0))
2442         {
2443         if (j == 0)
2444           smtp_ports++;
2445         else
2446           smtps_ports++;
2447
2448         /* Now the information about the port (and sometimes interface) */
2449
2450         if (ipa->address[0] == ':' && ipa->address[1] == 0)
2451           {                                             /* v6 wildcard */
2452           if (ipa->next && ipa->next->address[0] == 0 &&
2453               ipa->next->port == ipa->port)
2454             {
2455             ipa->log = string_sprintf(" port %d (IPv6 and IPv4)", ipa->port);
2456             (ipa = ipa->next)->log = NULL;
2457             }
2458           else if (ipa->v6_include_v4)
2459             ipa->log = string_sprintf(" port %d (IPv6 with IPv4)", ipa->port);
2460           else
2461             ipa->log = string_sprintf(" port %d (IPv6)", ipa->port);
2462           }
2463         else if (ipa->address[0] == 0)                  /* v4 wildcard */
2464           ipa->log = string_sprintf(" port %d (IPv4)", ipa->port);
2465         else                            /* check for previously-seen IP */
2466           {
2467           ip_address_item * i2;
2468           for (i2 = addresses; i2 != ipa; i2 = i2->next)
2469             if (  host_is_tls_on_connect_port(i2->port) == (j > 0)
2470                && Ustrcmp(ipa->address, i2->address) == 0
2471                )
2472               {                         /* found; append port to list */
2473               for (p = i2->log; *p; ) p++;      /* end of existing string   { */
2474               if (*--p == '}') *p = '\0';       /* drop EOL */
2475               while (isdigit(*--p)) ;           /* char before port */
2476
2477               i2->log = *p == ':'               /* no list yet?     { */
2478                 ? string_sprintf("%.*s{%s,%d}",
2479                   (int)(p - i2->log + 1), i2->log, p+1, ipa->port)
2480                 : string_sprintf("%s,%d}", i2->log, ipa->port);
2481               ipa->log = NULL;
2482               break;
2483               }
2484           if (i2 == ipa)                /* first-time IP */
2485             ipa->log = string_sprintf(" [%s]:%d", ipa->address, ipa->port);
2486           }
2487         }
2488       }
2489
2490   p = big_buffer;
2491   for (int j = 0, i; j < 2; j++)
2492     {
2493     /* First time round, look for SMTP ports; second time round, look for
2494     SMTPS ports. For the first one of each, insert leading text. */
2495
2496     if (j == 0)
2497       {
2498       if (smtp_ports > 0)
2499         p += sprintf(CS p, "SMTP on");
2500       }
2501     else
2502       if (smtps_ports > 0)
2503         p += sprintf(CS p, "%sSMTPS on",
2504           smtp_ports == 0 ? "" : " and for ");
2505
2506     /* Now the information about the port (and sometimes interface) */
2507
2508     for (i = 0, ipa = addresses; i < 10 && ipa; i++, ipa = ipa->next)
2509       if (host_is_tls_on_connect_port(ipa->port) == (j > 0))
2510         if (ipa->log)
2511           p += sprintf(CS p, "%s",  ipa->log);
2512
2513     if (ipa)
2514       p += sprintf(CS p, " ...");
2515     }
2516
2517   log_write(0, LOG_MAIN,
2518     "exim %s daemon started: pid=%d, %s, listening for %s",
2519     version_string, getpid(), qinfo, big_buffer);
2520   set_process_info("daemon(%s): %s, listening for %s",
2521     version_string, qinfo, big_buffer);
2522   }
2523
2524 else    /* no listening sockets, only queue-runs */
2525   {
2526   const uschar * s = describe_queue_runners();
2527   log_write(0, LOG_MAIN,
2528     "exim %s daemon started: pid=%d, %s, not listening for SMTP",
2529     version_string, getpid(), s);
2530   set_process_info("daemon(%s): %s, not listening", version_string, s);
2531   }
2532
2533 /* Do any work it might be useful to amortize over our children
2534 (eg: compile regex) */
2535
2536 dns_pattern_init();
2537 smtp_deliver_init();    /* Used for callouts */
2538
2539 #ifndef DISABLE_DKIM
2540   {
2541 # ifdef MEASURE_TIMING
2542   struct timeval t0;
2543   gettimeofday(&t0, NULL);
2544 # endif
2545   dkim_exim_init();
2546 # ifdef MEASURE_TIMING
2547   report_time_since(&t0, US"dkim_exim_init (delta)");
2548 # endif
2549   }
2550 #endif
2551
2552 #ifdef WITH_CONTENT_SCAN
2553 malware_init();
2554 #endif
2555 #ifdef SUPPORT_SPF
2556 spf_init();
2557 #endif
2558 #ifndef DISABLE_TLS
2559 tls_daemon_init();
2560 #endif
2561
2562 /* Add ancillary sockets to the set for select */
2563
2564 poll_fd_count = listen_socket_count;
2565 #ifndef DISABLE_TLS
2566 if (tls_watch_fd >= 0)
2567   {
2568   tls_watch_poll = &fd_polls[poll_fd_count++];
2569   tls_watch_poll->fd = tls_watch_fd;
2570   tls_watch_poll->events = POLLIN;
2571   }
2572 #endif
2573 if (daemon_notifier_fd >= 0)
2574   {
2575   dnotify_poll = &fd_polls[poll_fd_count++];
2576   dnotify_poll->fd = daemon_notifier_fd;
2577   dnotify_poll->events = POLLIN;
2578   }
2579
2580 /* Close the log so it can be renamed and moved. In the few cases below where
2581 this long-running process writes to the log (always exceptional conditions), it
2582 closes the log afterwards, for the same reason. */
2583
2584 log_close_all();
2585
2586 DEBUG(D_any) debug_print_ids(US"daemon running with");
2587
2588 /* Any messages accepted via this route are going to be SMTP. */
2589
2590 smtp_input = TRUE;
2591
2592 #ifdef MEASURE_TIMING
2593 report_time_since(&timestamp_startup, US"daemon loop start");   /* testcase 0022 */
2594 #endif
2595
2596 /* Enter the never-ending loop... */
2597
2598 for (;;)
2599   {
2600   int nolisten_sleep = 60;
2601
2602   if (sigterm_seen)
2603     daemon_die();       /* Does not return */
2604
2605   /* This code is placed first in the loop, so that it gets obeyed at the
2606   start, before the first wait, for the queue-runner case, so that the first
2607   one can be started immediately.
2608
2609   The other option is that we have an inetd wait timeout specified to -bw. */
2610
2611   if (sigalrm_seen)
2612     if (inetd_wait_timeout > 0)
2613       daemon_inetd_wtimeout(last_connection_time);      /* Might not return */
2614     else
2615       nolisten_sleep =
2616         daemon_qrun(local_queue_run_max, fd_polls, listen_socket_count);
2617
2618
2619   /* Sleep till a connection happens if listening, and handle the connection if
2620   that is why we woke up. The FreeBSD operating system requires the use of
2621   select() before accept() because the latter function is not interrupted by
2622   a signal, and we want to wake up for SIGCHLD and SIGALRM signals. Some other
2623   OS do notice signals in accept() but it does no harm to have the select()
2624   in for all of them - and it won't then be a lurking problem for ports to
2625   new OS. In fact, the later addition of listening on specific interfaces only
2626   requires this way of working anyway. */
2627
2628   if (f.daemon_listen)
2629     {
2630     int lcount;
2631     BOOL select_failed = FALSE;
2632
2633     DEBUG(D_any) debug_printf("Listening...\n");
2634
2635     /* In rare cases we may have had a SIGCHLD signal in the time between
2636     setting the handler (below) and getting back here. If so, pretend that the
2637     select() was interrupted so that we reap the child. This might still leave
2638     a small window when a SIGCHLD could get lost. However, since we use SIGCHLD
2639     only to do the reaping more quickly, it shouldn't result in anything other
2640     than a delay until something else causes a wake-up. */
2641
2642     if (sigchld_seen)
2643       {
2644       lcount = -1;
2645       errno = EINTR;
2646       }
2647     else
2648       lcount = poll(fd_polls, poll_fd_count, -1);
2649
2650     if (lcount < 0)
2651       {
2652       select_failed = TRUE;
2653       lcount = 1;
2654       }
2655
2656     /* Clean up any subprocesses that may have terminated. We need to do this
2657     here so that smtp_accept_max_per_host works when a connection to that host
2658     has completed, and we are about to accept a new one. When this code was
2659     later in the sequence, a new connection could be rejected, even though an
2660     old one had just finished. Preserve the errno from any select() failure for
2661     the use of the common select/accept error processing below. */
2662
2663       {
2664       int select_errno = errno;
2665       handle_ending_processes();
2666
2667 #ifndef DISABLE_TLS
2668       {
2669       int old_tfd;
2670       /* Create or rotate any required keys; handle (delayed) filewatch event */
2671
2672       if ((old_tfd = tls_daemon_tick()) >= 0)
2673         for (struct pollfd * p = &fd_polls[listen_socket_count];
2674              p < fd_polls + poll_fd_count; p++)
2675           if (p->fd == old_tfd) { p->fd = tls_watch_fd ; break; }
2676       }
2677 #endif
2678       errno = select_errno;
2679       }
2680
2681     /* Loop for all the sockets that are currently ready to go. If select
2682     actually failed, we have set the count to 1 and select_failed=TRUE, so as
2683     to use the common error code for select/accept below. */
2684
2685     while (lcount-- > 0)
2686       {
2687       int accept_socket = -1;
2688 #if HAVE_IPV6
2689       struct sockaddr_in6 accepted;
2690 #else
2691       struct sockaddr_in accepted;
2692 #endif
2693
2694       if (!select_failed)
2695         {
2696 #if !defined(DISABLE_TLS) && (defined(EXIM_HAVE_INOTIFY) || defined(EXIM_HAVE_KEVENT))
2697         if (tls_watch_poll && tls_watch_poll->revents & POLLIN)
2698           {
2699           tls_watch_poll->revents = 0;
2700           tls_watch_trigger_time = time(NULL);  /* Set up delayed event */
2701           tls_watch_discard_event(tls_watch_fd);
2702           break;        /* to top of daemon loop */
2703           }
2704 #endif
2705         if (dnotify_poll && dnotify_poll->revents & POLLIN)
2706           {
2707           dnotify_poll->revents = 0;
2708           sigalrm_seen = daemon_notification();
2709           break;        /* to top of daemon loop */
2710           }
2711         for (struct pollfd * p = fd_polls; p < fd_polls + listen_socket_count;
2712              p++)
2713           if (p->revents & POLLIN)
2714             {
2715             EXIM_SOCKLEN_T alen = sizeof(accepted);
2716 #if defined(__FreeBSD__) && defined(SO_LISTENQLEN)
2717             int backlog;
2718             socklen_t blen = sizeof(backlog);
2719
2720             if (  smtp_backlog_monitor > 0
2721                && getsockopt(p->fd, SOL_SOCKET, SO_LISTENQLEN, &backlog, &blen) == 0)
2722               {
2723               DEBUG(D_interface)
2724                 debug_printf("listen fd %d queue curr %d\n", p->fd, backlog);
2725               smtp_listen_backlog = backlog;
2726               }
2727
2728 #elif defined(TCP_INFO) && defined(EXIM_HAVE_TCPI_UNACKED)
2729             struct tcp_info ti;
2730             socklen_t tlen = sizeof(ti);
2731
2732             /* If monitoring the backlog is wanted, grab for later logging */
2733
2734             smtp_listen_backlog = 0;
2735             if (  smtp_backlog_monitor > 0
2736                && getsockopt(p->fd, IPPROTO_TCP, TCP_INFO, &ti, &tlen) == 0)
2737               {
2738               DEBUG(D_interface) debug_printf("listen fd %d queue max %u curr %u\n",
2739                       p->fd, ti.tcpi_sacked, ti.tcpi_unacked);
2740               smtp_listen_backlog = ti.tcpi_unacked;
2741               }
2742 #endif
2743             p->revents = 0;
2744             accept_socket = accept(p->fd, (struct sockaddr *)&accepted, &alen);
2745             break;
2746             }
2747         }
2748
2749       /* If select or accept has failed and this was not caused by an
2750       interruption, log the incident and try again. With asymmetric TCP/IP
2751       routing errors such as "No route to network" have been seen here. Also
2752       "connection reset by peer" has been seen. These cannot be classed as
2753       disastrous errors, but they could fill up a lot of log. The code in smail
2754       crashes the daemon after 10 successive failures of accept, on the grounds
2755       that some OS fail continuously. Exim originally followed suit, but this
2756       appears to have caused problems. Now it just keeps going, but instead of
2757       logging each error, it batches them up when they are continuous. */
2758
2759       if (accept_socket < 0 && errno != EINTR)
2760         {
2761         if (accept_retry_count == 0)
2762           {
2763           accept_retry_errno = errno;
2764           accept_retry_select_failed = select_failed;
2765           }
2766         else if (  errno != accept_retry_errno
2767                 || select_failed != accept_retry_select_failed
2768                 || accept_retry_count >= 50)
2769           {
2770           log_write(0, LOG_MAIN | (accept_retry_count >= 50 ? LOG_PANIC : 0),
2771             "%d %s() failure%s: %s",
2772             accept_retry_count,
2773             accept_retry_select_failed ? "select" : "accept",
2774             accept_retry_count == 1 ? "" : "s",
2775             strerror(accept_retry_errno));
2776           log_close_all();
2777           accept_retry_count = 0;
2778           accept_retry_errno = errno;
2779           accept_retry_select_failed = select_failed;
2780           }
2781         accept_retry_count++;
2782         }
2783       else if (accept_retry_count > 0)
2784         {
2785         log_write(0, LOG_MAIN, "%d %s() failure%s: %s",
2786           accept_retry_count,
2787           accept_retry_select_failed ? "select" : "accept",
2788           accept_retry_count == 1 ? "" : "s",
2789           strerror(accept_retry_errno));
2790         log_close_all();
2791         accept_retry_count = 0;
2792         }
2793
2794       /* If select/accept succeeded, deal with the connection. */
2795
2796       if (accept_socket >= 0)
2797         {
2798 #ifdef TCP_QUICKACK /* Avoid pure-ACKs while in tls protocol pingpong phase */
2799         /* Unfortunately we cannot be certain to do this before a TLS-on-connect
2800         Client Hello arrives and is acked. We do it as early as possible. */
2801         (void) setsockopt(accept_socket, IPPROTO_TCP, TCP_QUICKACK, US &off, sizeof(off));
2802 #endif
2803         if (inetd_wait_timeout)
2804           last_connection_time = time(NULL);
2805         handle_smtp_call(fd_polls, listen_socket_count, accept_socket,
2806           (struct sockaddr *)&accepted);
2807         }
2808       }
2809     }
2810
2811   /* If not listening, then just sleep for the queue interval. If we woke
2812   up early the last time for some other signal, it won't matter because
2813   the alarm signal will wake at the right time. This code originally used
2814   sleep() but it turns out that on the FreeBSD system, sleep() is not inter-
2815   rupted by signals, so it wasn't waking up for SIGALRM or SIGCHLD. Luckily
2816   select() can be used as an interruptible sleep() on all versions of Unix. */
2817
2818   else
2819     {
2820     struct pollfd p;
2821     poll(&p, 0, nolisten_sleep * 1000);
2822     handle_ending_processes();
2823     }
2824
2825   /* Re-enable the SIGCHLD handler if it has been run. It can't do it
2826   for itself, because it isn't doing the waiting itself. */
2827
2828   if (sigchld_seen)
2829     {
2830     sigchld_seen = FALSE;
2831     os_non_restarting_signal(SIGCHLD, main_sigchld_handler);
2832     }
2833
2834   /* Handle being woken by SIGHUP. We know at this point that the result
2835   of accept() has been dealt with, so we can re-exec exim safely, first
2836   closing the listening sockets so that they can be reused. Cancel any pending
2837   alarm in case it is just about to go off, and set SIGHUP to be ignored so
2838   that another HUP in quick succession doesn't clobber the new daemon before it
2839   gets going. All log files get closed by the close-on-exec flag; however, if
2840   the exec fails, we need to close the logs. */
2841
2842   if (sighup_seen)
2843     {
2844     log_write(0, LOG_MAIN, "pid %d: SIGHUP received: re-exec daemon",
2845       getpid());
2846     close_daemon_sockets(daemon_notifier_fd, fd_polls, listen_socket_count);
2847     unlink_notifier_socket();
2848     ALARM_CLR(0);
2849     signal(SIGHUP, SIG_IGN);
2850     sighup_argv[0] = exim_path;
2851     exim_nullstd();
2852     execv(CS exim_path, (char *const *)sighup_argv);
2853     log_write(0, LOG_MAIN|LOG_PANIC_DIE, "pid %d: exec of %s failed: %s",
2854       getpid(), exim_path, strerror(errno));
2855     log_close_all();
2856     }
2857
2858   }   /* End of main loop */
2859
2860 /* Control never reaches here */
2861 }
2862
2863 /* vi: aw ai sw=2
2864 */
2865 /* End of exim_daemon.c */