refactor
[exim.git] / src / src / daemon.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) The Exim Maintainers 2020 - 2022 */
6 /* Copyright (c) University of Cambridge 1995 - 2018 */
7 /* See the file NOTICE for conditions of use and distribution. */
8 /* SPDX-License-Identifier: GPL-2.0-or-later */
9
10 /* Functions concerned with running Exim as a daemon */
11
12
13 #include "exim.h"
14
15
16 /* Structure for holding data for each SMTP connection */
17
18 typedef struct smtp_slot {
19   pid_t pid;                       /* pid of the spawned reception process */
20   uschar *host_address;            /* address of the client host */
21 } smtp_slot;
22
23 /* An empty slot for initializing (Standard C does not allow constructor
24 expressions in assignments except as initializers in declarations). */
25
26 static smtp_slot empty_smtp_slot = { .pid = 0, .host_address = NULL };
27
28
29
30 /*************************************************
31 *               Local static variables           *
32 *************************************************/
33
34 static SIGNAL_BOOL sigchld_seen;
35 static SIGNAL_BOOL sighup_seen;
36 static SIGNAL_BOOL sigterm_seen;
37
38 static int   accept_retry_count = 0;
39 static int   accept_retry_errno;
40 static BOOL  accept_retry_select_failed;
41
42 static int   queue_run_count = 0;
43 static pid_t *queue_pid_slots = NULL;
44 static smtp_slot *smtp_slots = NULL;
45
46 static BOOL  write_pid = TRUE;
47
48 #ifndef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
49 static uschar * notifier_socket_name;
50 #endif
51
52
53 /*************************************************
54 *             SIGHUP Handler                     *
55 *************************************************/
56
57 /* All this handler does is to set a flag and re-enable the signal.
58
59 Argument: the signal number
60 Returns:  nothing
61 */
62
63 static void
64 sighup_handler(int sig)
65 {
66 sighup_seen = TRUE;
67 signal(SIGHUP, sighup_handler);
68 }
69
70
71
72 /*************************************************
73 *     SIGCHLD handler for main daemon process    *
74 *************************************************/
75
76 /* Don't re-enable the handler here, since we aren't doing the
77 waiting here. If the signal is re-enabled, there will just be an
78 infinite sequence of calls to this handler. The SIGCHLD signal is
79 used just as a means of waking up the daemon so that it notices
80 terminated subprocesses as soon as possible.
81
82 Argument: the signal number
83 Returns:  nothing
84 */
85
86 static void
87 main_sigchld_handler(int sig)
88 {
89 os_non_restarting_signal(SIGCHLD, SIG_DFL);
90 sigchld_seen = TRUE;
91 }
92
93
94 /* SIGTERM handler.  Try to get the daemon pid file removed
95 before exiting. */
96
97 static void
98 main_sigterm_handler(int sig)
99 {
100 sigterm_seen = TRUE;
101 }
102
103
104
105
106 /*************************************************
107 *          Unexpected errors in SMTP calls       *
108 *************************************************/
109
110 /* This function just saves a bit of repetitious coding.
111
112 Arguments:
113   log_msg        Text of message to be logged
114   smtp_msg       Text of SMTP error message
115   was_errno      The failing errno
116
117 Returns:         nothing
118 */
119
120 static void
121 never_error(uschar *log_msg, uschar *smtp_msg, int was_errno)
122 {
123 uschar *emsg = was_errno <= 0
124   ? US"" : string_sprintf(": %s", strerror(was_errno));
125 log_write(0, LOG_MAIN|LOG_PANIC, "%s%s", log_msg, emsg);
126 if (smtp_out) smtp_printf("421 %s\r\n", FALSE, smtp_msg);
127 }
128
129
130
131
132 /*************************************************
133 *************************************************/
134
135 static void
136 unlink_notifier_socket(void)
137 {
138 #ifndef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
139 DEBUG(D_any) debug_printf("unlinking notifier socket %s\n", notifier_socket_name);
140 Uunlink(notifier_socket_name);
141 #endif
142 }
143
144
145 static void
146 close_daemon_sockets(int daemon_notifier_fd,
147   struct pollfd * fd_polls, int listen_socket_count)
148 {
149 if (daemon_notifier_fd >= 0)
150   {
151   (void) close(daemon_notifier_fd);
152   daemon_notifier_fd = -1;
153   }
154
155 for (int i = 0; i < listen_socket_count; i++) (void) close(fd_polls[i].fd);
156 }
157
158
159 /*************************************************
160 *            Handle a connected SMTP call        *
161 *************************************************/
162
163 /* This function is called when an SMTP connection has been accepted.
164 If there are too many, give an error message and close down. Otherwise
165 spin off a sub-process to handle the call. The list of listening sockets
166 is required so that they can be closed in the sub-process. Take care not to
167 leak store in this process - reset the stacking pool at the end.
168
169 Arguments:
170   fd_polls        sockets which are listening for incoming calls
171   listen_socket_count   count of listening sockets
172   accept_socket         socket of the current accepted call
173   accepted              socket information about the current call
174
175 Returns:            nothing
176 */
177
178 static void
179 handle_smtp_call(struct pollfd *fd_polls, int listen_socket_count,
180   int accept_socket, struct sockaddr *accepted)
181 {
182 pid_t pid;
183 union sockaddr_46 interface_sockaddr;
184 EXIM_SOCKLEN_T ifsize = sizeof(interface_sockaddr);
185 int dup_accept_socket = -1;
186 int max_for_this_host = 0;
187 int save_log_selector = *log_selector;
188 gstring * whofrom;
189
190 rmark reset_point = store_mark();
191
192 /* Make the address available in ASCII representation, and also fish out
193 the remote port. */
194
195 sender_host_address = host_ntoa(-1, accepted, NULL, &sender_host_port);
196 DEBUG(D_any) debug_printf("Connection request from %s port %d\n",
197   sender_host_address, sender_host_port);
198
199 /* Set up the output stream, check the socket has duplicated, and set up the
200 input stream. These operations fail only the exceptional circumstances. Note
201 that never_error() won't use smtp_out if it is NULL. */
202
203 if (!(smtp_out = fdopen(accept_socket, "wb")))
204   {
205   never_error(US"daemon: fdopen() for smtp_out failed", US"", errno);
206   goto ERROR_RETURN;
207   }
208
209 if ((dup_accept_socket = dup(accept_socket)) < 0)
210   {
211   never_error(US"daemon: couldn't dup socket descriptor",
212     US"Connection setup failed", errno);
213   goto ERROR_RETURN;
214   }
215
216 if (!(smtp_in = fdopen(dup_accept_socket, "rb")))
217   {
218   never_error(US"daemon: fdopen() for smtp_in failed",
219     US"Connection setup failed", errno);
220   goto ERROR_RETURN;
221   }
222
223 /* Get the data for the local interface address. Panic for most errors, but
224 "connection reset by peer" just means the connection went away. */
225
226 if (getsockname(accept_socket, (struct sockaddr *)(&interface_sockaddr),
227      &ifsize) < 0)
228   {
229   log_write(0, LOG_MAIN | ((errno == ECONNRESET)? 0 : LOG_PANIC),
230     "getsockname() failed: %s", strerror(errno));
231   smtp_printf("421 Local problem: getsockname() failed; please try again later\r\n", FALSE);
232   goto ERROR_RETURN;
233   }
234
235 interface_address = host_ntoa(-1, &interface_sockaddr, NULL, &interface_port);
236 DEBUG(D_interface) debug_printf("interface address=%s port=%d\n",
237   interface_address, interface_port);
238
239 /* Build a string identifying the remote host and, if requested, the port and
240 the local interface data. This is for logging; at the end of this function the
241 memory is reclaimed. */
242
243 whofrom = string_append(NULL, 3, "[", sender_host_address, "]");
244
245 if (LOGGING(incoming_port))
246   whofrom = string_fmt_append(whofrom, ":%d", sender_host_port);
247
248 if (LOGGING(incoming_interface))
249   whofrom = string_fmt_append(whofrom, " I=[%s]:%d",
250     interface_address, interface_port);
251
252 (void) string_from_gstring(whofrom);    /* Terminate the newly-built string */
253
254 /* Check maximum number of connections. We do not check for reserved
255 connections or unacceptable hosts here. That is done in the subprocess because
256 it might take some time. */
257
258 if (smtp_accept_max > 0 && smtp_accept_count >= smtp_accept_max)
259   {
260   DEBUG(D_any) debug_printf("rejecting SMTP connection: count=%d max=%d\n",
261     smtp_accept_count, smtp_accept_max);
262   smtp_printf("421 Too many concurrent SMTP connections; "
263     "please try again later.\r\n", FALSE);
264   log_write(L_connection_reject,
265             LOG_MAIN, "Connection from %s refused: too many connections",
266     whofrom->s);
267   goto ERROR_RETURN;
268   }
269
270 /* If a load limit above which only reserved hosts are acceptable is defined,
271 get the load average here, and if there are in fact no reserved hosts, do
272 the test right away (saves a fork). If there are hosts, do the check in the
273 subprocess because it might take time. */
274
275 if (smtp_load_reserve >= 0)
276   {
277   load_average = OS_GETLOADAVG();
278   if (!smtp_reserve_hosts && load_average > smtp_load_reserve)
279     {
280     DEBUG(D_any) debug_printf("rejecting SMTP connection: load average = %.2f\n",
281       (double)load_average/1000.0);
282     smtp_printf("421 Too much load; please try again later.\r\n", FALSE);
283     log_write(L_connection_reject,
284               LOG_MAIN, "Connection from %s refused: load average = %.2f",
285       whofrom->s, (double)load_average/1000.0);
286     goto ERROR_RETURN;
287     }
288   }
289
290 /* Check that one specific host (strictly, IP address) is not hogging
291 resources. This is done here to prevent a denial of service attack by someone
292 forcing you to fork lots of times before denying service. The value of
293 smtp_accept_max_per_host is a string which is expanded. This makes it possible
294 to provide host-specific limits according to $sender_host address, but because
295 this is in the daemon mainline, only fast expansions (such as inline address
296 checks) should be used. The documentation is full of warnings. */
297
298 if (smtp_accept_max_per_host)
299   {
300   uschar *expanded = expand_string(smtp_accept_max_per_host);
301   if (!expanded)
302     {
303     if (!f.expand_string_forcedfail)
304       log_write(0, LOG_MAIN|LOG_PANIC, "expansion of smtp_accept_max_per_host "
305         "failed for %s: %s", whofrom->s, expand_string_message);
306     }
307   /* For speed, interpret a decimal number inline here */
308   else
309     {
310     uschar *s = expanded;
311     while (isdigit(*s))
312       max_for_this_host = max_for_this_host * 10 + *s++ - '0';
313     if (*s)
314       log_write(0, LOG_MAIN|LOG_PANIC, "expansion of smtp_accept_max_per_host "
315         "for %s contains non-digit: %s", whofrom->s, expanded);
316     }
317   }
318
319 /* If we have fewer connections than max_for_this_host, we can skip the tedious
320 per host_address checks. Note that at this stage smtp_accept_count contains the
321 count of *other* connections, not including this one. */
322
323 if (max_for_this_host > 0 && smtp_accept_count >= max_for_this_host)
324   {
325   int host_accept_count = 0;
326   int other_host_count = 0;    /* keep a count of non matches to optimise */
327
328   for (int i = 0; i < smtp_accept_max; ++i)
329     if (smtp_slots[i].host_address)
330       {
331       if (Ustrcmp(sender_host_address, smtp_slots[i].host_address) == 0)
332        host_accept_count++;
333       else
334        other_host_count++;
335
336       /* Testing all these strings is expensive - see if we can drop out
337       early, either by hitting the target, or finding there are not enough
338       connections left to make the target. */
339
340       if (  host_accept_count >= max_for_this_host
341          || smtp_accept_count - other_host_count < max_for_this_host)
342        break;
343       }
344
345   if (host_accept_count >= max_for_this_host)
346     {
347     DEBUG(D_any) debug_printf("rejecting SMTP connection: too many from this "
348       "IP address: count=%d max=%d\n",
349       host_accept_count, max_for_this_host);
350     smtp_printf("421 Too many concurrent SMTP connections "
351       "from this IP address; please try again later.\r\n", FALSE);
352     log_write(L_connection_reject,
353               LOG_MAIN, "Connection from %s refused: too many connections "
354       "from that IP address", whofrom->s);
355     search_tidyup();
356     goto ERROR_RETURN;
357     }
358   }
359
360 /* OK, the connection count checks have been passed. Before we can fork the
361 accepting process, we must first log the connection if requested. This logging
362 used to happen in the subprocess, but doing that means that the value of
363 smtp_accept_count can be out of step by the time it is logged. So we have to do
364 the logging here and accept the performance cost. Note that smtp_accept_count
365 hasn't yet been incremented to take account of this connection.
366
367 In order to minimize the cost (because this is going to happen for every
368 connection), do a preliminary selector test here. This saves ploughing through
369 the generalized logging code each time when the selector is false. If the
370 selector is set, check whether the host is on the list for logging. If not,
371 arrange to unset the selector in the subprocess. */
372
373 if (LOGGING(smtp_connection))
374   {
375   uschar *list = hosts_connection_nolog;
376   memset(sender_host_cache, 0, sizeof(sender_host_cache));
377   if (list && verify_check_host(&list) == OK)
378     save_log_selector &= ~L_smtp_connection;
379   else
380     log_write(L_smtp_connection, LOG_MAIN, "SMTP connection from %s "
381       "(TCP/IP connection count = %d)", whofrom->s, smtp_accept_count + 1);
382   }
383
384 /* Now we can fork the accepting process; do a lookup tidy, just in case any
385 expansion above did a lookup. */
386
387 search_tidyup();
388 pid = exim_fork(US"daemon-accept");
389
390 /* Handle the child process */
391
392 if (pid == 0)
393   {
394   int queue_only_reason = 0;
395   int old_pool = store_pool;
396   int save_debug_selector = debug_selector;
397   BOOL local_queue_only;
398   BOOL session_local_queue_only;
399 #ifdef SA_NOCLDWAIT
400   struct sigaction act;
401 #endif
402
403   smtp_accept_count++;    /* So that it includes this process */
404
405   /* If the listen backlog was over the monitoring level, log it. */
406
407   if (smtp_listen_backlog > smtp_backlog_monitor)
408     log_write(0, LOG_MAIN, "listen backlog %d I=[%s]:%d",
409                 smtp_listen_backlog, interface_address, interface_port);
410
411   /* May have been modified for the subprocess */
412
413   *log_selector = save_log_selector;
414
415   /* Get the local interface address into permanent store */
416
417   store_pool = POOL_PERM;
418   interface_address = string_copy(interface_address);
419   store_pool = old_pool;
420
421   /* Check for a tls-on-connect port */
422
423   if (host_is_tls_on_connect_port(interface_port)) tls_in.on_connect = TRUE;
424
425   /* Expand smtp_active_hostname if required. We do not do this any earlier,
426   because it may depend on the local interface address (indeed, that is most
427   likely what it depends on.) */
428
429   smtp_active_hostname = primary_hostname;
430   if (raw_active_hostname)
431     {
432     uschar * nah = expand_string(raw_active_hostname);
433     if (!nah)
434       {
435       if (!f.expand_string_forcedfail)
436         {
437         log_write(0, LOG_MAIN|LOG_PANIC, "failed to expand \"%s\" "
438           "(smtp_active_hostname): %s", raw_active_hostname,
439           expand_string_message);
440         smtp_printf("421 Local configuration error; "
441           "please try again later.\r\n", FALSE);
442         mac_smtp_fflush();
443         search_tidyup();
444         exim_underbar_exit(EXIT_FAILURE);
445         }
446       }
447     else if (*nah) smtp_active_hostname = nah;
448     }
449
450   /* Initialize the queueing flags */
451
452   queue_check_only();
453   session_local_queue_only = queue_only;
454
455   /* Close the listening sockets, and set the SIGCHLD handler to SIG_IGN.
456   We also attempt to set things up so that children are automatically reaped,
457   but just in case this isn't available, there's a paranoid waitpid() in the
458   loop too (except for systems where we are sure it isn't needed). See the more
459   extensive comment before the reception loop in exim.c for a fuller
460   explanation of this logic. */
461
462   close_daemon_sockets(daemon_notifier_fd, fd_polls, listen_socket_count);
463
464   /* Set FD_CLOEXEC on the SMTP socket. We don't want any rogue child processes
465   to be able to communicate with them, under any circumstances. */
466   (void)fcntl(accept_socket, F_SETFD,
467               fcntl(accept_socket, F_GETFD) | FD_CLOEXEC);
468   (void)fcntl(dup_accept_socket, F_SETFD,
469               fcntl(dup_accept_socket, F_GETFD) | FD_CLOEXEC);
470
471 #ifdef SA_NOCLDWAIT
472   act.sa_handler = SIG_IGN;
473   sigemptyset(&(act.sa_mask));
474   act.sa_flags = SA_NOCLDWAIT;
475   sigaction(SIGCHLD, &act, NULL);
476 #else
477   signal(SIGCHLD, SIG_IGN);
478 #endif
479   signal(SIGTERM, SIG_DFL);
480   signal(SIGINT, SIG_DFL);
481
482   /* Attempt to get an id from the sending machine via the RFC 1413
483   protocol. We do this in the sub-process in order not to hold up the
484   main process if there is any delay. Then set up the fullhost information
485   in case there is no HELO/EHLO.
486
487   If debugging is enabled only for the daemon, we must turn if off while
488   finding the id, but turn it on again afterwards so that information about the
489   incoming connection is output. */
490
491   if (f.debug_daemon) debug_selector = 0;
492   verify_get_ident(IDENT_PORT);
493   host_build_sender_fullhost();
494   debug_selector = save_debug_selector;
495
496   DEBUG(D_any)
497     debug_printf("Process %d is handling incoming connection from %s\n",
498       (int)getpid(), sender_fullhost);
499
500   /* Now disable debugging permanently if it's required only for the daemon
501   process. */
502
503   if (f.debug_daemon) debug_selector = 0;
504
505   /* If there are too many child processes for immediate delivery,
506   set the session_local_queue_only flag, which is initialized from the
507   configured value and may therefore already be TRUE. Leave logging
508   till later so it will have a message id attached. Note that there is no
509   possibility of re-calculating this per-message, because the value of
510   smtp_accept_count does not change in this subprocess. */
511
512   if (smtp_accept_queue > 0 && smtp_accept_count > smtp_accept_queue)
513     {
514     session_local_queue_only = TRUE;
515     queue_only_reason = 1;
516     }
517
518   /* Handle the start of the SMTP session, then loop, accepting incoming
519   messages from the SMTP connection. The end will come at the QUIT command,
520   when smtp_setup_msg() returns 0. A break in the connection causes the
521   process to die (see accept.c).
522
523   NOTE: We do *not* call smtp_log_no_mail() if smtp_start_session() fails,
524   because a log line has already been written for all its failure exists
525   (usually "connection refused: <reason>") and writing another one is
526   unnecessary clutter. */
527
528   if (!smtp_start_session())
529     {
530     mac_smtp_fflush();
531     search_tidyup();
532     exim_underbar_exit(EXIT_SUCCESS);
533     }
534
535   for (;;)
536     {
537     int rc;
538     message_id[0] = 0;            /* Clear out any previous message_id */
539     reset_point = store_mark();   /* Save current store high water point */
540
541     DEBUG(D_any)
542       debug_printf("Process %d is ready for new message\n", (int)getpid());
543
544     /* Smtp_setup_msg() returns 0 on QUIT or if the call is from an
545     unacceptable host or if an ACL "drop" command was triggered, -1 on
546     connection lost, and +1 on validly reaching DATA. Receive_msg() almost
547     always returns TRUE when smtp_input is true; just retry if no message was
548     accepted (can happen for invalid message parameters). However, it can yield
549     FALSE if the connection was forcibly dropped by the DATA ACL. */
550
551     if ((rc = smtp_setup_msg()) > 0)
552       {
553       BOOL ok = receive_msg(FALSE);
554       search_tidyup();                    /* Close cached databases */
555       if (!ok)                            /* Connection was dropped */
556         {
557         cancel_cutthrough_connection(TRUE, US"receive dropped");
558         mac_smtp_fflush();
559         smtp_log_no_mail();               /* Log no mail if configured */
560         exim_underbar_exit(EXIT_SUCCESS);
561         }
562       if (message_id[0] == 0) continue;   /* No message was accepted */
563       }
564     else                                /* bad smtp_setup_msg() */
565       {
566       if (smtp_out)
567         {
568         int fd = fileno(smtp_in);
569         uschar buf[128];
570
571         mac_smtp_fflush();
572         /* drain socket, for clean TCP FINs */
573         if (fcntl(fd, F_SETFL, O_NONBLOCK) == 0)
574           for(int i = 16; read(fd, buf, sizeof(buf)) > 0 && i > 0; ) i--;
575         }
576       cancel_cutthrough_connection(TRUE, US"message setup dropped");
577       search_tidyup();
578       smtp_log_no_mail();                 /* Log no mail if configured */
579
580       /*XXX should we pause briefly, hoping that the client will be the
581       active TCP closer hence get the TCP_WAIT endpoint? */
582       DEBUG(D_receive) debug_printf("SMTP>>(close on process exit)\n");
583       exim_underbar_exit(rc ? EXIT_FAILURE : EXIT_SUCCESS);
584       }
585
586     /* Show the recipients when debugging */
587
588     DEBUG(D_receive)
589       {
590       if (sender_address)
591         debug_printf("Sender: %s\n", sender_address);
592       if (recipients_list)
593         {
594         debug_printf("Recipients:\n");
595         for (int i = 0; i < recipients_count; i++)
596           debug_printf("  %s\n", recipients_list[i].address);
597         }
598       }
599
600     /* A message has been accepted. Clean up any previous delivery processes
601     that have completed and are defunct, on systems where they don't go away
602     by themselves (see comments when setting SIG_IGN above). On such systems
603     (if any) these delivery processes hang around after termination until
604     the next message is received. */
605
606     #ifndef SIG_IGN_WORKS
607     while (waitpid(-1, NULL, WNOHANG) > 0);
608     #endif
609
610     /* Reclaim up the store used in accepting this message */
611
612       {
613       int r = receive_messagecount;
614       BOOL q = f.queue_only_policy;
615       smtp_reset(reset_point);
616       reset_point = NULL;
617       f.queue_only_policy = q;
618       receive_messagecount = r;
619       }
620
621     /* If queue_only is set or if there are too many incoming connections in
622     existence, session_local_queue_only will be TRUE. If it is not, check
623     whether we have received too many messages in this session for immediate
624     delivery. */
625
626     if (!session_local_queue_only &&
627         smtp_accept_queue_per_connection > 0 &&
628         receive_messagecount > smtp_accept_queue_per_connection)
629       {
630       session_local_queue_only = TRUE;
631       queue_only_reason = 2;
632       }
633
634     /* Initialize local_queue_only from session_local_queue_only. If it is not
635     true, and queue_only_load is set, check that the load average is below it.
636     If local_queue_only is set by this means, we also set if for the session if
637     queue_only_load_latch is true (the default). This means that, once set,
638     local_queue_only remains set for any subsequent messages on the same SMTP
639     connection. This is a deliberate choice; even though the load average may
640     fall, it doesn't seem right to deliver later messages on the same call when
641     not delivering earlier ones. However, the are special circumstances such as
642     very long-lived connections from scanning appliances where this is not the
643     best strategy. In such cases, queue_only_load_latch should be set false. */
644
645     if (  !(local_queue_only = session_local_queue_only)
646        && queue_only_load >= 0
647        && (local_queue_only = (load_average = OS_GETLOADAVG()) > queue_only_load)
648        )
649       {
650       queue_only_reason = 3;
651       if (queue_only_load_latch) session_local_queue_only = TRUE;
652       }
653
654     /* Log the queueing here, when it will get a message id attached, but
655     not if queue_only is set (case 0). */
656
657     if (local_queue_only) switch(queue_only_reason)
658       {
659       case 1: log_write(L_delay_delivery,
660                 LOG_MAIN, "no immediate delivery: too many connections "
661                 "(%d, max %d)", smtp_accept_count, smtp_accept_queue);
662               break;
663
664       case 2: log_write(L_delay_delivery,
665                 LOG_MAIN, "no immediate delivery: more than %d messages "
666                 "received in one connection", smtp_accept_queue_per_connection);
667               break;
668
669       case 3: log_write(L_delay_delivery,
670                 LOG_MAIN, "no immediate delivery: load average %.2f",
671                 (double)load_average/1000.0);
672               break;
673       }
674
675     /* If a delivery attempt is required, spin off a new process to handle it.
676     If we are not root, we have to re-exec exim unless deliveries are being
677     done unprivileged. */
678
679     else if (  (!f.queue_only_policy || f.queue_smtp)
680             && !f.deliver_freeze)
681       {
682       pid_t dpid;
683
684       /* We used to flush smtp_out before forking so that buffered data was not
685       duplicated, but now we want to pipeline the responses for data and quit.
686       Instead, hard-close the fd underlying smtp_out right after fork to discard
687       the data buffer. */
688
689       if ((dpid = exim_fork(US"daemon-accept-delivery")) == 0)
690         {
691         (void)fclose(smtp_in);
692         (void)close(fileno(smtp_out));
693         (void)fclose(smtp_out);
694         smtp_in = smtp_out = NULL;
695
696         /* Don't ever molest the parent's SSL connection, but do clean up
697         the data structures if necessary. */
698
699 #ifndef DISABLE_TLS
700         tls_close(NULL, TLS_NO_SHUTDOWN);
701 #endif
702
703         /* Reset SIGHUP and SIGCHLD in the child in both cases. */
704
705         signal(SIGHUP,  SIG_DFL);
706         signal(SIGCHLD, SIG_DFL);
707         signal(SIGTERM, SIG_DFL);
708         signal(SIGINT, SIG_DFL);
709
710         if (geteuid() != root_uid && !deliver_drop_privilege)
711           {
712           signal(SIGALRM, SIG_DFL);
713           delivery_re_exec(CEE_EXEC_PANIC);
714           /* Control does not return here. */
715           }
716
717         /* No need to re-exec; SIGALRM remains set to the default handler */
718
719         (void) deliver_message(message_id, FALSE, FALSE);
720         search_tidyup();
721         exim_underbar_exit(EXIT_SUCCESS);
722         }
723
724       if (dpid > 0)
725         {
726         release_cutthrough_connection(US"passed for delivery");
727         DEBUG(D_any) debug_printf("forked delivery process %d\n", (int)dpid);
728         }
729       else
730         {
731         cancel_cutthrough_connection(TRUE, US"delivery fork failed");
732         log_write(0, LOG_MAIN|LOG_PANIC, "daemon: delivery process fork "
733           "failed: %s", strerror(errno));
734         }
735       }
736     }
737   }
738
739
740 /* Carrying on in the parent daemon process... Can't do much if the fork
741 failed. Otherwise, keep count of the number of accepting processes and
742 remember the pid for ticking off when the child completes. */
743
744 if (pid < 0)
745   never_error(US"daemon: accept process fork failed", US"Fork failed", errno);
746 else
747   {
748   for (int i = 0; i < smtp_accept_max; ++i)
749     if (smtp_slots[i].pid <= 0)
750       {
751       smtp_slots[i].pid = pid;
752       /* Connection closes come asyncronously, so we cannot stack this store */
753       if (smtp_accept_max_per_host)
754         smtp_slots[i].host_address = string_copy_malloc(sender_host_address);
755       smtp_accept_count++;
756       break;
757       }
758   DEBUG(D_any) debug_printf("%d SMTP accept process%s running\n",
759     smtp_accept_count, smtp_accept_count == 1 ? "" : "es");
760   }
761
762 /* Get here via goto in error cases */
763
764 ERROR_RETURN:
765
766 /* Close the streams associated with the socket which will also close the
767 socket fds in this process. We can't do anything if fclose() fails, but
768 logging brings it to someone's attention. However, "connection reset by peer"
769 isn't really a problem, so skip that one. On Solaris, a dropped connection can
770 manifest itself as a broken pipe, so drop that one too. If the streams don't
771 exist, something went wrong while setting things up. Make sure the socket
772 descriptors are closed, in order to drop the connection. */
773
774 if (smtp_out)
775   {
776   if (fclose(smtp_out) != 0 && errno != ECONNRESET && errno != EPIPE)
777     log_write(0, LOG_MAIN|LOG_PANIC, "daemon: fclose(smtp_out) failed: %s",
778       strerror(errno));
779   smtp_out = NULL;
780   }
781 else (void)close(accept_socket);
782
783 if (smtp_in)
784   {
785   if (fclose(smtp_in) != 0 && errno != ECONNRESET && errno != EPIPE)
786     log_write(0, LOG_MAIN|LOG_PANIC, "daemon: fclose(smtp_in) failed: %s",
787       strerror(errno));
788   smtp_in = NULL;
789   }
790 else (void)close(dup_accept_socket);
791
792 /* Release any store used in this process, including the store used for holding
793 the incoming host address and an expanded active_hostname. */
794
795 log_close_all();
796 interface_address = sender_host_name = sender_host_address = NULL;
797 store_reset(reset_point);
798 }
799
800
801
802
803 /*************************************************
804 *       Check wildcard listen special cases      *
805 *************************************************/
806
807 /* This function is used when binding and listening on lists of addresses and
808 ports. It tests for special cases of wildcard listening, when IPv4 and IPv6
809 sockets may interact in different ways in different operating systems. It is
810 passed an error number, the list of listening addresses, and the current
811 address. Two checks are available: for a previous wildcard IPv6 address, or for
812 a following wildcard IPv4 address, in both cases on the same port.
813
814 In practice, pairs of wildcard addresses should be adjacent in the address list
815 because they are sorted that way below.
816
817 Arguments:
818   eno            the error number
819   addresses      the list of addresses
820   ipa            the current IP address
821   back           if TRUE, check for previous wildcard IPv6 address
822                  if FALSE, check for a following wildcard IPv4 address
823
824 Returns:         TRUE or FALSE
825 */
826
827 static BOOL
828 check_special_case(int eno, ip_address_item *addresses, ip_address_item *ipa,
829   BOOL back)
830 {
831 ip_address_item *ipa2;
832
833 /* For the "back" case, if the failure was "address in use" for a wildcard IPv4
834 address, seek a previous IPv6 wildcard address on the same port. As it is
835 previous, it must have been successfully bound and be listening. Flag it as a
836 "6 including 4" listener. */
837
838 if (back)
839   {
840   if (eno != EADDRINUSE || ipa->address[0] != 0) return FALSE;
841   for (ipa2 = addresses; ipa2 != ipa; ipa2 = ipa2->next)
842     {
843     if (ipa2->address[1] == 0 && ipa2->port == ipa->port)
844       {
845       ipa2->v6_include_v4 = TRUE;
846       return TRUE;
847       }
848     }
849   }
850
851 /* For the "forward" case, if the current address is a wildcard IPv6 address,
852 we seek a following wildcard IPv4 address on the same port. */
853
854 else
855   {
856   if (ipa->address[0] != ':' || ipa->address[1] != 0) return FALSE;
857   for (ipa2 = ipa->next; ipa2 != NULL; ipa2 = ipa2->next)
858     if (ipa2->address[0] == 0 && ipa->port == ipa2->port) return TRUE;
859   }
860
861 return FALSE;
862 }
863
864
865
866
867 /*************************************************
868 *         Handle terminating subprocesses        *
869 *************************************************/
870
871 /* Handle the termination of child processes. Theoretically, this need be done
872 only when sigchld_seen is TRUE, but rumour has it that some systems lose
873 SIGCHLD signals at busy times, so to be on the safe side, this function is
874 called each time round. It shouldn't be too expensive.
875
876 Arguments:  none
877 Returns:    nothing
878 */
879
880 static void
881 handle_ending_processes(void)
882 {
883 int status;
884 pid_t pid;
885
886 while ((pid = waitpid(-1, &status, WNOHANG)) > 0)
887   {
888   DEBUG(D_any)
889     {
890     debug_printf("child %d ended: status=0x%x\n", (int)pid, status);
891 #ifdef WCOREDUMP
892     if (WIFEXITED(status))
893       debug_printf("  normal exit, %d\n", WEXITSTATUS(status));
894     else if (WIFSIGNALED(status))
895       debug_printf("  signal exit, signal %d%s\n", WTERMSIG(status),
896           WCOREDUMP(status) ? " (core dumped)" : "");
897 #endif
898     }
899
900   /* If it's a listening daemon for which we are keeping track of individual
901   subprocesses, deal with an accepting process that has terminated. */
902
903   if (smtp_slots)
904     {
905     int i;
906     for (i = 0; i < smtp_accept_max; i++)
907       if (smtp_slots[i].pid == pid)
908         {
909         if (smtp_slots[i].host_address)
910           store_free(smtp_slots[i].host_address);
911         smtp_slots[i] = empty_smtp_slot;
912         if (--smtp_accept_count < 0) smtp_accept_count = 0;
913         DEBUG(D_any) debug_printf("%d SMTP accept process%s now running\n",
914           smtp_accept_count, (smtp_accept_count == 1)? "" : "es");
915         break;
916         }
917     if (i < smtp_accept_max) continue;  /* Found an accepting process */
918     }
919
920   /* If it wasn't an accepting process, see if it was a queue-runner
921   process that we are tracking. */
922
923   if (queue_pid_slots)
924     {
925     int max = atoi(CS expand_string(queue_run_max));
926     for (int i = 0; i < max; i++)
927       if (queue_pid_slots[i] == pid)
928         {
929         queue_pid_slots[i] = 0;
930         if (--queue_run_count < 0) queue_run_count = 0;
931         DEBUG(D_any) debug_printf("%d queue-runner process%s now running\n",
932           queue_run_count, (queue_run_count == 1)? "" : "es");
933         break;
934         }
935     }
936   }
937 }
938
939
940 static void
941 set_pid_file_path(void)
942 {
943 if (override_pid_file_path)
944   pid_file_path = override_pid_file_path;
945
946 if (!*pid_file_path)
947   pid_file_path = string_sprintf("%s/exim-daemon.pid", spool_directory);
948
949 if (pid_file_path[0] != '/')
950   log_write(0, LOG_PANIC_DIE, "pid file path %s must be absolute\n", pid_file_path);
951 }
952
953
954 enum pid_op { PID_WRITE, PID_CHECK, PID_DELETE };
955
956 /* Do various pid file operations as safe as possible. Ideally we'd just
957 drop the privileges for creation of the pid file and not care at all about removal of
958 the file. FIXME.
959 Returns: true on success, false + errno==EACCES otherwise
960 */
961
962 static BOOL
963 operate_on_pid_file(const enum pid_op operation, const pid_t pid)
964 {
965 char pid_line[sizeof(int) * 3 + 2];
966 const int pid_len = snprintf(pid_line, sizeof(pid_line), "%d\n", (int)pid);
967 BOOL lines_match = FALSE;
968 uschar * path, * base, * dir;
969
970 const int dir_flags = O_RDONLY | O_NONBLOCK;
971 const int base_flags = O_NOFOLLOW | O_NONBLOCK;
972 const mode_t base_mode = 0644;
973 struct stat sb;
974 int cwd_fd = -1, dir_fd = -1, base_fd = -1;
975 BOOL success = FALSE;
976 errno = EACCES;
977
978 set_pid_file_path();
979 if (!f.running_in_test_harness && real_uid != root_uid && real_uid != exim_uid) goto cleanup;
980 if (pid_len < 2 || pid_len >= (int)sizeof(pid_line)) goto cleanup;
981
982 path = string_copy(pid_file_path);
983 if ((base = Ustrrchr(path, '/')) == NULL)       /* should not happen, but who knows */
984   log_write(0, LOG_MAIN|LOG_PANIC_DIE, "pid file path \"%s\" does not contain a '/'", pid_file_path);
985
986 dir = base != path ? path : US"/";
987 *base++ = '\0';
988
989 if (!dir || !*dir || *dir != '/') goto cleanup;
990 if (!base || !*base || Ustrchr(base, '/') != NULL) goto cleanup;
991
992 cwd_fd = open(".", dir_flags);
993 if (cwd_fd < 0 || fstat(cwd_fd, &sb) != 0 || !S_ISDIR(sb.st_mode)) goto cleanup;
994 dir_fd = open(CS dir, dir_flags);
995 if (dir_fd < 0 || fstat(dir_fd, &sb) != 0 || !S_ISDIR(sb.st_mode)) goto cleanup;
996
997 /* emulate openat */
998 if (fchdir(dir_fd) != 0) goto cleanup;
999 base_fd = open(CS base, O_RDONLY | base_flags);
1000 if (fchdir(cwd_fd) != 0)
1001   log_write(0, LOG_MAIN|LOG_PANIC_DIE, "can't return to previous working dir: %s", strerror(errno));
1002
1003 if (base_fd >= 0)
1004   {
1005   char line[sizeof(pid_line)];
1006   ssize_t len = -1;
1007
1008   if (fstat(base_fd, &sb) != 0 || !S_ISREG(sb.st_mode)) goto cleanup;
1009   if ((sb.st_mode & 07777) != base_mode || sb.st_nlink != 1) goto cleanup;
1010   if (sb.st_size < 2 || sb.st_size >= (off_t)sizeof(line)) goto cleanup;
1011
1012   len = read(base_fd, line, sizeof(line));
1013   if (len != (ssize_t)sb.st_size) goto cleanup;
1014   line[len] = '\0';
1015
1016   if (strspn(line, "0123456789") != (size_t)len-1) goto cleanup;
1017   if (line[len-1] != '\n') goto cleanup;
1018   lines_match = len == pid_len && strcmp(line, pid_line) == 0;
1019   }
1020
1021 if (operation == PID_WRITE)
1022   {
1023   if (!lines_match)
1024     {
1025     if (base_fd >= 0)
1026       {
1027       int error = -1;
1028       /* emulate unlinkat */
1029       if (fchdir(dir_fd) != 0) goto cleanup;
1030       error = unlink(CS base);
1031       if (fchdir(cwd_fd) != 0)
1032         log_write(0, LOG_MAIN|LOG_PANIC_DIE, "can't return to previous working dir: %s", strerror(errno));
1033       if (error) goto cleanup;
1034       (void)close(base_fd);
1035       base_fd = -1;
1036      }
1037     /* emulate openat */
1038     if (fchdir(dir_fd) != 0) goto cleanup;
1039     base_fd = open(CS base, O_WRONLY | O_CREAT | O_EXCL | base_flags, base_mode);
1040     if (fchdir(cwd_fd) != 0)
1041         log_write(0, LOG_MAIN|LOG_PANIC_DIE, "can't return to previous working dir: %s", strerror(errno));
1042     if (base_fd < 0) goto cleanup;
1043     if (fchmod(base_fd, base_mode) != 0) goto cleanup;
1044     if (write(base_fd, pid_line, pid_len) != pid_len) goto cleanup;
1045     DEBUG(D_any) debug_printf("pid written to %s\n", pid_file_path);
1046     }
1047   }
1048 else
1049   {
1050   if (!lines_match) goto cleanup;
1051   if (operation == PID_DELETE)
1052     {
1053     int error = -1;
1054     /* emulate unlinkat */
1055     if (fchdir(dir_fd) != 0) goto cleanup;
1056     error = unlink(CS base);
1057     if (fchdir(cwd_fd) != 0)
1058         log_write(0, LOG_MAIN|LOG_PANIC_DIE, "can't return to previous working dir: %s", strerror(errno));
1059     if (error) goto cleanup;
1060     }
1061   }
1062
1063 success = TRUE;
1064 errno = 0;
1065
1066 cleanup:
1067 if (cwd_fd >= 0) (void)close(cwd_fd);
1068 if (dir_fd >= 0) (void)close(dir_fd);
1069 if (base_fd >= 0) (void)close(base_fd);
1070 return success;
1071 }
1072
1073
1074 /* Remove the daemon's pidfile.  Note: runs with root privilege,
1075 as a direct child of the daemon.  Does not return. */
1076
1077 void
1078 delete_pid_file(void)
1079 {
1080 const BOOL success = operate_on_pid_file(PID_DELETE, getppid());
1081
1082 DEBUG(D_any)
1083   debug_printf("delete pid file %s %s: %s\n", pid_file_path,
1084     success ? "success" : "failure", strerror(errno));
1085
1086 exim_exit(EXIT_SUCCESS);
1087 }
1088
1089
1090 /* Called by the daemon; exec a child to get the pid file deleted
1091 since we may require privs for the containing directory */
1092
1093 static void
1094 daemon_die(void)
1095 {
1096 int pid;
1097
1098 DEBUG(D_any) debug_printf("SIGTERM/SIGINT seen\n");
1099 #if !defined(DISABLE_TLS) && (defined(EXIM_HAVE_INOTIFY) || defined(EXIM_HAVE_KEVENT))
1100 tls_watch_invalidate();
1101 #endif
1102
1103 if (daemon_notifier_fd >= 0)
1104   {
1105   close(daemon_notifier_fd);
1106   daemon_notifier_fd = -1;
1107   unlink_notifier_socket();
1108   }
1109
1110 if (f.running_in_test_harness || write_pid)
1111   {
1112   if ((pid = exim_fork(US"daemon-del-pidfile")) == 0)
1113     {
1114     if (override_pid_file_path)
1115       (void)child_exec_exim(CEE_EXEC_PANIC, FALSE, NULL, FALSE, 3,
1116         "-oP", override_pid_file_path, "-oPX");
1117     else
1118       (void)child_exec_exim(CEE_EXEC_PANIC, FALSE, NULL, FALSE, 1, "-oPX");
1119
1120     /* Control never returns here. */
1121     }
1122   if (pid > 0)
1123     child_close(pid, 1);
1124   }
1125 exim_exit(EXIT_SUCCESS);
1126 }
1127
1128
1129 /*************************************************
1130 *       Listener socket for local work prompts   *
1131 *************************************************/
1132
1133 ssize_t
1134 daemon_client_sockname(struct sockaddr_un * sup, uschar ** sname)
1135 {
1136 #ifdef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
1137 sup->sun_path[0] = 0;  /* Abstract local socket addr - Linux-specific? */
1138 return offsetof(struct sockaddr_un, sun_path) + 1
1139   + snprintf(sup->sun_path+1, sizeof(sup->sun_path)-1, "exim_%d", getpid());
1140 #else
1141 *sname = string_sprintf("%s/p_%d", spool_directory, getpid());
1142 return offsetof(struct sockaddr_un, sun_path)
1143   + snprintf(sup->sun_path, sizeof(sup->sun_path), "%s", CS *sname);
1144 #endif
1145 }
1146
1147 ssize_t
1148 daemon_notifier_sockname(struct sockaddr_un * sup)
1149 {
1150 #ifdef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
1151 sup->sun_path[0] = 0;  /* Abstract local socket addr - Linux-specific? */
1152 return offsetof(struct sockaddr_un, sun_path) + 1
1153   + snprintf(sup->sun_path+1, sizeof(sup->sun_path)-1, "%s",
1154               CS expand_string(notifier_socket));
1155 #else
1156 notifier_socket_name = expand_string(notifier_socket);
1157 return offsetof(struct sockaddr_un, sun_path)
1158   + snprintf(sup->sun_path, sizeof(sup->sun_path), "%s",
1159               CS notifier_socket_name);
1160 #endif
1161 }
1162
1163
1164 static void
1165 daemon_notifier_socket(void)
1166 {
1167 int fd;
1168 const uschar * where;
1169 struct sockaddr_un sa_un = {.sun_family = AF_UNIX};
1170 ssize_t len;
1171
1172 if (!f.notifier_socket_en)
1173   {
1174   DEBUG(D_any) debug_printf("-oY used so not creating notifier socket\n");
1175   return;
1176   }
1177 if (override_local_interfaces && !override_pid_file_path)
1178   {
1179   DEBUG(D_any)
1180     debug_printf("-oX used without -oP so not creating notifier socket\n");
1181   return;
1182   }
1183 if (!notifier_socket || !*notifier_socket)
1184   {
1185   DEBUG(D_any) debug_printf("no name for notifier socket\n");
1186   return;
1187   }
1188
1189 DEBUG(D_any) debug_printf("creating notifier socket\n");
1190
1191 #ifdef SOCK_CLOEXEC
1192 if ((fd = socket(PF_UNIX, SOCK_DGRAM|SOCK_CLOEXEC, 0)) < 0)
1193   { where = US"socket"; goto bad; }
1194 #else
1195 if ((fd = socket(PF_UNIX, SOCK_DGRAM, 0)) < 0)
1196   { where = US"socket"; goto bad; }
1197 (void)fcntl(fd, F_SETFD, fcntl(fd, F_GETFD) | FD_CLOEXEC);
1198 #endif
1199
1200 len = daemon_notifier_sockname(&sa_un);
1201
1202 #ifdef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
1203 DEBUG(D_any) debug_printf(" @%s\n", sa_un.sun_path+1);
1204 #else                   /* filesystem-visible and persistent; will neeed removal */
1205 DEBUG(D_any) debug_printf(" %s\n", sa_un.sun_path);
1206 #endif
1207
1208 if (bind(fd, (const struct sockaddr *)&sa_un, (socklen_t)len) < 0)
1209   { where = US"bind"; goto bad; }
1210
1211 #ifdef SO_PASSCRED              /* Linux */
1212 if (setsockopt(fd, SOL_SOCKET, SO_PASSCRED, &on, sizeof(on)) < 0)
1213   { where = US"SO_PASSCRED"; goto bad2; }
1214 #elif defined(LOCAL_CREDS)      /* FreeBSD-ish */
1215 if (setsockopt(fd, 0, LOCAL_CREDS, &on, sizeof(on)) < 0)
1216   { where = US"LOCAL_CREDS"; goto bad2; }
1217 #endif
1218
1219 /* debug_printf("%s: fd %d\n", __FUNCTION__, fd); */
1220 daemon_notifier_fd = fd;
1221 return;
1222
1223 bad2:
1224 #ifndef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
1225   Uunlink(sa_un.sun_path);
1226 #endif
1227 bad:
1228   log_write(0, LOG_MAIN|LOG_PANIC, "%s %s: %s",
1229     __FUNCTION__, where, strerror(errno));
1230   close(fd);
1231   return;
1232 }
1233
1234
1235 static uschar queuerun_msgid[MESSAGE_ID_LENGTH+1];
1236
1237 /* The notifier socket has something to read. Pull the message from it, decode
1238 and do the action.
1239
1240 Return TRUE if a sigalrm should be emulated */
1241
1242 static BOOL
1243 daemon_notification(void)
1244 {
1245 uschar buf[256], cbuf[256];
1246 struct sockaddr_un sa_un;
1247 struct iovec iov = {.iov_base = buf, .iov_len = sizeof(buf)-1};
1248 struct msghdr msg = { .msg_name = &sa_un,
1249                       .msg_namelen = sizeof(sa_un),
1250                       .msg_iov = &iov,
1251                       .msg_iovlen = 1,
1252                       .msg_control = cbuf,
1253                       .msg_controllen = sizeof(cbuf)
1254                     };
1255 ssize_t sz;
1256
1257 buf[sizeof(buf)-1] = 0;
1258 if ((sz = recvmsg(daemon_notifier_fd, &msg, 0)) <= 0) return FALSE;
1259 if (sz >= sizeof(buf)) return FALSE;
1260
1261 #ifdef notdef
1262 debug_printf("addrlen %d\n", msg.msg_namelen);
1263 #endif
1264 DEBUG(D_queue_run)
1265   if (msg.msg_namelen > 0)
1266     {
1267     BOOL abstract = !*sa_un.sun_path;
1268     char * name = sa_un.sun_path + (abstract ? 1 : 0);
1269     int namelen =  (int)msg.msg_namelen - abstract ? 1 : 0;
1270     if (*name)
1271       debug_printf("%s from addr '%s%.*s'\n", __FUNCTION__,
1272         abstract ? "@" : "",
1273         namelen, name);
1274     else
1275       debug_printf("%s (from unknown addr)\n", __FUNCTION__);
1276     }
1277   else
1278     debug_printf("%s (from unknown addr)\n", __FUNCTION__);
1279
1280 /* Refuse to handle the item unless the peer has good credentials */
1281 #ifdef SCM_CREDENTIALS
1282 # define EXIM_SCM_CR_TYPE SCM_CREDENTIALS
1283 #elif defined(LOCAL_CREDS) && defined(SCM_CREDS)
1284 # define EXIM_SCM_CR_TYPE SCM_CREDS
1285 #else
1286         /* The OS has no way to get the creds of the caller (for a unix/datagram socket.
1287         Punt; don't try to check. */
1288 #endif
1289
1290 #ifdef EXIM_SCM_CR_TYPE
1291 for (struct cmsghdr * cp = CMSG_FIRSTHDR(&msg);
1292      cp;
1293      cp = CMSG_NXTHDR(&msg, cp))
1294   if (cp->cmsg_level == SOL_SOCKET && cp->cmsg_type == EXIM_SCM_CR_TYPE)
1295   {
1296 # ifdef SCM_CREDENTIALS                                 /* Linux */
1297   struct ucred * cr = (struct ucred *) CMSG_DATA(cp);
1298   if (cr->uid && cr->uid != exim_uid)
1299     {
1300     DEBUG(D_queue_run) debug_printf("%s: sender creds pid %d uid %d gid %d\n",
1301       __FUNCTION__, (int)cr->pid, (int)cr->uid, (int)cr->gid);
1302     }
1303 # elif defined(LOCAL_CREDS)                             /* BSD-ish */
1304   struct sockcred * cr = (struct sockcred *) CMSG_DATA(cp);
1305   if (cr->sc_uid && cr->sc_uid != exim_uid)
1306     {
1307     DEBUG(D_queue_run) debug_printf("%s: sender creds pid ??? uid %d gid %d\n",
1308       __FUNCTION__, (int)cr->sc_uid, (int)cr->sc_gid);
1309     }
1310 # endif
1311   break;
1312   }
1313 #endif
1314
1315 buf[sz] = 0;
1316 switch (buf[0])
1317   {
1318 #ifndef DISABLE_QUEUE_RAMP
1319   case NOTIFY_MSG_QRUN:
1320     /* this should be a message_id */
1321     DEBUG(D_queue_run)
1322       debug_printf("%s: qrunner trigger: %s\n", __FUNCTION__, buf+1);
1323     memcpy(queuerun_msgid, buf+1, MESSAGE_ID_LENGTH+1);
1324     return TRUE;
1325 #endif
1326
1327   case NOTIFY_QUEUE_SIZE_REQ:
1328     {
1329     uschar buf[16];
1330     int len = snprintf(CS buf, sizeof(buf), "%u", queue_count_cached());
1331
1332     DEBUG(D_queue_run)
1333       debug_printf("%s: queue size request: %s\n", __FUNCTION__, buf);
1334
1335     if (sendto(daemon_notifier_fd, buf, len, 0,
1336                 (const struct sockaddr *)&sa_un, msg.msg_namelen) < 0)
1337       log_write(0, LOG_MAIN|LOG_PANIC,
1338         "%s: sendto: %s\n", __FUNCTION__, strerror(errno));
1339     break;
1340     }
1341
1342   case NOTIFY_REGEX:
1343     regex_at_daemon(buf);
1344     break;
1345   }
1346 return FALSE;
1347 }
1348
1349
1350
1351 static void
1352 daemon_inetd_wtimeout(time_t last_connection_time)
1353 {
1354 time_t resignal_interval = inetd_wait_timeout;
1355
1356 if (last_connection_time == (time_t)0)
1357   {
1358   DEBUG(D_any)
1359     debug_printf("inetd wait timeout expired, but still not seen first message, ignoring\n");
1360   }
1361 else
1362   {
1363   time_t now = time(NULL);
1364   if (now == (time_t)-1)
1365     {
1366     DEBUG(D_any) debug_printf("failed to get time: %s\n", strerror(errno));
1367     }
1368   else if ((now - last_connection_time) >= inetd_wait_timeout)
1369     {
1370     DEBUG(D_any)
1371       debug_printf("inetd wait timeout %d expired, ending daemon\n",
1372           inetd_wait_timeout);
1373     log_write(0, LOG_MAIN, "exim %s daemon terminating, inetd wait timeout reached.\n",
1374         version_string);
1375     daemon_die();               /* Does not return */
1376     }
1377   else
1378     resignal_interval -= (now - last_connection_time);
1379   }
1380
1381 sigalrm_seen = FALSE;
1382 ALARM(resignal_interval);
1383 }
1384
1385
1386 static void
1387 daemon_qrun(int local_queue_run_max, struct pollfd * fd_polls, int listen_socket_count)
1388 {
1389 DEBUG(D_any) debug_printf("%s received\n",
1390 #ifndef DISABLE_QUEUE_RAMP
1391   *queuerun_msgid ? "qrun notification" :
1392 #endif
1393   "SIGALRM");
1394
1395 /* Do a full queue run in a child process, if required, unless we already
1396 have enough queue runners on the go. If we are not running as root, a
1397 re-exec is required. */
1398
1399 if (  queue_interval > 0
1400    && (local_queue_run_max <= 0 || queue_run_count < local_queue_run_max))
1401   {
1402 pid_t pid;
1403
1404   if ((pid = exim_fork(US"queue-runner")) == 0)
1405     {
1406     /* Disable debugging if it's required only for the daemon process. We
1407     leave the above message, because it ties up with the "child ended"
1408     debugging messages. */
1409
1410     if (f.debug_daemon) debug_selector = 0;
1411
1412     /* Close any open listening sockets in the child */
1413
1414     close_daemon_sockets(daemon_notifier_fd,
1415       fd_polls, listen_socket_count);
1416
1417     /* Reset SIGHUP and SIGCHLD in the child in both cases. */
1418
1419     signal(SIGHUP,  SIG_DFL);
1420     signal(SIGCHLD, SIG_DFL);
1421     signal(SIGTERM, SIG_DFL);
1422     signal(SIGINT, SIG_DFL);
1423
1424     /* Re-exec if privilege has been given up, unless deliver_drop_
1425     privilege is set. Reset SIGALRM before exec(). */
1426
1427     if (geteuid() != root_uid && !deliver_drop_privilege)
1428       {
1429       uschar opt[8];
1430       uschar *p = opt;
1431       uschar *extra[7];
1432       int extracount = 1;
1433
1434       signal(SIGALRM, SIG_DFL);
1435       *p++ = '-';
1436       *p++ = 'q';
1437       if (  f.queue_2stage
1438 #ifndef DISABLE_QUEUE_RAMP
1439          && !*queuerun_msgid
1440 #endif
1441          ) *p++ = 'q';
1442       if (f.queue_run_first_delivery) *p++ = 'i';
1443       if (f.queue_run_force) *p++ = 'f';
1444       if (f.deliver_force_thaw) *p++ = 'f';
1445       if (f.queue_run_local) *p++ = 'l';
1446       *p = 0;
1447       extra[0] = *queue_name
1448         ? string_sprintf("%sG%s", opt, queue_name) : opt;
1449
1450 #ifndef DISABLE_QUEUE_RAMP
1451       if (*queuerun_msgid)
1452         {
1453         log_write(0, LOG_MAIN, "notify triggered queue run");
1454         extra[extracount++] = queuerun_msgid;   /* Trigger only the */
1455         extra[extracount++] = queuerun_msgid;   /* one message      */
1456         }
1457 #endif
1458
1459       /* If -R or -S were on the original command line, ensure they get
1460       passed on. */
1461
1462       if (deliver_selectstring)
1463         {
1464         extra[extracount++] = f.deliver_selectstring_regex ? US"-Rr" : US"-R";
1465         extra[extracount++] = deliver_selectstring;
1466         }
1467
1468       if (deliver_selectstring_sender)
1469         {
1470         extra[extracount++] = f.deliver_selectstring_sender_regex
1471           ? US"-Sr" : US"-S";
1472         extra[extracount++] = deliver_selectstring_sender;
1473         }
1474
1475       /* Overlay this process with a new execution. */
1476
1477       (void)child_exec_exim(CEE_EXEC_PANIC, FALSE, NULL, FALSE, extracount,
1478         extra[0], extra[1], extra[2], extra[3], extra[4], extra[5], extra[6]);
1479
1480       /* Control never returns here. */
1481       }
1482
1483     /* No need to re-exec; SIGALRM remains set to the default handler */
1484
1485 #ifndef DISABLE_QUEUE_RAMP
1486     if (*queuerun_msgid)
1487       {
1488       log_write(0, LOG_MAIN, "notify triggered queue run");
1489       f.queue_2stage = FALSE;
1490       queue_run(queuerun_msgid, queuerun_msgid, FALSE);
1491       }
1492     else
1493 #endif
1494       queue_run(NULL, NULL, FALSE);
1495     exim_underbar_exit(EXIT_SUCCESS);
1496     }
1497
1498   if (pid < 0)
1499     {
1500     log_write(0, LOG_MAIN|LOG_PANIC, "daemon: fork of queue-runner "
1501       "process failed: %s", strerror(errno));
1502     log_close_all();
1503     }
1504   else
1505     {
1506     for (int i = 0; i < local_queue_run_max; ++i)
1507       if (queue_pid_slots[i] <= 0)
1508         {
1509         queue_pid_slots[i] = pid;
1510         queue_run_count++;
1511         break;
1512         }
1513     DEBUG(D_any) debug_printf("%d queue-runner process%s running\n",
1514       queue_run_count, queue_run_count == 1 ? "" : "es");
1515     }
1516   }
1517
1518 /* Reset the alarm clock */
1519
1520 sigalrm_seen = FALSE;
1521 #ifndef DISABLE_QUEUE_RAMP
1522 if (*queuerun_msgid)
1523   *queuerun_msgid = 0;
1524 else
1525 #endif
1526   ALARM(queue_interval);
1527 }
1528
1529 /*************************************************
1530 *              Exim Daemon Mainline              *
1531 *************************************************/
1532
1533 /* The daemon can do two jobs, either of which is optional:
1534
1535 (1) Listens for incoming SMTP calls and spawns off a sub-process to handle
1536 each one. This is requested by the -bd option, with -oX specifying the SMTP
1537 port on which to listen (for testing).
1538
1539 (2) Spawns a queue-running process every so often. This is controlled by the
1540 -q option with a an interval time. (If no time is given, a single queue run
1541 is done from the main function, and control doesn't get here.)
1542
1543 Root privilege is required in order to attach to port 25. Some systems require
1544 it when calling socket() rather than bind(). To cope with all cases, we run as
1545 root for both socket() and bind(). Some systems also require root in order to
1546 write to the pid file directory. This function must therefore be called as root
1547 if it is to work properly in all circumstances. Once the socket is bound and
1548 the pid file written, root privilege is given up if there is an exim uid.
1549
1550 There are no arguments to this function, and it never returns. */
1551
1552 void
1553 daemon_go(void)
1554 {
1555 struct passwd * pw;
1556 struct pollfd * fd_polls, * tls_watch_poll = NULL, * dnotify_poll = NULL;
1557 int listen_socket_count = 0, poll_fd_count;
1558 ip_address_item * addresses = NULL;
1559 time_t last_connection_time = (time_t)0;
1560 int local_queue_run_max = atoi(CS expand_string(queue_run_max));
1561
1562 process_purpose = US"daemon";
1563
1564 /* If any debugging options are set, turn on the D_pid bit so that all
1565 debugging lines get the pid added. */
1566
1567 DEBUG(D_any|D_v) debug_selector |= D_pid;
1568
1569 /* Allocate enough pollstructs for inetd mode plus the ancillary sockets;
1570 also used when there are no listen sockets. */
1571
1572 fd_polls = store_get(sizeof(struct pollfd) * 3, GET_UNTAINTED);
1573
1574 if (f.inetd_wait_mode)
1575   {
1576   listen_socket_count = 1;
1577   (void) close(3);
1578   if (dup2(0, 3) == -1)
1579     log_write(0, LOG_MAIN|LOG_PANIC_DIE,
1580         "failed to dup inetd socket safely away: %s", strerror(errno));
1581
1582   fd_polls[0].fd = 3;
1583   fd_polls[0].events = POLLIN;
1584   (void) close(0);
1585   (void) close(1);
1586   (void) close(2);
1587   exim_nullstd();
1588
1589   if (debug_file == stderr)
1590     {
1591     /* need a call to log_write before call to open debug_file, so that
1592     log.c:file_path has been initialised.  This is unfortunate. */
1593     log_write(0, LOG_MAIN, "debugging Exim in inetd wait mode starting");
1594
1595     fclose(debug_file);
1596     debug_file = NULL;
1597     exim_nullstd(); /* re-open fd2 after we just closed it again */
1598     debug_logging_activate(US"-wait", NULL);
1599     }
1600
1601   DEBUG(D_any) debug_printf("running in inetd wait mode\n");
1602
1603   /* As per below, when creating sockets ourselves, we handle tcp_nodelay for
1604   our own buffering; we assume though that inetd set the socket REUSEADDR. */
1605
1606   if (tcp_nodelay)
1607     if (setsockopt(3, IPPROTO_TCP, TCP_NODELAY, US &on, sizeof(on)))
1608       log_write(0, LOG_MAIN|LOG_PANIC_DIE, "failed to set socket NODELAY: %s",
1609         strerror(errno));
1610   }
1611
1612
1613 if (f.inetd_wait_mode || f.daemon_listen)
1614   {
1615   /* If any option requiring a load average to be available during the
1616   reception of a message is set, call os_getloadavg() while we are root
1617   for those OS for which this is necessary the first time it is called (in
1618   order to perform an "open" on the kernel memory file). */
1619
1620 #ifdef LOAD_AVG_NEEDS_ROOT
1621   if (queue_only_load >= 0 || smtp_load_reserve >= 0 ||
1622        (deliver_queue_load_max >= 0 && deliver_drop_privilege))
1623     (void)os_getloadavg();
1624 #endif
1625   }
1626
1627
1628 /* Do the preparation for setting up a listener on one or more interfaces, and
1629 possible on various ports. This is controlled by the combination of
1630 local_interfaces (which can set IP addresses and ports) and daemon_smtp_port
1631 (which is a list of default ports to use for those items in local_interfaces
1632 that do not specify a port). The -oX command line option can be used to
1633 override one or both of these options.
1634
1635 If local_interfaces is not set, the default is to listen on all interfaces.
1636 When it is set, it can include "all IPvx interfaces" as an item. This is useful
1637 when different ports are in use.
1638
1639 It turns out that listening on all interfaces is messy in an IPv6 world,
1640 because several different implementation approaches have been taken. This code
1641 is now supposed to work with all of them. The point of difference is whether an
1642 IPv6 socket that is listening on all interfaces will receive incoming IPv4
1643 calls or not. We also have to cope with the case when IPv6 libraries exist, but
1644 there is no IPv6 support in the kernel.
1645
1646 . On Solaris, an IPv6 socket will accept IPv4 calls, and give them as mapped
1647   addresses. However, if an IPv4 socket is also listening on all interfaces,
1648   calls are directed to the appropriate socket.
1649
1650 . On (some versions of) Linux, an IPv6 socket will accept IPv4 calls, and
1651   give them as mapped addresses, but an attempt also to listen on an IPv4
1652   socket on all interfaces causes an error.
1653
1654 . On OpenBSD, an IPv6 socket will not accept IPv4 calls. You have to set up
1655   two sockets if you want to accept both kinds of call.
1656
1657 . FreeBSD is like OpenBSD, but it has the IPV6_V6ONLY socket option, which
1658   can be turned off, to make it behave like the versions of Linux described
1659   above.
1660
1661 . I heard a report that the USAGI IPv6 stack for Linux has implemented
1662   IPV6_V6ONLY.
1663
1664 So, what we do when IPv6 is supported is as follows:
1665
1666  (1) After it is set up, the list of interfaces is scanned for wildcard
1667      addresses. If an IPv6 and an IPv4 wildcard are both found for the same
1668      port, the list is re-arranged so that they are together, with the IPv6
1669      wildcard first.
1670
1671  (2) If the creation of a wildcard IPv6 socket fails, we just log the error and
1672      carry on if an IPv4 wildcard socket for the same port follows later in the
1673      list. This allows Exim to carry on in the case when the kernel has no IPv6
1674      support.
1675
1676  (3) Having created an IPv6 wildcard socket, we try to set IPV6_V6ONLY if that
1677      option is defined. However, if setting fails, carry on regardless (but log
1678      the incident).
1679
1680  (4) If binding or listening on an IPv6 wildcard socket fails, it is a serious
1681      error.
1682
1683  (5) If binding or listening on an IPv4 wildcard socket fails with the error
1684      EADDRINUSE, and a previous interface was an IPv6 wildcard for the same
1685      port (which must have succeeded or we wouldn't have got this far), we
1686      assume we are in the situation where just a single socket is permitted,
1687      and ignore the error.
1688
1689 Phew!
1690
1691 The preparation code decodes options and sets up the relevant data. We do this
1692 first, so that we can return non-zero if there are any syntax errors, and also
1693 write to stderr. */
1694
1695 if (f.daemon_listen && !f.inetd_wait_mode)
1696   {
1697   int *default_smtp_port;
1698   int sep;
1699   int pct = 0;
1700   uschar *s;
1701   const uschar * list;
1702   uschar *local_iface_source = US"local_interfaces";
1703   ip_address_item *ipa;
1704   ip_address_item **pipa;
1705
1706   /* If -oX was used, disable the writing of a pid file unless -oP was
1707   explicitly used to force it. Then scan the string given to -oX. Any items
1708   that contain neither a dot nor a colon are used to override daemon_smtp_port.
1709   Any other items are used to override local_interfaces. */
1710
1711   if (override_local_interfaces)
1712     {
1713     gstring * new_smtp_port = NULL;
1714     gstring * new_local_interfaces = NULL;
1715
1716     if (!override_pid_file_path) write_pid = FALSE;
1717
1718     list = override_local_interfaces;
1719     sep = 0;
1720     while ((s = string_nextinlist(&list, &sep, NULL, 0)))
1721       {
1722       uschar joinstr[4];
1723       gstring ** gp = Ustrpbrk(s, ".:") ? &new_local_interfaces : &new_smtp_port;
1724
1725       if (!*gp)
1726         {
1727         joinstr[0] = sep;
1728         joinstr[1] = ' ';
1729         *gp = string_catn(*gp, US"<", 1);
1730         }
1731
1732       *gp = string_catn(*gp, joinstr, 2);
1733       *gp = string_cat (*gp, s);
1734       }
1735
1736     if (new_smtp_port)
1737       {
1738       daemon_smtp_port = string_from_gstring(new_smtp_port);
1739       DEBUG(D_any) debug_printf("daemon_smtp_port overridden by -oX:\n  %s\n",
1740         daemon_smtp_port);
1741       }
1742
1743     if (new_local_interfaces)
1744       {
1745       local_interfaces = string_from_gstring(new_local_interfaces);
1746       local_iface_source = US"-oX data";
1747       DEBUG(D_any) debug_printf("local_interfaces overridden by -oX:\n  %s\n",
1748         local_interfaces);
1749       }
1750     }
1751
1752   /* Create a list of default SMTP ports, to be used if local_interfaces
1753   contains entries without explicit ports. First count the number of ports, then
1754   build a translated list in a vector. */
1755
1756   list = daemon_smtp_port;
1757   sep = 0;
1758   while ((s = string_nextinlist(&list, &sep, NULL, 0)))
1759     pct++;
1760   default_smtp_port = store_get((pct+1) * sizeof(int), GET_UNTAINTED);
1761   list = daemon_smtp_port;
1762   sep = 0;
1763   for (pct = 0;
1764        (s = string_nextinlist(&list, &sep, NULL, 0));
1765        pct++)
1766     {
1767     if (isdigit(*s))
1768       {
1769       uschar *end;
1770       default_smtp_port[pct] = Ustrtol(s, &end, 0);
1771       if (end != s + Ustrlen(s))
1772         log_write(0, LOG_PANIC_DIE|LOG_CONFIG, "invalid SMTP port: %s", s);
1773       }
1774     else
1775       {
1776       struct servent *smtp_service = getservbyname(CS s, "tcp");
1777       if (!smtp_service)
1778         log_write(0, LOG_PANIC_DIE|LOG_CONFIG, "TCP port \"%s\" not found", s);
1779       default_smtp_port[pct] = ntohs(smtp_service->s_port);
1780       }
1781     }
1782   default_smtp_port[pct] = 0;
1783
1784   /* Check the list of TLS-on-connect ports and do name lookups if needed */
1785
1786   list = tls_in.on_connect_ports;
1787   sep = 0;
1788   /* the list isn't expanded so cannot be tainted.  If it ever is we will trap here */
1789   while ((s = string_nextinlist(&list, &sep, big_buffer, big_buffer_size)))
1790     if (!isdigit(*s))
1791       {
1792       gstring * g = NULL;
1793
1794       list = tls_in.on_connect_ports;
1795       tls_in.on_connect_ports = NULL;
1796       sep = 0;
1797       while ((s = string_nextinlist(&list, &sep, big_buffer, big_buffer_size)))
1798         {
1799         if (!isdigit(*s))
1800           {
1801           struct servent * smtp_service = getservbyname(CS s, "tcp");
1802           if (!smtp_service)
1803             log_write(0, LOG_PANIC_DIE|LOG_CONFIG, "TCP port \"%s\" not found", s);
1804           s = string_sprintf("%d", (int)ntohs(smtp_service->s_port));
1805           }
1806         g = string_append_listele(g, ':', s);
1807         }
1808       if (g)
1809         tls_in.on_connect_ports = g->s;
1810       break;
1811       }
1812
1813   /* Create the list of local interfaces, possibly with ports included. This
1814   list may contain references to 0.0.0.0 and ::0 as wildcards. These special
1815   values are converted below. */
1816
1817   addresses = host_build_ifacelist(local_interfaces, local_iface_source);
1818
1819   /* In the list of IP addresses, convert 0.0.0.0 into an empty string, and ::0
1820   into the string ":". We use these to recognize wildcards in IPv4 and IPv6. In
1821   fact, many IP stacks recognize 0.0.0.0 and ::0 and handle them as wildcards
1822   anyway, but we need to know which are the wildcard addresses, and the shorter
1823   strings are neater.
1824
1825   In the same scan, fill in missing port numbers from the default list. When
1826   there is more than one item in the list, extra items are created. */
1827
1828   for (ipa = addresses; ipa; ipa = ipa->next)
1829     {
1830     if (Ustrcmp(ipa->address, "0.0.0.0") == 0)
1831       ipa->address[0] = 0;
1832     else if (Ustrcmp(ipa->address, "::0") == 0)
1833       {
1834       ipa->address[0] = ':';
1835       ipa->address[1] = 0;
1836       }
1837
1838     if (ipa->port > 0) continue;
1839
1840     if (daemon_smtp_port[0] <= 0)
1841       log_write(0, LOG_MAIN|LOG_PANIC_DIE, "no port specified for interface "
1842         "%s and daemon_smtp_port is unset; cannot start daemon",
1843         ipa->address[0] == 0 ? US"\"all IPv4\"" :
1844         ipa->address[1] == 0 ? US"\"all IPv6\"" : ipa->address);
1845
1846     ipa->port = default_smtp_port[0];
1847     for (int i = 1; default_smtp_port[i] > 0; i++)
1848       {
1849       ip_address_item * new = store_get(sizeof(ip_address_item), GET_UNTAINTED);
1850
1851       memcpy(new->address, ipa->address, Ustrlen(ipa->address) + 1);
1852       new->port = default_smtp_port[i];
1853       new->next = ipa->next;
1854       ipa->next = new;
1855       ipa = new;
1856       }
1857     }
1858
1859   /* Scan the list of addresses for wildcards. If we find an IPv4 and an IPv6
1860   wildcard for the same port, ensure that (a) they are together and (b) the
1861   IPv6 address comes first. This makes handling the messy features easier, and
1862   also simplifies the construction of the "daemon started" log line. */
1863
1864   pipa = &addresses;
1865   for (ipa = addresses; ipa; pipa = &ipa->next, ipa = ipa->next)
1866     {
1867     ip_address_item *ipa2;
1868
1869     /* Handle an IPv4 wildcard */
1870
1871     if (ipa->address[0] == 0)
1872       for (ipa2 = ipa; ipa2->next; ipa2 = ipa2->next)
1873         {
1874         ip_address_item *ipa3 = ipa2->next;
1875         if (ipa3->address[0] == ':' &&
1876             ipa3->address[1] == 0 &&
1877             ipa3->port == ipa->port)
1878           {
1879           ipa2->next = ipa3->next;
1880           ipa3->next = ipa;
1881           *pipa = ipa3;
1882           break;
1883           }
1884         }
1885
1886     /* Handle an IPv6 wildcard. */
1887
1888     else if (ipa->address[0] == ':' && ipa->address[1] == 0)
1889       for (ipa2 = ipa; ipa2->next; ipa2 = ipa2->next)
1890         {
1891         ip_address_item *ipa3 = ipa2->next;
1892         if (ipa3->address[0] == 0 && ipa3->port == ipa->port)
1893           {
1894           ipa2->next = ipa3->next;
1895           ipa3->next = ipa->next;
1896           ipa->next = ipa3;
1897           ipa = ipa3;
1898           break;
1899           }
1900         }
1901     }
1902
1903   /* Get a vector to remember all the sockets in.
1904   Two extra elements for the ancillary sockets */
1905
1906   for (ipa = addresses; ipa; ipa = ipa->next)
1907     listen_socket_count++;
1908   fd_polls = store_get(sizeof(struct pollfd) * (listen_socket_count + 2),
1909                             GET_UNTAINTED);
1910   for (struct pollfd * p = fd_polls; p < fd_polls + listen_socket_count + 2;
1911        p++)
1912     { p->fd = -1; p->events = POLLIN; }
1913
1914   } /* daemon_listen but not inetd_wait_mode */
1915
1916 if (f.daemon_listen)
1917   {
1918
1919   /* Do a sanity check on the max connects value just to save us from getting
1920   a huge amount of store. */
1921
1922   if (smtp_accept_max > 4095) smtp_accept_max = 4096;
1923
1924   /* There's no point setting smtp_accept_queue unless it is less than the max
1925   connects limit. The configuration reader ensures that the max is set if the
1926   queue-only option is set. */
1927
1928   if (smtp_accept_queue > smtp_accept_max) smtp_accept_queue = 0;
1929
1930   /* Get somewhere to keep the list of SMTP accepting pids if we are keeping
1931   track of them for total number and queue/host limits. */
1932
1933   if (smtp_accept_max > 0)
1934     {
1935     smtp_slots = store_get(smtp_accept_max * sizeof(smtp_slot), GET_UNTAINTED);
1936     for (int i = 0; i < smtp_accept_max; i++) smtp_slots[i] = empty_smtp_slot;
1937     }
1938   }
1939
1940 /* The variable background_daemon is always false when debugging, but
1941 can also be forced false in order to keep a non-debugging daemon in the
1942 foreground. If background_daemon is true, close all open file descriptors that
1943 we know about, but then re-open stdin, stdout, and stderr to /dev/null.  Also
1944 do this for inetd_wait mode.
1945
1946 This is protection against any called functions (in libraries, or in
1947 Perl, or whatever) that think they can write to stderr (or stdout). Before this
1948 was added, it was quite likely that an SMTP connection would use one of these
1949 file descriptors, in which case writing random stuff to it caused chaos.
1950
1951 Then disconnect from the controlling terminal, Most modern Unixes seem to have
1952 setsid() for getting rid of the controlling terminal. For any OS that doesn't,
1953 setsid() can be #defined as a no-op, or as something else. */
1954
1955 if (f.background_daemon || f.inetd_wait_mode)
1956   {
1957   log_close_all();    /* Just in case anything was logged earlier */
1958   search_tidyup();    /* Just in case any were used in reading the config. */
1959   (void)close(0);           /* Get rid of stdin/stdout/stderr */
1960   (void)close(1);
1961   (void)close(2);
1962   exim_nullstd();     /* Connect stdin/stdout/stderr to /dev/null */
1963   log_stderr = NULL;  /* So no attempt to copy paniclog output */
1964   }
1965
1966 if (f.background_daemon)
1967   {
1968   /* If the parent process of this one has pid == 1, we are re-initializing the
1969   daemon as the result of a SIGHUP. In this case, there is no need to do
1970   anything, because the controlling terminal has long gone. Otherwise, fork, in
1971   case current process is a process group leader (see 'man setsid' for an
1972   explanation) before calling setsid().
1973   All other forks want daemon_listen cleared. Rather than blow a register, jsut
1974   restore it here. */
1975
1976   if (getppid() != 1)
1977     {
1978     BOOL daemon_listen = f.daemon_listen;
1979     pid_t pid = exim_fork(US"daemon");
1980     if (pid < 0) log_write(0, LOG_MAIN|LOG_PANIC_DIE,
1981       "fork() failed when starting daemon: %s", strerror(errno));
1982     if (pid > 0) exit(EXIT_SUCCESS);      /* in parent process, just exit */
1983     (void)setsid();                       /* release controlling terminal */
1984     f.daemon_listen = daemon_listen;
1985     }
1986   }
1987
1988 /* We are now in the disconnected, daemon process (unless debugging). Set up
1989 the listening sockets if required. */
1990
1991 daemon_notifier_socket();
1992
1993 if (f.daemon_listen && !f.inetd_wait_mode)
1994   {
1995   int sk;
1996   ip_address_item *ipa;
1997
1998   /* For each IP address, create a socket, bind it to the appropriate port, and
1999   start listening. See comments above about IPv6 sockets that may or may not
2000   accept IPv4 calls when listening on all interfaces. We also have to cope with
2001   the case of a system with IPv6 libraries, but no IPv6 support in the kernel.
2002   listening, provided a wildcard IPv4 socket for the same port follows. */
2003
2004   for (ipa = addresses, sk = 0; sk < listen_socket_count; ipa = ipa->next, sk++)
2005     {
2006     BOOL wildcard;
2007     ip_address_item * ipa2;
2008     int fd, af;
2009
2010     if (Ustrchr(ipa->address, ':') != NULL)
2011       {
2012       af = AF_INET6;
2013       wildcard = ipa->address[1] == 0;
2014       }
2015     else
2016       {
2017       af = AF_INET;
2018       wildcard = ipa->address[0] == 0;
2019       }
2020
2021     if ((fd_polls[sk].fd = fd = ip_socket(SOCK_STREAM, af)) < 0)
2022       {
2023       if (check_special_case(0, addresses, ipa, FALSE))
2024         {
2025         log_write(0, LOG_MAIN, "Failed to create IPv6 socket for wildcard "
2026           "listening (%s): will use IPv4", strerror(errno));
2027         goto SKIP_SOCKET;
2028         }
2029       log_write(0, LOG_PANIC_DIE, "IPv%c socket creation failed: %s",
2030         af == AF_INET6 ? '6' : '4', strerror(errno));
2031       }
2032
2033     /* If this is an IPv6 wildcard socket, set IPV6_V6ONLY if that option is
2034     available. Just log failure (can get protocol not available, just like
2035     socket creation can). */
2036
2037 #ifdef IPV6_V6ONLY
2038     if (af == AF_INET6 && wildcard &&
2039         setsockopt(fd, IPPROTO_IPV6, IPV6_V6ONLY, &on, sizeof(on)) < 0)
2040       log_write(0, LOG_MAIN, "Setting IPV6_V6ONLY on daemon's IPv6 wildcard "
2041         "socket failed (%s): carrying on without it", strerror(errno));
2042 #endif  /* IPV6_V6ONLY */
2043
2044     /* Set SO_REUSEADDR so that the daemon can be restarted while a connection
2045     is being handled.  Without this, a connection will prevent reuse of the
2046     smtp port for listening. */
2047
2048     if (setsockopt(fd, SOL_SOCKET, SO_REUSEADDR, &on, sizeof(on)) < 0)
2049       log_write(0, LOG_MAIN|LOG_PANIC_DIE, "setting SO_REUSEADDR on socket "
2050         "failed when starting daemon: %s", strerror(errno));
2051
2052     /* Set TCP_NODELAY; Exim does its own buffering. There is a switch to
2053     disable this because it breaks some broken clients. */
2054
2055     if (tcp_nodelay) setsockopt(fd, IPPROTO_TCP, TCP_NODELAY, &on, sizeof(on));
2056
2057     /* Now bind the socket to the required port; if Exim is being restarted
2058     it may not always be possible to bind immediately, even with SO_REUSEADDR
2059     set, so try 10 times, waiting between each try. After 10 failures, we give
2060     up. In an IPv6 environment, if bind () fails with the error EADDRINUSE and
2061     we are doing wildcard IPv4 listening and there was a previous IPv6 wildcard
2062     address for the same port, ignore the error on the grounds that we must be
2063     in a system where the IPv6 socket accepts both kinds of call. This is
2064     necessary for (some release of) USAGI Linux; other IP stacks fail at the
2065     listen() stage instead. */
2066
2067 #ifdef TCP_FASTOPEN
2068     f.tcp_fastopen_ok = TRUE;
2069 #endif
2070     for(;;)
2071       {
2072       uschar *msg, *addr;
2073       if (ip_bind(fd, af, ipa->address, ipa->port) >= 0) break;
2074       if (check_special_case(errno, addresses, ipa, TRUE))
2075         {
2076         DEBUG(D_any) debug_printf("wildcard IPv4 bind() failed after IPv6 "
2077           "listen() success; EADDRINUSE ignored\n");
2078         (void)close(fd);
2079         goto SKIP_SOCKET;
2080         }
2081       msg = US strerror(errno);
2082       addr = wildcard
2083         ? af == AF_INET6
2084         ? US"(any IPv6)"
2085         : US"(any IPv4)"
2086         : ipa->address;
2087       if (daemon_startup_retries <= 0)
2088         log_write(0, LOG_MAIN|LOG_PANIC_DIE,
2089           "socket bind() to port %d for address %s failed: %s: "
2090           "daemon abandoned", ipa->port, addr, msg);
2091       log_write(0, LOG_MAIN, "socket bind() to port %d for address %s "
2092         "failed: %s: waiting %s before trying again (%d more %s)",
2093         ipa->port, addr, msg, readconf_printtime(daemon_startup_sleep),
2094         daemon_startup_retries, (daemon_startup_retries > 1)? "tries" : "try");
2095       daemon_startup_retries--;
2096       sleep(daemon_startup_sleep);
2097       }
2098
2099     DEBUG(D_any)
2100       if (wildcard)
2101         debug_printf("listening on all interfaces (IPv%c) port %d\n",
2102           af == AF_INET6 ? '6' : '4', ipa->port);
2103       else
2104         debug_printf("listening on %s port %d\n", ipa->address, ipa->port);
2105
2106     /* Start listening on the bound socket, establishing the maximum backlog of
2107     connections that is allowed. On success, add to the set of sockets for select
2108     and continue to the next address. */
2109
2110 #if defined(TCP_FASTOPEN) && !defined(__APPLE__)
2111     if (  f.tcp_fastopen_ok
2112        && setsockopt(fd, IPPROTO_TCP, TCP_FASTOPEN,
2113                     &smtp_connect_backlog, sizeof(smtp_connect_backlog)))
2114       {
2115       DEBUG(D_any) debug_printf("setsockopt FASTOPEN: %s\n", strerror(errno));
2116       f.tcp_fastopen_ok = FALSE;
2117       }
2118 #endif
2119     if (listen(fd, smtp_connect_backlog) >= 0)
2120       {
2121 #if defined(TCP_FASTOPEN) && defined(__APPLE__)
2122       if (  f.tcp_fastopen_ok
2123          && setsockopt(fd, IPPROTO_TCP, TCP_FASTOPEN, &on, sizeof(on)))
2124         {
2125         DEBUG(D_any) debug_printf("setsockopt FASTOPEN: %s\n", strerror(errno));
2126         f.tcp_fastopen_ok = FALSE;
2127         }
2128 #endif
2129       fd_polls[sk].fd = fd;
2130       continue;
2131       }
2132
2133     /* Listening has failed. In an IPv6 environment, as for bind(), if listen()
2134     fails with the error EADDRINUSE and we are doing IPv4 wildcard listening
2135     and there was a previous successful IPv6 wildcard listen on the same port,
2136     we want to ignore the error on the grounds that we must be in a system
2137     where the IPv6 socket accepts both kinds of call. */
2138
2139     if (!check_special_case(errno, addresses, ipa, TRUE))
2140       log_write(0, LOG_PANIC_DIE, "listen() failed on interface %s: %s",
2141         wildcard
2142         ? af == AF_INET6 ? US"(any IPv6)" : US"(any IPv4)" : ipa->address,
2143         strerror(errno));
2144
2145     DEBUG(D_any) debug_printf("wildcard IPv4 listen() failed after IPv6 "
2146       "listen() success; EADDRINUSE ignored\n");
2147     (void)close(fd);
2148
2149     /* Come here if there has been a problem with the socket which we
2150     are going to ignore. We remove the address from the chain, and back up the
2151     counts. */
2152
2153   SKIP_SOCKET:
2154     sk--;                          /* Back up the count */
2155     listen_socket_count--;         /* Reduce the total */
2156     if (ipa == addresses) addresses = ipa->next; else
2157       {
2158       for (ipa2 = addresses; ipa2->next != ipa; ipa2 = ipa2->next);
2159       ipa2->next = ipa->next;
2160       ipa = ipa2;
2161       }
2162     }          /* End of bind/listen loop for each address */
2163   }            /* End of setup for listening */
2164
2165
2166 /* If we are not listening, we want to write a pid file only if -oP was
2167 explicitly given. */
2168
2169 else if (!override_pid_file_path)
2170   write_pid = FALSE;
2171
2172 /* Write the pid to a known file for assistance in identification, if required.
2173 We do this before giving up root privilege, because on some systems it is
2174 necessary to be root in order to write into the pid file directory. There's
2175 nothing to stop multiple daemons running, as long as no more than one listens
2176 on a given TCP/IP port on the same interface(s). However, in these
2177 circumstances it gets far too complicated to mess with pid file names
2178 automatically. Consequently, Exim 4 writes a pid file only
2179
2180   (a) When running in the test harness, or
2181   (b) When -bd is used and -oX is not used, or
2182   (c) When -oP is used to supply a path.
2183
2184 The variable daemon_write_pid is used to control this. */
2185
2186 if (f.running_in_test_harness || write_pid)
2187   {
2188   const enum pid_op operation = (f.running_in_test_harness
2189      || real_uid == root_uid
2190      || (real_uid == exim_uid && !override_pid_file_path)) ? PID_WRITE : PID_CHECK;
2191   if (!operate_on_pid_file(operation, getpid()))
2192     DEBUG(D_any) debug_printf("%s pid file %s: %s\n", (operation == PID_WRITE) ? "write" : "check", pid_file_path, strerror(errno));
2193   }
2194
2195 /* Set up the handler for SIGHUP, which causes a restart of the daemon. */
2196
2197 sighup_seen = FALSE;
2198 signal(SIGHUP, sighup_handler);
2199
2200 /* Give up root privilege at this point (assuming that exim_uid and exim_gid
2201 are not root). The third argument controls the running of initgroups().
2202 Normally we do this, in order to set up the groups for the Exim user. However,
2203 if we are not root at this time - some odd installations run that way - we
2204 cannot do this. */
2205
2206 exim_setugid(exim_uid, exim_gid, geteuid()==root_uid, US"running as a daemon");
2207
2208 /* Update the originator_xxx fields so that received messages as listed as
2209 coming from Exim, not whoever started the daemon. */
2210
2211 originator_uid = exim_uid;
2212 originator_gid = exim_gid;
2213 originator_login = (pw = getpwuid(exim_uid))
2214   ? string_copy_perm(US pw->pw_name, FALSE) : US"exim";
2215
2216 /* Get somewhere to keep the list of queue-runner pids if we are keeping track
2217 of them (and also if we are doing queue runs). */
2218
2219 if (queue_interval > 0 && local_queue_run_max > 0)
2220   {
2221   queue_pid_slots = store_get(local_queue_run_max * sizeof(pid_t), GET_UNTAINTED);
2222   for (int i = 0; i < local_queue_run_max; i++) queue_pid_slots[i] = 0;
2223   }
2224
2225 /* Set up the handler for termination of child processes, and the one
2226 telling us to die. */
2227
2228 sigchld_seen = FALSE;
2229 os_non_restarting_signal(SIGCHLD, main_sigchld_handler);
2230
2231 sigterm_seen = FALSE;
2232 os_non_restarting_signal(SIGTERM, main_sigterm_handler);
2233 os_non_restarting_signal(SIGINT, main_sigterm_handler);
2234
2235 /* If we are to run the queue periodically, pretend the alarm has just gone
2236 off. This will cause the first queue-runner to get kicked off straight away. */
2237
2238 sigalrm_seen = (queue_interval > 0);
2239
2240 /* Log the start up of a daemon - at least one of listening or queue running
2241 must be set up. */
2242
2243 if (f.inetd_wait_mode)
2244   {
2245   uschar *p = big_buffer;
2246
2247   if (inetd_wait_timeout >= 0)
2248     sprintf(CS p, "terminating after %d seconds", inetd_wait_timeout);
2249   else
2250     sprintf(CS p, "with no wait timeout");
2251
2252   log_write(0, LOG_MAIN,
2253     "exim %s daemon started: pid=%d, launched with listening socket, %s",
2254     version_string, getpid(), big_buffer);
2255   set_process_info("daemon(%s): pre-listening socket", version_string);
2256
2257   /* set up the timeout logic */
2258   sigalrm_seen = TRUE;
2259   }
2260
2261 else if (f.daemon_listen)
2262   {
2263   int smtp_ports = 0;
2264   int smtps_ports = 0;
2265   ip_address_item * ipa;
2266   uschar * p;
2267   uschar * qinfo = queue_interval > 0
2268     ? string_sprintf("-q%s%s",
2269         f.queue_2stage ? "q" : "", readconf_printtime(queue_interval))
2270     : US"no queue runs";
2271
2272   /* Build a list of listening addresses in big_buffer, but limit it to 10
2273   items. The style is for backwards compatibility.
2274
2275   It is now possible to have some ports listening for SMTPS (the old,
2276   deprecated protocol that starts TLS without using STARTTLS), and others
2277   listening for standard SMTP. Keep their listings separate. */
2278
2279   for (int j = 0, i; j < 2; j++)
2280     {
2281     for (i = 0, ipa = addresses; i < 10 && ipa; i++, ipa = ipa->next)
2282       {
2283       /* First time round, look for SMTP ports; second time round, look for
2284       SMTPS ports. Build IP+port strings. */
2285
2286       if (host_is_tls_on_connect_port(ipa->port) == (j > 0))
2287         {
2288         if (j == 0)
2289           smtp_ports++;
2290         else
2291           smtps_ports++;
2292
2293         /* Now the information about the port (and sometimes interface) */
2294
2295         if (ipa->address[0] == ':' && ipa->address[1] == 0)
2296           {                                             /* v6 wildcard */
2297           if (ipa->next && ipa->next->address[0] == 0 &&
2298               ipa->next->port == ipa->port)
2299             {
2300             ipa->log = string_sprintf(" port %d (IPv6 and IPv4)", ipa->port);
2301             (ipa = ipa->next)->log = NULL;
2302             }
2303           else if (ipa->v6_include_v4)
2304             ipa->log = string_sprintf(" port %d (IPv6 with IPv4)", ipa->port);
2305           else
2306             ipa->log = string_sprintf(" port %d (IPv6)", ipa->port);
2307           }
2308         else if (ipa->address[0] == 0)                  /* v4 wildcard */
2309           ipa->log = string_sprintf(" port %d (IPv4)", ipa->port);
2310         else                            /* check for previously-seen IP */
2311           {
2312           ip_address_item * i2;
2313           for (i2 = addresses; i2 != ipa; i2 = i2->next)
2314             if (  host_is_tls_on_connect_port(i2->port) == (j > 0)
2315                && Ustrcmp(ipa->address, i2->address) == 0
2316                )
2317               {                         /* found; append port to list */
2318               for (p = i2->log; *p; ) p++;      /* end of existing string */
2319               if (*--p == '}') *p = '\0';       /* drop EOL */
2320               while (isdigit(*--p)) ;           /* char before port */
2321
2322               i2->log = *p == ':'               /* no list yet?     { */
2323                 ? string_sprintf("%.*s{%s,%d}",
2324                   (int)(p - i2->log + 1), i2->log, p+1, ipa->port)
2325                 : string_sprintf("%s,%d}", i2->log, ipa->port);
2326               ipa->log = NULL;
2327               break;
2328               }
2329           if (i2 == ipa)                /* first-time IP */
2330             ipa->log = string_sprintf(" [%s]:%d", ipa->address, ipa->port);
2331           }
2332         }
2333       }
2334     }
2335
2336   p = big_buffer;
2337   for (int j = 0, i; j < 2; j++)
2338     {
2339     /* First time round, look for SMTP ports; second time round, look for
2340     SMTPS ports. For the first one of each, insert leading text. */
2341
2342     if (j == 0)
2343       {
2344       if (smtp_ports > 0)
2345         p += sprintf(CS p, "SMTP on");
2346       }
2347     else
2348       if (smtps_ports > 0)
2349         p += sprintf(CS p, "%sSMTPS on",
2350           smtp_ports == 0 ? "" : " and for ");
2351
2352     /* Now the information about the port (and sometimes interface) */
2353
2354     for (i = 0, ipa = addresses; i < 10 && ipa; i++, ipa = ipa->next)
2355       if (host_is_tls_on_connect_port(ipa->port) == (j > 0))
2356         if (ipa->log)
2357           p += sprintf(CS p, "%s",  ipa->log);
2358
2359     if (ipa)
2360       p += sprintf(CS p, " ...");
2361     }
2362
2363   log_write(0, LOG_MAIN,
2364     "exim %s daemon started: pid=%d, %s, listening for %s",
2365     version_string, getpid(), qinfo, big_buffer);
2366   set_process_info("daemon(%s): %s, listening for %s",
2367     version_string, qinfo, big_buffer);
2368   }
2369
2370 else
2371   {
2372   uschar * s = *queue_name
2373     ? string_sprintf("-qG%s/%s", queue_name, readconf_printtime(queue_interval))
2374     : string_sprintf("-q%s", readconf_printtime(queue_interval));
2375   log_write(0, LOG_MAIN,
2376     "exim %s daemon started: pid=%d, %s, not listening for SMTP",
2377     version_string, getpid(), s);
2378   set_process_info("daemon(%s): %s, not listening", version_string, s);
2379   }
2380
2381 /* Do any work it might be useful to amortize over our children
2382 (eg: compile regex) */
2383
2384 dns_pattern_init();
2385 smtp_deliver_init();    /* Used for callouts */
2386
2387 #ifndef DISABLE_DKIM
2388   {
2389 # ifdef MEASURE_TIMING
2390   struct timeval t0;
2391   gettimeofday(&t0, NULL);
2392 # endif
2393   dkim_exim_init();
2394 # ifdef MEASURE_TIMING
2395   report_time_since(&t0, US"dkim_exim_init (delta)");
2396 # endif
2397   }
2398 #endif
2399
2400 #ifdef WITH_CONTENT_SCAN
2401 malware_init();
2402 #endif
2403 #ifdef SUPPORT_SPF
2404 spf_init();
2405 #endif
2406 #ifndef DISABLE_TLS
2407 tls_daemon_init();
2408 #endif
2409
2410 /* Add ancillary sockets to the set for select */
2411
2412 poll_fd_count = listen_socket_count;
2413 #ifndef DISABLE_TLS
2414 if (tls_watch_fd >= 0)
2415   {
2416   tls_watch_poll = &fd_polls[poll_fd_count++];
2417   tls_watch_poll->fd = tls_watch_fd;
2418   tls_watch_poll->events = POLLIN;
2419   }
2420 #endif
2421 if (daemon_notifier_fd >= 0)
2422   {
2423   dnotify_poll = &fd_polls[poll_fd_count++];
2424   dnotify_poll->fd = daemon_notifier_fd;
2425   dnotify_poll->events = POLLIN;
2426   }
2427
2428 /* Close the log so it can be renamed and moved. In the few cases below where
2429 this long-running process writes to the log (always exceptional conditions), it
2430 closes the log afterwards, for the same reason. */
2431
2432 log_close_all();
2433
2434 DEBUG(D_any) debug_print_ids(US"daemon running with");
2435
2436 /* Any messages accepted via this route are going to be SMTP. */
2437
2438 smtp_input = TRUE;
2439
2440 #ifdef MEASURE_TIMING
2441 report_time_since(&timestamp_startup, US"daemon loop start");   /* testcase 0022 */
2442 #endif
2443
2444 /* Enter the never-ending loop... */
2445
2446 for (;;)
2447   {
2448   if (sigterm_seen)
2449     daemon_die();       /* Does not return */
2450
2451   /* This code is placed first in the loop, so that it gets obeyed at the
2452   start, before the first wait, for the queue-runner case, so that the first
2453   one can be started immediately.
2454
2455   The other option is that we have an inetd wait timeout specified to -bw. */
2456
2457   if (sigalrm_seen)
2458     if (inetd_wait_timeout > 0)
2459       daemon_inetd_wtimeout(last_connection_time);      /* Might not return */
2460     else
2461       daemon_qrun(local_queue_run_max, fd_polls, listen_socket_count);
2462
2463
2464   /* Sleep till a connection happens if listening, and handle the connection if
2465   that is why we woke up. The FreeBSD operating system requires the use of
2466   select() before accept() because the latter function is not interrupted by
2467   a signal, and we want to wake up for SIGCHLD and SIGALRM signals. Some other
2468   OS do notice signals in accept() but it does no harm to have the select()
2469   in for all of them - and it won't then be a lurking problem for ports to
2470   new OS. In fact, the later addition of listening on specific interfaces only
2471   requires this way of working anyway. */
2472
2473   if (f.daemon_listen)
2474     {
2475     int lcount;
2476     BOOL select_failed = FALSE;
2477
2478     DEBUG(D_any) debug_printf("Listening...\n");
2479
2480     /* In rare cases we may have had a SIGCHLD signal in the time between
2481     setting the handler (below) and getting back here. If so, pretend that the
2482     select() was interrupted so that we reap the child. This might still leave
2483     a small window when a SIGCHLD could get lost. However, since we use SIGCHLD
2484     only to do the reaping more quickly, it shouldn't result in anything other
2485     than a delay until something else causes a wake-up. */
2486
2487     if (sigchld_seen)
2488       {
2489       lcount = -1;
2490       errno = EINTR;
2491       }
2492     else
2493       lcount = poll(fd_polls, poll_fd_count, -1);
2494
2495     if (lcount < 0)
2496       {
2497       select_failed = TRUE;
2498       lcount = 1;
2499       }
2500
2501     /* Clean up any subprocesses that may have terminated. We need to do this
2502     here so that smtp_accept_max_per_host works when a connection to that host
2503     has completed, and we are about to accept a new one. When this code was
2504     later in the sequence, a new connection could be rejected, even though an
2505     old one had just finished. Preserve the errno from any select() failure for
2506     the use of the common select/accept error processing below. */
2507
2508       {
2509       int select_errno = errno;
2510       handle_ending_processes();
2511
2512 #ifndef DISABLE_TLS
2513       {
2514       int old_tfd;
2515       /* Create or rotate any required keys; handle (delayed) filewatch event */
2516
2517       if ((old_tfd = tls_daemon_tick()) >= 0)
2518         for (struct pollfd * p = &fd_polls[listen_socket_count];
2519              p < fd_polls + poll_fd_count; p++)
2520           if (p->fd == old_tfd) { p->fd = tls_watch_fd ; break; }
2521       }
2522 #endif
2523       errno = select_errno;
2524       }
2525
2526     /* Loop for all the sockets that are currently ready to go. If select
2527     actually failed, we have set the count to 1 and select_failed=TRUE, so as
2528     to use the common error code for select/accept below. */
2529
2530     while (lcount-- > 0)
2531       {
2532       int accept_socket = -1;
2533 #if HAVE_IPV6
2534       struct sockaddr_in6 accepted;
2535 #else
2536       struct sockaddr_in accepted;
2537 #endif
2538
2539       if (!select_failed)
2540         {
2541 #if !defined(DISABLE_TLS) && (defined(EXIM_HAVE_INOTIFY) || defined(EXIM_HAVE_KEVENT))
2542         if (tls_watch_poll && tls_watch_poll->revents & POLLIN)
2543           {
2544           tls_watch_poll->revents = 0;
2545           tls_watch_trigger_time = time(NULL);  /* Set up delayed event */
2546           tls_watch_discard_event(tls_watch_fd);
2547           break;        /* to top of daemon loop */
2548           }
2549 #endif
2550         if (dnotify_poll && dnotify_poll->revents & POLLIN)
2551           {
2552           dnotify_poll->revents = 0;
2553           sigalrm_seen = daemon_notification();
2554           break;        /* to top of daemon loop */
2555           }
2556         for (struct pollfd * p = fd_polls; p < fd_polls + listen_socket_count;
2557              p++)
2558           if (p->revents & POLLIN)
2559             {
2560             EXIM_SOCKLEN_T alen = sizeof(accepted);
2561 #if defined(__FreeBSD__) && defined(SO_LISTENQLEN)
2562             int backlog;
2563             socklen_t blen = sizeof(backlog);
2564
2565             if (  smtp_backlog_monitor > 0
2566                && getsockopt(p->fd, SOL_SOCKET, SO_LISTENQLEN, &backlog, &blen) == 0)
2567               {
2568               DEBUG(D_interface)
2569                 debug_printf("listen fd %d queue curr %d\n", p->fd, backlog);
2570               smtp_listen_backlog = backlog;
2571               }
2572
2573 #elif defined(TCP_INFO) && defined(EXIM_HAVE_TCPI_UNACKED)
2574             struct tcp_info ti;
2575             socklen_t tlen = sizeof(ti);
2576
2577             /* If monitoring the backlog is wanted, grab for later logging */
2578
2579             smtp_listen_backlog = 0;
2580             if (  smtp_backlog_monitor > 0
2581                && getsockopt(p->fd, IPPROTO_TCP, TCP_INFO, &ti, &tlen) == 0)
2582               {
2583               DEBUG(D_interface) debug_printf("listen fd %d queue max %u curr %u\n",
2584                       p->fd, ti.tcpi_sacked, ti.tcpi_unacked);
2585               smtp_listen_backlog = ti.tcpi_unacked;
2586               }
2587 #endif
2588             p->revents = 0;
2589             accept_socket = accept(p->fd, (struct sockaddr *)&accepted, &alen);
2590             break;
2591             }
2592         }
2593
2594       /* If select or accept has failed and this was not caused by an
2595       interruption, log the incident and try again. With asymmetric TCP/IP
2596       routing errors such as "No route to network" have been seen here. Also
2597       "connection reset by peer" has been seen. These cannot be classed as
2598       disastrous errors, but they could fill up a lot of log. The code in smail
2599       crashes the daemon after 10 successive failures of accept, on the grounds
2600       that some OS fail continuously. Exim originally followed suit, but this
2601       appears to have caused problems. Now it just keeps going, but instead of
2602       logging each error, it batches them up when they are continuous. */
2603
2604       if (accept_socket < 0 && errno != EINTR)
2605         {
2606         if (accept_retry_count == 0)
2607           {
2608           accept_retry_errno = errno;
2609           accept_retry_select_failed = select_failed;
2610           }
2611         else if (  errno != accept_retry_errno
2612                 || select_failed != accept_retry_select_failed
2613                 || accept_retry_count >= 50)
2614           {
2615           log_write(0, LOG_MAIN | (accept_retry_count >= 50 ? LOG_PANIC : 0),
2616             "%d %s() failure%s: %s",
2617             accept_retry_count,
2618             accept_retry_select_failed ? "select" : "accept",
2619             accept_retry_count == 1 ? "" : "s",
2620             strerror(accept_retry_errno));
2621           log_close_all();
2622           accept_retry_count = 0;
2623           accept_retry_errno = errno;
2624           accept_retry_select_failed = select_failed;
2625           }
2626         accept_retry_count++;
2627         }
2628       else if (accept_retry_count > 0)
2629         {
2630         log_write(0, LOG_MAIN, "%d %s() failure%s: %s",
2631           accept_retry_count,
2632           accept_retry_select_failed ? "select" : "accept",
2633           accept_retry_count == 1 ? "" : "s",
2634           strerror(accept_retry_errno));
2635         log_close_all();
2636         accept_retry_count = 0;
2637         }
2638
2639       /* If select/accept succeeded, deal with the connection. */
2640
2641       if (accept_socket >= 0)
2642         {
2643 #ifdef TCP_QUICKACK /* Avoid pure-ACKs while in tls protocol pingpong phase */
2644         /* Unfortunately we cannot be certain to do this before a TLS-on-connect
2645         Client Hello arrives and is acked. We do it as early as possible. */
2646         (void) setsockopt(accept_socket, IPPROTO_TCP, TCP_QUICKACK, US &off, sizeof(off));
2647 #endif
2648         if (inetd_wait_timeout)
2649           last_connection_time = time(NULL);
2650         handle_smtp_call(fd_polls, listen_socket_count, accept_socket,
2651           (struct sockaddr *)&accepted);
2652         }
2653       }
2654     }
2655
2656   /* If not listening, then just sleep for the queue interval. If we woke
2657   up early the last time for some other signal, it won't matter because
2658   the alarm signal will wake at the right time. This code originally used
2659   sleep() but it turns out that on the FreeBSD system, sleep() is not inter-
2660   rupted by signals, so it wasn't waking up for SIGALRM or SIGCHLD. Luckily
2661   select() can be used as an interruptible sleep() on all versions of Unix. */
2662
2663   else
2664     {
2665     struct pollfd p;
2666     poll(&p, 0, queue_interval * 1000);
2667     handle_ending_processes();
2668     }
2669
2670   /* Re-enable the SIGCHLD handler if it has been run. It can't do it
2671   for itself, because it isn't doing the waiting itself. */
2672
2673   if (sigchld_seen)
2674     {
2675     sigchld_seen = FALSE;
2676     os_non_restarting_signal(SIGCHLD, main_sigchld_handler);
2677     }
2678
2679   /* Handle being woken by SIGHUP. We know at this point that the result
2680   of accept() has been dealt with, so we can re-exec exim safely, first
2681   closing the listening sockets so that they can be reused. Cancel any pending
2682   alarm in case it is just about to go off, and set SIGHUP to be ignored so
2683   that another HUP in quick succession doesn't clobber the new daemon before it
2684   gets going. All log files get closed by the close-on-exec flag; however, if
2685   the exec fails, we need to close the logs. */
2686
2687   if (sighup_seen)
2688     {
2689     log_write(0, LOG_MAIN, "pid %d: SIGHUP received: re-exec daemon",
2690       getpid());
2691     close_daemon_sockets(daemon_notifier_fd, fd_polls, listen_socket_count);
2692     unlink_notifier_socket();
2693     ALARM_CLR(0);
2694     signal(SIGHUP, SIG_IGN);
2695     sighup_argv[0] = exim_path;
2696     exim_nullstd();
2697     execv(CS exim_path, (char *const *)sighup_argv);
2698     log_write(0, LOG_MAIN|LOG_PANIC_DIE, "pid %d: exec of %s failed: %s",
2699       getpid(), exim_path, strerror(errno));
2700     log_close_all();
2701     }
2702
2703   }   /* End of main loop */
2704
2705 /* Control never reaches here */
2706 }
2707
2708 /* vi: aw ai sw=2
2709 */
2710 /* End of exim_daemon.c */