899aa0dab539b5f74e123054da2493be2669d369
[users/heiko/exim.git] / src / src / daemon.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) University of Cambridge 1995 - 2018 */
6 /* Copyright (c) The Exim Maintainers 2020 */
7 /* See the file NOTICE for conditions of use and distribution. */
8
9 /* Functions concerned with running Exim as a daemon */
10
11
12 #include "exim.h"
13
14
15 /* Structure for holding data for each SMTP connection */
16
17 typedef struct smtp_slot {
18   pid_t pid;                       /* pid of the spawned reception process */
19   uschar *host_address;            /* address of the client host */
20 } smtp_slot;
21
22 /* An empty slot for initializing (Standard C does not allow constructor
23 expressions in assignments except as initializers in declarations). */
24
25 static smtp_slot empty_smtp_slot = { .pid = 0, .host_address = NULL };
26
27
28
29 /*************************************************
30 *               Local static variables           *
31 *************************************************/
32
33 static SIGNAL_BOOL sigchld_seen;
34 static SIGNAL_BOOL sighup_seen;
35 static SIGNAL_BOOL sigterm_seen;
36
37 static int   accept_retry_count = 0;
38 static int   accept_retry_errno;
39 static BOOL  accept_retry_select_failed;
40
41 static int   queue_run_count = 0;
42 static pid_t *queue_pid_slots = NULL;
43 static smtp_slot *smtp_slots = NULL;
44
45 static BOOL  write_pid = TRUE;
46
47
48
49 /*************************************************
50 *             SIGHUP Handler                     *
51 *************************************************/
52
53 /* All this handler does is to set a flag and re-enable the signal.
54
55 Argument: the signal number
56 Returns:  nothing
57 */
58
59 static void
60 sighup_handler(int sig)
61 {
62 sighup_seen = TRUE;
63 signal(SIGHUP, sighup_handler);
64 }
65
66
67
68 /*************************************************
69 *     SIGCHLD handler for main daemon process    *
70 *************************************************/
71
72 /* Don't re-enable the handler here, since we aren't doing the
73 waiting here. If the signal is re-enabled, there will just be an
74 infinite sequence of calls to this handler. The SIGCHLD signal is
75 used just as a means of waking up the daemon so that it notices
76 terminated subprocesses as soon as possible.
77
78 Argument: the signal number
79 Returns:  nothing
80 */
81
82 static void
83 main_sigchld_handler(int sig)
84 {
85 os_non_restarting_signal(SIGCHLD, SIG_DFL);
86 sigchld_seen = TRUE;
87 }
88
89
90 /* SIGTERM handler.  Try to get the damon pif file removed
91 before exiting. */
92
93 static void
94 main_sigterm_handler(int sig)
95 {
96 sigterm_seen = TRUE;
97 }
98
99
100
101
102 /*************************************************
103 *          Unexpected errors in SMTP calls       *
104 *************************************************/
105
106 /* This function just saves a bit of repetitious coding.
107
108 Arguments:
109   log_msg        Text of message to be logged
110   smtp_msg       Text of SMTP error message
111   was_errno      The failing errno
112
113 Returns:         nothing
114 */
115
116 static void
117 never_error(uschar *log_msg, uschar *smtp_msg, int was_errno)
118 {
119 uschar *emsg = was_errno <= 0
120   ? US"" : string_sprintf(": %s", strerror(was_errno));
121 log_write(0, LOG_MAIN|LOG_PANIC, "%s%s", log_msg, emsg);
122 if (smtp_out) smtp_printf("421 %s\r\n", FALSE, smtp_msg);
123 }
124
125
126
127
128 /*************************************************
129 *************************************************/
130
131 static void
132 close_daemon_sockets(int daemon_notifier_fd,
133   int * listen_sockets, int listen_socket_count)
134 {
135 if (daemon_notifier_fd >= 0) (void) close(daemon_notifier_fd);
136 for (int i = 0; i < listen_socket_count; i++) (void) close(listen_sockets[i]);
137 }
138
139
140 /*************************************************
141 *            Handle a connected SMTP call        *
142 *************************************************/
143
144 /* This function is called when an SMTP connection has been accepted.
145 If there are too many, give an error message and close down. Otherwise
146 spin off a sub-process to handle the call. The list of listening sockets
147 is required so that they can be closed in the sub-process. Take care not to
148 leak store in this process - reset the stacking pool at the end.
149
150 Arguments:
151   listen_sockets        sockets which are listening for incoming calls
152   listen_socket_count   count of listening sockets
153   accept_socket         socket of the current accepted call
154   accepted              socket information about the current call
155
156 Returns:            nothing
157 */
158
159 static void
160 handle_smtp_call(int *listen_sockets, int listen_socket_count,
161   int accept_socket, struct sockaddr *accepted)
162 {
163 pid_t pid;
164 union sockaddr_46 interface_sockaddr;
165 EXIM_SOCKLEN_T ifsize = sizeof(interface_sockaddr);
166 int dup_accept_socket = -1;
167 int max_for_this_host = 0;
168 int save_log_selector = *log_selector;
169 gstring * whofrom;
170
171 rmark reset_point = store_mark();
172
173 /* Make the address available in ASCII representation, and also fish out
174 the remote port. */
175
176 sender_host_address = host_ntoa(-1, accepted, NULL, &sender_host_port);
177 DEBUG(D_any) debug_printf("Connection request from %s port %d\n",
178   sender_host_address, sender_host_port);
179
180 /* Set up the output stream, check the socket has duplicated, and set up the
181 input stream. These operations fail only the exceptional circumstances. Note
182 that never_error() won't use smtp_out if it is NULL. */
183
184 if (!(smtp_out = fdopen(accept_socket, "wb")))
185   {
186   never_error(US"daemon: fdopen() for smtp_out failed", US"", errno);
187   goto ERROR_RETURN;
188   }
189
190 if ((dup_accept_socket = dup(accept_socket)) < 0)
191   {
192   never_error(US"daemon: couldn't dup socket descriptor",
193     US"Connection setup failed", errno);
194   goto ERROR_RETURN;
195   }
196
197 if (!(smtp_in = fdopen(dup_accept_socket, "rb")))
198   {
199   never_error(US"daemon: fdopen() for smtp_in failed",
200     US"Connection setup failed", errno);
201   goto ERROR_RETURN;
202   }
203
204 /* Get the data for the local interface address. Panic for most errors, but
205 "connection reset by peer" just means the connection went away. */
206
207 if (getsockname(accept_socket, (struct sockaddr *)(&interface_sockaddr),
208      &ifsize) < 0)
209   {
210   log_write(0, LOG_MAIN | ((errno == ECONNRESET)? 0 : LOG_PANIC),
211     "getsockname() failed: %s", strerror(errno));
212   smtp_printf("421 Local problem: getsockname() failed; please try again later\r\n", FALSE);
213   goto ERROR_RETURN;
214   }
215
216 interface_address = host_ntoa(-1, &interface_sockaddr, NULL, &interface_port);
217 DEBUG(D_interface) debug_printf("interface address=%s port=%d\n",
218   interface_address, interface_port);
219
220 /* Build a string identifying the remote host and, if requested, the port and
221 the local interface data. This is for logging; at the end of this function the
222 memory is reclaimed. */
223
224 whofrom = string_append(NULL, 3, "[", sender_host_address, "]");
225
226 if (LOGGING(incoming_port))
227   whofrom = string_fmt_append(whofrom, ":%d", sender_host_port);
228
229 if (LOGGING(incoming_interface))
230   whofrom = string_fmt_append(whofrom, " I=[%s]:%d",
231     interface_address, interface_port);
232
233 (void) string_from_gstring(whofrom);    /* Terminate the newly-built string */
234
235 /* Check maximum number of connections. We do not check for reserved
236 connections or unacceptable hosts here. That is done in the subprocess because
237 it might take some time. */
238
239 if (smtp_accept_max > 0 && smtp_accept_count >= smtp_accept_max)
240   {
241   DEBUG(D_any) debug_printf("rejecting SMTP connection: count=%d max=%d\n",
242     smtp_accept_count, smtp_accept_max);
243   smtp_printf("421 Too many concurrent SMTP connections; "
244     "please try again later.\r\n", FALSE);
245   log_write(L_connection_reject,
246             LOG_MAIN, "Connection from %s refused: too many connections",
247     whofrom->s);
248   goto ERROR_RETURN;
249   }
250
251 /* If a load limit above which only reserved hosts are acceptable is defined,
252 get the load average here, and if there are in fact no reserved hosts, do
253 the test right away (saves a fork). If there are hosts, do the check in the
254 subprocess because it might take time. */
255
256 if (smtp_load_reserve >= 0)
257   {
258   load_average = OS_GETLOADAVG();
259   if (smtp_reserve_hosts == NULL && load_average > smtp_load_reserve)
260     {
261     DEBUG(D_any) debug_printf("rejecting SMTP connection: load average = %.2f\n",
262       (double)load_average/1000.0);
263     smtp_printf("421 Too much load; please try again later.\r\n", FALSE);
264     log_write(L_connection_reject,
265               LOG_MAIN, "Connection from %s refused: load average = %.2f",
266       whofrom->s, (double)load_average/1000.0);
267     goto ERROR_RETURN;
268     }
269   }
270
271 /* Check that one specific host (strictly, IP address) is not hogging
272 resources. This is done here to prevent a denial of service attack by someone
273 forcing you to fork lots of times before denying service. The value of
274 smtp_accept_max_per_host is a string which is expanded. This makes it possible
275 to provide host-specific limits according to $sender_host address, but because
276 this is in the daemon mainline, only fast expansions (such as inline address
277 checks) should be used. The documentation is full of warnings. */
278
279 if (smtp_accept_max_per_host)
280   {
281   uschar *expanded = expand_string(smtp_accept_max_per_host);
282   if (!expanded)
283     {
284     if (!f.expand_string_forcedfail)
285       log_write(0, LOG_MAIN|LOG_PANIC, "expansion of smtp_accept_max_per_host "
286         "failed for %s: %s", whofrom->s, expand_string_message);
287     }
288   /* For speed, interpret a decimal number inline here */
289   else
290     {
291     uschar *s = expanded;
292     while (isdigit(*s))
293       max_for_this_host = max_for_this_host * 10 + *s++ - '0';
294     if (*s)
295       log_write(0, LOG_MAIN|LOG_PANIC, "expansion of smtp_accept_max_per_host "
296         "for %s contains non-digit: %s", whofrom->s, expanded);
297     }
298   }
299
300 /* If we have fewer connections than max_for_this_host, we can skip the tedious
301 per host_address checks. Note that at this stage smtp_accept_count contains the
302 count of *other* connections, not including this one. */
303
304 if (max_for_this_host > 0 && smtp_accept_count >= max_for_this_host)
305   {
306   int host_accept_count = 0;
307   int other_host_count = 0;    /* keep a count of non matches to optimise */
308
309   for (int i = 0; i < smtp_accept_max; ++i)
310     if (smtp_slots[i].host_address)
311       {
312       if (Ustrcmp(sender_host_address, smtp_slots[i].host_address) == 0)
313        host_accept_count++;
314       else
315        other_host_count++;
316
317       /* Testing all these strings is expensive - see if we can drop out
318       early, either by hitting the target, or finding there are not enough
319       connections left to make the target. */
320
321       if (  host_accept_count >= max_for_this_host
322          || smtp_accept_count - other_host_count < max_for_this_host)
323        break;
324       }
325
326   if (host_accept_count >= max_for_this_host)
327     {
328     DEBUG(D_any) debug_printf("rejecting SMTP connection: too many from this "
329       "IP address: count=%d max=%d\n",
330       host_accept_count, max_for_this_host);
331     smtp_printf("421 Too many concurrent SMTP connections "
332       "from this IP address; please try again later.\r\n", FALSE);
333     log_write(L_connection_reject,
334               LOG_MAIN, "Connection from %s refused: too many connections "
335       "from that IP address", whofrom->s);
336     search_tidyup();
337     goto ERROR_RETURN;
338     }
339   }
340
341 /* OK, the connection count checks have been passed. Before we can fork the
342 accepting process, we must first log the connection if requested. This logging
343 used to happen in the subprocess, but doing that means that the value of
344 smtp_accept_count can be out of step by the time it is logged. So we have to do
345 the logging here and accept the performance cost. Note that smtp_accept_count
346 hasn't yet been incremented to take account of this connection.
347
348 In order to minimize the cost (because this is going to happen for every
349 connection), do a preliminary selector test here. This saves ploughing through
350 the generalized logging code each time when the selector is false. If the
351 selector is set, check whether the host is on the list for logging. If not,
352 arrange to unset the selector in the subprocess. */
353
354 if (LOGGING(smtp_connection))
355   {
356   uschar *list = hosts_connection_nolog;
357   memset(sender_host_cache, 0, sizeof(sender_host_cache));
358   if (list != NULL && verify_check_host(&list) == OK)
359     save_log_selector &= ~L_smtp_connection;
360   else
361     log_write(L_smtp_connection, LOG_MAIN, "SMTP connection from %s "
362       "(TCP/IP connection count = %d)", whofrom->s, smtp_accept_count + 1);
363   }
364
365 /* Now we can fork the accepting process; do a lookup tidy, just in case any
366 expansion above did a lookup. */
367
368 search_tidyup();
369 pid = exim_fork(US"daemon-accept");
370
371 /* Handle the child process */
372
373 if (pid == 0)
374   {
375   int queue_only_reason = 0;
376   int old_pool = store_pool;
377   int save_debug_selector = debug_selector;
378   BOOL local_queue_only;
379   BOOL session_local_queue_only;
380   #ifdef SA_NOCLDWAIT
381   struct sigaction act;
382   #endif
383
384   smtp_accept_count++;    /* So that it includes this process */
385
386   /* May have been modified for the subprocess */
387
388   *log_selector = save_log_selector;
389
390   /* Get the local interface address into permanent store */
391
392   store_pool = POOL_PERM;
393   interface_address = string_copy(interface_address);
394   store_pool = old_pool;
395
396   /* Check for a tls-on-connect port */
397
398   if (host_is_tls_on_connect_port(interface_port)) tls_in.on_connect = TRUE;
399
400   /* Expand smtp_active_hostname if required. We do not do this any earlier,
401   because it may depend on the local interface address (indeed, that is most
402   likely what it depends on.) */
403
404   smtp_active_hostname = primary_hostname;
405   if (raw_active_hostname)
406     {
407     uschar * nah = expand_string(raw_active_hostname);
408     if (!nah)
409       {
410       if (!f.expand_string_forcedfail)
411         {
412         log_write(0, LOG_MAIN|LOG_PANIC, "failed to expand \"%s\" "
413           "(smtp_active_hostname): %s", raw_active_hostname,
414           expand_string_message);
415         smtp_printf("421 Local configuration error; "
416           "please try again later.\r\n", FALSE);
417         mac_smtp_fflush();
418         search_tidyup();
419         exim_underbar_exit(EXIT_FAILURE);
420         }
421       }
422     else if (*nah) smtp_active_hostname = nah;
423     }
424
425   /* Initialize the queueing flags */
426
427   queue_check_only();
428   session_local_queue_only = queue_only;
429
430   /* Close the listening sockets, and set the SIGCHLD handler to SIG_IGN.
431   We also attempt to set things up so that children are automatically reaped,
432   but just in case this isn't available, there's a paranoid waitpid() in the
433   loop too (except for systems where we are sure it isn't needed). See the more
434   extensive comment before the reception loop in exim.c for a fuller
435   explanation of this logic. */
436
437   close_daemon_sockets(daemon_notifier_fd, listen_sockets, listen_socket_count);
438
439   /* Set FD_CLOEXEC on the SMTP socket. We don't want any rogue child processes
440   to be able to communicate with them, under any circumstances. */
441   (void)fcntl(accept_socket, F_SETFD,
442               fcntl(accept_socket, F_GETFD) | FD_CLOEXEC);
443   (void)fcntl(dup_accept_socket, F_SETFD,
444               fcntl(dup_accept_socket, F_GETFD) | FD_CLOEXEC);
445
446   #ifdef SA_NOCLDWAIT
447   act.sa_handler = SIG_IGN;
448   sigemptyset(&(act.sa_mask));
449   act.sa_flags = SA_NOCLDWAIT;
450   sigaction(SIGCHLD, &act, NULL);
451   #else
452   signal(SIGCHLD, SIG_IGN);
453   #endif
454   signal(SIGTERM, SIG_DFL);
455
456   /* Attempt to get an id from the sending machine via the RFC 1413
457   protocol. We do this in the sub-process in order not to hold up the
458   main process if there is any delay. Then set up the fullhost information
459   in case there is no HELO/EHLO.
460
461   If debugging is enabled only for the daemon, we must turn if off while
462   finding the id, but turn it on again afterwards so that information about the
463   incoming connection is output. */
464
465   if (f.debug_daemon) debug_selector = 0;
466   verify_get_ident(IDENT_PORT);
467   host_build_sender_fullhost();
468   debug_selector = save_debug_selector;
469
470   DEBUG(D_any)
471     debug_printf("Process %d is handling incoming connection from %s\n",
472       (int)getpid(), sender_fullhost);
473
474   /* Now disable debugging permanently if it's required only for the daemon
475   process. */
476
477   if (f.debug_daemon) debug_selector = 0;
478
479   /* If there are too many child processes for immediate delivery,
480   set the session_local_queue_only flag, which is initialized from the
481   configured value and may therefore already be TRUE. Leave logging
482   till later so it will have a message id attached. Note that there is no
483   possibility of re-calculating this per-message, because the value of
484   smtp_accept_count does not change in this subprocess. */
485
486   if (smtp_accept_queue > 0 && smtp_accept_count > smtp_accept_queue)
487     {
488     session_local_queue_only = TRUE;
489     queue_only_reason = 1;
490     }
491
492   /* Handle the start of the SMTP session, then loop, accepting incoming
493   messages from the SMTP connection. The end will come at the QUIT command,
494   when smtp_setup_msg() returns 0. A break in the connection causes the
495   process to die (see accept.c).
496
497   NOTE: We do *not* call smtp_log_no_mail() if smtp_start_session() fails,
498   because a log line has already been written for all its failure exists
499   (usually "connection refused: <reason>") and writing another one is
500   unnecessary clutter. */
501
502   if (!smtp_start_session())
503     {
504     mac_smtp_fflush();
505     search_tidyup();
506     exim_underbar_exit(EXIT_SUCCESS);
507     }
508
509   for (;;)
510     {
511     int rc;
512     message_id[0] = 0;            /* Clear out any previous message_id */
513     reset_point = store_mark();   /* Save current store high water point */
514
515     DEBUG(D_any)
516       debug_printf("Process %d is ready for new message\n", (int)getpid());
517
518     /* Smtp_setup_msg() returns 0 on QUIT or if the call is from an
519     unacceptable host or if an ACL "drop" command was triggered, -1 on
520     connection lost, and +1 on validly reaching DATA. Receive_msg() almost
521     always returns TRUE when smtp_input is true; just retry if no message was
522     accepted (can happen for invalid message parameters). However, it can yield
523     FALSE if the connection was forcibly dropped by the DATA ACL. */
524
525     if ((rc = smtp_setup_msg()) > 0)
526       {
527       BOOL ok = receive_msg(FALSE);
528       search_tidyup();                    /* Close cached databases */
529       if (!ok)                            /* Connection was dropped */
530         {
531         cancel_cutthrough_connection(TRUE, US"receive dropped");
532         mac_smtp_fflush();
533         smtp_log_no_mail();               /* Log no mail if configured */
534         exim_underbar_exit(EXIT_SUCCESS);
535         }
536       if (message_id[0] == 0) continue;   /* No message was accepted */
537       }
538     else
539       {
540       if (smtp_out)
541         {
542         int fd = fileno(smtp_in);
543         uschar buf[128];
544
545         mac_smtp_fflush();
546         /* drain socket, for clean TCP FINs */
547         if (fcntl(fd, F_SETFL, O_NONBLOCK) == 0)
548           for(int i = 16; read(fd, buf, sizeof(buf)) > 0 && i > 0; ) i--;
549         }
550       cancel_cutthrough_connection(TRUE, US"message setup dropped");
551       search_tidyup();
552       smtp_log_no_mail();                 /* Log no mail if configured */
553
554       /*XXX should we pause briefly, hoping that the client will be the
555       active TCP closer hence get the TCP_WAIT endpoint? */
556       DEBUG(D_receive) debug_printf("SMTP>>(close on process exit)\n");
557       exim_underbar_exit(rc ? EXIT_FAILURE : EXIT_SUCCESS);
558       }
559
560     /* Show the recipients when debugging */
561
562     DEBUG(D_receive)
563       {
564       if (sender_address)
565         debug_printf("Sender: %s\n", sender_address);
566       if (recipients_list)
567         {
568         debug_printf("Recipients:\n");
569         for (int i = 0; i < recipients_count; i++)
570           debug_printf("  %s\n", recipients_list[i].address);
571         }
572       }
573
574     /* A message has been accepted. Clean up any previous delivery processes
575     that have completed and are defunct, on systems where they don't go away
576     by themselves (see comments when setting SIG_IGN above). On such systems
577     (if any) these delivery processes hang around after termination until
578     the next message is received. */
579
580     #ifndef SIG_IGN_WORKS
581     while (waitpid(-1, NULL, WNOHANG) > 0);
582     #endif
583
584     /* Reclaim up the store used in accepting this message */
585
586       {
587       int r = receive_messagecount;
588       BOOL q = f.queue_only_policy;
589       smtp_reset(reset_point);
590       reset_point = NULL;
591       f.queue_only_policy = q;
592       receive_messagecount = r;
593       }
594
595     /* If queue_only is set or if there are too many incoming connections in
596     existence, session_local_queue_only will be TRUE. If it is not, check
597     whether we have received too many messages in this session for immediate
598     delivery. */
599
600     if (!session_local_queue_only &&
601         smtp_accept_queue_per_connection > 0 &&
602         receive_messagecount > smtp_accept_queue_per_connection)
603       {
604       session_local_queue_only = TRUE;
605       queue_only_reason = 2;
606       }
607
608     /* Initialize local_queue_only from session_local_queue_only. If it is not
609     true, and queue_only_load is set, check that the load average is below it.
610     If local_queue_only is set by this means, we also set if for the session if
611     queue_only_load_latch is true (the default). This means that, once set,
612     local_queue_only remains set for any subsequent messages on the same SMTP
613     connection. This is a deliberate choice; even though the load average may
614     fall, it doesn't seem right to deliver later messages on the same call when
615     not delivering earlier ones. However, the are special circumstances such as
616     very long-lived connections from scanning appliances where this is not the
617     best strategy. In such cases, queue_only_load_latch should be set false. */
618
619     if (  !(local_queue_only = session_local_queue_only)
620        && queue_only_load >= 0
621        && (local_queue_only = (load_average = OS_GETLOADAVG()) > queue_only_load)
622        )
623       {
624       queue_only_reason = 3;
625       if (queue_only_load_latch) session_local_queue_only = TRUE;
626       }
627
628     /* Log the queueing here, when it will get a message id attached, but
629     not if queue_only is set (case 0). */
630
631     if (local_queue_only) switch(queue_only_reason)
632       {
633       case 1: log_write(L_delay_delivery,
634                 LOG_MAIN, "no immediate delivery: too many connections "
635                 "(%d, max %d)", smtp_accept_count, smtp_accept_queue);
636               break;
637
638       case 2: log_write(L_delay_delivery,
639                 LOG_MAIN, "no immediate delivery: more than %d messages "
640                 "received in one connection", smtp_accept_queue_per_connection);
641               break;
642
643       case 3: log_write(L_delay_delivery,
644                 LOG_MAIN, "no immediate delivery: load average %.2f",
645                 (double)load_average/1000.0);
646               break;
647       }
648
649     /* If a delivery attempt is required, spin off a new process to handle it.
650     If we are not root, we have to re-exec exim unless deliveries are being
651     done unprivileged. */
652
653     else if (  (!f.queue_only_policy || f.queue_smtp)
654             && !f.deliver_freeze)
655       {
656       pid_t dpid;
657
658       /* Before forking, ensure that the C output buffer is flushed. Otherwise
659       anything that it in it will get duplicated, leading to duplicate copies
660       of the pending output. */
661
662       mac_smtp_fflush();
663
664       if ((dpid = exim_fork(US"daemon-accept-delivery")) == 0)
665         {
666         (void)fclose(smtp_in);
667         (void)fclose(smtp_out);
668
669         /* Don't ever molest the parent's SSL connection, but do clean up
670         the data structures if necessary. */
671
672 #ifndef DISABLE_TLS
673         tls_close(NULL, TLS_NO_SHUTDOWN);
674 #endif
675
676         /* Reset SIGHUP and SIGCHLD in the child in both cases. */
677
678         signal(SIGHUP,  SIG_DFL);
679         signal(SIGCHLD, SIG_DFL);
680         signal(SIGTERM, SIG_DFL);
681
682         if (geteuid() != root_uid && !deliver_drop_privilege)
683           {
684           signal(SIGALRM, SIG_DFL);
685           delivery_re_exec(CEE_EXEC_PANIC);
686           /* Control does not return here. */
687           }
688
689         /* No need to re-exec; SIGALRM remains set to the default handler */
690
691         (void) deliver_message(message_id, FALSE, FALSE);
692         search_tidyup();
693         exim_underbar_exit(EXIT_SUCCESS);
694         }
695
696       if (dpid > 0)
697         {
698         release_cutthrough_connection(US"passed for delivery");
699         DEBUG(D_any) debug_printf("forked delivery process %d\n", (int)dpid);
700         }
701       else
702         {
703         cancel_cutthrough_connection(TRUE, US"delivery fork failed");
704         log_write(0, LOG_MAIN|LOG_PANIC, "daemon: delivery process fork "
705           "failed: %s", strerror(errno));
706         }
707       }
708     }
709   }
710
711
712 /* Carrying on in the parent daemon process... Can't do much if the fork
713 failed. Otherwise, keep count of the number of accepting processes and
714 remember the pid for ticking off when the child completes. */
715
716 if (pid < 0)
717   never_error(US"daemon: accept process fork failed", US"Fork failed", errno);
718 else
719   {
720   for (int i = 0; i < smtp_accept_max; ++i)
721     if (smtp_slots[i].pid <= 0)
722       {
723       smtp_slots[i].pid = pid;
724       /* Connection closes come asyncronously, so we cannot stack this store */
725       if (smtp_accept_max_per_host)
726         smtp_slots[i].host_address = string_copy_malloc(sender_host_address);
727       smtp_accept_count++;
728       break;
729       }
730   DEBUG(D_any) debug_printf("%d SMTP accept process%s running\n",
731     smtp_accept_count, smtp_accept_count == 1 ? "" : "es");
732   }
733
734 /* Get here via goto in error cases */
735
736 ERROR_RETURN:
737
738 /* Close the streams associated with the socket which will also close the
739 socket fds in this process. We can't do anything if fclose() fails, but
740 logging brings it to someone's attention. However, "connection reset by peer"
741 isn't really a problem, so skip that one. On Solaris, a dropped connection can
742 manifest itself as a broken pipe, so drop that one too. If the streams don't
743 exist, something went wrong while setting things up. Make sure the socket
744 descriptors are closed, in order to drop the connection. */
745
746 if (smtp_out)
747   {
748   if (fclose(smtp_out) != 0 && errno != ECONNRESET && errno != EPIPE)
749     log_write(0, LOG_MAIN|LOG_PANIC, "daemon: fclose(smtp_out) failed: %s",
750       strerror(errno));
751   smtp_out = NULL;
752   }
753 else (void)close(accept_socket);
754
755 if (smtp_in)
756   {
757   if (fclose(smtp_in) != 0 && errno != ECONNRESET && errno != EPIPE)
758     log_write(0, LOG_MAIN|LOG_PANIC, "daemon: fclose(smtp_in) failed: %s",
759       strerror(errno));
760   smtp_in = NULL;
761   }
762 else (void)close(dup_accept_socket);
763
764 /* Release any store used in this process, including the store used for holding
765 the incoming host address and an expanded active_hostname. */
766
767 log_close_all();
768 interface_address =
769 sender_host_address = NULL;
770 store_reset(reset_point);
771 sender_host_address = NULL;
772 }
773
774
775
776
777 /*************************************************
778 *       Check wildcard listen special cases      *
779 *************************************************/
780
781 /* This function is used when binding and listening on lists of addresses and
782 ports. It tests for special cases of wildcard listening, when IPv4 and IPv6
783 sockets may interact in different ways in different operating systems. It is
784 passed an error number, the list of listening addresses, and the current
785 address. Two checks are available: for a previous wildcard IPv6 address, or for
786 a following wildcard IPv4 address, in both cases on the same port.
787
788 In practice, pairs of wildcard addresses should be adjacent in the address list
789 because they are sorted that way below.
790
791 Arguments:
792   eno            the error number
793   addresses      the list of addresses
794   ipa            the current IP address
795   back           if TRUE, check for previous wildcard IPv6 address
796                  if FALSE, check for a following wildcard IPv4 address
797
798 Returns:         TRUE or FALSE
799 */
800
801 static BOOL
802 check_special_case(int eno, ip_address_item *addresses, ip_address_item *ipa,
803   BOOL back)
804 {
805 ip_address_item *ipa2;
806
807 /* For the "back" case, if the failure was "address in use" for a wildcard IPv4
808 address, seek a previous IPv6 wildcard address on the same port. As it is
809 previous, it must have been successfully bound and be listening. Flag it as a
810 "6 including 4" listener. */
811
812 if (back)
813   {
814   if (eno != EADDRINUSE || ipa->address[0] != 0) return FALSE;
815   for (ipa2 = addresses; ipa2 != ipa; ipa2 = ipa2->next)
816     {
817     if (ipa2->address[1] == 0 && ipa2->port == ipa->port)
818       {
819       ipa2->v6_include_v4 = TRUE;
820       return TRUE;
821       }
822     }
823   }
824
825 /* For the "forward" case, if the current address is a wildcard IPv6 address,
826 we seek a following wildcard IPv4 address on the same port. */
827
828 else
829   {
830   if (ipa->address[0] != ':' || ipa->address[1] != 0) return FALSE;
831   for (ipa2 = ipa->next; ipa2 != NULL; ipa2 = ipa2->next)
832     if (ipa2->address[0] == 0 && ipa->port == ipa2->port) return TRUE;
833   }
834
835 return FALSE;
836 }
837
838
839
840
841 /*************************************************
842 *         Handle terminating subprocesses        *
843 *************************************************/
844
845 /* Handle the termination of child processes. Theoretically, this need be done
846 only when sigchld_seen is TRUE, but rumour has it that some systems lose
847 SIGCHLD signals at busy times, so to be on the safe side, this function is
848 called each time round. It shouldn't be too expensive.
849
850 Arguments:  none
851 Returns:    nothing
852 */
853
854 static void
855 handle_ending_processes(void)
856 {
857 int status;
858 pid_t pid;
859
860 while ((pid = waitpid(-1, &status, WNOHANG)) > 0)
861   {
862   DEBUG(D_any)
863     {
864     debug_printf("child %d ended: status=0x%x\n", (int)pid, status);
865 #ifdef WCOREDUMP
866     if (WIFEXITED(status))
867       debug_printf("  normal exit, %d\n", WEXITSTATUS(status));
868     else if (WIFSIGNALED(status))
869       debug_printf("  signal exit, signal %d%s\n", WTERMSIG(status),
870           WCOREDUMP(status) ? " (core dumped)" : "");
871 #endif
872     }
873
874   /* If it's a listening daemon for which we are keeping track of individual
875   subprocesses, deal with an accepting process that has terminated. */
876
877   if (smtp_slots)
878     {
879     int i;
880     for (i = 0; i < smtp_accept_max; i++)
881       if (smtp_slots[i].pid == pid)
882         {
883         if (smtp_slots[i].host_address)
884           store_free(smtp_slots[i].host_address);
885         smtp_slots[i] = empty_smtp_slot;
886         if (--smtp_accept_count < 0) smtp_accept_count = 0;
887         DEBUG(D_any) debug_printf("%d SMTP accept process%s now running\n",
888           smtp_accept_count, (smtp_accept_count == 1)? "" : "es");
889         break;
890         }
891     if (i < smtp_accept_max) continue;  /* Found an accepting process */
892     }
893
894   /* If it wasn't an accepting process, see if it was a queue-runner
895   process that we are tracking. */
896
897   if (queue_pid_slots)
898     {
899     int max = atoi(CS expand_string(queue_run_max));
900     for (int i = 0; i < max; i++)
901       if (queue_pid_slots[i] == pid)
902         {
903         queue_pid_slots[i] = 0;
904         if (--queue_run_count < 0) queue_run_count = 0;
905         DEBUG(D_any) debug_printf("%d queue-runner process%s now running\n",
906           queue_run_count, (queue_run_count == 1)? "" : "es");
907         break;
908         }
909     }
910   }
911 }
912
913
914
915 static void
916 set_pid_file_path(void)
917 {
918 if (override_pid_file_path)
919   pid_file_path = override_pid_file_path;
920
921 if (!*pid_file_path)
922   pid_file_path = string_sprintf("%s/exim-daemon.pid", spool_directory);
923 }
924
925
926 /* Remove the daemon's pidfile.  Note: runs with root privilege,
927 as a direct child of the daemon.  Does not return. */
928
929 void
930 delete_pid_file(void)
931 {
932 uschar * daemon_pid = string_sprintf("%d\n", (int)getppid());
933 FILE * f;
934
935 set_pid_file_path();
936 if ((f = Ufopen(pid_file_path, "rb")))
937   {
938   if (  fgets(CS big_buffer, big_buffer_size, f)
939         && Ustrcmp(daemon_pid, big_buffer) == 0
940      )
941     if (Uunlink(pid_file_path) == 0)
942       {
943       DEBUG(D_any)
944         debug_printf("%s unlink: %s\n", pid_file_path, strerror(errno));
945       }
946     else
947       DEBUG(D_any)
948         debug_printf("unlinked %s\n", pid_file_path);
949   fclose(f);
950   }
951 else
952   DEBUG(D_any)
953     debug_printf("%s\n", string_open_failed("pid file %s", pid_file_path));
954 exim_exit(EXIT_SUCCESS);
955 }
956
957
958 /* Called by the daemon; exec a child to get the pid file deleted
959 since we may require privs for the containing directory */
960
961 static void
962 daemon_die(void)
963 {
964 int pid;
965
966 #if defined(EXIM_HAVE_INOTIFY) || defined(EXIM_HAVE_KEVENT)
967 tls_watch_invalidate();
968 #endif
969
970 if (daemon_notifier_fd >= 0)
971   {
972   close(daemon_notifier_fd);
973   daemon_notifier_fd = -1;
974 #ifndef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
975     {
976     uschar * s = expand_string(notifier_socket);
977     DEBUG(D_any) debug_printf("unlinking notifier socket %s\n", s);
978     Uunlink(s);
979     }
980 #endif
981   }
982
983 if (f.running_in_test_harness || write_pid)
984   {
985   if ((pid = exim_fork(US"daemon-del-pidfile")) == 0)
986     {
987     if (override_pid_file_path)
988       (void)child_exec_exim(CEE_EXEC_PANIC, FALSE, NULL, FALSE, 3,
989         "-oP", override_pid_file_path, "-oPX");
990     else
991       (void)child_exec_exim(CEE_EXEC_PANIC, FALSE, NULL, FALSE, 1, "-oPX");
992
993     /* Control never returns here. */
994     }
995   if (pid > 0)
996     child_close(pid, 1);
997   }
998 exim_exit(EXIT_SUCCESS);
999 }
1000
1001
1002 /*************************************************
1003 *       Listener socket for local work prompts   *
1004 *************************************************/
1005
1006 static void
1007 daemon_notifier_socket(void)
1008 {
1009 int fd;
1010 const uschar * where;
1011 struct sockaddr_un sa_un = {.sun_family = AF_UNIX};
1012 int len;
1013
1014 if (!notifier_socket || !*notifier_socket)
1015   {
1016   DEBUG(D_any) debug_printf("-oY used so not creating notifier socket\n");
1017   return;
1018   }
1019 if (override_local_interfaces && !override_pid_file_path)
1020   {
1021   DEBUG(D_any)
1022     debug_printf("-oX used without -oP so not creating notifier socket\n");
1023   return;
1024   }
1025
1026 DEBUG(D_any) debug_printf("creating notifier socket\n");
1027
1028 #ifdef SOCK_CLOEXEC
1029 if ((fd = socket(PF_UNIX, SOCK_DGRAM|SOCK_CLOEXEC, 0)) < 0)
1030   { where = US"socket"; goto bad; }
1031 #else
1032 if ((fd = socket(PF_UNIX, SOCK_DGRAM, 0)) < 0)
1033   { where = US"socket"; goto bad; }
1034 (void)fcntl(fd, F_SETFD, fcntl(fd, F_GETFD) | FD_CLOEXEC);
1035 #endif
1036
1037 #ifdef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
1038 sa_un.sun_path[0] = 0;  /* Abstract local socket addr - Linux-specific? */
1039 len = offsetof(struct sockaddr_un, sun_path) + 1
1040   + snprintf(sa_un.sun_path+1, sizeof(sa_un.sun_path)-1, "%s",
1041               expand_string(notifier_socket));
1042 DEBUG(D_any) debug_printf(" @%s\n", sa_un.sun_path+1);
1043 #else                   /* filesystem-visible and persistent; will neeed removal */
1044 len = offsetof(struct sockaddr_un, sun_path)
1045   + snprintf(sa_un.sun_path, sizeof(sa_un.sun_path), "%s", 
1046               expand_string(notifier_socket));
1047 DEBUG(D_any) debug_printf(" %s\n", sa_un.sun_path);
1048 #endif
1049
1050 if (bind(fd, (const struct sockaddr *)&sa_un, len) < 0)
1051   { where = US"bind"; goto bad; }
1052
1053 #ifdef SO_PASSCRED              /* Linux */
1054 if (setsockopt(fd, SOL_SOCKET, SO_PASSCRED, &on, sizeof(on)) < 0)
1055   { where = US"SO_PASSCRED"; goto bad2; }
1056 #elif defined(LOCAL_CREDS)      /* FreeBSD-ish */
1057 if (setsockopt(fd, 0, LOCAL_CREDS, &on, sizeof(on)) < 0)
1058   { where = US"LOCAL_CREDS"; goto bad2; }
1059 #endif
1060
1061 /* debug_printf("%s: fd %d\n", __FUNCTION__, fd); */
1062 daemon_notifier_fd = fd;
1063 return;
1064
1065 bad2:
1066 #ifndef EXIM_HAVE_ABSTRACT_UNIX_SOCKETS
1067   Uunlink(sa_un.sun_path);
1068 #endif
1069 bad:
1070   log_write(0, LOG_MAIN|LOG_PANIC, "%s %s: %s",
1071     __FUNCTION__, where, strerror(errno));
1072   close(fd);
1073   return;
1074 }
1075
1076
1077 static uschar queuerun_msgid[MESSAGE_ID_LENGTH+1];
1078
1079 /* Return TRUE if a sigalrm should be emulated */
1080 static BOOL
1081 daemon_notification(void)
1082 {
1083 uschar buf[256], cbuf[256];
1084 struct sockaddr_un sa_un;
1085 struct iovec iov = {.iov_base = buf, .iov_len = sizeof(buf)-1};
1086 struct msghdr msg = { .msg_name = &sa_un,
1087                       .msg_namelen = sizeof(sa_un),
1088                       .msg_iov = &iov,
1089                       .msg_iovlen = 1,
1090                       .msg_control = cbuf,
1091                       .msg_controllen = sizeof(cbuf)
1092                     };
1093 ssize_t sz;
1094
1095 buf[sizeof(buf)-1] = 0;
1096 if ((sz = recvmsg(daemon_notifier_fd, &msg, 0)) <= 0) return FALSE;
1097 if (sz >= sizeof(buf)) return FALSE;
1098
1099 #ifdef notdef
1100 debug_printf("addrlen %d\n", msg.msg_namelen);
1101 #endif
1102 DEBUG(D_queue_run) debug_printf("%s from addr '%s%.*s'\n", __FUNCTION__,
1103   *sa_un.sun_path ? "" : "@",
1104   (int)msg.msg_namelen - (*sa_un.sun_path ? 0 : 1),
1105   sa_un.sun_path + (*sa_un.sun_path ? 0 : 1));
1106
1107 /* Refuse to handle the item unless the peer has good credentials */
1108 #ifdef SCM_CREDENTIALS
1109 # define EXIM_SCM_CR_TYPE SCM_CREDENTIALS
1110 #elif defined(LOCAL_CREDS) && defined(SCM_CREDS)
1111 # define EXIM_SCM_CR_TYPE SCM_CREDS
1112 #else
1113         /* The OS has no way to get the creds of the caller (for a unix/datagram socket.
1114         Punt; don't try to check. */
1115 #endif
1116
1117 #ifdef EXIM_SCM_CR_TYPE
1118 for (struct cmsghdr * cp = CMSG_FIRSTHDR(&msg);
1119      cp;
1120      cp = CMSG_NXTHDR(&msg, cp))
1121   if (cp->cmsg_level == SOL_SOCKET && cp->cmsg_type == EXIM_SCM_CR_TYPE)
1122   {
1123 # ifdef SCM_CREDENTIALS                                 /* Linux */
1124   struct ucred * cr = (struct ucred *) CMSG_DATA(cp);
1125   if (cr->uid && cr->uid != exim_uid)
1126     {
1127     DEBUG(D_queue_run) debug_printf("%s: sender creds pid %d uid %d gid %d\n",
1128       __FUNCTION__, (int)cr->pid, (int)cr->uid, (int)cr->gid);
1129     return FALSE;
1130     }
1131 # elif defined(LOCAL_CREDS)                             /* BSD-ish */
1132   struct sockcred * cr = (struct sockcred *) CMSG_DATA(cp);
1133   if (cr->sc_uid && cr->sc_uid != exim_uid)
1134     {
1135     DEBUG(D_queue_run) debug_printf("%s: sender creds pid ??? uid %d gid %d\n",
1136       __FUNCTION__, (int)cr->sc_uid, (int)cr->sc_gid);
1137     return FALSE;
1138     }
1139 # endif
1140   break;
1141   }
1142 #endif
1143
1144 buf[sz] = 0;
1145 switch (buf[0])
1146   {
1147 #ifndef DISABLE_QUEUE_RAMP
1148   case NOTIFY_MSG_QRUN:
1149     /* this should be a message_id */
1150     DEBUG(D_queue_run)
1151       debug_printf("%s: qrunner trigger: %s\n", __FUNCTION__, buf+1);
1152     memcpy(queuerun_msgid, buf+1, MESSAGE_ID_LENGTH+1);
1153     return TRUE;
1154 #endif
1155
1156   case NOTIFY_QUEUE_SIZE_REQ:
1157     {
1158     uschar buf[16];
1159     int len = snprintf(CS buf, sizeof(buf), "%u", queue_count_cached());
1160
1161     DEBUG(D_queue_run)
1162       debug_printf("%s: queue size request: %s\n", __FUNCTION__, buf);
1163
1164     if (sendto(daemon_notifier_fd, buf, len, 0,
1165                 (const struct sockaddr *)&sa_un, msg.msg_namelen) < 0)
1166       log_write(0, LOG_MAIN|LOG_PANIC,
1167         "%s: sendto: %s\n", __FUNCTION__, strerror(errno));
1168     return FALSE;
1169     }
1170   }
1171 return FALSE;
1172 }
1173
1174
1175 /*************************************************
1176 *              Exim Daemon Mainline              *
1177 *************************************************/
1178
1179 /* The daemon can do two jobs, either of which is optional:
1180
1181 (1) Listens for incoming SMTP calls and spawns off a sub-process to handle
1182 each one. This is requested by the -bd option, with -oX specifying the SMTP
1183 port on which to listen (for testing).
1184
1185 (2) Spawns a queue-running process every so often. This is controlled by the
1186 -q option with a an interval time. (If no time is given, a single queue run
1187 is done from the main function, and control doesn't get here.)
1188
1189 Root privilege is required in order to attach to port 25. Some systems require
1190 it when calling socket() rather than bind(). To cope with all cases, we run as
1191 root for both socket() and bind(). Some systems also require root in order to
1192 write to the pid file directory. This function must therefore be called as root
1193 if it is to work properly in all circumstances. Once the socket is bound and
1194 the pid file written, root privilege is given up if there is an exim uid.
1195
1196 There are no arguments to this function, and it never returns. */
1197
1198 void
1199 daemon_go(void)
1200 {
1201 struct passwd *pw;
1202 int *listen_sockets = NULL;
1203 int listen_socket_count = 0;
1204 ip_address_item *addresses = NULL;
1205 time_t last_connection_time = (time_t)0;
1206 int local_queue_run_max = atoi(CS expand_string(queue_run_max));
1207
1208 process_purpose = US"daemon";
1209
1210 /* If any debugging options are set, turn on the D_pid bit so that all
1211 debugging lines get the pid added. */
1212
1213 DEBUG(D_any|D_v) debug_selector |= D_pid;
1214
1215 if (f.inetd_wait_mode)
1216   {
1217   listen_socket_count = 1;
1218   listen_sockets = store_get(sizeof(int), FALSE);
1219   (void) close(3);
1220   if (dup2(0, 3) == -1)
1221     log_write(0, LOG_MAIN|LOG_PANIC_DIE,
1222         "failed to dup inetd socket safely away: %s", strerror(errno));
1223
1224   listen_sockets[0] = 3;
1225   (void) close(0);
1226   (void) close(1);
1227   (void) close(2);
1228   exim_nullstd();
1229
1230   if (debug_file == stderr)
1231     {
1232     /* need a call to log_write before call to open debug_file, so that
1233     log.c:file_path has been initialised.  This is unfortunate. */
1234     log_write(0, LOG_MAIN, "debugging Exim in inetd wait mode starting");
1235
1236     fclose(debug_file);
1237     debug_file = NULL;
1238     exim_nullstd(); /* re-open fd2 after we just closed it again */
1239     debug_logging_activate(US"-wait", NULL);
1240     }
1241
1242   DEBUG(D_any) debug_printf("running in inetd wait mode\n");
1243
1244   /* As per below, when creating sockets ourselves, we handle tcp_nodelay for
1245   our own buffering; we assume though that inetd set the socket REUSEADDR. */
1246
1247   if (tcp_nodelay)
1248     if (setsockopt(3, IPPROTO_TCP, TCP_NODELAY, US &on, sizeof(on)))
1249       log_write(0, LOG_MAIN|LOG_PANIC_DIE, "failed to set socket NODELAY: %s",
1250         strerror(errno));
1251   }
1252
1253
1254 if (f.inetd_wait_mode || f.daemon_listen)
1255   {
1256   /* If any option requiring a load average to be available during the
1257   reception of a message is set, call os_getloadavg() while we are root
1258   for those OS for which this is necessary the first time it is called (in
1259   order to perform an "open" on the kernel memory file). */
1260
1261   #ifdef LOAD_AVG_NEEDS_ROOT
1262   if (queue_only_load >= 0 || smtp_load_reserve >= 0 ||
1263        (deliver_queue_load_max >= 0 && deliver_drop_privilege))
1264     (void)os_getloadavg();
1265   #endif
1266   }
1267
1268
1269 /* Do the preparation for setting up a listener on one or more interfaces, and
1270 possible on various ports. This is controlled by the combination of
1271 local_interfaces (which can set IP addresses and ports) and daemon_smtp_port
1272 (which is a list of default ports to use for those items in local_interfaces
1273 that do not specify a port). The -oX command line option can be used to
1274 override one or both of these options.
1275
1276 If local_interfaces is not set, the default is to listen on all interfaces.
1277 When it is set, it can include "all IPvx interfaces" as an item. This is useful
1278 when different ports are in use.
1279
1280 It turns out that listening on all interfaces is messy in an IPv6 world,
1281 because several different implementation approaches have been taken. This code
1282 is now supposed to work with all of them. The point of difference is whether an
1283 IPv6 socket that is listening on all interfaces will receive incoming IPv4
1284 calls or not. We also have to cope with the case when IPv6 libraries exist, but
1285 there is no IPv6 support in the kernel.
1286
1287 . On Solaris, an IPv6 socket will accept IPv4 calls, and give them as mapped
1288   addresses. However, if an IPv4 socket is also listening on all interfaces,
1289   calls are directed to the appropriate socket.
1290
1291 . On (some versions of) Linux, an IPv6 socket will accept IPv4 calls, and
1292   give them as mapped addresses, but an attempt also to listen on an IPv4
1293   socket on all interfaces causes an error.
1294
1295 . On OpenBSD, an IPv6 socket will not accept IPv4 calls. You have to set up
1296   two sockets if you want to accept both kinds of call.
1297
1298 . FreeBSD is like OpenBSD, but it has the IPV6_V6ONLY socket option, which
1299   can be turned off, to make it behave like the versions of Linux described
1300   above.
1301
1302 . I heard a report that the USAGI IPv6 stack for Linux has implemented
1303   IPV6_V6ONLY.
1304
1305 So, what we do when IPv6 is supported is as follows:
1306
1307  (1) After it is set up, the list of interfaces is scanned for wildcard
1308      addresses. If an IPv6 and an IPv4 wildcard are both found for the same
1309      port, the list is re-arranged so that they are together, with the IPv6
1310      wildcard first.
1311
1312  (2) If the creation of a wildcard IPv6 socket fails, we just log the error and
1313      carry on if an IPv4 wildcard socket for the same port follows later in the
1314      list. This allows Exim to carry on in the case when the kernel has no IPv6
1315      support.
1316
1317  (3) Having created an IPv6 wildcard socket, we try to set IPV6_V6ONLY if that
1318      option is defined. However, if setting fails, carry on regardless (but log
1319      the incident).
1320
1321  (4) If binding or listening on an IPv6 wildcard socket fails, it is a serious
1322      error.
1323
1324  (5) If binding or listening on an IPv4 wildcard socket fails with the error
1325      EADDRINUSE, and a previous interface was an IPv6 wildcard for the same
1326      port (which must have succeeded or we wouldn't have got this far), we
1327      assume we are in the situation where just a single socket is permitted,
1328      and ignore the error.
1329
1330 Phew!
1331
1332 The preparation code decodes options and sets up the relevant data. We do this
1333 first, so that we can return non-zero if there are any syntax errors, and also
1334 write to stderr. */
1335
1336 if (f.daemon_listen && !f.inetd_wait_mode)
1337   {
1338   int *default_smtp_port;
1339   int sep;
1340   int pct = 0;
1341   uschar *s;
1342   const uschar * list;
1343   uschar *local_iface_source = US"local_interfaces";
1344   ip_address_item *ipa;
1345   ip_address_item **pipa;
1346
1347   /* If -oX was used, disable the writing of a pid file unless -oP was
1348   explicitly used to force it. Then scan the string given to -oX. Any items
1349   that contain neither a dot nor a colon are used to override daemon_smtp_port.
1350   Any other items are used to override local_interfaces. */
1351
1352   if (override_local_interfaces)
1353     {
1354     gstring * new_smtp_port = NULL;
1355     gstring * new_local_interfaces = NULL;
1356
1357     if (!override_pid_file_path) write_pid = FALSE;
1358
1359     list = override_local_interfaces;
1360     sep = 0;
1361     while ((s = string_nextinlist(&list, &sep, NULL, 0)))
1362       {
1363       uschar joinstr[4];
1364       gstring ** gp = Ustrpbrk(s, ".:") ? &new_local_interfaces : &new_smtp_port;
1365
1366       if (!*gp)
1367         {
1368         joinstr[0] = sep;
1369         joinstr[1] = ' ';
1370         *gp = string_catn(*gp, US"<", 1);
1371         }
1372
1373       *gp = string_catn(*gp, joinstr, 2);
1374       *gp = string_cat (*gp, s);
1375       }
1376
1377     if (new_smtp_port)
1378       {
1379       daemon_smtp_port = string_from_gstring(new_smtp_port);
1380       DEBUG(D_any) debug_printf("daemon_smtp_port overridden by -oX:\n  %s\n",
1381         daemon_smtp_port);
1382       }
1383
1384     if (new_local_interfaces)
1385       {
1386       local_interfaces = string_from_gstring(new_local_interfaces);
1387       local_iface_source = US"-oX data";
1388       DEBUG(D_any) debug_printf("local_interfaces overridden by -oX:\n  %s\n",
1389         local_interfaces);
1390       }
1391     }
1392
1393   /* Create a list of default SMTP ports, to be used if local_interfaces
1394   contains entries without explicit ports. First count the number of ports, then
1395   build a translated list in a vector. */
1396
1397   list = daemon_smtp_port;
1398   sep = 0;
1399   while ((s = string_nextinlist(&list, &sep, NULL, 0)))
1400     pct++;
1401   default_smtp_port = store_get((pct+1) * sizeof(int), FALSE);
1402   list = daemon_smtp_port;
1403   sep = 0;
1404   for (pct = 0;
1405        (s = string_nextinlist(&list, &sep, NULL, 0));
1406        pct++)
1407     {
1408     if (isdigit(*s))
1409       {
1410       uschar *end;
1411       default_smtp_port[pct] = Ustrtol(s, &end, 0);
1412       if (end != s + Ustrlen(s))
1413         log_write(0, LOG_PANIC_DIE|LOG_CONFIG, "invalid SMTP port: %s", s);
1414       }
1415     else
1416       {
1417       struct servent *smtp_service = getservbyname(CS s, "tcp");
1418       if (!smtp_service)
1419         log_write(0, LOG_PANIC_DIE|LOG_CONFIG, "TCP port \"%s\" not found", s);
1420       default_smtp_port[pct] = ntohs(smtp_service->s_port);
1421       }
1422     }
1423   default_smtp_port[pct] = 0;
1424
1425   /* Check the list of TLS-on-connect ports and do name lookups if needed */
1426
1427   list = tls_in.on_connect_ports;
1428   sep = 0;
1429   while ((s = string_nextinlist(&list, &sep, big_buffer, big_buffer_size)))
1430     if (!isdigit(*s))
1431       {
1432       gstring * g = NULL;
1433
1434       list = tls_in.on_connect_ports;
1435       tls_in.on_connect_ports = NULL;
1436       sep = 0;
1437       while ((s = string_nextinlist(&list, &sep, big_buffer, big_buffer_size)))
1438         {
1439         if (!isdigit(*s))
1440           {
1441           struct servent * smtp_service = getservbyname(CS s, "tcp");
1442           if (!smtp_service)
1443             log_write(0, LOG_PANIC_DIE|LOG_CONFIG, "TCP port \"%s\" not found", s);
1444           s = string_sprintf("%d", (int)ntohs(smtp_service->s_port));
1445           }
1446         g = string_append_listele(g, ':', s);
1447         }
1448       if (g)
1449         tls_in.on_connect_ports = g->s;
1450       break;
1451       }
1452
1453   /* Create the list of local interfaces, possibly with ports included. This
1454   list may contain references to 0.0.0.0 and ::0 as wildcards. These special
1455   values are converted below. */
1456
1457   addresses = host_build_ifacelist(local_interfaces, local_iface_source);
1458
1459   /* In the list of IP addresses, convert 0.0.0.0 into an empty string, and ::0
1460   into the string ":". We use these to recognize wildcards in IPv4 and IPv6. In
1461   fact, many IP stacks recognize 0.0.0.0 and ::0 and handle them as wildcards
1462   anyway, but we need to know which are the wildcard addresses, and the shorter
1463   strings are neater.
1464
1465   In the same scan, fill in missing port numbers from the default list. When
1466   there is more than one item in the list, extra items are created. */
1467
1468   for (ipa = addresses; ipa; ipa = ipa->next)
1469     {
1470     if (Ustrcmp(ipa->address, "0.0.0.0") == 0)
1471       ipa->address[0] = 0;
1472     else if (Ustrcmp(ipa->address, "::0") == 0)
1473       {
1474       ipa->address[0] = ':';
1475       ipa->address[1] = 0;
1476       }
1477
1478     if (ipa->port > 0) continue;
1479
1480     if (daemon_smtp_port[0] <= 0)
1481       log_write(0, LOG_MAIN|LOG_PANIC_DIE, "no port specified for interface "
1482         "%s and daemon_smtp_port is unset; cannot start daemon",
1483         ipa->address[0] == 0 ? US"\"all IPv4\"" :
1484         ipa->address[1] == 0 ? US"\"all IPv6\"" : ipa->address);
1485
1486     ipa->port = default_smtp_port[0];
1487     for (int i = 1; default_smtp_port[i] > 0; i++)
1488       {
1489       ip_address_item *new = store_get(sizeof(ip_address_item), FALSE);
1490
1491       memcpy(new->address, ipa->address, Ustrlen(ipa->address) + 1);
1492       new->port = default_smtp_port[i];
1493       new->next = ipa->next;
1494       ipa->next = new;
1495       ipa = new;
1496       }
1497     }
1498
1499   /* Scan the list of addresses for wildcards. If we find an IPv4 and an IPv6
1500   wildcard for the same port, ensure that (a) they are together and (b) the
1501   IPv6 address comes first. This makes handling the messy features easier, and
1502   also simplifies the construction of the "daemon started" log line. */
1503
1504   pipa = &addresses;
1505   for (ipa = addresses; ipa; pipa = &ipa->next, ipa = ipa->next)
1506     {
1507     ip_address_item *ipa2;
1508
1509     /* Handle an IPv4 wildcard */
1510
1511     if (ipa->address[0] == 0)
1512       for (ipa2 = ipa; ipa2->next; ipa2 = ipa2->next)
1513         {
1514         ip_address_item *ipa3 = ipa2->next;
1515         if (ipa3->address[0] == ':' &&
1516             ipa3->address[1] == 0 &&
1517             ipa3->port == ipa->port)
1518           {
1519           ipa2->next = ipa3->next;
1520           ipa3->next = ipa;
1521           *pipa = ipa3;
1522           break;
1523           }
1524         }
1525
1526     /* Handle an IPv6 wildcard. */
1527
1528     else if (ipa->address[0] == ':' && ipa->address[1] == 0)
1529       for (ipa2 = ipa; ipa2->next; ipa2 = ipa2->next)
1530         {
1531         ip_address_item *ipa3 = ipa2->next;
1532         if (ipa3->address[0] == 0 && ipa3->port == ipa->port)
1533           {
1534           ipa2->next = ipa3->next;
1535           ipa3->next = ipa->next;
1536           ipa->next = ipa3;
1537           ipa = ipa3;
1538           break;
1539           }
1540         }
1541     }
1542
1543   /* Get a vector to remember all the sockets in */
1544
1545   for (ipa = addresses; ipa; ipa = ipa->next)
1546     listen_socket_count++;
1547   listen_sockets = store_get(sizeof(int) * listen_socket_count, FALSE);
1548
1549   } /* daemon_listen but not inetd_wait_mode */
1550
1551 if (f.daemon_listen)
1552   {
1553
1554   /* Do a sanity check on the max connects value just to save us from getting
1555   a huge amount of store. */
1556
1557   if (smtp_accept_max > 4095) smtp_accept_max = 4096;
1558
1559   /* There's no point setting smtp_accept_queue unless it is less than the max
1560   connects limit. The configuration reader ensures that the max is set if the
1561   queue-only option is set. */
1562
1563   if (smtp_accept_queue > smtp_accept_max) smtp_accept_queue = 0;
1564
1565   /* Get somewhere to keep the list of SMTP accepting pids if we are keeping
1566   track of them for total number and queue/host limits. */
1567
1568   if (smtp_accept_max > 0)
1569     {
1570     smtp_slots = store_get(smtp_accept_max * sizeof(smtp_slot), FALSE);
1571     for (int i = 0; i < smtp_accept_max; i++) smtp_slots[i] = empty_smtp_slot;
1572     }
1573   }
1574
1575 /* The variable background_daemon is always false when debugging, but
1576 can also be forced false in order to keep a non-debugging daemon in the
1577 foreground. If background_daemon is true, close all open file descriptors that
1578 we know about, but then re-open stdin, stdout, and stderr to /dev/null.  Also
1579 do this for inetd_wait mode.
1580
1581 This is protection against any called functions (in libraries, or in
1582 Perl, or whatever) that think they can write to stderr (or stdout). Before this
1583 was added, it was quite likely that an SMTP connection would use one of these
1584 file descriptors, in which case writing random stuff to it caused chaos.
1585
1586 Then disconnect from the controlling terminal, Most modern Unixes seem to have
1587 setsid() for getting rid of the controlling terminal. For any OS that doesn't,
1588 setsid() can be #defined as a no-op, or as something else. */
1589
1590 if (f.background_daemon || f.inetd_wait_mode)
1591   {
1592   log_close_all();    /* Just in case anything was logged earlier */
1593   search_tidyup();    /* Just in case any were used in reading the config. */
1594   (void)close(0);           /* Get rid of stdin/stdout/stderr */
1595   (void)close(1);
1596   (void)close(2);
1597   exim_nullstd();     /* Connect stdin/stdout/stderr to /dev/null */
1598   log_stderr = NULL;  /* So no attempt to copy paniclog output */
1599   }
1600
1601 if (f.background_daemon)
1602   {
1603   /* If the parent process of this one has pid == 1, we are re-initializing the
1604   daemon as the result of a SIGHUP. In this case, there is no need to do
1605   anything, because the controlling terminal has long gone. Otherwise, fork, in
1606   case current process is a process group leader (see 'man setsid' for an
1607   explanation) before calling setsid(). */
1608
1609   if (getppid() != 1)
1610     {
1611     pid_t pid = exim_fork(US"daemon");
1612     if (pid < 0) log_write(0, LOG_MAIN|LOG_PANIC_DIE,
1613       "fork() failed when starting daemon: %s", strerror(errno));
1614     if (pid > 0) exit(EXIT_SUCCESS);      /* in parent process, just exit */
1615     (void)setsid();                       /* release controlling terminal */
1616     }
1617   }
1618
1619 /* We are now in the disconnected, daemon process (unless debugging). Set up
1620 the listening sockets if required. */
1621
1622 daemon_notifier_socket();
1623
1624 if (f.daemon_listen && !f.inetd_wait_mode)
1625   {
1626   int sk;
1627   ip_address_item *ipa;
1628
1629   /* For each IP address, create a socket, bind it to the appropriate port, and
1630   start listening. See comments above about IPv6 sockets that may or may not
1631   accept IPv4 calls when listening on all interfaces. We also have to cope with
1632   the case of a system with IPv6 libraries, but no IPv6 support in the kernel.
1633   listening, provided a wildcard IPv4 socket for the same port follows. */
1634
1635   for (ipa = addresses, sk = 0; sk < listen_socket_count; ipa = ipa->next, sk++)
1636     {
1637     BOOL wildcard;
1638     ip_address_item *ipa2;
1639     int af;
1640
1641     if (Ustrchr(ipa->address, ':') != NULL)
1642       {
1643       af = AF_INET6;
1644       wildcard = ipa->address[1] == 0;
1645       }
1646     else
1647       {
1648       af = AF_INET;
1649       wildcard = ipa->address[0] == 0;
1650       }
1651
1652     if ((listen_sockets[sk] = ip_socket(SOCK_STREAM, af)) < 0)
1653       {
1654       if (check_special_case(0, addresses, ipa, FALSE))
1655         {
1656         log_write(0, LOG_MAIN, "Failed to create IPv6 socket for wildcard "
1657           "listening (%s): will use IPv4", strerror(errno));
1658         goto SKIP_SOCKET;
1659         }
1660       log_write(0, LOG_PANIC_DIE, "IPv%c socket creation failed: %s",
1661         (af == AF_INET6)? '6' : '4', strerror(errno));
1662       }
1663
1664     /* If this is an IPv6 wildcard socket, set IPV6_V6ONLY if that option is
1665     available. Just log failure (can get protocol not available, just like
1666     socket creation can). */
1667
1668 #ifdef IPV6_V6ONLY
1669     if (af == AF_INET6 && wildcard &&
1670         setsockopt(listen_sockets[sk], IPPROTO_IPV6, IPV6_V6ONLY, CS (&on),
1671           sizeof(on)) < 0)
1672       log_write(0, LOG_MAIN, "Setting IPV6_V6ONLY on daemon's IPv6 wildcard "
1673         "socket failed (%s): carrying on without it", strerror(errno));
1674 #endif  /* IPV6_V6ONLY */
1675
1676     /* Set SO_REUSEADDR so that the daemon can be restarted while a connection
1677     is being handled.  Without this, a connection will prevent reuse of the
1678     smtp port for listening. */
1679
1680     if (setsockopt(listen_sockets[sk], SOL_SOCKET, SO_REUSEADDR,
1681                    US (&on), sizeof(on)) < 0)
1682       log_write(0, LOG_MAIN|LOG_PANIC_DIE, "setting SO_REUSEADDR on socket "
1683         "failed when starting daemon: %s", strerror(errno));
1684
1685     /* Set TCP_NODELAY; Exim does its own buffering. There is a switch to
1686     disable this because it breaks some broken clients. */
1687
1688     if (tcp_nodelay) setsockopt(listen_sockets[sk], IPPROTO_TCP, TCP_NODELAY,
1689       US (&on), sizeof(on));
1690
1691     /* Now bind the socket to the required port; if Exim is being restarted
1692     it may not always be possible to bind immediately, even with SO_REUSEADDR
1693     set, so try 10 times, waiting between each try. After 10 failures, we give
1694     up. In an IPv6 environment, if bind () fails with the error EADDRINUSE and
1695     we are doing wildcard IPv4 listening and there was a previous IPv6 wildcard
1696     address for the same port, ignore the error on the grounds that we must be
1697     in a system where the IPv6 socket accepts both kinds of call. This is
1698     necessary for (some release of) USAGI Linux; other IP stacks fail at the
1699     listen() stage instead. */
1700
1701 #ifdef TCP_FASTOPEN
1702     f.tcp_fastopen_ok = TRUE;
1703 #endif
1704     for(;;)
1705       {
1706       uschar *msg, *addr;
1707       if (ip_bind(listen_sockets[sk], af, ipa->address, ipa->port) >= 0) break;
1708       if (check_special_case(errno, addresses, ipa, TRUE))
1709         {
1710         DEBUG(D_any) debug_printf("wildcard IPv4 bind() failed after IPv6 "
1711           "listen() success; EADDRINUSE ignored\n");
1712         (void)close(listen_sockets[sk]);
1713         goto SKIP_SOCKET;
1714         }
1715       msg = US strerror(errno);
1716       addr = wildcard
1717         ? af == AF_INET6
1718         ? US"(any IPv6)"
1719         : US"(any IPv4)"
1720         : ipa->address;
1721       if (daemon_startup_retries <= 0)
1722         log_write(0, LOG_MAIN|LOG_PANIC_DIE,
1723           "socket bind() to port %d for address %s failed: %s: "
1724           "daemon abandoned", ipa->port, addr, msg);
1725       log_write(0, LOG_MAIN, "socket bind() to port %d for address %s "
1726         "failed: %s: waiting %s before trying again (%d more %s)",
1727         ipa->port, addr, msg, readconf_printtime(daemon_startup_sleep),
1728         daemon_startup_retries, (daemon_startup_retries > 1)? "tries" : "try");
1729       daemon_startup_retries--;
1730       sleep(daemon_startup_sleep);
1731       }
1732
1733     DEBUG(D_any)
1734       if (wildcard)
1735         debug_printf("listening on all interfaces (IPv%c) port %d\n",
1736           af == AF_INET6 ? '6' : '4', ipa->port);
1737       else
1738         debug_printf("listening on %s port %d\n", ipa->address, ipa->port);
1739
1740 #if defined(TCP_FASTOPEN) && !defined(__APPLE__)
1741     if (  f.tcp_fastopen_ok
1742        && setsockopt(listen_sockets[sk], IPPROTO_TCP, TCP_FASTOPEN,
1743                     &smtp_connect_backlog, sizeof(smtp_connect_backlog)))
1744       {
1745       DEBUG(D_any) debug_printf("setsockopt FASTOPEN: %s\n", strerror(errno));
1746       f.tcp_fastopen_ok = FALSE;
1747       }
1748 #endif
1749
1750     /* Start listening on the bound socket, establishing the maximum backlog of
1751     connections that is allowed. On success, continue to the next address. */
1752
1753     if (listen(listen_sockets[sk], smtp_connect_backlog) >= 0)
1754       {
1755 #if defined(TCP_FASTOPEN) && defined(__APPLE__)
1756       if (  f.tcp_fastopen_ok
1757          && setsockopt(listen_sockets[sk], IPPROTO_TCP, TCP_FASTOPEN,
1758                       &on, sizeof(on)))
1759         {
1760         DEBUG(D_any) debug_printf("setsockopt FASTOPEN: %s\n", strerror(errno));
1761         f.tcp_fastopen_ok = FALSE;
1762         }
1763 #endif
1764       continue;
1765       }
1766
1767     /* Listening has failed. In an IPv6 environment, as for bind(), if listen()
1768     fails with the error EADDRINUSE and we are doing IPv4 wildcard listening
1769     and there was a previous successful IPv6 wildcard listen on the same port,
1770     we want to ignore the error on the grounds that we must be in a system
1771     where the IPv6 socket accepts both kinds of call. */
1772
1773     if (!check_special_case(errno, addresses, ipa, TRUE))
1774       log_write(0, LOG_PANIC_DIE, "listen() failed on interface %s: %s",
1775         wildcard
1776         ? af == AF_INET6 ? US"(any IPv6)" : US"(any IPv4)" : ipa->address,
1777         strerror(errno));
1778
1779     DEBUG(D_any) debug_printf("wildcard IPv4 listen() failed after IPv6 "
1780       "listen() success; EADDRINUSE ignored\n");
1781     (void)close(listen_sockets[sk]);
1782
1783     /* Come here if there has been a problem with the socket which we
1784     are going to ignore. We remove the address from the chain, and back up the
1785     counts. */
1786
1787   SKIP_SOCKET:
1788     sk--;                          /* Back up the count */
1789     listen_socket_count--;         /* Reduce the total */
1790     if (ipa == addresses) addresses = ipa->next; else
1791       {
1792       for (ipa2 = addresses; ipa2->next != ipa; ipa2 = ipa2->next);
1793       ipa2->next = ipa->next;
1794       ipa = ipa2;
1795       }
1796     }          /* End of bind/listen loop for each address */
1797   }            /* End of setup for listening */
1798
1799
1800 /* If we are not listening, we want to write a pid file only if -oP was
1801 explicitly given. */
1802
1803 else if (!override_pid_file_path)
1804   write_pid = FALSE;
1805
1806 /* Write the pid to a known file for assistance in identification, if required.
1807 We do this before giving up root privilege, because on some systems it is
1808 necessary to be root in order to write into the pid file directory. There's
1809 nothing to stop multiple daemons running, as long as no more than one listens
1810 on a given TCP/IP port on the same interface(s). However, in these
1811 circumstances it gets far too complicated to mess with pid file names
1812 automatically. Consequently, Exim 4 writes a pid file only
1813
1814   (a) When running in the test harness, or
1815   (b) When -bd is used and -oX is not used, or
1816   (c) When -oP is used to supply a path.
1817
1818 The variable daemon_write_pid is used to control this. */
1819
1820 if (f.running_in_test_harness || write_pid)
1821   {
1822   FILE *f;
1823
1824   set_pid_file_path();
1825   if ((f = modefopen(pid_file_path, "wb", 0644)))
1826     {
1827     (void)fprintf(f, "%d\n", (int)getpid());
1828     (void)fclose(f);
1829     DEBUG(D_any) debug_printf("pid written to %s\n", pid_file_path);
1830     }
1831   else
1832     DEBUG(D_any)
1833       debug_printf("%s\n", string_open_failed("pid file %s", pid_file_path));
1834   }
1835
1836 /* Set up the handler for SIGHUP, which causes a restart of the daemon. */
1837
1838 sighup_seen = FALSE;
1839 signal(SIGHUP, sighup_handler);
1840
1841 /* Give up root privilege at this point (assuming that exim_uid and exim_gid
1842 are not root). The third argument controls the running of initgroups().
1843 Normally we do this, in order to set up the groups for the Exim user. However,
1844 if we are not root at this time - some odd installations run that way - we
1845 cannot do this. */
1846
1847 exim_setugid(exim_uid, exim_gid, geteuid()==root_uid, US"running as a daemon");
1848
1849 /* Update the originator_xxx fields so that received messages as listed as
1850 coming from Exim, not whoever started the daemon. */
1851
1852 originator_uid = exim_uid;
1853 originator_gid = exim_gid;
1854 originator_login = (pw = getpwuid(exim_uid))
1855   ? string_copy_perm(US pw->pw_name, FALSE) : US"exim";
1856
1857 /* Get somewhere to keep the list of queue-runner pids if we are keeping track
1858 of them (and also if we are doing queue runs). */
1859
1860 if (queue_interval > 0 && local_queue_run_max > 0)
1861   {
1862   queue_pid_slots = store_get(local_queue_run_max * sizeof(pid_t), FALSE);
1863   for (int i = 0; i < local_queue_run_max; i++) queue_pid_slots[i] = 0;
1864   }
1865
1866 /* Set up the handler for termination of child processes, and the one
1867 telling us to die. */
1868
1869 sigchld_seen = FALSE;
1870 os_non_restarting_signal(SIGCHLD, main_sigchld_handler);
1871
1872 sigterm_seen = FALSE;
1873 os_non_restarting_signal(SIGTERM, main_sigterm_handler);
1874
1875 /* If we are to run the queue periodically, pretend the alarm has just gone
1876 off. This will cause the first queue-runner to get kicked off straight away. */
1877
1878 sigalrm_seen = (queue_interval > 0);
1879
1880 /* Log the start up of a daemon - at least one of listening or queue running
1881 must be set up. */
1882
1883 if (f.inetd_wait_mode)
1884   {
1885   uschar *p = big_buffer;
1886
1887   if (inetd_wait_timeout >= 0)
1888     sprintf(CS p, "terminating after %d seconds", inetd_wait_timeout);
1889   else
1890     sprintf(CS p, "with no wait timeout");
1891
1892   log_write(0, LOG_MAIN,
1893     "exim %s daemon started: pid=%d, launched with listening socket, %s",
1894     version_string, getpid(), big_buffer);
1895   set_process_info("daemon(%s): pre-listening socket", version_string);
1896
1897   /* set up the timeout logic */
1898   sigalrm_seen = TRUE;
1899   }
1900
1901 else if (f.daemon_listen)
1902   {
1903   int smtp_ports = 0;
1904   int smtps_ports = 0;
1905   ip_address_item * ipa;
1906   uschar * p;
1907   uschar * qinfo = queue_interval > 0
1908     ? string_sprintf("-q%s%s",
1909         f.queue_2stage ? "q" : "", readconf_printtime(queue_interval))
1910     : US"no queue runs";
1911
1912   /* Build a list of listening addresses in big_buffer, but limit it to 10
1913   items. The style is for backwards compatibility.
1914
1915   It is now possible to have some ports listening for SMTPS (the old,
1916   deprecated protocol that starts TLS without using STARTTLS), and others
1917   listening for standard SMTP. Keep their listings separate. */
1918
1919   for (int j = 0, i; j < 2; j++)
1920     {
1921     for (i = 0, ipa = addresses; i < 10 && ipa; i++, ipa = ipa->next)
1922       {
1923       /* First time round, look for SMTP ports; second time round, look for
1924       SMTPS ports. Build IP+port strings. */
1925
1926       if (host_is_tls_on_connect_port(ipa->port) == (j > 0))
1927         {
1928         if (j == 0)
1929           smtp_ports++;
1930         else
1931           smtps_ports++;
1932
1933         /* Now the information about the port (and sometimes interface) */
1934
1935         if (ipa->address[0] == ':' && ipa->address[1] == 0)
1936           {                                             /* v6 wildcard */
1937           if (ipa->next && ipa->next->address[0] == 0 &&
1938               ipa->next->port == ipa->port)
1939             {
1940             ipa->log = string_sprintf(" port %d (IPv6 and IPv4)", ipa->port);
1941             (ipa = ipa->next)->log = NULL;
1942             }
1943           else if (ipa->v6_include_v4)
1944             ipa->log = string_sprintf(" port %d (IPv6 with IPv4)", ipa->port);
1945           else
1946             ipa->log = string_sprintf(" port %d (IPv6)", ipa->port);
1947           }
1948         else if (ipa->address[0] == 0)                  /* v4 wildcard */
1949           ipa->log = string_sprintf(" port %d (IPv4)", ipa->port);
1950         else                            /* check for previously-seen IP */
1951           {
1952           ip_address_item * i2;
1953           for (i2 = addresses; i2 != ipa; i2 = i2->next)
1954             if (  host_is_tls_on_connect_port(i2->port) == (j > 0)
1955                && Ustrcmp(ipa->address, i2->address) == 0
1956                )
1957               {                         /* found; append port to list */
1958               for (p = i2->log; *p; ) p++;      /* end of existing string */
1959               if (*--p == '}') *p = '\0';       /* drop EOL */
1960               while (isdigit(*--p)) ;           /* char before port */
1961
1962               i2->log = *p == ':'               /* no list yet? */
1963                 ? string_sprintf("%.*s{%s,%d}",
1964                   (int)(p - i2->log + 1), i2->log, p+1, ipa->port)
1965                 : string_sprintf("%s,%d}", i2->log, ipa->port);
1966               ipa->log = NULL;
1967               break;
1968               }
1969           if (i2 == ipa)                /* first-time IP */
1970             ipa->log = string_sprintf(" [%s]:%d", ipa->address, ipa->port);
1971           }
1972         }
1973       }
1974     }
1975
1976   p = big_buffer;
1977   for (int j = 0, i; j < 2; j++)
1978     {
1979     /* First time round, look for SMTP ports; second time round, look for
1980     SMTPS ports. For the first one of each, insert leading text. */
1981
1982     if (j == 0)
1983       {
1984       if (smtp_ports > 0)
1985         p += sprintf(CS p, "SMTP on");
1986       }
1987     else
1988       if (smtps_ports > 0)
1989         p += sprintf(CS p, "%sSMTPS on",
1990           smtp_ports == 0 ? "" : " and for ");
1991
1992     /* Now the information about the port (and sometimes interface) */
1993
1994     for (i = 0, ipa = addresses; i < 10 && ipa; i++, ipa = ipa->next)
1995       if (host_is_tls_on_connect_port(ipa->port) == (j > 0))
1996         if (ipa->log)
1997           p += sprintf(CS p, "%s",  ipa->log);
1998
1999     if (ipa)
2000       p += sprintf(CS p, " ...");
2001     }
2002
2003   log_write(0, LOG_MAIN,
2004     "exim %s daemon started: pid=%d, %s, listening for %s",
2005     version_string, getpid(), qinfo, big_buffer);
2006   set_process_info("daemon(%s): %s, listening for %s",
2007     version_string, qinfo, big_buffer);
2008   }
2009
2010 else
2011   {
2012   uschar * s = *queue_name
2013     ? string_sprintf("-qG%s/%s", queue_name, readconf_printtime(queue_interval))
2014     : string_sprintf("-q%s", readconf_printtime(queue_interval));
2015   log_write(0, LOG_MAIN,
2016     "exim %s daemon started: pid=%d, %s, not listening for SMTP",
2017     version_string, getpid(), s);
2018   set_process_info("daemon(%s): %s, not listening", version_string, s);
2019   }
2020
2021 /* Do any work it might be useful to amortize over our children
2022 (eg: compile regex) */
2023
2024 dns_pattern_init();
2025 smtp_deliver_init();    /* Used for callouts */
2026
2027 #ifndef DISABLE_DKIM
2028   {
2029 # ifdef MEASURE_TIMING
2030   struct timeval t0;
2031   gettimeofday(&t0, NULL);
2032 # endif
2033   dkim_exim_init();
2034 # ifdef MEASURE_TIMING
2035   report_time_since(&t0, US"dkim_exim_init (delta)");
2036 # endif
2037   }
2038 #endif
2039
2040 #ifdef WITH_CONTENT_SCAN
2041 malware_init();
2042 #endif
2043 #ifdef SUPPORT_SPF
2044 spf_init();
2045 #endif
2046 #ifndef DISABLE_TLS
2047 tls_daemon_init();
2048 #endif
2049
2050 /* Close the log so it can be renamed and moved. In the few cases below where
2051 this long-running process writes to the log (always exceptional conditions), it
2052 closes the log afterwards, for the same reason. */
2053
2054 log_close_all();
2055
2056 DEBUG(D_any) debug_print_ids(US"daemon running with");
2057
2058 /* Any messages accepted via this route are going to be SMTP. */
2059
2060 smtp_input = TRUE;
2061
2062 #ifdef MEASURE_TIMING
2063 report_time_since(&timestamp_startup, US"daemon loop start");   /* testcase 0022 */
2064 #endif
2065
2066 /* Enter the never-ending loop... */
2067
2068 for (;;)
2069   {
2070   #if HAVE_IPV6
2071   struct sockaddr_in6 accepted;
2072   #else
2073   struct sockaddr_in accepted;
2074   #endif
2075
2076   EXIM_SOCKLEN_T len;
2077   pid_t pid;
2078
2079   if (sigterm_seen)
2080     daemon_die();       /* Does not return */
2081
2082   /* This code is placed first in the loop, so that it gets obeyed at the
2083   start, before the first wait, for the queue-runner case, so that the first
2084   one can be started immediately.
2085
2086   The other option is that we have an inetd wait timeout specified to -bw. */
2087
2088   if (sigalrm_seen)
2089     {
2090     if (inetd_wait_timeout > 0)
2091       {
2092       time_t resignal_interval = inetd_wait_timeout;
2093
2094       if (last_connection_time == (time_t)0)
2095         {
2096         DEBUG(D_any)
2097           debug_printf("inetd wait timeout expired, but still not seen first message, ignoring\n");
2098         }
2099       else
2100         {
2101         time_t now = time(NULL);
2102         if (now == (time_t)-1)
2103           {
2104           DEBUG(D_any) debug_printf("failed to get time: %s\n", strerror(errno));
2105           }
2106         else
2107           {
2108           if ((now - last_connection_time) >= inetd_wait_timeout)
2109             {
2110             DEBUG(D_any)
2111               debug_printf("inetd wait timeout %d expired, ending daemon\n",
2112                   inetd_wait_timeout);
2113             log_write(0, LOG_MAIN, "exim %s daemon terminating, inetd wait timeout reached.\n",
2114                 version_string);
2115             exit(EXIT_SUCCESS);
2116             }
2117           else
2118             {
2119             resignal_interval -= (now - last_connection_time);
2120             }
2121           }
2122         }
2123
2124       sigalrm_seen = FALSE;
2125       ALARM(resignal_interval);
2126       }
2127
2128     else
2129       {
2130       DEBUG(D_any) debug_printf("%s received\n",
2131 #ifndef DISABLE_QUEUE_RAMP
2132         *queuerun_msgid ? "qrun notification" :
2133 #endif
2134         "SIGALRM");
2135
2136       /* Do a full queue run in a child process, if required, unless we already
2137       have enough queue runners on the go. If we are not running as root, a
2138       re-exec is required. */
2139
2140       if (  queue_interval > 0
2141          && (local_queue_run_max <= 0 || queue_run_count < local_queue_run_max))
2142         {
2143         if ((pid = exim_fork(US"queue-runner")) == 0)
2144           {
2145           /* Disable debugging if it's required only for the daemon process. We
2146           leave the above message, because it ties up with the "child ended"
2147           debugging messages. */
2148
2149           if (f.debug_daemon) debug_selector = 0;
2150
2151           /* Close any open listening sockets in the child */
2152
2153           close_daemon_sockets(daemon_notifier_fd,
2154             listen_sockets, listen_socket_count);
2155
2156           /* Reset SIGHUP and SIGCHLD in the child in both cases. */
2157
2158           signal(SIGHUP,  SIG_DFL);
2159           signal(SIGCHLD, SIG_DFL);
2160           signal(SIGTERM, SIG_DFL);
2161
2162           /* Re-exec if privilege has been given up, unless deliver_drop_
2163           privilege is set. Reset SIGALRM before exec(). */
2164
2165           if (geteuid() != root_uid && !deliver_drop_privilege)
2166             {
2167             uschar opt[8];
2168             uschar *p = opt;
2169             uschar *extra[7];
2170             int extracount = 1;
2171
2172             signal(SIGALRM, SIG_DFL);
2173             *p++ = '-';
2174             *p++ = 'q';
2175             if (  f.queue_2stage
2176 #ifndef DISABLE_QUEUE_RAMP
2177                && !*queuerun_msgid
2178 #endif
2179                ) *p++ = 'q';
2180             if (f.queue_run_first_delivery) *p++ = 'i';
2181             if (f.queue_run_force) *p++ = 'f';
2182             if (f.deliver_force_thaw) *p++ = 'f';
2183             if (f.queue_run_local) *p++ = 'l';
2184             *p = 0;
2185             extra[0] = *queue_name
2186               ? string_sprintf("%sG%s", opt, queue_name) : opt;
2187
2188 #ifndef DISABLE_QUEUE_RAMP
2189             if (*queuerun_msgid)
2190               {
2191               log_write(0, LOG_MAIN, "notify triggered queue run");
2192               extra[extracount++] = queuerun_msgid;     /* Trigger only the */
2193               extra[extracount++] = queuerun_msgid;     /* one message      */
2194               }
2195 #endif
2196
2197             /* If -R or -S were on the original command line, ensure they get
2198             passed on. */
2199
2200             if (deliver_selectstring)
2201               {
2202               extra[extracount++] = f.deliver_selectstring_regex ? US"-Rr" : US"-R";
2203               extra[extracount++] = deliver_selectstring;
2204               }
2205
2206             if (deliver_selectstring_sender)
2207               {
2208               extra[extracount++] = f.deliver_selectstring_sender_regex
2209                 ? US"-Sr" : US"-S";
2210               extra[extracount++] = deliver_selectstring_sender;
2211               }
2212
2213             /* Overlay this process with a new execution. */
2214
2215             (void)child_exec_exim(CEE_EXEC_PANIC, FALSE, NULL, FALSE, extracount,
2216               extra[0], extra[1], extra[2], extra[3], extra[4], extra[5], extra[6]);
2217
2218             /* Control never returns here. */
2219             }
2220
2221           /* No need to re-exec; SIGALRM remains set to the default handler */
2222
2223 #ifndef DISABLE_QUEUE_RAMP
2224           if (*queuerun_msgid)
2225             {
2226             log_write(0, LOG_MAIN, "notify triggered queue run");
2227             f.queue_2stage = FALSE;
2228             queue_run(queuerun_msgid, queuerun_msgid, FALSE);
2229             }
2230           else
2231 #endif
2232             queue_run(NULL, NULL, FALSE);
2233           exim_underbar_exit(EXIT_SUCCESS);
2234           }
2235
2236         if (pid < 0)
2237           {
2238           log_write(0, LOG_MAIN|LOG_PANIC, "daemon: fork of queue-runner "
2239             "process failed: %s", strerror(errno));
2240           log_close_all();
2241           }
2242         else
2243           {
2244           for (int i = 0; i < local_queue_run_max; ++i)
2245             if (queue_pid_slots[i] <= 0)
2246               {
2247               queue_pid_slots[i] = pid;
2248               queue_run_count++;
2249               break;
2250               }
2251           DEBUG(D_any) debug_printf("%d queue-runner process%s running\n",
2252             queue_run_count, queue_run_count == 1 ? "" : "es");
2253           }
2254         }
2255
2256       /* Reset the alarm clock */
2257
2258       sigalrm_seen = FALSE;
2259 #ifndef DISABLE_QUEUE_RAMP
2260       if (*queuerun_msgid)
2261         *queuerun_msgid = 0;
2262       else
2263 #endif
2264         ALARM(queue_interval);
2265       }
2266
2267     } /* sigalrm_seen */
2268
2269
2270   /* Sleep till a connection happens if listening, and handle the connection if
2271   that is why we woke up. The FreeBSD operating system requires the use of
2272   select() before accept() because the latter function is not interrupted by
2273   a signal, and we want to wake up for SIGCHLD and SIGALRM signals. Some other
2274   OS do notice signals in accept() but it does no harm to have the select()
2275   in for all of them - and it won't then be a lurking problem for ports to
2276   new OS. In fact, the later addition of listening on specific interfaces only
2277   requires this way of working anyway. */
2278
2279   if (f.daemon_listen)
2280     {
2281     int lcount, select_errno;
2282     int max_socket = 0;
2283     BOOL select_failed = FALSE;
2284     fd_set select_listen;
2285
2286     FD_ZERO(&select_listen);
2287 #ifndef DISABLE_TLS
2288     if (tls_watch_fd >= 0)
2289       {
2290       FD_SET(tls_watch_fd, &select_listen);
2291       if (tls_watch_fd > max_socket) max_socket = tls_watch_fd;
2292       }
2293 #endif
2294     if (daemon_notifier_fd >= 0)
2295       {
2296       FD_SET(daemon_notifier_fd, &select_listen);
2297       if (daemon_notifier_fd > max_socket) max_socket = daemon_notifier_fd;
2298       }
2299     for (int sk = 0; sk < listen_socket_count; sk++)
2300       {
2301       FD_SET(listen_sockets[sk], &select_listen);
2302       if (listen_sockets[sk] > max_socket) max_socket = listen_sockets[sk];
2303       }
2304
2305     DEBUG(D_any) debug_printf("Listening...\n");
2306
2307     /* In rare cases we may have had a SIGCHLD signal in the time between
2308     setting the handler (below) and getting back here. If so, pretend that the
2309     select() was interrupted so that we reap the child. This might still leave
2310     a small window when a SIGCHLD could get lost. However, since we use SIGCHLD
2311     only to do the reaping more quickly, it shouldn't result in anything other
2312     than a delay until something else causes a wake-up. */
2313
2314     if (sigchld_seen)
2315       {
2316       lcount = -1;
2317       errno = EINTR;
2318       }
2319     else
2320       lcount = select(max_socket + 1, (SELECT_ARG2_TYPE *)&select_listen,
2321         NULL, NULL, NULL);
2322
2323     if (lcount < 0)
2324       {
2325       select_failed = TRUE;
2326       lcount = 1;
2327       }
2328
2329     /* Clean up any subprocesses that may have terminated. We need to do this
2330     here so that smtp_accept_max_per_host works when a connection to that host
2331     has completed, and we are about to accept a new one. When this code was
2332     later in the sequence, a new connection could be rejected, even though an
2333     old one had just finished. Preserve the errno from any select() failure for
2334     the use of the common select/accept error processing below. */
2335
2336     select_errno = errno;
2337     handle_ending_processes();
2338     errno = select_errno;
2339
2340 #ifndef DISABLE_TLS
2341     /* Create or rotate any required keys; handle (delayed) filewatch event */
2342     tls_daemon_tick();
2343 #endif
2344
2345     /* Loop for all the sockets that are currently ready to go. If select
2346     actually failed, we have set the count to 1 and select_failed=TRUE, so as
2347     to use the common error code for select/accept below. */
2348
2349     while (lcount-- > 0)
2350       {
2351       int accept_socket = -1;
2352
2353       if (!select_failed)
2354         {
2355 #if !defined(DISABLE_TLS) && (defined(EXIM_HAVE_INOTIFY) || defined(EXIM_HAVE_KEVENT))
2356         if (tls_watch_fd >= 0 && FD_ISSET(tls_watch_fd, &select_listen))
2357           {
2358           FD_CLR(tls_watch_fd, &select_listen);
2359           tls_watch_trigger_time = time(NULL);  /* Set up delayed event */
2360           tls_watch_discard_event(tls_watch_fd);
2361           break;        /* to top of daemon loop */
2362           }
2363 #endif
2364         if (  daemon_notifier_fd >= 0
2365            && FD_ISSET(daemon_notifier_fd, &select_listen))
2366           {
2367           FD_CLR(daemon_notifier_fd, &select_listen);
2368           sigalrm_seen = daemon_notification();
2369           break;        /* to top of daemon loop */
2370           }
2371         for (int sk = 0; sk < listen_socket_count; sk++)
2372           if (FD_ISSET(listen_sockets[sk], &select_listen))
2373             {
2374             len = sizeof(accepted);
2375             accept_socket = accept(listen_sockets[sk],
2376               (struct sockaddr *)&accepted, &len);
2377             FD_CLR(listen_sockets[sk], &select_listen);
2378             break;
2379             }
2380         }
2381
2382       /* If select or accept has failed and this was not caused by an
2383       interruption, log the incident and try again. With asymmetric TCP/IP
2384       routing errors such as "No route to network" have been seen here. Also
2385       "connection reset by peer" has been seen. These cannot be classed as
2386       disastrous errors, but they could fill up a lot of log. The code in smail
2387       crashes the daemon after 10 successive failures of accept, on the grounds
2388       that some OS fail continuously. Exim originally followed suit, but this
2389       appears to have caused problems. Now it just keeps going, but instead of
2390       logging each error, it batches them up when they are continuous. */
2391
2392       if (accept_socket < 0 && errno != EINTR)
2393         {
2394         if (accept_retry_count == 0)
2395           {
2396           accept_retry_errno = errno;
2397           accept_retry_select_failed = select_failed;
2398           }
2399         else
2400           {
2401           if (errno != accept_retry_errno ||
2402               select_failed != accept_retry_select_failed ||
2403               accept_retry_count >= 50)
2404             {
2405             log_write(0, LOG_MAIN | ((accept_retry_count >= 50)? LOG_PANIC : 0),
2406               "%d %s() failure%s: %s",
2407               accept_retry_count,
2408               accept_retry_select_failed? "select" : "accept",
2409               (accept_retry_count == 1)? "" : "s",
2410               strerror(accept_retry_errno));
2411             log_close_all();
2412             accept_retry_count = 0;
2413             accept_retry_errno = errno;
2414             accept_retry_select_failed = select_failed;
2415             }
2416           }
2417         accept_retry_count++;
2418         }
2419
2420       else
2421         {
2422         if (accept_retry_count > 0)
2423           {
2424           log_write(0, LOG_MAIN, "%d %s() failure%s: %s",
2425             accept_retry_count,
2426             accept_retry_select_failed? "select" : "accept",
2427             (accept_retry_count == 1)? "" : "s",
2428             strerror(accept_retry_errno));
2429           log_close_all();
2430           accept_retry_count = 0;
2431           }
2432         }
2433
2434       /* If select/accept succeeded, deal with the connection. */
2435
2436       if (accept_socket >= 0)
2437         {
2438         if (inetd_wait_timeout)
2439           last_connection_time = time(NULL);
2440         handle_smtp_call(listen_sockets, listen_socket_count, accept_socket,
2441           (struct sockaddr *)&accepted);
2442         }
2443       }
2444     }
2445
2446   /* If not listening, then just sleep for the queue interval. If we woke
2447   up early the last time for some other signal, it won't matter because
2448   the alarm signal will wake at the right time. This code originally used
2449   sleep() but it turns out that on the FreeBSD system, sleep() is not inter-
2450   rupted by signals, so it wasn't waking up for SIGALRM or SIGCHLD. Luckily
2451   select() can be used as an interruptible sleep() on all versions of Unix. */
2452
2453   else
2454     {
2455     struct timeval tv;
2456     tv.tv_sec = queue_interval;
2457     tv.tv_usec = 0;
2458     select(0, NULL, NULL, NULL, &tv);
2459     handle_ending_processes();
2460     }
2461
2462   /* Re-enable the SIGCHLD handler if it has been run. It can't do it
2463   for itself, because it isn't doing the waiting itself. */
2464
2465   if (sigchld_seen)
2466     {
2467     sigchld_seen = FALSE;
2468     os_non_restarting_signal(SIGCHLD, main_sigchld_handler);
2469     }
2470
2471   /* Handle being woken by SIGHUP. We know at this point that the result
2472   of accept() has been dealt with, so we can re-exec exim safely, first
2473   closing the listening sockets so that they can be reused. Cancel any pending
2474   alarm in case it is just about to go off, and set SIGHUP to be ignored so
2475   that another HUP in quick succession doesn't clobber the new daemon before it
2476   gets going. All log files get closed by the close-on-exec flag; however, if
2477   the exec fails, we need to close the logs. */
2478
2479   if (sighup_seen)
2480     {
2481     log_write(0, LOG_MAIN, "pid %d: SIGHUP received: re-exec daemon",
2482       getpid());
2483     close_daemon_sockets(daemon_notifier_fd,
2484       listen_sockets, listen_socket_count);
2485     ALARM_CLR(0);
2486     signal(SIGHUP, SIG_IGN);
2487     sighup_argv[0] = exim_path;
2488     exim_nullstd();
2489     execv(CS exim_path, (char *const *)sighup_argv);
2490     log_write(0, LOG_MAIN|LOG_PANIC_DIE, "pid %d: exec of %s failed: %s",
2491       getpid(), exim_path, strerror(errno));
2492     log_close_all();
2493     }
2494
2495   }   /* End of main loop */
2496
2497 /* Control never reaches here */
2498 }
2499
2500 /* vi: aw ai sw=2
2501 */
2502 /* End of exim_daemon.c */