bb54571beb96025601df67aedfbf8029b80c45b2
[exim.git] / src / src / spool_in.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) The Exim Maintainers 2020 - 2024 */
6 /* Copyright (c) University of Cambridge 1995 - 2018 */
7 /* See the file NOTICE for conditions of use and distribution. */
8 /* SPDX-License-Identifier: GPL-2.0-or-later */
9
10 /* Functions for reading spool files. When compiling for a utility (eximon),
11 not all are needed, and some functionality can be cut out. */
12
13
14 #include "exim.h"
15
16
17
18 #ifndef COMPILE_UTILITY
19 /*************************************************
20 *           Open and lock data file              *
21 *************************************************/
22
23 /* The data file is the one that is used for locking, because the header file
24 can get replaced during delivery because of header rewriting. The file has
25 to opened with write access so that we can get an exclusive lock, but in
26 fact it won't be written to. Just in case there's a major disaster (e.g.
27 overwriting some other file descriptor with the value of this one), open it
28 with append.
29
30 As called by deliver_message() (at least) we are operating as root.
31
32 Argument: the id of the message
33 Returns:  fd if file successfully opened and locked, else -1
34
35 Side effect: message_subdir is set for the (possibly split) spool directory
36 */
37
38 int
39 spool_open_datafile(const uschar * id)
40 {
41 struct stat statbuf;
42 flock_t lock_data;
43 int fd;
44
45 /* If split_spool_directory is set (handled by set_subdir_str()), first look for
46 the file in the appropriate sub-directory of the input directory. If it is not
47 found there, try the input directory itself, to pick up leftovers from before
48 the splitting. If split_ spool_directory is not set, first look in the main
49 input directory. If it is not found there, try the split sub-directory, in case
50 it is left over from a splitting state. */
51
52 for (int i = 0; i < 2; i++)
53   {
54   uschar * fname;
55   int save_errno;
56
57   set_subdir_str(message_subdir, id, i);
58   fname = spool_fname(US"input", message_subdir, id, US"-D");
59   DEBUG(D_deliver) debug_printf_indent("Trying spool file %s\n", fname);
60
61   /* We protect against symlink attacks both in not propagating the
62   file-descriptor to other processes as we exec, and also ensuring that we
63   don't even open symlinks.
64   No -D file inside the spool area should be a symlink.  */
65
66   if ((fd = Uopen(fname,
67                   EXIM_CLOEXEC | EXIM_NOFOLLOW | O_RDWR | O_APPEND, 0)) >= 0)
68     break;
69   save_errno = errno;
70   if (errno == ENOENT)
71     {
72     if (i == 0) continue;
73     if (!f.queue_running)
74       log_write(0, LOG_MAIN, "Spool%s%s file %s-D not found",
75         *queue_name ? US" Q=" : US"",
76         *queue_name ? queue_name : US"",
77         id);
78     else DEBUG(D_deliver)
79       debug_printf("Spool%s%s file %s-D not found\n",
80         *queue_name ? US" Q=" : US"",
81         *queue_name ? queue_name : US"",
82         id);
83     }
84   else
85     log_write(0, LOG_MAIN, "Spool error for %s: %s", fname, strerror(errno));
86   errno = save_errno;
87   return -1;
88   }
89
90 /* File is open and message_subdir is set. Set the close-on-exec flag, and lock
91 the file. We lock only the first line of the file (containing the message ID)
92 because this apparently is needed for running Exim under Cygwin. If the entire
93 file is locked in one process, a sub-process cannot access it, even when passed
94 an open file descriptor (at least, I think that's the Cygwin story). On real
95 Unix systems it doesn't make any difference as long as Exim is consistent in
96 what it locks. */
97
98 #ifndef O_CLOEXEC
99 (void)fcntl(fd, F_SETFD, fcntl(fd, F_GETFD) | FD_CLOEXEC);
100 #endif
101
102 lock_data.l_type = F_WRLCK;
103 lock_data.l_whence = SEEK_SET;
104 lock_data.l_start = 0;
105 lock_data.l_len = spool_data_start_offset(id);
106
107 if (fcntl(fd, F_SETLK, &lock_data) < 0)
108   {
109   log_write(L_skip_delivery, LOG_MAIN,
110       "Spool file for %s is locked (another process is handling this message)",
111       id);
112   (void)close(fd);
113   errno = 0;
114   return -1;
115   }
116
117 /* Get the size of the data; don't include the leading filename line
118 in the count, but add one for the newline before the data. */
119
120 if (fstat(fd, &statbuf) == 0)
121   {
122   message_body_size = statbuf.st_size - spool_data_start_offset(id);
123   message_size = message_body_size + 1;
124   }
125
126 return fd;
127 }
128 #endif  /* COMPILE_UTILITY */
129
130
131
132 /*************************************************
133 *    Read non-recipients tree from spool file    *
134 *************************************************/
135
136 /* The tree of non-recipients is written to the spool file in a form that
137 makes it easy to read back into a tree. The format is as follows:
138
139    . Each node is preceded by two letter(Y/N) indicating whether it has left
140      or right children. There's one space after the two flags, before the name.
141
142    . The left subtree (if any) then follows, then the right subtree (if any).
143
144 This function is entered with the next input line in the buffer. Note we must
145 save the right flag before recursing with the same buffer.
146
147 Once the tree is read, we re-construct the balance fields by scanning the tree.
148 I forgot to write them out originally, and the compatible fix is to do it this
149 way. This initial local recursing function does the necessary.
150
151 Arguments:
152   node      tree node
153
154 Returns:    maximum depth below the node, including the node itself
155 */
156
157 static int
158 count_below(tree_node *node)
159 {
160 int nleft, nright;
161 if (node == NULL) return 0;
162 nleft = count_below(node->left);
163 nright = count_below(node->right);
164 node->balance = (nleft > nright)? 1 : ((nright > nleft)? 2 : 0);
165 return 1 + ((nleft > nright)? nleft : nright);
166 }
167
168 /* This is the real function...
169
170 Arguments:
171   connect      pointer to the root of the tree
172   f            FILE to read data from
173   buffer       contains next input line; further lines read into it
174   buffer_size  size of the buffer
175
176 Returns:       FALSE on format error
177 */
178
179 static BOOL
180 read_nonrecipients_tree(tree_node **connect, FILE *f, uschar *buffer,
181   int buffer_size)
182 {
183 tree_node *node;
184 int n = Ustrlen(buffer);
185 BOOL right = buffer[1] == 'Y';
186
187 if (n < 5) return FALSE;    /* malformed line */
188 buffer[n-1] = 0;            /* Remove \n */
189 node = store_get(sizeof(tree_node) + n - 3, GET_TAINTED);       /* rcpt names tainted */
190 *connect = node;
191 Ustrcpy(node->name, buffer + 3);
192 node->data.ptr = NULL;
193
194 if (buffer[0] == 'Y')
195   {
196   if (Ufgets(buffer, buffer_size, f) == NULL ||
197     !read_nonrecipients_tree(&node->left, f, buffer, buffer_size))
198       return FALSE;
199   }
200 else node->left = NULL;
201
202 if (right)
203   {
204   if (Ufgets(buffer, buffer_size, f) == NULL ||
205     !read_nonrecipients_tree(&node->right, f, buffer, buffer_size))
206       return FALSE;
207   }
208 else node->right = NULL;
209
210 (void) count_below(*connect);
211 return TRUE;
212 }
213
214
215
216
217 /* Reset all the global variables to their default values. However, there is
218 one exception. DO NOT change the default value of dont_deliver, because it may
219 be forced by an external setting. */
220
221 void
222 spool_clear_header_globals(void)
223 {
224 acl_var_c = acl_var_m = NULL;
225 authenticated_id = NULL;
226 authenticated_sender = NULL;
227 f.allow_unqualified_recipient = FALSE;
228 f.allow_unqualified_sender = FALSE;
229 body_linecount = 0;
230 body_zerocount = 0;
231 f.deliver_firsttime = FALSE;
232 f.deliver_freeze = FALSE;
233 deliver_frozen_at = 0;
234 f.deliver_manual_thaw = FALSE;
235 /* f.dont_deliver must NOT be reset */
236 header_list = header_last = NULL;
237 host_lookup_deferred = FALSE;
238 host_lookup_failed = FALSE;
239 interface_address = NULL;
240 interface_port = 0;
241 f.local_error_message = FALSE;
242 #ifdef HAVE_LOCAL_SCAN
243 local_scan_data = NULL;
244 #endif
245 max_received_linelength = 0;
246 message_linecount = 0;
247 received_protocol = NULL;
248 received_count = 0;
249 recipients_list = NULL;
250 sender_address = NULL;
251 sender_fullhost = NULL;
252 sender_helo_name = NULL;
253 sender_host_address = NULL;
254 sender_host_name = NULL;
255 sender_host_port = 0;
256 sender_host_authenticated = sender_host_auth_pubname = NULL;
257 sender_ident = NULL;
258 f.sender_local = FALSE;
259 f.sender_set_untrusted = FALSE;
260 smtp_active_hostname = primary_hostname;
261 #ifndef COMPILE_UTILITY
262 f.spool_file_wireformat = FALSE;
263 #endif
264 tree_nonrecipients = NULL;
265
266 #ifdef EXPERIMENTAL_BRIGHTMAIL
267 bmi_run = 0;
268 bmi_verdicts = NULL;
269 #endif
270
271 #ifndef DISABLE_DKIM
272 dkim_signers = NULL;
273 f.dkim_disable_verify = FALSE;
274 dkim_collect_input = 0;
275 #endif
276
277 #ifndef DISABLE_TLS
278 tls_in.certificate_verified = FALSE;
279 # ifdef SUPPORT_DANE
280 tls_in.dane_verified = FALSE;
281 # endif
282 tls_in.ver = tls_in.cipher = NULL;
283 # ifndef COMPILE_UTILITY        /* tls support fns not built in */
284 tls_free_cert(&tls_in.ourcert);
285 tls_free_cert(&tls_in.peercert);
286 # endif
287 tls_in.peerdn = NULL;
288 tls_in.sni = NULL;
289 tls_in.ocsp = OCSP_NOT_REQ;
290 #endif
291
292 #ifdef WITH_CONTENT_SCAN
293 spam_bar = NULL;
294 spam_score = NULL;
295 spam_score_int = NULL;
296 #endif
297
298 #if defined(SUPPORT_I18N) && !defined(COMPILE_UTILITY)
299 message_smtputf8 = FALSE;
300 message_utf8_downconvert = 0;
301 #endif
302
303 #ifndef COMPILE_UTILITY
304 debuglog_name[0] = '\0';
305 #endif
306 dsn_ret = 0;
307 dsn_envid = NULL;
308 }
309
310 static void *
311 fgets_big_buffer(FILE *fp)
312 {
313 int len = 0;
314
315 big_buffer[0] = 0;
316 if (Ufgets(big_buffer, big_buffer_size, fp) == NULL) return NULL;
317
318 while ((len = Ustrlen(big_buffer)) == big_buffer_size-1
319       && big_buffer[len-1] != '\n')
320   {
321   uschar *newbuffer;
322   int newsize;
323
324   if (big_buffer_size >= BIG_BUFFER_SIZE * 4) return NULL;
325   newsize = big_buffer_size * 2;
326   newbuffer = store_get_perm(newsize, GET_UNTAINTED);
327   memcpy(newbuffer, big_buffer, len);
328
329   big_buffer = newbuffer;
330   big_buffer_size = newsize;
331   if (Ufgets(big_buffer + len, big_buffer_size - len, fp) == NULL) return NULL;
332   }
333
334 if (len <= 0 || big_buffer[len-1] != '\n') return NULL;
335 return big_buffer;
336 }
337
338
339
340 /*************************************************
341 *             Read spool header file             *
342 *************************************************/
343
344 /* This function reads a spool header file and places the data into the
345 appropriate global variables. The header portion is always read, but header
346 structures are built only if read_headers is set true. It isn't, for example,
347 while generating -bp output.
348
349 It may be possible for blocks of nulls (binary zeroes) to get written on the
350 end of a file if there is a system crash during writing. It was observed on an
351 earlier version of Exim that omitted to fsync() the files - this is thought to
352 have been the cause of that incident, but in any case, this code must be robust
353 against such an event, and if such a file is encountered, it must be treated as
354 malformed.
355
356 As called from deliver_message() (at least) we are running as root.
357
358 Arguments:
359   name          name of the header file, including the -H
360   read_headers  TRUE if in-store header structures are to be built
361   subdir_set    TRUE is message_subdir is already set
362
363 Returns:        spool_read_OK        success
364                 spool_read_notopen   open failed
365                 spool_read_enverror  error in the envelope portion
366                 spool_read_hdrerror  error in the header portion
367 */
368
369 int
370 spool_read_header(uschar *name, BOOL read_headers, BOOL subdir_set)
371 {
372 FILE * fp = NULL;
373 int n;
374 int rcount = 0;
375 long int uid, gid;
376 BOOL inheader = FALSE;
377 const uschar * where;
378
379 /* Reset all the global variables to their default values. However, there is
380 one exception. DO NOT change the default value of dont_deliver, because it may
381 be forced by an external setting. */
382
383 spool_clear_header_globals();
384
385 /* Generate the full name and open the file. If message_subdir is already
386 set, just look in the given directory. Otherwise, look in both the split
387 and unsplit directories, as for the data file above. */
388
389 for (int n = 0; n < 2; n++)
390   {
391   if (!subdir_set)
392     set_subdir_str(message_subdir, name, n);
393
394   if ((fp = Ufopen(spool_fname(US"input", message_subdir, name, US""), "rb")))
395     break;
396   if (n != 0 || subdir_set || errno != ENOENT)
397     return spool_read_notopen;
398   }
399
400 errno = 0;
401
402 #ifndef COMPILE_UTILITY
403 DEBUG(D_deliver) debug_printf_indent("reading spool file %s\n", name);
404 #endif  /* COMPILE_UTILITY */
405
406 /* The first line of a spool file contains the message id followed by -H (i.e.
407 the file name), in order to make the file self-identifying. */
408
409 where = US"first line read";
410 if (Ufgets(big_buffer, big_buffer_size, fp) == NULL) goto SPOOL_READ_ERROR;
411 where = US"first line length";
412 if (  (  Ustrlen(big_buffer) != MESSAGE_ID_LENGTH + 3
413       && Ustrlen(big_buffer) != MESSAGE_ID_LENGTH_OLD + 3
414       )
415    || (  Ustrncmp(big_buffer, name, MESSAGE_ID_LENGTH + 2) != 0
416       && Ustrncmp(big_buffer, name, MESSAGE_ID_LENGTH_OLD + 2) != 0
417    )  )
418   goto SPOOL_FORMAT_ERROR;
419
420 /* The next three lines in the header file are in a fixed format. The first
421 contains the login, uid, and gid of the user who caused the file to be written.
422 There are known cases where a negative gid is used, so we allow for both
423 negative uids and gids. The second contains the mail address of the message's
424 sender, enclosed in <>. The third contains the time the message was received,
425 and the number of warning messages for delivery delays that have been sent. */
426
427 where = US"2nd line read";
428 if (Ufgets(big_buffer, big_buffer_size, fp) == NULL) goto SPOOL_READ_ERROR;
429
430  {
431   uschar *p = big_buffer + Ustrlen(big_buffer);
432   while (p > big_buffer && isspace(p[-1])) p--;
433   *p = 0;
434   where = US"2nd line fmt 1";
435   if (!isdigit(p[-1])) goto SPOOL_FORMAT_ERROR;
436   while (p > big_buffer && (isdigit(p[-1]) || '-' == p[-1])) p--;
437   gid = Uatoi(p);
438   where = US"2nd line fmt 2";
439   if (p <= big_buffer || *(--p) != ' ') goto SPOOL_FORMAT_ERROR;
440   *p = 0;
441   if (!isdigit(p[-1])) goto SPOOL_FORMAT_ERROR;
442   while (p > big_buffer && (isdigit(p[-1]) || '-' == p[-1])) p--;
443   uid = Uatoi(p);
444   where = US"2nd line fmt 3";
445   if (p <= big_buffer || *(--p) != ' ') goto SPOOL_FORMAT_ERROR;
446   *p = 0;
447  }
448
449 originator_login = string_copy(big_buffer);
450 originator_uid = (uid_t)uid;
451 originator_gid = (gid_t)gid;
452
453 where = US"envelope from";
454 if (Ufgets(big_buffer, big_buffer_size, fp) == NULL) goto SPOOL_READ_ERROR;
455 n = Ustrlen(big_buffer);
456 if (n < 3 || big_buffer[0] != '<' || big_buffer[n-2] != '>')
457   goto SPOOL_FORMAT_ERROR;
458
459  {
460   uschar * s = store_get(n-2, GET_TAINTED);
461   Ustrncpy(s, big_buffer+1, n-3);
462   s[n-3] = '\0';
463   sender_address = s;
464  }
465
466 where = US"time";
467 if (Ufgets(big_buffer, big_buffer_size, fp) == NULL) goto SPOOL_READ_ERROR;
468 if (sscanf(CS big_buffer, TIME_T_FMT " %d", &received_time.tv_sec, &warning_count) != 2)
469   goto SPOOL_FORMAT_ERROR;
470 received_time.tv_usec = 0;
471 received_time_complete = received_time;
472
473
474 message_age = time(NULL) - received_time.tv_sec;
475 #ifndef COMPILE_UTILITY
476 if (f.running_in_test_harness)
477   message_age = test_harness_fudged_queue_time(message_age);
478 #endif
479
480 #ifndef COMPILE_UTILITY
481 DEBUG(D_deliver) debug_printf_indent("user=%s uid=%ld gid=%ld sender=%s\n",
482   originator_login, (long int)originator_uid, (long int)originator_gid,
483   sender_address);
484 #endif
485
486 /* Now there may be a number of optional lines, each starting with "-". If you
487 add a new setting here, make sure you set the default above.
488
489 Because there are now quite a number of different possibilities, we use a
490 switch on the first character to avoid too many failing tests. Thanks to Nico
491 Erfurth for the patch that implemented this. I have made it even more efficient
492 by not re-scanning the first two characters.
493
494 To allow new versions of Exim that add additional flags to interwork with older
495 versions that do not understand them, just ignore any lines starting with "-"
496 that we don't recognize. Otherwise it wouldn't be possible to back off a new
497 version that left new-style flags written on the spool.
498
499 If the line starts with "--" the content of the variable is tainted.
500 If the line start "--(<lookuptype>)" it is also quoted for the given <lookuptype>.
501 */
502
503 for (;;)
504   {
505   const void * proto_mem;
506   uschar * var;
507   const uschar * p;
508
509   if (fgets_big_buffer(fp) == NULL) goto SPOOL_READ_ERROR;
510   if (big_buffer[0] != '-') break;
511   big_buffer[Ustrlen(big_buffer)-1] = 0;
512
513   proto_mem = big_buffer[1] == '-' ? GET_TAINTED : GET_UNTAINTED;
514   var =  big_buffer + (proto_mem == GET_UNTAINTED ? 1 : 2);
515   if (*var == '(')                              /* marker for quoted value */
516     {
517     uschar * s;
518     for (s = ++var; *s != ')'; ) s++;
519 #ifndef COMPILE_UTILITY
520       {
521       const lookup_info * li;
522       if (!(li= search_findtype(var, s - var)))
523         {
524         DEBUG(D_any)
525           debug_printf("Unrecognised quoter %.*s\n", (int)(s - var), var+1);
526         where = NULL;
527         goto SPOOL_FORMAT_ERROR;
528         }
529       proto_mem = store_get_quoted(1, GET_TAINTED, li->acq_num, li->name);
530       }
531 #endif  /* COMPILE_UTILITY */
532     var = s + 1;
533     }
534   p = var + 1;
535
536   switch(*var)
537     {
538     case 'a':
539
540     /* Nowadays we use "-aclc" and "-aclm" for the different types of ACL
541     variable, because Exim allows any number of them, with arbitrary names.
542     The line in the spool file is "-acl[cm] <name> <length>". The name excludes
543     the c or m. */
544
545     if (Ustrncmp(p, "clc ", 4) == 0 ||
546         Ustrncmp(p, "clm ", 4) == 0)
547       {
548       uschar *name, *endptr;
549       int count;
550       tree_node *node;
551       endptr = Ustrchr(var + 5, ' ');
552       where = US"-aclXn";
553       if (!endptr) goto SPOOL_FORMAT_ERROR;
554       name = string_sprintf("%c%.*s", var[3],
555         (int)(endptr - var - 5), var + 5);
556       if (sscanf(CS endptr, " %d", &count) != 1) goto SPOOL_FORMAT_ERROR;
557       node = acl_var_create(name);
558       node->data.ptr = store_get(count + 1, proto_mem);
559       if (fread(node->data.ptr, 1, count+1, fp) < count) goto SPOOL_READ_ERROR;
560       ((uschar*)node->data.ptr)[count] = 0;
561       }
562
563     else if (Ustrcmp(p, "llow_unqualified_recipient") == 0)
564       f.allow_unqualified_recipient = TRUE;
565     else if (Ustrcmp(p, "llow_unqualified_sender") == 0)
566       f.allow_unqualified_sender = TRUE;
567
568     else if (Ustrncmp(p, "uth_id", 6) == 0)
569       authenticated_id = string_copy_taint(var + 8, proto_mem);
570     else if (Ustrncmp(p, "uth_sender", 10) == 0)
571       authenticated_sender = string_copy_taint(var + 12, proto_mem);
572     else if (Ustrncmp(p, "ctive_hostname", 14) == 0)
573       smtp_active_hostname = string_copy_taint(var + 16, proto_mem);
574
575     /* For long-term backward compatibility, we recognize "-acl", which was
576     used before the number of ACL variables changed from 10 to 20. This was
577     before the subsequent change to an arbitrary number of named variables.
578     This code is retained so that upgrades from very old versions can still
579     handle old-format spool files. The value given after "-acl" is a number
580     that is 0-9 for connection variables, and 10-19 for message variables. */
581
582     else if (Ustrncmp(p, "cl ", 3) == 0)
583       {
584       unsigned index, count;
585       uschar name[20];   /* Need plenty of space for %u format */
586       tree_node * node;
587       where = US"-acl (old)";
588       if (  sscanf(CS var + 4, "%u %u", &index, &count) != 2
589          || index >= 20
590          || count > 16384       /* arbitrary limit on variable size */
591          )
592         goto SPOOL_FORMAT_ERROR;
593       if (index < 10)
594         (void) string_format(name, sizeof(name), "%c%u", 'c', index);
595       else
596         (void) string_format(name, sizeof(name), "%c%u", 'm', index - 10);
597       node = acl_var_create(name);
598       node->data.ptr = store_get(count + 1, proto_mem);
599       /* We sanity-checked the count, so disable the Coverity error */
600       /* coverity[tainted_data] */
601       if (fread(node->data.ptr, 1, count+1, fp) < count) goto SPOOL_READ_ERROR;
602       (US node->data.ptr)[count] = '\0';
603       }
604     break;
605
606     case 'b':
607     if (Ustrncmp(p, "ody_linecount", 13) == 0)
608       body_linecount = Uatoi(var + 14);
609     else if (Ustrncmp(p, "ody_zerocount", 13) == 0)
610       body_zerocount = Uatoi(var + 14);
611 #ifdef EXPERIMENTAL_BRIGHTMAIL
612     else if (Ustrncmp(p, "mi_verdicts ", 12) == 0)
613       bmi_verdicts = string_copy_taint(var + 13, proto_mem);
614 #endif
615     break;
616
617     case 'd':
618     if (Ustrcmp(p, "eliver_firsttime") == 0)
619       f.deliver_firsttime = TRUE;
620     else if (Ustrncmp(p, "sn_ret", 6) == 0)
621       dsn_ret= atoi(CS var + 7);
622     else if (Ustrncmp(p, "sn_envid", 8) == 0)
623       dsn_envid = string_copy_taint(var + 10, proto_mem);
624 #ifndef COMPILE_UTILITY
625     else if (Ustrncmp(p, "ebug_selector ", 14) == 0)
626       debug_selector = strtol(CS var + 15, NULL, 0);
627     else if (Ustrncmp(p, "ebuglog_name ", 13) == 0)
628       debug_logging_from_spool(var + 14);
629 #endif
630     break;
631
632     case 'f':
633     if (Ustrncmp(p, "rozen", 5) == 0)
634       {
635       f.deliver_freeze = TRUE;
636       if (sscanf(CS var+6, TIME_T_FMT, &deliver_frozen_at) != 1)
637         goto SPOOL_READ_ERROR;
638       }
639     break;
640
641     case 'h':
642     if (Ustrcmp(p, "ost_lookup_deferred") == 0)
643       host_lookup_deferred = TRUE;
644     else if (Ustrcmp(p, "ost_lookup_failed") == 0)
645       host_lookup_failed = TRUE;
646     else if (Ustrncmp(p, "ost_auth_pubname", 16) == 0)
647       sender_host_auth_pubname = string_copy_taint(var + 18, proto_mem);
648     else if (Ustrncmp(p, "ost_auth", 8) == 0)
649       sender_host_authenticated = string_copy_taint(var + 10, proto_mem);
650     else if (Ustrncmp(p, "ost_name", 8) == 0)
651       sender_host_name = string_copy_taint(var + 10, proto_mem);
652     else if (Ustrncmp(p, "elo_name", 8) == 0)
653       sender_helo_name = string_copy_taint(var + 10, proto_mem);
654
655     /* We now record the port number after the address, separated by a
656     dot. For compatibility during upgrading, do nothing if there
657     isn't a value (it gets left at zero). */
658
659     else if (Ustrncmp(p, "ost_address", 11) == 0)
660       {
661       sender_host_port = host_address_extract_port(var + 13);
662       sender_host_address = string_copy_taint(var + 13, proto_mem);
663       }
664     break;
665
666     case 'i':
667     if (Ustrncmp(p, "nterface_address", 16) == 0)
668       {
669       interface_port = host_address_extract_port(var + 18);
670       interface_address = string_copy_taint(var + 18, proto_mem);
671       }
672     else if (Ustrncmp(p, "dent", 4) == 0)
673       sender_ident = string_copy_taint(var + 6, proto_mem);
674     break;
675
676     case 'l':
677     if (Ustrcmp(p, "ocal") == 0)
678       f.sender_local = TRUE;
679     else if (Ustrcmp(var, "localerror") == 0)
680       f.local_error_message = TRUE;
681 #ifdef HAVE_LOCAL_SCAN
682     else if (Ustrncmp(p, "ocal_scan ", 10) == 0)
683       local_scan_data = string_copy_taint(var + 11, proto_mem);
684 #endif
685     break;
686
687     case 'm':
688     if (Ustrcmp(p, "anual_thaw") == 0)
689       f.deliver_manual_thaw = TRUE;
690     else if (Ustrncmp(p, "ax_received_linelength", 22) == 0)
691       max_received_linelength = Uatoi(var + 23);
692     break;
693
694     case 'N':
695     if (*p == 0) f.dont_deliver = TRUE;   /* -N */
696     break;
697
698     case 'r':
699     if (Ustrncmp(p, "eceived_protocol", 16) == 0)
700       received_protocol = string_copy_taint(var + 18, proto_mem);
701     else if (Ustrncmp(p, "eceived_time_usec", 17) == 0)
702       {
703       unsigned usec;
704       if (sscanf(CS var + 20, "%u", &usec) == 1)
705         {
706         received_time.tv_usec = usec;
707         if (!received_time_complete.tv_sec) received_time_complete.tv_usec = usec;
708         }
709       }
710     else if (Ustrncmp(p, "eceived_time_complete", 21) == 0)
711       {
712       unsigned sec, usec;
713       if (sscanf(CS var + 23, "%u.%u", &sec, &usec) == 2)
714         {
715         received_time_complete.tv_sec = sec;
716         received_time_complete.tv_usec = usec;
717         }
718       }
719     break;
720
721     case 's':
722     if (Ustrncmp(p, "ender_set_untrusted", 19) == 0)
723       f.sender_set_untrusted = TRUE;
724 #ifdef WITH_CONTENT_SCAN
725     else if (Ustrncmp(p, "pam_bar ", 8) == 0)
726       spam_bar = string_copy_taint(var + 9, proto_mem);
727     else if (Ustrncmp(p, "pam_score ", 10) == 0)
728       spam_score = string_copy_taint(var + 11, proto_mem);
729     else if (Ustrncmp(p, "pam_score_int ", 14) == 0)
730       spam_score_int = string_copy_taint(var + 15, proto_mem);
731 #endif
732 #ifndef COMPILE_UTILITY
733     else if (Ustrncmp(p, "pool_file_wireformat", 20) == 0)
734       f.spool_file_wireformat = TRUE;
735 #endif
736 #if defined(SUPPORT_I18N) && !defined(COMPILE_UTILITY)
737     else if (Ustrncmp(p, "mtputf8", 7) == 0)
738       message_smtputf8 = TRUE;
739 #endif
740     break;
741
742 #ifndef DISABLE_TLS
743     case 't':
744     if (Ustrncmp(p, "ls_", 3) == 0)
745       {
746       const uschar * q = p + 3;
747       if (Ustrncmp(q, "certificate_verified", 20) == 0)
748         tls_in.certificate_verified = TRUE;
749       else if (Ustrncmp(q, "cipher", 6) == 0)
750         tls_in.cipher = string_copy_taint(q+7, proto_mem);
751 # ifndef COMPILE_UTILITY        /* tls support fns not built in */
752       else if (Ustrncmp(q, "ourcert", 7) == 0)
753         (void) tls_import_cert(q+8, &tls_in.ourcert);
754       else if (Ustrncmp(q, "peercert", 8) == 0)
755         (void) tls_import_cert(q+9, &tls_in.peercert);
756 # endif
757       else if (Ustrncmp(q, "peerdn", 6) == 0)
758         tls_in.peerdn = string_unprinting(string_copy_taint(q+7, proto_mem));
759       else if (Ustrncmp(q, "sni", 3) == 0)
760         tls_in.sni = string_unprinting(string_copy_taint(q+4, proto_mem));
761       else if (Ustrncmp(q, "ocsp", 4) == 0)
762         tls_in.ocsp = q[5] - '0';
763 # ifndef DISABLE_TLS_RESUME
764       else if (Ustrncmp(q, "resumption", 10) == 0)
765         tls_in.resumption = q[11] - 'A';
766 # endif
767       else if (Ustrncmp(q, "ver", 3) == 0)
768         tls_in.ver = string_copy_taint(q+4, proto_mem);
769       }
770     break;
771 #endif
772
773 #if defined(SUPPORT_I18N) && !defined(COMPILE_UTILITY)
774     case 'u':
775     if (Ustrncmp(p, "tf8_downcvt", 11) == 0)
776       message_utf8_downconvert = 1;
777     else if (Ustrncmp(p, "tf8_optdowncvt", 15) == 0)
778       message_utf8_downconvert = -1;
779     break;
780 #endif
781
782     default:    /* Present because some compilers complain if all */
783     break;      /* possibilities are not covered. */
784     }
785   }
786
787 /* Build sender_fullhost if required */
788
789 #ifndef COMPILE_UTILITY
790 host_build_sender_fullhost();
791 #endif  /* COMPILE_UTILITY */
792
793 #ifndef COMPILE_UTILITY
794 DEBUG(D_deliver)
795   debug_printf_indent("sender_local=%d ident=%s\n", f.sender_local,
796     sender_ident ? sender_ident : US"unset");
797 #endif  /* COMPILE_UTILITY */
798
799 /* We now have the tree of addresses NOT to deliver to, or a line
800 containing "XX", indicating no tree. */
801
802 where = US"nondeliver";
803 if (Ustrncmp(big_buffer, "XX\n", 3) != 0 &&
804   !read_nonrecipients_tree(&tree_nonrecipients, fp, big_buffer, big_buffer_size))
805     goto SPOOL_FORMAT_ERROR;
806
807 #ifndef COMPILE_UTILITY
808 DEBUG(D_deliver) debug_print_tree("Non-recipients", tree_nonrecipients);
809 #endif  /* COMPILE_UTILITY */
810
811 /* After reading the tree, the next line has not yet been read into the
812 buffer. It contains the count of recipients which follow on separate lines.
813 Apply an arbitrary sanity check.*/
814
815 where = US"rcpt cnt";
816 if (Ufgets(big_buffer, big_buffer_size, fp) == NULL) goto SPOOL_READ_ERROR;
817 if (sscanf(CS big_buffer, "%d", &rcount) != 1 || rcount > 16384)
818   goto SPOOL_FORMAT_ERROR;
819
820 #ifndef COMPILE_UTILITY
821 DEBUG(D_deliver) debug_printf_indent("recipients_count=%d\n", rcount);
822 #endif  /* COMPILE_UTILITY */
823
824 recipients_list_max = rcount;
825 recipients_list = store_get(rcount * sizeof(recipient_item), GET_UNTAINTED);
826
827 /* We sanitised the count and know we have enough memory, so disable
828 the Coverity error on recipients_count */
829 /* coverity[tainted_data] */
830
831 where = US"recipient";
832 for (recipients_count = 0; recipients_count < rcount; recipients_count++)
833   {
834   int nn;
835   int pno = -1;
836   int dsn_flags = 0;
837   uschar *orcpt = NULL;
838   uschar *errors_to = NULL;
839   uschar *p;
840
841   if (fgets_big_buffer(fp) == NULL) goto SPOOL_READ_ERROR;
842   nn = Ustrlen(big_buffer);
843   if (nn < 2) goto SPOOL_FORMAT_ERROR;
844
845   /* Remove the newline; this terminates the address if there is no additional
846   data on the line. */
847
848   p = big_buffer + nn - 1;
849   *p-- = 0;
850
851   /* Look back from the end of the line for digits and special terminators.
852   Since an address must end with a domain, we can tell that extra data is
853   present by the presence of the terminator, which is always some character
854   that cannot exist in a domain. (If I'd thought of the need for additional
855   data early on, I'd have put it at the start, with the address at the end. As
856   it is, we have to operate backwards. Addresses are permitted to contain
857   spaces, you see.)
858
859   This code has to cope with various versions of this data that have evolved
860   over time. In all cases, the line might just contain an address, with no
861   additional data. Otherwise, the possibilities are as follows:
862
863   Exim 3 type:       <address><space><digits>,<digits>,<digits>
864
865     The second set of digits is the parent number for one_time addresses. The
866     other values were remnants of earlier experiments that were abandoned.
867
868   Exim 4 first type: <address><space><digits>
869
870     The digits are the parent number for one_time addresses.
871
872   Exim 4 new type:   <address><space><data>#<type bits>
873
874     The type bits indicate what the contents of the data are.
875
876     Bit 01 indicates that, reading from right to left, the data
877       ends with <errors_to address><space><len>,<pno> where pno is
878       the parent number for one_time addresses, and len is the length
879       of the errors_to address (zero meaning none).
880
881     Bit 02 indicates that, again reading from right to left, the data continues
882      with orcpt len(orcpt),dsn_flags
883    */
884
885   while (isdigit(*p)) p--;
886
887   /* Handle Exim 3 spool files */
888
889   if (*p == ',')
890     {
891     int dummy;
892 #if !defined (COMPILE_UTILITY)
893     DEBUG(D_deliver) debug_printf_indent("**** SPOOL_IN - Exim 3 spool file\n");
894 #endif
895     while (isdigit(*(--p)) || *p == ',');
896     if (*p == ' ')
897       {
898       *p++ = 0;
899       (void)sscanf(CS p, "%d,%d", &dummy, &pno);
900       }
901     }
902
903   /* Handle early Exim 4 spool files */
904
905   else if (*p == ' ')
906     {
907 #if !defined (COMPILE_UTILITY)
908     DEBUG(D_deliver) debug_printf_indent("**** SPOOL_IN - early Exim 4 spool file\n");
909 #endif
910     *p++ = 0;
911     (void)sscanf(CS p, "%d", &pno);
912     }
913
914   /* Handle current format Exim 4 spool files */
915
916   else if (*p == '#')
917     {
918     int flags;
919
920 #if !defined (COMPILE_UTILITY)
921     DEBUG(D_deliver) debug_printf_indent("**** SPOOL_IN - Exim standard format spoolfile\n");
922 #endif
923
924     (void)sscanf(CS p+1, "%d", &flags);
925
926     if (flags & 0x01)      /* one_time data exists */
927       {
928       int len;
929       while (isdigit(*(--p)) || *p == ',' || *p == '-');
930       (void)sscanf(CS p+1, "%d,%d", &len, &pno);
931       *p = 0;
932       if (len > 0)
933         {
934         p -= len;
935         errors_to = string_copy_taint(p, GET_TAINTED);
936         }
937       }
938
939     *--p = 0;   /* Terminate address */
940     if (flags & 0x02)      /* one_time data exists */
941       {
942       int len;
943       while (isdigit(*(--p)) || *p == ',' || *p == '-');
944       (void)sscanf(CS p+1, "%d,%d", &len, &dsn_flags);
945       *p = 0;
946       if (len > 0)
947         {
948         p -= len;
949         orcpt = string_copy_taint(p, GET_TAINTED);
950         }
951       }
952
953     *--p = 0;   /* Terminate address */
954     }
955 #if !defined(COMPILE_UTILITY)
956   else
957     { DEBUG(D_deliver) debug_printf_indent("**** SPOOL_IN - No additional fields\n"); }
958
959   if (orcpt || dsn_flags)
960     DEBUG(D_deliver) debug_printf_indent("**** SPOOL_IN - address: <%s> orcpt: <%s> dsn_flags: 0x%x\n",
961       big_buffer, orcpt, dsn_flags);
962   if (errors_to)
963     DEBUG(D_deliver) debug_printf_indent("**** SPOOL_IN - address: <%s> errorsto: <%s>\n",
964       big_buffer, errors_to);
965 #endif
966
967   recipients_list[recipients_count].address = string_copy_taint(big_buffer, GET_TAINTED);
968   recipients_list[recipients_count].pno = pno;
969   recipients_list[recipients_count].errors_to = errors_to;
970   recipients_list[recipients_count].orcpt = orcpt;
971   recipients_list[recipients_count].dsn_flags = dsn_flags;
972   }
973
974 /* The remainder of the spool header file contains the headers for the message,
975 separated off from the previous data by a blank line. Each header is preceded
976 by a count of its length and either a certain letter (for various identified
977 headers), space (for a miscellaneous live header) or an asterisk (for a header
978 that has been rewritten). Count the Received: headers. We read the headers
979 always, in order to check on the format of the file, but only create a header
980 list if requested to do so. */
981
982 inheader = TRUE;
983 where = US"headers";
984 if (Ufgets(big_buffer, big_buffer_size, fp) == NULL) goto SPOOL_READ_ERROR;
985 if (big_buffer[0] != '\n') goto SPOOL_FORMAT_ERROR;
986
987 while ((n = fgetc(fp)) != EOF)
988   {
989   header_line * h;
990   uschar flag[4];
991   int i;
992
993   if (!isdigit(n)) goto SPOOL_FORMAT_ERROR;
994   if(ungetc(n, fp) == EOF  ||  fscanf(fp, "%d%c ", &n, flag) == EOF)
995     goto SPOOL_READ_ERROR;
996   if (flag[0] != '*') message_size += n;  /* Omit non-transmitted headers */
997
998   if (read_headers)
999     {
1000     h = store_get(sizeof(header_line), GET_UNTAINTED);
1001     h->next = NULL;
1002     h->type = flag[0];
1003     h->slen = n;
1004     h->text = store_get(n+1, GET_TAINTED);
1005
1006     if (h->type == htype_received) received_count++;
1007
1008     if (header_list) header_last->next = h;
1009     else header_list = h;
1010     header_last = h;
1011
1012     for (i = 0; i < n; i++)
1013       {
1014       int c = fgetc(fp);
1015       if (c == 0 || c == EOF) goto SPOOL_FORMAT_ERROR;
1016       if (c == '\n' && h->type != htype_old) message_linecount++;
1017       h->text[i] = c;
1018       }
1019     h->text[i] = 0;
1020     }
1021
1022   /* Not requiring header data, just skip through the bytes */
1023
1024   else for (i = 0; i < n; i++)
1025     {
1026     int c = fgetc(fp);
1027     if (c == 0 || c == EOF) goto SPOOL_FORMAT_ERROR;
1028     }
1029   }
1030
1031 /* We have successfully read the data in the header file. Update the message
1032 line count by adding the body linecount to the header linecount. Close the file
1033 and give a positive response. */
1034
1035 #ifndef COMPILE_UTILITY
1036 DEBUG(D_deliver) debug_printf_indent("body_linecount=%d message_linecount=%d\n",
1037   body_linecount, message_linecount);
1038 #endif  /* COMPILE_UTILITY */
1039
1040 message_linecount += body_linecount;
1041
1042 fclose(fp);
1043 return spool_read_OK;
1044
1045
1046 /* There was an error reading the spool or there was missing data,
1047 or there was a format error. A "read error" with no errno means an
1048 unexpected EOF, which we treat as a format error. */
1049
1050 SPOOL_READ_ERROR:
1051 if (errno != 0)
1052   {
1053   n = errno;
1054
1055 #ifndef COMPILE_UTILITY
1056   DEBUG(D_any) debug_printf("Error while reading spool file %s\n", name);
1057 #endif  /* COMPILE_UTILITY */
1058
1059   fclose(fp);
1060   errno = n;
1061   return inheader ? spool_read_hdrerror : spool_read_enverror;
1062   }
1063
1064 SPOOL_FORMAT_ERROR:
1065
1066 #ifndef COMPILE_UTILITY
1067 DEBUG(D_any) debug_printf("Format error in spool file %s%s%s\n", name,
1068   where ? ": " : "", where ? where : US"");
1069 #endif  /* COMPILE_UTILITY */
1070
1071 fclose(fp);
1072 errno = ERRNO_SPOOLFORMAT;
1073 return inheader? spool_read_hdrerror : spool_read_enverror;
1074 }
1075
1076
1077 #ifndef COMPILE_UTILITY
1078 /* Read out just the (envelope) sender string from the spool -H file.
1079 Remove the <> wrap and return it in allocated store.  Return NULL on error.
1080
1081 We assume that message_subdir is already set.
1082 */
1083
1084 uschar *
1085 spool_sender_from_msgid(const uschar * id)
1086 {
1087 FILE * fp;
1088 int n;
1089 uschar * yield = NULL;
1090
1091 if (!(fp = Ufopen(spool_fname(US"input", message_subdir, id, US"-H"), "rb")))
1092   return NULL;
1093
1094 DEBUG(D_deliver) debug_printf_indent("reading spool file %s-H\n", id);
1095
1096 /* Skip the line with the copy of the filename, then the line with login/uid/gid.
1097 Read the next line, which should be the envelope sender.
1098 Do basic validation on that. */
1099
1100 if (  Ufgets(big_buffer, big_buffer_size, fp) != NULL
1101    && Ufgets(big_buffer, big_buffer_size, fp) != NULL
1102    && Ufgets(big_buffer, big_buffer_size, fp) != NULL
1103    && (n = Ustrlen(big_buffer)) >= 3
1104    && big_buffer[0] == '<' && big_buffer[n-2] == '>'
1105    )
1106   {
1107   yield = store_get(n-2, GET_TAINTED);
1108   Ustrncpy(yield, big_buffer+1, n-3);
1109   yield[n-3] = 0;
1110   }
1111 fclose(fp);
1112 return yield;
1113 }
1114 #endif  /* COMPILE_UTILITY */
1115
1116 /* vi: aw ai sw=2
1117 */
1118 /* End of spool_in.c */