Support wire-format spoolfiles
[exim.git] / src / src / spool_in.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) University of Cambridge 1995 - 2016 */
6 /* See the file NOTICE for conditions of use and distribution. */
7
8 /* Functions for reading spool files. When compiling for a utility (eximon),
9 not all are needed, and some functionality can be cut out. */
10
11
12 #include "exim.h"
13
14
15
16 #ifndef COMPILE_UTILITY
17 /*************************************************
18 *           Open and lock data file              *
19 *************************************************/
20
21 /* The data file is the one that is used for locking, because the header file
22 can get replaced during delivery because of header rewriting. The file has
23 to opened with write access so that we can get an exclusive lock, but in
24 fact it won't be written to. Just in case there's a major disaster (e.g.
25 overwriting some other file descriptor with the value of this one), open it
26 with append.
27
28 As called by deliver_message() (at least) we are operating as root.
29
30 Argument: the id of the message
31 Returns:  fd if file successfully opened and locked, else -1
32
33 Side effect: message_subdir is set for the (possibly split) spool directory
34 */
35
36 int
37 spool_open_datafile(uschar *id)
38 {
39 int i;
40 struct stat statbuf;
41 flock_t lock_data;
42 int fd;
43
44 /* If split_spool_directory is set, first look for the file in the appropriate
45 sub-directory of the input directory. If it is not found there, try the input
46 directory itself, to pick up leftovers from before the splitting. If split_
47 spool_directory is not set, first look in the main input directory. If it is
48 not found there, try the split sub-directory, in case it is left over from a
49 splitting state. */
50
51 for (i = 0; i < 2; i++)
52   {
53   uschar * fname;
54   int save_errno;
55
56   message_subdir[0] = split_spool_directory == i ? '\0' : id[5];
57   fname = spool_fname(US"input", message_subdir, id, US"-D");
58   DEBUG(D_deliver) debug_printf("Trying spool file %s\n", fname);
59
60   if ((fd = Uopen(fname,
61 #ifdef O_CLOEXEC
62                       O_CLOEXEC |
63 #endif
64                       O_RDWR | O_APPEND, 0)) >= 0)
65     break;
66   save_errno = errno;
67   if (errno == ENOENT)
68     {
69     if (i == 0) continue;
70     if (!queue_running)
71       log_write(0, LOG_MAIN, "Spool%s%s file %s-D not found",
72         *queue_name ? US" Q=" : US"",
73         *queue_name ? queue_name : US"",
74         id);
75     }
76   else
77     log_write(0, LOG_MAIN, "Spool error for %s: %s", fname, strerror(errno));
78   errno = save_errno;
79   return -1;
80   }
81
82 /* File is open and message_subdir is set. Set the close-on-exec flag, and lock
83 the file. We lock only the first line of the file (containing the message ID)
84 because this apparently is needed for running Exim under Cygwin. If the entire
85 file is locked in one process, a sub-process cannot access it, even when passed
86 an open file descriptor (at least, I think that's the Cygwin story). On real
87 Unix systems it doesn't make any difference as long as Exim is consistent in
88 what it locks. */
89
90 #ifndef O_CLOEXEC
91 (void)fcntl(fd, F_SETFD, fcntl(fd, F_GETFD) | FD_CLOEXEC);
92 #endif
93
94 lock_data.l_type = F_WRLCK;
95 lock_data.l_whence = SEEK_SET;
96 lock_data.l_start = 0;
97 lock_data.l_len = SPOOL_DATA_START_OFFSET;
98
99 if (fcntl(fd, F_SETLK, &lock_data) < 0)
100   {
101   log_write(L_skip_delivery,
102             LOG_MAIN,
103             "Spool file is locked (another process is handling this message)");
104   (void)close(fd);
105   errno = 0;
106   return -1;
107   }
108
109 /* Get the size of the data; don't include the leading filename line
110 in the count, but add one for the newline before the data. */
111
112 if (fstat(fd, &statbuf) == 0)
113   {
114   message_body_size = statbuf.st_size - SPOOL_DATA_START_OFFSET;
115   message_size = message_body_size + 1;
116   }
117
118 return fd;
119 }
120 #endif  /* COMPILE_UTILITY */
121
122
123
124 /*************************************************
125 *    Read non-recipients tree from spool file    *
126 *************************************************/
127
128 /* The tree of non-recipients is written to the spool file in a form that
129 makes it easy to read back into a tree. The format is as follows:
130
131    . Each node is preceded by two letter(Y/N) indicating whether it has left
132      or right children. There's one space after the two flags, before the name.
133
134    . The left subtree (if any) then follows, then the right subtree (if any).
135
136 This function is entered with the next input line in the buffer. Note we must
137 save the right flag before recursing with the same buffer.
138
139 Once the tree is read, we re-construct the balance fields by scanning the tree.
140 I forgot to write them out originally, and the compatible fix is to do it this
141 way. This initial local recursing function does the necessary.
142
143 Arguments:
144   node      tree node
145
146 Returns:    maximum depth below the node, including the node itself
147 */
148
149 static int
150 count_below(tree_node *node)
151 {
152 int nleft, nright;
153 if (node == NULL) return 0;
154 nleft = count_below(node->left);
155 nright = count_below(node->right);
156 node->balance = (nleft > nright)? 1 : ((nright > nleft)? 2 : 0);
157 return 1 + ((nleft > nright)? nleft : nright);
158 }
159
160 /* This is the real function...
161
162 Arguments:
163   connect      pointer to the root of the tree
164   f            FILE to read data from
165   buffer       contains next input line; further lines read into it
166   buffer_size  size of the buffer
167
168 Returns:       FALSE on format error
169 */
170
171 static BOOL
172 read_nonrecipients_tree(tree_node **connect, FILE *f, uschar *buffer,
173   int buffer_size)
174 {
175 tree_node *node;
176 int n = Ustrlen(buffer);
177 BOOL right = buffer[1] == 'Y';
178
179 if (n < 5) return FALSE;    /* malformed line */
180 buffer[n-1] = 0;            /* Remove \n */
181 node = store_get(sizeof(tree_node) + n - 3);
182 *connect = node;
183 Ustrcpy(node->name, buffer + 3);
184 node->data.ptr = NULL;
185
186 if (buffer[0] == 'Y')
187   {
188   if (Ufgets(buffer, buffer_size, f) == NULL ||
189     !read_nonrecipients_tree(&node->left, f, buffer, buffer_size))
190       return FALSE;
191   }
192 else node->left = NULL;
193
194 if (right)
195   {
196   if (Ufgets(buffer, buffer_size, f) == NULL ||
197     !read_nonrecipients_tree(&node->right, f, buffer, buffer_size))
198       return FALSE;
199   }
200 else node->right = NULL;
201
202 (void) count_below(*connect);
203 return TRUE;
204 }
205
206
207
208
209 /*************************************************
210 *             Read spool header file             *
211 *************************************************/
212
213 /* This function reads a spool header file and places the data into the
214 appropriate global variables. The header portion is always read, but header
215 structures are built only if read_headers is set true. It isn't, for example,
216 while generating -bp output.
217
218 It may be possible for blocks of nulls (binary zeroes) to get written on the
219 end of a file if there is a system crash during writing. It was observed on an
220 earlier version of Exim that omitted to fsync() the files - this is thought to
221 have been the cause of that incident, but in any case, this code must be robust
222 against such an event, and if such a file is encountered, it must be treated as
223 malformed.
224
225 As called from deliver_message() (at least) we are running as root.
226
227 Arguments:
228   name          name of the header file, including the -H
229   read_headers  TRUE if in-store header structures are to be built
230   subdir_set    TRUE is message_subdir is already set
231
232 Returns:        spool_read_OK        success
233                 spool_read_notopen   open failed
234                 spool_read_enverror  error in the envelope portion
235                 spool_read_hdrerror  error in the header portion
236 */
237
238 int
239 spool_read_header(uschar *name, BOOL read_headers, BOOL subdir_set)
240 {
241 FILE *f = NULL;
242 int n;
243 int rcount = 0;
244 long int uid, gid;
245 BOOL inheader = FALSE;
246 uschar *p;
247
248 /* Reset all the global variables to their default values. However, there is
249 one exception. DO NOT change the default value of dont_deliver, because it may
250 be forced by an external setting. */
251
252 acl_var_c = acl_var_m = NULL;
253 authenticated_id = NULL;
254 authenticated_sender = NULL;
255 allow_unqualified_recipient = FALSE;
256 allow_unqualified_sender = FALSE;
257 body_linecount = 0;
258 body_zerocount = 0;
259 deliver_firsttime = FALSE;
260 deliver_freeze = FALSE;
261 deliver_frozen_at = 0;
262 deliver_manual_thaw = FALSE;
263 /* dont_deliver must NOT be reset */
264 header_list = header_last = NULL;
265 host_lookup_deferred = FALSE;
266 host_lookup_failed = FALSE;
267 interface_address = NULL;
268 interface_port = 0;
269 local_error_message = FALSE;
270 local_scan_data = NULL;
271 max_received_linelength = 0;
272 message_linecount = 0;
273 received_protocol = NULL;
274 received_count = 0;
275 recipients_list = NULL;
276 sender_address = NULL;
277 sender_fullhost = NULL;
278 sender_helo_name = NULL;
279 sender_host_address = NULL;
280 sender_host_name = NULL;
281 sender_host_port = 0;
282 sender_host_authenticated = NULL;
283 sender_ident = NULL;
284 sender_local = FALSE;
285 sender_set_untrusted = FALSE;
286 smtp_active_hostname = primary_hostname;
287 #ifndef COMPILE_UTILITY
288 spool_file_wireformat = FALSE;
289 #endif
290 tree_nonrecipients = NULL;
291
292 #ifdef EXPERIMENTAL_BRIGHTMAIL
293 bmi_run = 0;
294 bmi_verdicts = NULL;
295 #endif
296
297 #ifndef DISABLE_DKIM
298 dkim_signers = NULL;
299 dkim_disable_verify = FALSE;
300 dkim_collect_input = FALSE;
301 #endif
302
303 #ifdef SUPPORT_TLS
304 tls_in.certificate_verified = FALSE;
305 # ifdef EXPERIMENTAL_DANE
306 tls_in.dane_verified = FALSE;
307 # endif
308 tls_in.cipher = NULL;
309 # ifndef COMPILE_UTILITY        /* tls support fns not built in */
310 tls_free_cert(&tls_in.ourcert);
311 tls_free_cert(&tls_in.peercert);
312 # endif
313 tls_in.peerdn = NULL;
314 tls_in.sni = NULL;
315 tls_in.ocsp = OCSP_NOT_REQ;
316 #endif
317
318 #ifdef WITH_CONTENT_SCAN
319 spam_bar = NULL;
320 spam_score = NULL;
321 spam_score_int = NULL;
322 #endif
323
324 #if defined(SUPPORT_I18N) && !defined(COMPILE_UTILITY)
325 message_smtputf8 = FALSE;
326 message_utf8_downconvert = 0;
327 #endif
328
329 dsn_ret = 0;
330 dsn_envid = NULL;
331
332 /* Generate the full name and open the file. If message_subdir is already
333 set, just look in the given directory. Otherwise, look in both the split
334 and unsplit directories, as for the data file above. */
335
336 for (n = 0; n < 2; n++)
337   {
338   if (!subdir_set)
339     message_subdir[0] = split_spool_directory == (n == 0) ? name[5] : 0;
340
341   if ((f = Ufopen(spool_fname(US"input", message_subdir, name, US""), "rb")))
342     break;
343   if (n != 0 || subdir_set || errno != ENOENT)
344     return spool_read_notopen;
345   }
346
347 errno = 0;
348
349 #ifndef COMPILE_UTILITY
350 DEBUG(D_deliver) debug_printf("reading spool file %s\n", name);
351 #endif  /* COMPILE_UTILITY */
352
353 /* The first line of a spool file contains the message id followed by -H (i.e.
354 the file name), in order to make the file self-identifying. */
355
356 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
357 if (Ustrlen(big_buffer) != MESSAGE_ID_LENGTH + 3 ||
358     Ustrncmp(big_buffer, name, MESSAGE_ID_LENGTH + 2) != 0)
359   goto SPOOL_FORMAT_ERROR;
360
361 /* The next three lines in the header file are in a fixed format. The first
362 contains the login, uid, and gid of the user who caused the file to be written.
363 There are known cases where a negative gid is used, so we allow for both
364 negative uids and gids. The second contains the mail address of the message's
365 sender, enclosed in <>. The third contains the time the message was received,
366 and the number of warning messages for delivery delays that have been sent. */
367
368 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
369
370 p = big_buffer + Ustrlen(big_buffer);
371 while (p > big_buffer && isspace(p[-1])) p--;
372 *p = 0;
373 if (!isdigit(p[-1])) goto SPOOL_FORMAT_ERROR;
374 while (p > big_buffer && (isdigit(p[-1]) || '-' == p[-1])) p--;
375 gid = Uatoi(p);
376 if (p <= big_buffer || *(--p) != ' ') goto SPOOL_FORMAT_ERROR;
377 *p = 0;
378 if (!isdigit(p[-1])) goto SPOOL_FORMAT_ERROR;
379 while (p > big_buffer && (isdigit(p[-1]) || '-' == p[-1])) p--;
380 uid = Uatoi(p);
381 if (p <= big_buffer || *(--p) != ' ') goto SPOOL_FORMAT_ERROR;
382 *p = 0;
383
384 originator_login = string_copy(big_buffer);
385 originator_uid = (uid_t)uid;
386 originator_gid = (gid_t)gid;
387
388 /* envelope from */
389 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
390 n = Ustrlen(big_buffer);
391 if (n < 3 || big_buffer[0] != '<' || big_buffer[n-2] != '>')
392   goto SPOOL_FORMAT_ERROR;
393
394 sender_address = store_get(n-2);
395 Ustrncpy(sender_address, big_buffer+1, n-3);
396 sender_address[n-3] = 0;
397
398 /* time */
399 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
400 if (sscanf(CS big_buffer, "%d %d", &received_time, &warning_count) != 2)
401   goto SPOOL_FORMAT_ERROR;
402
403 message_age = time(NULL) - received_time;
404
405 #ifndef COMPILE_UTILITY
406 DEBUG(D_deliver) debug_printf("user=%s uid=%ld gid=%ld sender=%s\n",
407   originator_login, (long int)originator_uid, (long int)originator_gid,
408   sender_address);
409 #endif  /* COMPILE_UTILITY */
410
411 /* Now there may be a number of optional lines, each starting with "-". If you
412 add a new setting here, make sure you set the default above.
413
414 Because there are now quite a number of different possibilities, we use a
415 switch on the first character to avoid too many failing tests. Thanks to Nico
416 Erfurth for the patch that implemented this. I have made it even more efficient
417 by not re-scanning the first two characters.
418
419 To allow new versions of Exim that add additional flags to interwork with older
420 versions that do not understand them, just ignore any lines starting with "-"
421 that we don't recognize. Otherwise it wouldn't be possible to back off a new
422 version that left new-style flags written on the spool. */
423
424 p = big_buffer + 2;
425 for (;;)
426   {
427   int len;
428   if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
429   if (big_buffer[0] != '-') break;
430   while (  (len = Ustrlen(big_buffer)) == big_buffer_size-1
431         && big_buffer[len-1] != '\n'
432         )
433     {   /* buffer not big enough for line; certs make this possible */
434     uschar * buf;
435     if (big_buffer_size >= BIG_BUFFER_SIZE*4) goto SPOOL_READ_ERROR;
436     buf = store_get_perm(big_buffer_size *= 2);
437     memcpy(buf, big_buffer, --len);
438     big_buffer = buf;
439     if (Ufgets(big_buffer+len, big_buffer_size-len, f) == NULL)
440       goto SPOOL_READ_ERROR;
441     }
442   big_buffer[len-1] = 0;
443
444   switch(big_buffer[1])
445     {
446     case 'a':
447
448     /* Nowadays we use "-aclc" and "-aclm" for the different types of ACL
449     variable, because Exim allows any number of them, with arbitrary names.
450     The line in the spool file is "-acl[cm] <name> <length>". The name excludes
451     the c or m. */
452
453     if (Ustrncmp(p, "clc ", 4) == 0 ||
454         Ustrncmp(p, "clm ", 4) == 0)
455       {
456       uschar *name, *endptr;
457       int count;
458       tree_node *node;
459       endptr = Ustrchr(big_buffer + 6, ' ');
460       if (endptr == NULL) goto SPOOL_FORMAT_ERROR;
461       name = string_sprintf("%c%.*s", big_buffer[4], endptr - big_buffer - 6,
462         big_buffer + 6);
463       if (sscanf(CS endptr, " %d", &count) != 1) goto SPOOL_FORMAT_ERROR;
464       node = acl_var_create(name);
465       node->data.ptr = store_get(count + 1);
466       if (fread(node->data.ptr, 1, count+1, f) < count) goto SPOOL_READ_ERROR;
467       ((uschar*)node->data.ptr)[count] = 0;
468       }
469
470     else if (Ustrcmp(p, "llow_unqualified_recipient") == 0)
471       allow_unqualified_recipient = TRUE;
472     else if (Ustrcmp(p, "llow_unqualified_sender") == 0)
473       allow_unqualified_sender = TRUE;
474
475     else if (Ustrncmp(p, "uth_id", 6) == 0)
476       authenticated_id = string_copy(big_buffer + 9);
477     else if (Ustrncmp(p, "uth_sender", 10) == 0)
478       authenticated_sender = string_copy(big_buffer + 13);
479     else if (Ustrncmp(p, "ctive_hostname", 14) == 0)
480       smtp_active_hostname = string_copy(big_buffer + 17);
481
482     /* For long-term backward compatibility, we recognize "-acl", which was
483     used before the number of ACL variables changed from 10 to 20. This was
484     before the subsequent change to an arbitrary number of named variables.
485     This code is retained so that upgrades from very old versions can still
486     handle old-format spool files. The value given after "-acl" is a number
487     that is 0-9 for connection variables, and 10-19 for message variables. */
488
489     else if (Ustrncmp(p, "cl ", 3) == 0)
490       {
491       unsigned index, count;
492       uschar name[20];   /* Need plenty of space for %u format */
493       tree_node * node;
494       if (  sscanf(CS big_buffer + 5, "%u %u", &index, &count) != 2
495          || index >= 20
496          || count > 16384       /* arbitrary limit on variable size */
497          )
498         goto SPOOL_FORMAT_ERROR;
499       if (index < 10)
500         (void) string_format(name, sizeof(name), "%c%u", 'c', index);
501       else
502         (void) string_format(name, sizeof(name), "%c%u", 'm', index - 10);
503       node = acl_var_create(name);
504       node->data.ptr = store_get(count + 1);
505       /* We sanity-checked the count, so disable the Coverity error */
506       /* coverity[tainted_data] */
507       if (fread(node->data.ptr, 1, count+1, f) < count) goto SPOOL_READ_ERROR;
508       (US node->data.ptr)[count] = '\0';
509       }
510     break;
511
512     case 'b':
513     if (Ustrncmp(p, "ody_linecount", 13) == 0)
514       body_linecount = Uatoi(big_buffer + 15);
515     else if (Ustrncmp(p, "ody_zerocount", 13) == 0)
516       body_zerocount = Uatoi(big_buffer + 15);
517 #ifdef EXPERIMENTAL_BRIGHTMAIL
518     else if (Ustrncmp(p, "mi_verdicts ", 12) == 0)
519       bmi_verdicts = string_copy(big_buffer + 14);
520 #endif
521     break;
522
523     case 'd':
524     if (Ustrcmp(p, "eliver_firsttime") == 0)
525       deliver_firsttime = TRUE;
526     /* Check if the dsn flags have been set in the header file */
527     else if (Ustrncmp(p, "sn_ret", 6) == 0)
528       dsn_ret= atoi(CS big_buffer + 8);
529     else if (Ustrncmp(p, "sn_envid", 8) == 0)
530       dsn_envid = string_copy(big_buffer + 11);
531     break;
532
533     case 'f':
534     if (Ustrncmp(p, "rozen", 5) == 0)
535       {
536       deliver_freeze = TRUE;
537       if (sscanf(CS big_buffer+7, TIME_T_FMT, &deliver_frozen_at) != 1)
538         goto SPOOL_READ_ERROR;
539       }
540     break;
541
542     case 'h':
543     if (Ustrcmp(p, "ost_lookup_deferred") == 0)
544       host_lookup_deferred = TRUE;
545     else if (Ustrcmp(p, "ost_lookup_failed") == 0)
546       host_lookup_failed = TRUE;
547     else if (Ustrncmp(p, "ost_auth", 8) == 0)
548       sender_host_authenticated = string_copy(big_buffer + 11);
549     else if (Ustrncmp(p, "ost_name", 8) == 0)
550       sender_host_name = string_copy(big_buffer + 11);
551     else if (Ustrncmp(p, "elo_name", 8) == 0)
552       sender_helo_name = string_copy(big_buffer + 11);
553
554     /* We now record the port number after the address, separated by a
555     dot. For compatibility during upgrading, do nothing if there
556     isn't a value (it gets left at zero). */
557
558     else if (Ustrncmp(p, "ost_address", 11) == 0)
559       {
560       sender_host_port = host_address_extract_port(big_buffer + 14);
561       sender_host_address = string_copy(big_buffer + 14);
562       }
563     break;
564
565     case 'i':
566     if (Ustrncmp(p, "nterface_address", 16) == 0)
567       {
568       interface_port = host_address_extract_port(big_buffer + 19);
569       interface_address = string_copy(big_buffer + 19);
570       }
571     else if (Ustrncmp(p, "dent", 4) == 0)
572       sender_ident = string_copy(big_buffer + 7);
573     break;
574
575     case 'l':
576     if (Ustrcmp(p, "ocal") == 0) sender_local = TRUE;
577     else if (Ustrcmp(big_buffer, "-localerror") == 0)
578       local_error_message = TRUE;
579     else if (Ustrncmp(p, "ocal_scan ", 10) == 0)
580       local_scan_data = string_copy(big_buffer + 12);
581     break;
582
583     case 'm':
584     if (Ustrcmp(p, "anual_thaw") == 0) deliver_manual_thaw = TRUE;
585     else if (Ustrncmp(p, "ax_received_linelength", 22) == 0)
586       max_received_linelength = Uatoi(big_buffer + 24);
587     break;
588
589     case 'N':
590     if (*p == 0) dont_deliver = TRUE;   /* -N */
591     break;
592
593     case 'r':
594     if (Ustrncmp(p, "eceived_protocol", 16) == 0)
595       received_protocol = string_copy(big_buffer + 19);
596     break;
597
598     case 's':
599     if (Ustrncmp(p, "ender_set_untrusted", 19) == 0)
600       sender_set_untrusted = TRUE;
601 #ifdef WITH_CONTENT_SCAN
602     else if (Ustrncmp(p, "pam_bar ", 8) == 0)
603       spam_bar = string_copy(big_buffer + 10);
604     else if (Ustrncmp(p, "pam_score ", 10) == 0)
605       spam_score = string_copy(big_buffer + 12);
606     else if (Ustrncmp(p, "pam_score_int ", 14) == 0)
607       spam_score_int = string_copy(big_buffer + 16);
608 #endif
609 #ifndef COMPILE_UTILITY
610     else if (Ustrncmp(p, "pool_file_wireformat", 20) == 0)
611       spool_file_wireformat = TRUE;
612 #endif
613 #if defined(SUPPORT_I18N) && !defined(COMPILE_UTILITY)
614     else if (Ustrncmp(p, "mtputf8", 7) == 0)
615       message_smtputf8 = TRUE;
616 #endif
617     break;
618
619 #ifdef SUPPORT_TLS
620     case 't':
621     if (Ustrncmp(p, "ls_certificate_verified", 23) == 0)
622       tls_in.certificate_verified = TRUE;
623     else if (Ustrncmp(p, "ls_cipher", 9) == 0)
624       tls_in.cipher = string_copy(big_buffer + 12);
625 # ifndef COMPILE_UTILITY        /* tls support fns not built in */
626     else if (Ustrncmp(p, "ls_ourcert", 10) == 0)
627       (void) tls_import_cert(big_buffer + 13, &tls_in.ourcert);
628     else if (Ustrncmp(p, "ls_peercert", 11) == 0)
629       (void) tls_import_cert(big_buffer + 14, &tls_in.peercert);
630 # endif
631     else if (Ustrncmp(p, "ls_peerdn", 9) == 0)
632       tls_in.peerdn = string_unprinting(string_copy(big_buffer + 12));
633     else if (Ustrncmp(p, "ls_sni", 6) == 0)
634       tls_in.sni = string_unprinting(string_copy(big_buffer + 9));
635     else if (Ustrncmp(p, "ls_ocsp", 7) == 0)
636       tls_in.ocsp = big_buffer[10] - '0';
637     break;
638 #endif
639
640 #if defined(SUPPORT_I18N) && !defined(COMPILE_UTILITY)
641     case 'u':
642     if (Ustrncmp(p, "tf8_downcvt", 11) == 0)
643       message_utf8_downconvert = 1;
644     else if (Ustrncmp(p, "tf8_optdowncvt", 15) == 0)
645       message_utf8_downconvert = -1;
646     break;
647 #endif
648
649     default:    /* Present because some compilers complain if all */
650     break;      /* possibilities are not covered. */
651     }
652   }
653
654 /* Build sender_fullhost if required */
655
656 #ifndef COMPILE_UTILITY
657 host_build_sender_fullhost();
658 #endif  /* COMPILE_UTILITY */
659
660 #ifndef COMPILE_UTILITY
661 DEBUG(D_deliver)
662   debug_printf("sender_local=%d ident=%s\n", sender_local,
663     (sender_ident == NULL)? US"unset" : sender_ident);
664 #endif  /* COMPILE_UTILITY */
665
666 /* We now have the tree of addresses NOT to deliver to, or a line
667 containing "XX", indicating no tree. */
668
669 if (Ustrncmp(big_buffer, "XX\n", 3) != 0 &&
670   !read_nonrecipients_tree(&tree_nonrecipients, f, big_buffer, big_buffer_size))
671     goto SPOOL_FORMAT_ERROR;
672
673 #ifndef COMPILE_UTILITY
674 DEBUG(D_deliver)
675   {
676   debug_printf("Non-recipients:\n");
677   debug_print_tree(tree_nonrecipients);
678   }
679 #endif  /* COMPILE_UTILITY */
680
681 /* After reading the tree, the next line has not yet been read into the
682 buffer. It contains the count of recipients which follow on separate lines.
683 Apply an arbitrary sanity check.*/
684
685 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
686 if (sscanf(CS big_buffer, "%d", &rcount) != 1 || rcount > 16384)
687   goto SPOOL_FORMAT_ERROR;
688
689 #ifndef COMPILE_UTILITY
690 DEBUG(D_deliver) debug_printf("recipients_count=%d\n", rcount);
691 #endif  /* COMPILE_UTILITY */
692
693 recipients_list_max = rcount;
694 recipients_list = store_get(rcount * sizeof(recipient_item));
695
696 /* We sanitised the count and know we have enough memory, so disable
697 the Coverity error on recipients_count */
698 /* coverity[tainted_data] */
699
700 for (recipients_count = 0; recipients_count < rcount; recipients_count++)
701   {
702   int nn;
703   int pno = -1;
704   int dsn_flags = 0;
705   uschar *orcpt = NULL;
706   uschar *errors_to = NULL;
707   uschar *p;
708
709   if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
710   nn = Ustrlen(big_buffer);
711   if (nn < 2) goto SPOOL_FORMAT_ERROR;
712
713   /* Remove the newline; this terminates the address if there is no additional
714   data on the line. */
715
716   p = big_buffer + nn - 1;
717   *p-- = 0;
718
719   /* Look back from the end of the line for digits and special terminators.
720   Since an address must end with a domain, we can tell that extra data is
721   present by the presence of the terminator, which is always some character
722   that cannot exist in a domain. (If I'd thought of the need for additional
723   data early on, I'd have put it at the start, with the address at the end. As
724   it is, we have to operate backwards. Addresses are permitted to contain
725   spaces, you see.)
726
727   This code has to cope with various versions of this data that have evolved
728   over time. In all cases, the line might just contain an address, with no
729   additional data. Otherwise, the possibilities are as follows:
730
731   Exim 3 type:       <address><space><digits>,<digits>,<digits>
732
733     The second set of digits is the parent number for one_time addresses. The
734     other values were remnants of earlier experiments that were abandoned.
735
736   Exim 4 first type: <address><space><digits>
737
738     The digits are the parent number for one_time addresses.
739
740   Exim 4 new type:   <address><space><data>#<type bits>
741
742     The type bits indicate what the contents of the data are.
743
744     Bit 01 indicates that, reading from right to left, the data
745       ends with <errors_to address><space><len>,<pno> where pno is
746       the parent number for one_time addresses, and len is the length
747       of the errors_to address (zero meaning none).
748
749     Bit 02 indicates that, again reading from right to left, the data continues
750      with orcpt len(orcpt),dsn_flags
751    */
752
753   while (isdigit(*p)) p--;
754
755   /* Handle Exim 3 spool files */
756
757   if (*p == ',')
758     {
759     int dummy;
760     while (isdigit(*(--p)) || *p == ',');
761     if (*p == ' ')
762       {
763       *p++ = 0;
764       (void)sscanf(CS p, "%d,%d", &dummy, &pno);
765       }
766     }
767
768   /* Handle early Exim 4 spool files */
769
770   else if (*p == ' ')
771     {
772     *p++ = 0;
773     (void)sscanf(CS p, "%d", &pno);
774     }
775
776   /* Handle current format Exim 4 spool files */
777
778   else if (*p == '#')
779     {
780     int flags;
781
782 #if !defined (COMPILE_UTILITY)
783     DEBUG(D_deliver) debug_printf("**** SPOOL_IN - Exim 4 standard format spoolfile\n");
784 #endif
785
786     (void)sscanf(CS p+1, "%d", &flags);
787
788     if ((flags & 0x01) != 0)      /* one_time data exists */
789       {
790       int len;
791       while (isdigit(*(--p)) || *p == ',' || *p == '-');
792       (void)sscanf(CS p+1, "%d,%d", &len, &pno);
793       *p = 0;
794       if (len > 0)
795         {
796         p -= len;
797         errors_to = string_copy(p);
798         }
799       }
800
801     *(--p) = 0;   /* Terminate address */
802     if ((flags & 0x02) != 0)      /* one_time data exists */
803       {
804       int len;
805       while (isdigit(*(--p)) || *p == ',' || *p == '-');
806       (void)sscanf(CS p+1, "%d,%d", &len, &dsn_flags);
807       *p = 0;
808       if (len > 0)
809         {
810         p -= len;
811         orcpt = string_copy(p);
812         }
813       }
814
815     *(--p) = 0;   /* Terminate address */
816     }
817 #if !defined(COMPILE_UTILITY)
818   else
819     { DEBUG(D_deliver) debug_printf("**** SPOOL_IN - No additional fields\n"); }
820
821   if ((orcpt != NULL) || (dsn_flags != 0))
822     {
823     DEBUG(D_deliver) debug_printf("**** SPOOL_IN - address: |%s| orcpt: |%s| dsn_flags: %d\n",
824       big_buffer, orcpt, dsn_flags);
825     }
826   if (errors_to != NULL)
827     {
828     DEBUG(D_deliver) debug_printf("**** SPOOL_IN - address: |%s| errorsto: |%s|\n",
829       big_buffer, errors_to);
830     }
831 #endif
832
833   recipients_list[recipients_count].address = string_copy(big_buffer);
834   recipients_list[recipients_count].pno = pno;
835   recipients_list[recipients_count].errors_to = errors_to;
836   recipients_list[recipients_count].orcpt = orcpt;
837   recipients_list[recipients_count].dsn_flags = dsn_flags;
838   }
839
840 /* The remainder of the spool header file contains the headers for the message,
841 separated off from the previous data by a blank line. Each header is preceded
842 by a count of its length and either a certain letter (for various identified
843 headers), space (for a miscellaneous live header) or an asterisk (for a header
844 that has been rewritten). Count the Received: headers. We read the headers
845 always, in order to check on the format of the file, but only create a header
846 list if requested to do so. */
847
848 inheader = TRUE;
849 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
850 if (big_buffer[0] != '\n') goto SPOOL_FORMAT_ERROR;
851
852 while ((n = fgetc(f)) != EOF)
853   {
854   header_line *h;
855   uschar flag[4];
856   int i;
857
858   if (!isdigit(n)) goto SPOOL_FORMAT_ERROR;
859   if(ungetc(n, f) == EOF  ||  fscanf(f, "%d%c ", &n, flag) == EOF)
860     goto SPOOL_READ_ERROR;
861   if (flag[0] != '*') message_size += n;  /* Omit non-transmitted headers */
862
863   if (read_headers)
864     {
865     h = store_get(sizeof(header_line));
866     h->next = NULL;
867     h->type = flag[0];
868     h->slen = n;
869     h->text = store_get(n+1);
870
871     if (h->type == htype_received) received_count++;
872
873     if (header_list == NULL) header_list = h;
874       else header_last->next = h;
875     header_last = h;
876
877     for (i = 0; i < n; i++)
878       {
879       int c = fgetc(f);
880       if (c == 0 || c == EOF) goto SPOOL_FORMAT_ERROR;
881       if (c == '\n' && h->type != htype_old) message_linecount++;
882       h->text[i] = c;
883       }
884     h->text[i] = 0;
885     }
886
887   /* Not requiring header data, just skip through the bytes */
888
889   else for (i = 0; i < n; i++)
890     {
891     int c = fgetc(f);
892     if (c == 0 || c == EOF) goto SPOOL_FORMAT_ERROR;
893     }
894   }
895
896 /* We have successfully read the data in the header file. Update the message
897 line count by adding the body linecount to the header linecount. Close the file
898 and give a positive response. */
899
900 #ifndef COMPILE_UTILITY
901 DEBUG(D_deliver) debug_printf("body_linecount=%d message_linecount=%d\n",
902   body_linecount, message_linecount);
903 #endif  /* COMPILE_UTILITY */
904
905 message_linecount += body_linecount;
906
907 fclose(f);
908 return spool_read_OK;
909
910
911 /* There was an error reading the spool or there was missing data,
912 or there was a format error. A "read error" with no errno means an
913 unexpected EOF, which we treat as a format error. */
914
915 SPOOL_READ_ERROR:
916 if (errno != 0)
917   {
918   n = errno;
919
920 #ifndef COMPILE_UTILITY
921   DEBUG(D_any) debug_printf("Error while reading spool file %s\n", name);
922 #endif  /* COMPILE_UTILITY */
923
924   fclose(f);
925   errno = n;
926   return inheader? spool_read_hdrerror : spool_read_enverror;
927   }
928
929 SPOOL_FORMAT_ERROR:
930
931 #ifndef COMPILE_UTILITY
932 DEBUG(D_any) debug_printf("Format error in spool file %s\n", name);
933 #endif  /* COMPILE_UTILITY */
934
935 fclose(f);
936 errno = ERRNO_SPOOLFORMAT;
937 return inheader? spool_read_hdrerror : spool_read_enverror;
938 }
939
940 /* vi: aw ai sw=2
941 */
942 /* End of spool_in.c */