Defend against symlink attack by another process running as exim
[exim.git] / src / src / spool_in.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) University of Cambridge 1995 - 2016 */
6 /* See the file NOTICE for conditions of use and distribution. */
7
8 /* Functions for reading spool files. When compiling for a utility (eximon),
9 not all are needed, and some functionality can be cut out. */
10
11
12 #include "exim.h"
13
14
15
16 #ifndef COMPILE_UTILITY
17 /*************************************************
18 *           Open and lock data file              *
19 *************************************************/
20
21 /* The data file is the one that is used for locking, because the header file
22 can get replaced during delivery because of header rewriting. The file has
23 to opened with write access so that we can get an exclusive lock, but in
24 fact it won't be written to. Just in case there's a major disaster (e.g.
25 overwriting some other file descriptor with the value of this one), open it
26 with append.
27
28 As called by deliver_message() (at least) we are operating as root.
29
30 Argument: the id of the message
31 Returns:  fd if file successfully opened and locked, else -1
32
33 Side effect: message_subdir is set for the (possibly split) spool directory
34 */
35
36 int
37 spool_open_datafile(uschar *id)
38 {
39 int i;
40 struct stat statbuf;
41 flock_t lock_data;
42 int fd;
43
44 /* If split_spool_directory is set, first look for the file in the appropriate
45 sub-directory of the input directory. If it is not found there, try the input
46 directory itself, to pick up leftovers from before the splitting. If split_
47 spool_directory is not set, first look in the main input directory. If it is
48 not found there, try the split sub-directory, in case it is left over from a
49 splitting state. */
50
51 for (i = 0; i < 2; i++)
52   {
53   uschar * fname;
54   int save_errno;
55
56   message_subdir[0] = split_spool_directory == i ? '\0' : id[5];
57   fname = spool_fname(US"input", message_subdir, id, US"-D");
58   DEBUG(D_deliver) debug_printf("Trying spool file %s\n", fname);
59
60   if ((fd = Uopen(fname,
61 #ifdef O_CLOEXEC
62                       O_CLOEXEC |
63 #endif
64                       O_RDWR | O_APPEND, 0)) >= 0)
65     break;
66   save_errno = errno;
67   if (errno == ENOENT)
68     {
69     if (i == 0) continue;
70     if (!queue_running)
71       log_write(0, LOG_MAIN, "Spool%s%s file %s-D not found",
72         *queue_name ? US" Q=" : US"",
73         *queue_name ? queue_name : US"",
74         id);
75     }
76   else
77     log_write(0, LOG_MAIN, "Spool error for %s: %s", fname, strerror(errno));
78   errno = save_errno;
79   return -1;
80   }
81
82 /* File is open and message_subdir is set. Set the close-on-exec flag, and lock
83 the file. We lock only the first line of the file (containing the message ID)
84 because this apparently is needed for running Exim under Cygwin. If the entire
85 file is locked in one process, a sub-process cannot access it, even when passed
86 an open file descriptor (at least, I think that's the Cygwin story). On real
87 Unix systems it doesn't make any difference as long as Exim is consistent in
88 what it locks. */
89
90 #ifndef O_CLOEXEC
91 (void)fcntl(fd, F_SETFD, fcntl(fd, F_GETFD) | FD_CLOEXEC);
92 #endif
93
94 lock_data.l_type = F_WRLCK;
95 lock_data.l_whence = SEEK_SET;
96 lock_data.l_start = 0;
97 lock_data.l_len = SPOOL_DATA_START_OFFSET;
98
99 if (fcntl(fd, F_SETLK, &lock_data) < 0)
100   {
101   log_write(L_skip_delivery,
102             LOG_MAIN,
103             "Spool file is locked (another process is handling this message)");
104   (void)close(fd);
105   errno = 0;
106   return -1;
107   }
108
109 /* Get the size of the data; don't include the leading filename line
110 in the count, but add one for the newline before the data. */
111
112 if (fstat(fd, &statbuf) == 0)
113   {
114   message_body_size = statbuf.st_size - SPOOL_DATA_START_OFFSET;
115   message_size = message_body_size + 1;
116   }
117
118 return fd;
119 }
120 #endif  /* COMPILE_UTILITY */
121
122
123
124 /*************************************************
125 *    Read non-recipients tree from spool file    *
126 *************************************************/
127
128 /* The tree of non-recipients is written to the spool file in a form that
129 makes it easy to read back into a tree. The format is as follows:
130
131    . Each node is preceded by two letter(Y/N) indicating whether it has left
132      or right children. There's one space after the two flags, before the name.
133
134    . The left subtree (if any) then follows, then the right subtree (if any).
135
136 This function is entered with the next input line in the buffer. Note we must
137 save the right flag before recursing with the same buffer.
138
139 Once the tree is read, we re-construct the balance fields by scanning the tree.
140 I forgot to write them out originally, and the compatible fix is to do it this
141 way. This initial local recursing function does the necessary.
142
143 Arguments:
144   node      tree node
145
146 Returns:    maximum depth below the node, including the node itself
147 */
148
149 static int
150 count_below(tree_node *node)
151 {
152 int nleft, nright;
153 if (node == NULL) return 0;
154 nleft = count_below(node->left);
155 nright = count_below(node->right);
156 node->balance = (nleft > nright)? 1 : ((nright > nleft)? 2 : 0);
157 return 1 + ((nleft > nright)? nleft : nright);
158 }
159
160 /* This is the real function...
161
162 Arguments:
163   connect      pointer to the root of the tree
164   f            FILE to read data from
165   buffer       contains next input line; further lines read into it
166   buffer_size  size of the buffer
167
168 Returns:       FALSE on format error
169 */
170
171 static BOOL
172 read_nonrecipients_tree(tree_node **connect, FILE *f, uschar *buffer,
173   int buffer_size)
174 {
175 tree_node *node;
176 int n = Ustrlen(buffer);
177 BOOL right = buffer[1] == 'Y';
178
179 if (n < 5) return FALSE;    /* malformed line */
180 buffer[n-1] = 0;            /* Remove \n */
181 node = store_get(sizeof(tree_node) + n - 3);
182 *connect = node;
183 Ustrcpy(node->name, buffer + 3);
184 node->data.ptr = NULL;
185
186 if (buffer[0] == 'Y')
187   {
188   if (Ufgets(buffer, buffer_size, f) == NULL ||
189     !read_nonrecipients_tree(&node->left, f, buffer, buffer_size))
190       return FALSE;
191   }
192 else node->left = NULL;
193
194 if (right)
195   {
196   if (Ufgets(buffer, buffer_size, f) == NULL ||
197     !read_nonrecipients_tree(&node->right, f, buffer, buffer_size))
198       return FALSE;
199   }
200 else node->right = NULL;
201
202 (void) count_below(*connect);
203 return TRUE;
204 }
205
206
207
208
209 /*************************************************
210 *             Read spool header file             *
211 *************************************************/
212
213 /* This function reads a spool header file and places the data into the
214 appropriate global variables. The header portion is always read, but header
215 structures are built only if read_headers is set true. It isn't, for example,
216 while generating -bp output.
217
218 It may be possible for blocks of nulls (binary zeroes) to get written on the
219 end of a file if there is a system crash during writing. It was observed on an
220 earlier version of Exim that omitted to fsync() the files - this is thought to
221 have been the cause of that incident, but in any case, this code must be robust
222 against such an event, and if such a file is encountered, it must be treated as
223 malformed.
224
225 As called from deliver_message() (at least) we are running as root.
226
227 Arguments:
228   name          name of the header file, including the -H
229   read_headers  TRUE if in-store header structures are to be built
230   subdir_set    TRUE is message_subdir is already set
231
232 Returns:        spool_read_OK        success
233                 spool_read_notopen   open failed
234                 spool_read_enverror  error in the envelope portion
235                 spool_read_hdrdrror  error in the header portion
236 */
237
238 int
239 spool_read_header(uschar *name, BOOL read_headers, BOOL subdir_set)
240 {
241 FILE *f = NULL;
242 int n;
243 int rcount = 0;
244 long int uid, gid;
245 BOOL inheader = FALSE;
246 uschar *p;
247
248 /* Reset all the global variables to their default values. However, there is
249 one exception. DO NOT change the default value of dont_deliver, because it may
250 be forced by an external setting. */
251
252 acl_var_c = acl_var_m = NULL;
253 authenticated_id = NULL;
254 authenticated_sender = NULL;
255 allow_unqualified_recipient = FALSE;
256 allow_unqualified_sender = FALSE;
257 body_linecount = 0;
258 body_zerocount = 0;
259 deliver_firsttime = FALSE;
260 deliver_freeze = FALSE;
261 deliver_frozen_at = 0;
262 deliver_manual_thaw = FALSE;
263 /* dont_deliver must NOT be reset */
264 header_list = header_last = NULL;
265 host_lookup_deferred = FALSE;
266 host_lookup_failed = FALSE;
267 interface_address = NULL;
268 interface_port = 0;
269 local_error_message = FALSE;
270 local_scan_data = NULL;
271 max_received_linelength = 0;
272 message_linecount = 0;
273 received_protocol = NULL;
274 received_count = 0;
275 recipients_list = NULL;
276 sender_address = NULL;
277 sender_fullhost = NULL;
278 sender_helo_name = NULL;
279 sender_host_address = NULL;
280 sender_host_name = NULL;
281 sender_host_port = 0;
282 sender_host_authenticated = NULL;
283 sender_ident = NULL;
284 sender_local = FALSE;
285 sender_set_untrusted = FALSE;
286 smtp_active_hostname = primary_hostname;
287 tree_nonrecipients = NULL;
288
289 #ifdef EXPERIMENTAL_BRIGHTMAIL
290 bmi_run = 0;
291 bmi_verdicts = NULL;
292 #endif
293
294 #ifndef DISABLE_DKIM
295 dkim_signers = NULL;
296 dkim_disable_verify = FALSE;
297 dkim_collect_input = FALSE;
298 #endif
299
300 #ifdef SUPPORT_TLS
301 tls_in.certificate_verified = FALSE;
302 # ifdef EXPERIMENTAL_DANE
303 tls_in.dane_verified = FALSE;
304 # endif
305 tls_in.cipher = NULL;
306 # ifndef COMPILE_UTILITY        /* tls support fns not built in */
307 tls_free_cert(&tls_in.ourcert);
308 tls_free_cert(&tls_in.peercert);
309 # endif
310 tls_in.peerdn = NULL;
311 tls_in.sni = NULL;
312 tls_in.ocsp = OCSP_NOT_REQ;
313 #endif
314
315 #ifdef WITH_CONTENT_SCAN
316 spam_bar = NULL;
317 spam_score = NULL;
318 spam_score_int = NULL;
319 #endif
320
321 #if defined(SUPPORT_I18N) && !defined(COMPILE_UTILITY)
322 message_smtputf8 = FALSE;
323 message_utf8_downconvert = 0;
324 #endif
325
326 dsn_ret = 0;
327 dsn_envid = NULL;
328
329 /* Generate the full name and open the file. If message_subdir is already
330 set, just look in the given directory. Otherwise, look in both the split
331 and unsplit directories, as for the data file above. */
332
333 for (n = 0; n < 2; n++)
334   {
335   if (!subdir_set)
336     message_subdir[0] = split_spool_directory == (n == 0) ? name[5] : 0;
337
338   if ((f = Ufopen(spool_fname(US"input", message_subdir, name, US""), "rb")))
339     break;
340   if (n != 0 || subdir_set || errno != ENOENT)
341     return spool_read_notopen;
342   }
343
344 errno = 0;
345
346 #ifndef COMPILE_UTILITY
347 DEBUG(D_deliver) debug_printf("reading spool file %s\n", name);
348 #endif  /* COMPILE_UTILITY */
349
350 /* The first line of a spool file contains the message id followed by -H (i.e.
351 the file name), in order to make the file self-identifying. */
352
353 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
354 if (Ustrlen(big_buffer) != MESSAGE_ID_LENGTH + 3 ||
355     Ustrncmp(big_buffer, name, MESSAGE_ID_LENGTH + 2) != 0)
356   goto SPOOL_FORMAT_ERROR;
357
358 /* The next three lines in the header file are in a fixed format. The first
359 contains the login, uid, and gid of the user who caused the file to be written.
360 There are known cases where a negative gid is used, so we allow for both
361 negative uids and gids. The second contains the mail address of the message's
362 sender, enclosed in <>. The third contains the time the message was received,
363 and the number of warning messages for delivery delays that have been sent. */
364
365 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
366
367 p = big_buffer + Ustrlen(big_buffer);
368 while (p > big_buffer && isspace(p[-1])) p--;
369 *p = 0;
370 if (!isdigit(p[-1])) goto SPOOL_FORMAT_ERROR;
371 while (p > big_buffer && (isdigit(p[-1]) || '-' == p[-1])) p--;
372 gid = Uatoi(p);
373 if (p <= big_buffer || *(--p) != ' ') goto SPOOL_FORMAT_ERROR;
374 *p = 0;
375 if (!isdigit(p[-1])) goto SPOOL_FORMAT_ERROR;
376 while (p > big_buffer && (isdigit(p[-1]) || '-' == p[-1])) p--;
377 uid = Uatoi(p);
378 if (p <= big_buffer || *(--p) != ' ') goto SPOOL_FORMAT_ERROR;
379 *p = 0;
380
381 originator_login = string_copy(big_buffer);
382 originator_uid = (uid_t)uid;
383 originator_gid = (gid_t)gid;
384
385 /* envelope from */
386 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
387 n = Ustrlen(big_buffer);
388 if (n < 3 || big_buffer[0] != '<' || big_buffer[n-2] != '>')
389   goto SPOOL_FORMAT_ERROR;
390
391 sender_address = store_get(n-2);
392 Ustrncpy(sender_address, big_buffer+1, n-3);
393 sender_address[n-3] = 0;
394
395 /* time */
396 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
397 if (sscanf(CS big_buffer, "%d %d", &received_time, &warning_count) != 2)
398   goto SPOOL_FORMAT_ERROR;
399
400 message_age = time(NULL) - received_time;
401
402 #ifndef COMPILE_UTILITY
403 DEBUG(D_deliver) debug_printf("user=%s uid=%ld gid=%ld sender=%s\n",
404   originator_login, (long int)originator_uid, (long int)originator_gid,
405   sender_address);
406 #endif  /* COMPILE_UTILITY */
407
408 /* Now there may be a number of optional lines, each starting with "-". If you
409 add a new setting here, make sure you set the default above.
410
411 Because there are now quite a number of different possibilities, we use a
412 switch on the first character to avoid too many failing tests. Thanks to Nico
413 Erfurth for the patch that implemented this. I have made it even more efficient
414 by not re-scanning the first two characters.
415
416 To allow new versions of Exim that add additional flags to interwork with older
417 versions that do not understand them, just ignore any lines starting with "-"
418 that we don't recognize. Otherwise it wouldn't be possible to back off a new
419 version that left new-style flags written on the spool. */
420
421 p = big_buffer + 2;
422 for (;;)
423   {
424   int len;
425   if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
426   if (big_buffer[0] != '-') break;
427   while (  (len = Ustrlen(big_buffer)) == big_buffer_size-1
428         && big_buffer[len-1] != '\n'
429         )
430     {   /* buffer not big enough for line; certs make this possible */
431     uschar * buf;
432     if (big_buffer_size >= BIG_BUFFER_SIZE*4) goto SPOOL_READ_ERROR;
433     buf = store_get_perm(big_buffer_size *= 2);
434     memcpy(buf, big_buffer, --len);
435     big_buffer = buf;
436     if (Ufgets(big_buffer+len, big_buffer_size-len, f) == NULL)
437       goto SPOOL_READ_ERROR;
438     }
439   big_buffer[len-1] = 0;
440
441   switch(big_buffer[1])
442     {
443     case 'a':
444
445     /* Nowadays we use "-aclc" and "-aclm" for the different types of ACL
446     variable, because Exim allows any number of them, with arbitrary names.
447     The line in the spool file is "-acl[cm] <name> <length>". The name excludes
448     the c or m. */
449
450     if (Ustrncmp(p, "clc ", 4) == 0 ||
451         Ustrncmp(p, "clm ", 4) == 0)
452       {
453       uschar *name, *endptr;
454       int count;
455       tree_node *node;
456       endptr = Ustrchr(big_buffer + 6, ' ');
457       if (endptr == NULL) goto SPOOL_FORMAT_ERROR;
458       name = string_sprintf("%c%.*s", big_buffer[4], endptr - big_buffer - 6,
459         big_buffer + 6);
460       if (sscanf(CS endptr, " %d", &count) != 1) goto SPOOL_FORMAT_ERROR;
461       node = acl_var_create(name);
462       node->data.ptr = store_get(count + 1);
463       if (fread(node->data.ptr, 1, count+1, f) < count) goto SPOOL_READ_ERROR;
464       ((uschar*)node->data.ptr)[count] = 0;
465       }
466
467     else if (Ustrcmp(p, "llow_unqualified_recipient") == 0)
468       allow_unqualified_recipient = TRUE;
469     else if (Ustrcmp(p, "llow_unqualified_sender") == 0)
470       allow_unqualified_sender = TRUE;
471
472     else if (Ustrncmp(p, "uth_id", 6) == 0)
473       authenticated_id = string_copy(big_buffer + 9);
474     else if (Ustrncmp(p, "uth_sender", 10) == 0)
475       authenticated_sender = string_copy(big_buffer + 13);
476     else if (Ustrncmp(p, "ctive_hostname", 14) == 0)
477       smtp_active_hostname = string_copy(big_buffer + 17);
478
479     /* For long-term backward compatibility, we recognize "-acl", which was
480     used before the number of ACL variables changed from 10 to 20. This was
481     before the subsequent change to an arbitrary number of named variables.
482     This code is retained so that upgrades from very old versions can still
483     handle old-format spool files. The value given after "-acl" is a number
484     that is 0-9 for connection variables, and 10-19 for message variables. */
485
486     else if (Ustrncmp(p, "cl ", 3) == 0)
487       {
488       unsigned index, count;
489       uschar name[20];   /* Need plenty of space for %u format */
490       tree_node * node;
491       if (  sscanf(CS big_buffer + 5, "%u %u", &index, &count) != 2
492          || index >= 20
493          )
494         goto SPOOL_FORMAT_ERROR;
495       if (index < 10)
496         (void) string_format(name, sizeof(name), "%c%u", 'c', index);
497       else
498         (void) string_format(name, sizeof(name), "%c%u", 'm', index - 10);
499       node = acl_var_create(name);
500       node->data.ptr = store_get(count + 1);
501       if (fread(node->data.ptr, 1, count+1, f) < count) goto SPOOL_READ_ERROR;
502       (US node->data.ptr)[count] = '\0';
503       }
504     break;
505
506     case 'b':
507     if (Ustrncmp(p, "ody_linecount", 13) == 0)
508       body_linecount = Uatoi(big_buffer + 15);
509     else if (Ustrncmp(p, "ody_zerocount", 13) == 0)
510       body_zerocount = Uatoi(big_buffer + 15);
511 #ifdef EXPERIMENTAL_BRIGHTMAIL
512     else if (Ustrncmp(p, "mi_verdicts ", 12) == 0)
513       bmi_verdicts = string_copy(big_buffer + 14);
514 #endif
515     break;
516
517     case 'd':
518     if (Ustrcmp(p, "eliver_firsttime") == 0)
519       deliver_firsttime = TRUE;
520     /* Check if the dsn flags have been set in the header file */
521     else if (Ustrncmp(p, "sn_ret", 6) == 0)
522       dsn_ret= atoi(CS big_buffer + 8);
523     else if (Ustrncmp(p, "sn_envid", 8) == 0)
524       dsn_envid = string_copy(big_buffer + 11);
525     break;
526
527     case 'f':
528     if (Ustrncmp(p, "rozen", 5) == 0)
529       {
530       deliver_freeze = TRUE;
531       if (sscanf(CS big_buffer+7, TIME_T_FMT, &deliver_frozen_at) != 1)
532         goto SPOOL_READ_ERROR;
533       }
534     break;
535
536     case 'h':
537     if (Ustrcmp(p, "ost_lookup_deferred") == 0)
538       host_lookup_deferred = TRUE;
539     else if (Ustrcmp(p, "ost_lookup_failed") == 0)
540       host_lookup_failed = TRUE;
541     else if (Ustrncmp(p, "ost_auth", 8) == 0)
542       sender_host_authenticated = string_copy(big_buffer + 11);
543     else if (Ustrncmp(p, "ost_name", 8) == 0)
544       sender_host_name = string_copy(big_buffer + 11);
545     else if (Ustrncmp(p, "elo_name", 8) == 0)
546       sender_helo_name = string_copy(big_buffer + 11);
547
548     /* We now record the port number after the address, separated by a
549     dot. For compatibility during upgrading, do nothing if there
550     isn't a value (it gets left at zero). */
551
552     else if (Ustrncmp(p, "ost_address", 11) == 0)
553       {
554       sender_host_port = host_address_extract_port(big_buffer + 14);
555       sender_host_address = string_copy(big_buffer + 14);
556       }
557     break;
558
559     case 'i':
560     if (Ustrncmp(p, "nterface_address", 16) == 0)
561       {
562       interface_port = host_address_extract_port(big_buffer + 19);
563       interface_address = string_copy(big_buffer + 19);
564       }
565     else if (Ustrncmp(p, "dent", 4) == 0)
566       sender_ident = string_copy(big_buffer + 7);
567     break;
568
569     case 'l':
570     if (Ustrcmp(p, "ocal") == 0) sender_local = TRUE;
571     else if (Ustrcmp(big_buffer, "-localerror") == 0)
572       local_error_message = TRUE;
573     else if (Ustrncmp(p, "ocal_scan ", 10) == 0)
574       local_scan_data = string_copy(big_buffer + 12);
575     break;
576
577     case 'm':
578     if (Ustrcmp(p, "anual_thaw") == 0) deliver_manual_thaw = TRUE;
579     else if (Ustrncmp(p, "ax_received_linelength", 22) == 0)
580       max_received_linelength = Uatoi(big_buffer + 24);
581     break;
582
583     case 'N':
584     if (*p == 0) dont_deliver = TRUE;   /* -N */
585     break;
586
587     case 'r':
588     if (Ustrncmp(p, "eceived_protocol", 16) == 0)
589       received_protocol = string_copy(big_buffer + 19);
590     break;
591
592     case 's':
593     if (Ustrncmp(p, "ender_set_untrusted", 19) == 0)
594       sender_set_untrusted = TRUE;
595 #ifdef WITH_CONTENT_SCAN
596     else if (Ustrncmp(p, "pam_bar ", 8) == 0)
597       spam_bar = string_copy(big_buffer + 10);
598     else if (Ustrncmp(p, "pam_score ", 10) == 0)
599       spam_score = string_copy(big_buffer + 12);
600     else if (Ustrncmp(p, "pam_score_int ", 14) == 0)
601       spam_score_int = string_copy(big_buffer + 16);
602 #endif
603 #if defined(SUPPORT_I18N) && !defined(COMPILE_UTILITY)
604     else if (Ustrncmp(p, "mtputf8", 7) == 0)
605       message_smtputf8 = TRUE;
606 #endif
607     break;
608
609 #ifdef SUPPORT_TLS
610     case 't':
611     if (Ustrncmp(p, "ls_certificate_verified", 23) == 0)
612       tls_in.certificate_verified = TRUE;
613     else if (Ustrncmp(p, "ls_cipher", 9) == 0)
614       tls_in.cipher = string_copy(big_buffer + 12);
615 # ifndef COMPILE_UTILITY        /* tls support fns not built in */
616     else if (Ustrncmp(p, "ls_ourcert", 10) == 0)
617       (void) tls_import_cert(big_buffer + 13, &tls_in.ourcert);
618     else if (Ustrncmp(p, "ls_peercert", 11) == 0)
619       (void) tls_import_cert(big_buffer + 14, &tls_in.peercert);
620 # endif
621     else if (Ustrncmp(p, "ls_peerdn", 9) == 0)
622       tls_in.peerdn = string_unprinting(string_copy(big_buffer + 12));
623     else if (Ustrncmp(p, "ls_sni", 6) == 0)
624       tls_in.sni = string_unprinting(string_copy(big_buffer + 9));
625     else if (Ustrncmp(p, "ls_ocsp", 7) == 0)
626       tls_in.ocsp = big_buffer[10] - '0';
627     break;
628 #endif
629
630 #if defined(SUPPORT_I18N) && !defined(COMPILE_UTILITY)
631     case 'u':
632     if (Ustrncmp(p, "tf8_downcvt", 11) == 0)
633       message_utf8_downconvert = 1;
634     else if (Ustrncmp(p, "tf8_optdowncvt", 15) == 0)
635       message_utf8_downconvert = -1;
636     break;
637 #endif
638
639     default:    /* Present because some compilers complain if all */
640     break;      /* possibilities are not covered. */
641     }
642   }
643
644 /* Build sender_fullhost if required */
645
646 #ifndef COMPILE_UTILITY
647 host_build_sender_fullhost();
648 #endif  /* COMPILE_UTILITY */
649
650 #ifndef COMPILE_UTILITY
651 DEBUG(D_deliver)
652   debug_printf("sender_local=%d ident=%s\n", sender_local,
653     (sender_ident == NULL)? US"unset" : sender_ident);
654 #endif  /* COMPILE_UTILITY */
655
656 /* We now have the tree of addresses NOT to deliver to, or a line
657 containing "XX", indicating no tree. */
658
659 if (Ustrncmp(big_buffer, "XX\n", 3) != 0 &&
660   !read_nonrecipients_tree(&tree_nonrecipients, f, big_buffer, big_buffer_size))
661     goto SPOOL_FORMAT_ERROR;
662
663 #ifndef COMPILE_UTILITY
664 DEBUG(D_deliver)
665   {
666   debug_printf("Non-recipients:\n");
667   debug_print_tree(tree_nonrecipients);
668   }
669 #endif  /* COMPILE_UTILITY */
670
671 /* After reading the tree, the next line has not yet been read into the
672 buffer. It contains the count of recipients which follow on separate lines. */
673
674 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
675 if (sscanf(CS big_buffer, "%d", &rcount) != 1) goto SPOOL_FORMAT_ERROR;
676
677 #ifndef COMPILE_UTILITY
678 DEBUG(D_deliver) debug_printf("recipients_count=%d\n", rcount);
679 #endif  /* COMPILE_UTILITY */
680
681 recipients_list_max = rcount;
682 recipients_list = store_get(rcount * sizeof(recipient_item));
683
684 for (recipients_count = 0; recipients_count < rcount; recipients_count++)
685   {
686   int nn;
687   int pno = -1;
688   int dsn_flags = 0;
689   uschar *orcpt = NULL;
690   uschar *errors_to = NULL;
691   uschar *p;
692
693   if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
694   nn = Ustrlen(big_buffer);
695   if (nn < 2) goto SPOOL_FORMAT_ERROR;
696
697   /* Remove the newline; this terminates the address if there is no additional
698   data on the line. */
699
700   p = big_buffer + nn - 1;
701   *p-- = 0;
702
703   /* Look back from the end of the line for digits and special terminators.
704   Since an address must end with a domain, we can tell that extra data is
705   present by the presence of the terminator, which is always some character
706   that cannot exist in a domain. (If I'd thought of the need for additional
707   data early on, I'd have put it at the start, with the address at the end. As
708   it is, we have to operate backwards. Addresses are permitted to contain
709   spaces, you see.)
710
711   This code has to cope with various versions of this data that have evolved
712   over time. In all cases, the line might just contain an address, with no
713   additional data. Otherwise, the possibilities are as follows:
714
715   Exim 3 type:       <address><space><digits>,<digits>,<digits>
716
717     The second set of digits is the parent number for one_time addresses. The
718     other values were remnants of earlier experiments that were abandoned.
719
720   Exim 4 first type: <address><space><digits>
721
722     The digits are the parent number for one_time addresses.
723
724   Exim 4 new type:   <address><space><data>#<type bits>
725
726     The type bits indicate what the contents of the data are.
727
728     Bit 01 indicates that, reading from right to left, the data
729       ends with <errors_to address><space><len>,<pno> where pno is
730       the parent number for one_time addresses, and len is the length
731       of the errors_to address (zero meaning none).
732
733     Bit 02 indicates that, again reading from right to left, the data continues
734      with orcpt len(orcpt),dsn_flags
735    */
736
737   while (isdigit(*p)) p--;
738
739   /* Handle Exim 3 spool files */
740
741   if (*p == ',')
742     {
743     int dummy;
744     while (isdigit(*(--p)) || *p == ',');
745     if (*p == ' ')
746       {
747       *p++ = 0;
748       (void)sscanf(CS p, "%d,%d", &dummy, &pno);
749       }
750     }
751
752   /* Handle early Exim 4 spool files */
753
754   else if (*p == ' ')
755     {
756     *p++ = 0;
757     (void)sscanf(CS p, "%d", &pno);
758     }
759
760   /* Handle current format Exim 4 spool files */
761
762   else if (*p == '#')
763     {
764     int flags;
765
766 #if !defined (COMPILE_UTILITY)
767     DEBUG(D_deliver) debug_printf("**** SPOOL_IN - Exim 4 standard format spoolfile\n");
768 #endif
769
770     (void)sscanf(CS p+1, "%d", &flags);
771
772     if ((flags & 0x01) != 0)      /* one_time data exists */
773       {
774       int len;
775       while (isdigit(*(--p)) || *p == ',' || *p == '-');
776       (void)sscanf(CS p+1, "%d,%d", &len, &pno);
777       *p = 0;
778       if (len > 0)
779         {
780         p -= len;
781         errors_to = string_copy(p);
782         }
783       }
784
785     *(--p) = 0;   /* Terminate address */
786     if ((flags & 0x02) != 0)      /* one_time data exists */
787       {
788       int len;
789       while (isdigit(*(--p)) || *p == ',' || *p == '-');
790       (void)sscanf(CS p+1, "%d,%d", &len, &dsn_flags);
791       *p = 0;
792       if (len > 0)
793         {
794         p -= len;
795         orcpt = string_copy(p);
796         }
797       }
798
799     *(--p) = 0;   /* Terminate address */
800     }
801 #if !defined(COMPILE_UTILITY)
802   else
803     { DEBUG(D_deliver) debug_printf("**** SPOOL_IN - No additional fields\n"); }
804
805   if ((orcpt != NULL) || (dsn_flags != 0))
806     {
807     DEBUG(D_deliver) debug_printf("**** SPOOL_IN - address: |%s| orcpt: |%s| dsn_flags: %d\n",
808       big_buffer, orcpt, dsn_flags);
809     }
810   if (errors_to != NULL)
811     {
812     DEBUG(D_deliver) debug_printf("**** SPOOL_IN - address: |%s| errorsto: |%s|\n",
813       big_buffer, errors_to);
814     }
815 #endif
816
817   recipients_list[recipients_count].address = string_copy(big_buffer);
818   recipients_list[recipients_count].pno = pno;
819   recipients_list[recipients_count].errors_to = errors_to;
820   recipients_list[recipients_count].orcpt = orcpt;
821   recipients_list[recipients_count].dsn_flags = dsn_flags;
822   }
823
824 /* The remainder of the spool header file contains the headers for the message,
825 separated off from the previous data by a blank line. Each header is preceded
826 by a count of its length and either a certain letter (for various identified
827 headers), space (for a miscellaneous live header) or an asterisk (for a header
828 that has been rewritten). Count the Received: headers. We read the headers
829 always, in order to check on the format of the file, but only create a header
830 list if requested to do so. */
831
832 inheader = TRUE;
833 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
834 if (big_buffer[0] != '\n') goto SPOOL_FORMAT_ERROR;
835
836 while ((n = fgetc(f)) != EOF)
837   {
838   header_line *h;
839   uschar flag[4];
840   int i;
841
842   if (!isdigit(n)) goto SPOOL_FORMAT_ERROR;
843   if(ungetc(n, f) == EOF  ||  fscanf(f, "%d%c ", &n, flag) == EOF)
844     goto SPOOL_READ_ERROR;
845   if (flag[0] != '*') message_size += n;  /* Omit non-transmitted headers */
846
847   if (read_headers)
848     {
849     h = store_get(sizeof(header_line));
850     h->next = NULL;
851     h->type = flag[0];
852     h->slen = n;
853     h->text = store_get(n+1);
854
855     if (h->type == htype_received) received_count++;
856
857     if (header_list == NULL) header_list = h;
858       else header_last->next = h;
859     header_last = h;
860
861     for (i = 0; i < n; i++)
862       {
863       int c = fgetc(f);
864       if (c == 0 || c == EOF) goto SPOOL_FORMAT_ERROR;
865       if (c == '\n' && h->type != htype_old) message_linecount++;
866       h->text[i] = c;
867       }
868     h->text[i] = 0;
869     }
870
871   /* Not requiring header data, just skip through the bytes */
872
873   else for (i = 0; i < n; i++)
874     {
875     int c = fgetc(f);
876     if (c == 0 || c == EOF) goto SPOOL_FORMAT_ERROR;
877     }
878   }
879
880 /* We have successfully read the data in the header file. Update the message
881 line count by adding the body linecount to the header linecount. Close the file
882 and give a positive response. */
883
884 #ifndef COMPILE_UTILITY
885 DEBUG(D_deliver) debug_printf("body_linecount=%d message_linecount=%d\n",
886   body_linecount, message_linecount);
887 #endif  /* COMPILE_UTILITY */
888
889 message_linecount += body_linecount;
890
891 fclose(f);
892 return spool_read_OK;
893
894
895 /* There was an error reading the spool or there was missing data,
896 or there was a format error. A "read error" with no errno means an
897 unexpected EOF, which we treat as a format error. */
898
899 SPOOL_READ_ERROR:
900 if (errno != 0)
901   {
902   n = errno;
903
904 #ifndef COMPILE_UTILITY
905   DEBUG(D_any) debug_printf("Error while reading spool file %s\n", name);
906 #endif  /* COMPILE_UTILITY */
907
908   fclose(f);
909   errno = n;
910   return inheader? spool_read_hdrerror : spool_read_enverror;
911   }
912
913 SPOOL_FORMAT_ERROR:
914
915 #ifndef COMPILE_UTILITY
916 DEBUG(D_any) debug_printf("Format error in spool file %s\n", name);
917 #endif  /* COMPILE_UTILITY */
918
919 fclose(f);
920 errno = ERRNO_SPOOLFORMAT;
921 return inheader? spool_read_hdrerror : spool_read_enverror;
922 }
923
924 /* vi: aw ai sw=2
925 */
926 /* End of spool_in.c */