a0fdcf96c294a902f203d3303cbee2c012a124c2
[users/jgh/exim.git] / src / src / spool_in.c
1 /* $Cambridge: exim/src/src/spool_in.c,v 1.20 2007/06/22 14:38:58 ph10 Exp $ */
2
3 /*************************************************
4 *     Exim - an Internet mail transport agent    *
5 *************************************************/
6
7 /* Copyright (c) University of Cambridge 1995 - 2007 */
8 /* See the file NOTICE for conditions of use and distribution. */
9
10 /* Functions for reading spool files. When compiling for a utility (eximon),
11 not all are needed, and some functionality can be cut out. */
12
13
14 #include "exim.h"
15
16
17
18 #ifndef COMPILE_UTILITY
19 /*************************************************
20 *           Open and lock data file              *
21 *************************************************/
22
23 /* The data file is the one that is used for locking, because the header file
24 can get replaced during delivery because of header rewriting. The file has
25 to opened with write access so that we can get an exclusive lock, but in
26 fact it won't be written to. Just in case there's a major disaster (e.g.
27 overwriting some other file descriptor with the value of this one), open it
28 with append.
29
30 Argument: the id of the message
31 Returns:  TRUE if file successfully opened and locked
32
33 Side effect: deliver_datafile is set to the fd of the open file.
34 */
35
36 BOOL
37 spool_open_datafile(uschar *id)
38 {
39 int i;
40 struct stat statbuf;
41 flock_t lock_data;
42 uschar spoolname[256];
43
44 /* If split_spool_directory is set, first look for the file in the appropriate
45 sub-directory of the input directory. If it is not found there, try the input
46 directory itself, to pick up leftovers from before the splitting. If split_
47 spool_directory is not set, first look in the main input directory. If it is
48 not found there, try the split sub-directory, in case it is left over from a
49 splitting state. */
50
51 for (i = 0; i < 2; i++)
52   {
53   int save_errno;
54   message_subdir[0] = (split_spool_directory == (i == 0))? id[5] : 0;
55   sprintf(CS spoolname, "%s/input/%s/%s-D", spool_directory, message_subdir, id);
56   deliver_datafile = Uopen(spoolname, O_RDWR | O_APPEND, 0);
57   if (deliver_datafile >= 0) break;
58   save_errno = errno;
59   if (errno == ENOENT)
60     {
61     if (i == 0) continue;
62     if (!queue_running)
63       log_write(0, LOG_MAIN, "Spool file %s-D not found", id);
64     }
65   else log_write(0, LOG_MAIN, "Spool error for %s: %s", spoolname,
66     strerror(errno));
67   errno = save_errno;
68   return FALSE;
69   }
70
71 /* File is open and message_subdir is set. Set the close-on-exec flag, and lock
72 the file. We lock only the first line of the file (containing the message ID)
73 because this apparently is needed for running Exim under Cygwin. If the entire
74 file is locked in one process, a sub-process cannot access it, even when passed
75 an open file descriptor (at least, I think that's the Cygwin story). On real
76 Unix systems it doesn't make any difference as long as Exim is consistent in
77 what it locks. */
78
79 (void)fcntl(deliver_datafile, F_SETFD, fcntl(deliver_datafile, F_GETFD) |
80   FD_CLOEXEC);
81
82 lock_data.l_type = F_WRLCK;
83 lock_data.l_whence = SEEK_SET;
84 lock_data.l_start = 0;
85 lock_data.l_len = SPOOL_DATA_START_OFFSET;
86
87 if (fcntl(deliver_datafile, F_SETLK, &lock_data) < 0)
88   {
89   log_write(L_skip_delivery,
90             LOG_MAIN,
91             "Spool file is locked (another process is handling this message)");
92   (void)close(deliver_datafile);
93   deliver_datafile = -1;
94   errno = 0;
95   return FALSE;
96   }
97
98 /* Get the size of the data; don't include the leading filename line
99 in the count, but add one for the newline before the data. */
100
101 if (fstat(deliver_datafile, &statbuf) == 0)
102   {
103   message_body_size = statbuf.st_size - SPOOL_DATA_START_OFFSET;
104   message_size = message_body_size + 1;
105   }
106
107 return TRUE;
108 }
109 #endif  /* COMPILE_UTILITY */
110
111
112
113 /*************************************************
114 *    Read non-recipients tree from spool file    *
115 *************************************************/
116
117 /* The tree of non-recipients is written to the spool file in a form that
118 makes it easy to read back into a tree. The format is as follows:
119
120    . Each node is preceded by two letter(Y/N) indicating whether it has left
121      or right children. There's one space after the two flags, before the name.
122
123    . The left subtree (if any) then follows, then the right subtree (if any).
124
125 This function is entered with the next input line in the buffer. Note we must
126 save the right flag before recursing with the same buffer.
127
128 Once the tree is read, we re-construct the balance fields by scanning the tree.
129 I forgot to write them out originally, and the compatible fix is to do it this
130 way. This initial local recursing function does the necessary.
131
132 Arguments:
133   node      tree node
134
135 Returns:    maximum depth below the node, including the node itself
136 */
137
138 static int
139 count_below(tree_node *node)
140 {
141 int nleft, nright;
142 if (node == NULL) return 0;
143 nleft = count_below(node->left);
144 nright = count_below(node->right);
145 node->balance = (nleft > nright)? 1 : ((nright > nleft)? 2 : 0);
146 return 1 + ((nleft > nright)? nleft : nright);
147 }
148
149 /* This is the real function...
150
151 Arguments:
152   connect      pointer to the root of the tree
153   f            FILE to read data from
154   buffer       contains next input line; further lines read into it
155   buffer_size  size of the buffer
156
157 Returns:       FALSE on format error
158 */
159
160 static BOOL
161 read_nonrecipients_tree(tree_node **connect, FILE *f, uschar *buffer,
162   int buffer_size)
163 {
164 tree_node *node;
165 int n = Ustrlen(buffer);
166 BOOL right = buffer[1] == 'Y';
167
168 if (n < 5) return FALSE;    /* malformed line */
169 buffer[n-1] = 0;            /* Remove \n */
170 node = store_get(sizeof(tree_node) + n - 3);
171 *connect = node;
172 Ustrcpy(node->name, buffer + 3);
173 node->data.ptr = NULL;
174
175 if (buffer[0] == 'Y')
176   {
177   if (Ufgets(buffer, buffer_size, f) == NULL ||
178     !read_nonrecipients_tree(&node->left, f, buffer, buffer_size))
179       return FALSE;
180   }
181 else node->left = NULL;
182
183 if (right)
184   {
185   if (Ufgets(buffer, buffer_size, f) == NULL ||
186     !read_nonrecipients_tree(&node->right, f, buffer, buffer_size))
187       return FALSE;
188   }
189 else node->right = NULL;
190
191 (void) count_below(*connect);
192 return TRUE;
193 }
194
195
196
197
198 /*************************************************
199 *             Read spool header file             *
200 *************************************************/
201
202 /* This function reads a spool header file and places the data into the
203 appropriate global variables. The header portion is always read, but header
204 structures are built only if read_headers is set true. It isn't, for example,
205 while generating -bp output.
206
207 It may be possible for blocks of nulls (binary zeroes) to get written on the
208 end of a file if there is a system crash during writing. It was observed on an
209 earlier version of Exim that omitted to fsync() the files - this is thought to
210 have been the cause of that incident, but in any case, this code must be robust
211 against such an event, and if such a file is encountered, it must be treated as
212 malformed.
213
214 Arguments:
215   name          name of the header file, including the -H
216   read_headers  TRUE if in-store header structures are to be built
217   subdir_set    TRUE is message_subdir is already set
218
219 Returns:        spool_read_OK        success
220                 spool_read_notopen   open failed
221                 spool_read_enverror  error in the envelope portion
222                 spool_read_hdrdrror  error in the header portion
223 */
224
225 int
226 spool_read_header(uschar *name, BOOL read_headers, BOOL subdir_set)
227 {
228 FILE *f = NULL;
229 int n;
230 int rcount = 0;
231 long int uid, gid;
232 BOOL inheader = FALSE;
233 uschar *p;
234
235 /* Reset all the global variables to their default values. However, there is
236 one exception. DO NOT change the default value of dont_deliver, because it may
237 be forced by an external setting. */
238
239 acl_var_c = acl_var_m = NULL;
240 authenticated_id = NULL;
241 authenticated_sender = NULL;
242 allow_unqualified_recipient = FALSE;
243 allow_unqualified_sender = FALSE;
244 body_linecount = 0;
245 body_zerocount = 0;
246 deliver_firsttime = FALSE;
247 deliver_freeze = FALSE;
248 deliver_frozen_at = 0;
249 deliver_manual_thaw = FALSE;
250 /* dont_deliver must NOT be reset */
251 header_list = header_last = NULL;
252 host_lookup_deferred = FALSE;
253 host_lookup_failed = FALSE;
254 interface_address = NULL;
255 interface_port = 0;
256 local_error_message = FALSE;
257 local_scan_data = NULL;
258 max_received_linelength = 0;
259 message_linecount = 0;
260 received_protocol = NULL;
261 received_count = 0;
262 recipients_list = NULL;
263 sender_address = NULL;
264 sender_fullhost = NULL;
265 sender_helo_name = NULL;
266 sender_host_address = NULL;
267 sender_host_name = NULL;
268 sender_host_port = 0;
269 sender_host_authenticated = NULL;
270 sender_ident = NULL;
271 sender_local = FALSE;
272 sender_set_untrusted = FALSE;
273 smtp_active_hostname = primary_hostname;
274 tree_nonrecipients = NULL;
275
276 #ifdef EXPERIMENTAL_BRIGHTMAIL
277 bmi_run = 0;
278 bmi_verdicts = NULL;
279 #endif
280
281 #ifdef EXPERIMENTAL_DOMAINKEYS
282 dk_do_verify = 0;
283 #endif
284
285 #ifdef SUPPORT_TLS
286 tls_certificate_verified = FALSE;
287 tls_cipher = NULL;
288 tls_peerdn = NULL;
289 #endif
290
291 #ifdef WITH_CONTENT_SCAN
292 spam_score_int = NULL;
293 #endif
294
295 /* Generate the full name and open the file. If message_subdir is already
296 set, just look in the given directory. Otherwise, look in both the split
297 and unsplit directories, as for the data file above. */
298
299 for (n = 0; n < 2; n++)
300   {
301   if (!subdir_set)
302     message_subdir[0] = (split_spool_directory == (n == 0))? name[5] : 0;
303   sprintf(CS big_buffer, "%s/input/%s/%s", spool_directory, message_subdir,
304     name);
305   f = Ufopen(big_buffer, "rb");
306   if (f != NULL) break;
307   if (n != 0 || subdir_set || errno != ENOENT) return spool_read_notopen;
308   }
309
310 errno = 0;
311
312 #ifndef COMPILE_UTILITY
313 DEBUG(D_deliver) debug_printf("reading spool file %s\n", name);
314 #endif  /* COMPILE_UTILITY */
315
316 /* The first line of a spool file contains the message id followed by -H (i.e.
317 the file name), in order to make the file self-identifying. */
318
319 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
320 if (Ustrlen(big_buffer) != MESSAGE_ID_LENGTH + 3 ||
321     Ustrncmp(big_buffer, name, MESSAGE_ID_LENGTH + 2) != 0)
322   goto SPOOL_FORMAT_ERROR;
323
324 /* The next three lines in the header file are in a fixed format. The first
325 contains the login, uid, and gid of the user who caused the file to be written.
326 There are known cases where a negative gid is used, so we allow for both
327 negative uids and gids. The second contains the mail address of the message's
328 sender, enclosed in <>. The third contains the time the message was received,
329 and the number of warning messages for delivery delays that have been sent. */
330
331 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
332
333 p = big_buffer + Ustrlen(big_buffer);
334 while (p > big_buffer && isspace(p[-1])) p--;
335 *p = 0;
336 if (!isdigit(p[-1])) goto SPOOL_FORMAT_ERROR;
337 while (p > big_buffer && (isdigit(p[-1]) || '-' == p[-1])) p--;
338 gid = Uatoi(p);
339 if (p <= big_buffer || *(--p) != ' ') goto SPOOL_FORMAT_ERROR;
340 *p = 0;
341 if (!isdigit(p[-1])) goto SPOOL_FORMAT_ERROR;
342 while (p > big_buffer && (isdigit(p[-1]) || '-' == p[-1])) p--;
343 uid = Uatoi(p);
344 if (p <= big_buffer || *(--p) != ' ') goto SPOOL_FORMAT_ERROR;
345 *p = 0;
346
347 originator_login = string_copy(big_buffer);
348 originator_uid = (uid_t)uid;
349 originator_gid = (gid_t)gid;
350
351 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
352 n = Ustrlen(big_buffer);
353 if (n < 3 || big_buffer[0] != '<' || big_buffer[n-2] != '>')
354   goto SPOOL_FORMAT_ERROR;
355
356 sender_address = store_get(n-2);
357 Ustrncpy(sender_address, big_buffer+1, n-3);
358 sender_address[n-3] = 0;
359
360 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
361 if (sscanf(CS big_buffer, "%d %d", &received_time, &warning_count) != 2)
362   goto SPOOL_FORMAT_ERROR;
363
364 message_age = time(NULL) - received_time;
365
366 #ifndef COMPILE_UTILITY
367 DEBUG(D_deliver) debug_printf("user=%s uid=%ld gid=%ld sender=%s\n",
368   originator_login, (long int)originator_uid, (long int)originator_gid,
369   sender_address);
370 #endif  /* COMPILE_UTILITY */
371
372 /* Now there may be a number of optional lines, each starting with "-". If you
373 add a new setting here, make sure you set the default above.
374
375 Because there are now quite a number of different possibilities, we use a
376 switch on the first character to avoid too many failing tests. Thanks to Nico
377 Erfurth for the patch that implemented this. I have made it even more efficient
378 by not re-scanning the first two characters.
379
380 To allow new versions of Exim that add additional flags to interwork with older
381 versions that do not understand them, just ignore any lines starting with "-"
382 that we don't recognize. Otherwise it wouldn't be possible to back off a new
383 version that left new-style flags written on the spool. */
384
385 p = big_buffer + 2;
386 for (;;)
387   {
388   if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
389   if (big_buffer[0] != '-') break;
390   big_buffer[Ustrlen(big_buffer) - 1] = 0;
391
392   switch(big_buffer[1])
393     {
394     case 'a':
395
396     /* Nowadays we use "-aclc" and "-aclm" for the different types of ACL
397     variable, because Exim allows any number of them, with arbitrary names.
398     The line in the spool file is "-acl[cm] <name> <length>". The name excludes
399     the c or m. */
400
401     if (Ustrncmp(p, "clc ", 4) == 0 ||
402         Ustrncmp(p, "clm ", 4) == 0)
403       {
404       uschar *name, *endptr;
405       int count;
406       tree_node *node;
407       endptr = Ustrchr(big_buffer + 6, ' ');
408       if (endptr == NULL) goto SPOOL_FORMAT_ERROR;
409       name = string_sprintf("%c%.*s", big_buffer[4], endptr - big_buffer - 6,
410         big_buffer + 6);
411       if (sscanf(CS endptr, " %d", &count) != 1) goto SPOOL_FORMAT_ERROR;
412       node = acl_var_create(name);
413       node->data.ptr = store_get(count + 1);
414       if (fread(node->data.ptr, 1, count+1, f) < count) goto SPOOL_READ_ERROR;
415       ((uschar*)node->data.ptr)[count] = 0;
416       }
417
418     else if (Ustrcmp(p, "llow_unqualified_recipient") == 0)
419       allow_unqualified_recipient = TRUE;
420     else if (Ustrcmp(p, "llow_unqualified_sender") == 0)
421       allow_unqualified_sender = TRUE;
422
423     else if (Ustrncmp(p, "uth_id", 6) == 0)
424       authenticated_id = string_copy(big_buffer + 9);
425     else if (Ustrncmp(p, "uth_sender", 10) == 0)
426       authenticated_sender = string_copy(big_buffer + 13);
427     else if (Ustrncmp(p, "ctive_hostname", 14) == 0)
428       smtp_active_hostname = string_copy(big_buffer + 17);
429
430     /* For long-term backward compatibility, we recognize "-acl", which was
431     used before the number of ACL variables changed from 10 to 20. This was
432     before the subsequent change to an arbitrary number of named variables.
433     This code is retained so that upgrades from very old versions can still
434     handle old-format spool files. The value given after "-acl" is a number
435     that is 0-9 for connection variables, and 10-19 for message variables. */
436
437     else if (Ustrncmp(p, "cl ", 3) == 0)
438       {
439       int index, count;
440       uschar name[20];   /* Need plenty of space for %d format */
441       tree_node *node;
442       if (sscanf(CS big_buffer + 5, "%d %d", &index, &count) != 2)
443         goto SPOOL_FORMAT_ERROR;
444       if (index < 10)
445         (void) string_format(name, sizeof(name), "%c%d", 'c', index);
446       else if (index < 20) /* ignore out-of-range index */
447         (void) string_format(name, sizeof(name), "%c%d", 'm', index - 10);
448       node = acl_var_create(name);
449       node->data.ptr = store_get(count + 1);
450       if (fread(node->data.ptr, 1, count+1, f) < count) goto SPOOL_READ_ERROR;
451       ((uschar*)node->data.ptr)[count] = 0;
452       }
453     break;
454
455     case 'b':
456     if (Ustrncmp(p, "ody_linecount", 13) == 0)
457       body_linecount = Uatoi(big_buffer + 15);
458     else if (Ustrncmp(p, "ody_zerocount", 13) == 0)
459       body_zerocount = Uatoi(big_buffer + 15);
460     #ifdef EXPERIMENTAL_BRIGHTMAIL
461     else if (Ustrncmp(p, "mi_verdicts ", 12) == 0)
462       bmi_verdicts = string_copy(big_buffer + 14);
463     #endif
464     break;
465
466     case 'd':
467     if (Ustrcmp(p, "eliver_firsttime") == 0)
468       deliver_firsttime = TRUE;
469     break;
470
471     case 'f':
472     if (Ustrncmp(p, "rozen", 5) == 0)
473       {
474       deliver_freeze = TRUE;
475       deliver_frozen_at = Uatoi(big_buffer + 7);
476       }
477     break;
478
479     case 'h':
480     if (Ustrcmp(p, "ost_lookup_deferred") == 0)
481       host_lookup_deferred = TRUE;
482     else if (Ustrcmp(p, "ost_lookup_failed") == 0)
483       host_lookup_failed = TRUE;
484     else if (Ustrncmp(p, "ost_auth", 8) == 0)
485       sender_host_authenticated = string_copy(big_buffer + 11);
486     else if (Ustrncmp(p, "ost_name", 8) == 0)
487       sender_host_name = string_copy(big_buffer + 11);
488     else if (Ustrncmp(p, "elo_name", 8) == 0)
489       sender_helo_name = string_copy(big_buffer + 11);
490
491     /* We now record the port number after the address, separated by a
492     dot. For compatibility during upgrading, do nothing if there
493     isn't a value (it gets left at zero). */
494
495     else if (Ustrncmp(p, "ost_address", 11) == 0)
496       {
497       sender_host_port = host_address_extract_port(big_buffer + 14);
498       sender_host_address = string_copy(big_buffer + 14);
499       }
500     break;
501
502     case 'i':
503     if (Ustrncmp(p, "nterface_address", 16) == 0)
504       {
505       interface_port = host_address_extract_port(big_buffer + 19);
506       interface_address = string_copy(big_buffer + 19);
507       }
508     else if (Ustrncmp(p, "dent", 4) == 0)
509       sender_ident = string_copy(big_buffer + 7);
510     break;
511
512     case 'l':
513     if (Ustrcmp(p, "ocal") == 0) sender_local = TRUE;
514     else if (Ustrcmp(big_buffer, "-localerror") == 0)
515       local_error_message = TRUE;
516     else if (Ustrncmp(p, "ocal_scan ", 10) == 0)
517       local_scan_data = string_copy(big_buffer + 12);
518     break;
519
520     case 'm':
521     if (Ustrcmp(p, "anual_thaw") == 0) deliver_manual_thaw = TRUE;
522     else if (Ustrncmp(p, "ax_received_linelength", 22) == 0)
523       max_received_linelength = Uatoi(big_buffer + 24);
524     break;
525
526     case 'N':
527     if (*p == 0) dont_deliver = TRUE;   /* -N */
528     break;
529
530     case 'r':
531     if (Ustrncmp(p, "eceived_protocol", 16) == 0)
532       received_protocol = string_copy(big_buffer + 19);
533     break;
534
535     case 's':
536     if (Ustrncmp(p, "ender_set_untrusted", 19) == 0)
537       sender_set_untrusted = TRUE;
538     #ifdef WITH_CONTENT_SCAN
539     else if (Ustrncmp(p, "pam_score_int ", 14) == 0)
540       spam_score_int = string_copy(big_buffer + 16);
541     #endif
542     break;
543
544     #ifdef SUPPORT_TLS
545     case 't':
546     if (Ustrncmp(p, "ls_certificate_verified", 23) == 0)
547       tls_certificate_verified = TRUE;
548     else if (Ustrncmp(p, "ls_cipher", 9) == 0)
549       tls_cipher = string_copy(big_buffer + 12);
550     else if (Ustrncmp(p, "ls_peerdn", 9) == 0)
551       tls_peerdn = string_copy(big_buffer + 12);
552     break;
553     #endif
554
555     default:    /* Present because some compilers complain if all */
556     break;      /* possibilities are not covered. */
557     }
558   }
559
560 /* Build sender_fullhost if required */
561
562 #ifndef COMPILE_UTILITY
563 host_build_sender_fullhost();
564 #endif  /* COMPILE_UTILITY */
565
566 #ifndef COMPILE_UTILITY
567 DEBUG(D_deliver)
568   debug_printf("sender_local=%d ident=%s\n", sender_local,
569     (sender_ident == NULL)? US"unset" : sender_ident);
570 #endif  /* COMPILE_UTILITY */
571
572 /* We now have the tree of addresses NOT to deliver to, or a line
573 containing "XX", indicating no tree. */
574
575 if (Ustrncmp(big_buffer, "XX\n", 3) != 0 &&
576   !read_nonrecipients_tree(&tree_nonrecipients, f, big_buffer, big_buffer_size))
577     goto SPOOL_FORMAT_ERROR;
578
579 #ifndef COMPILE_UTILITY
580 DEBUG(D_deliver)
581   {
582   debug_printf("Non-recipients:\n");
583   debug_print_tree(tree_nonrecipients);
584   }
585 #endif  /* COMPILE_UTILITY */
586
587 /* After reading the tree, the next line has not yet been read into the
588 buffer. It contains the count of recipients which follow on separate lines. */
589
590 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
591 if (sscanf(CS big_buffer, "%d", &rcount) != 1) goto SPOOL_FORMAT_ERROR;
592
593 #ifndef COMPILE_UTILITY
594 DEBUG(D_deliver) debug_printf("recipients_count=%d\n", rcount);
595 #endif  /* COMPILE_UTILITY */
596
597 recipients_list_max = rcount;
598 recipients_list = store_get(rcount * sizeof(recipient_item));
599
600 for (recipients_count = 0; recipients_count < rcount; recipients_count++)
601   {
602   int nn;
603   int pno = -1;
604   uschar *errors_to = NULL;
605   uschar *p;
606
607   if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
608   nn = Ustrlen(big_buffer);
609   if (nn < 2) goto SPOOL_FORMAT_ERROR;
610
611   /* Remove the newline; this terminates the address if there is no additional
612   data on the line. */
613
614   p = big_buffer + nn - 1;
615   *p-- = 0;
616
617   /* Look back from the end of the line for digits and special terminators.
618   Since an address must end with a domain, we can tell that extra data is
619   present by the presence of the terminator, which is always some character
620   that cannot exist in a domain. (If I'd thought of the need for additional
621   data early on, I'd have put it at the start, with the address at the end. As
622   it is, we have to operate backwards. Addresses are permitted to contain
623   spaces, you see.)
624
625   This code has to cope with various versions of this data that have evolved
626   over time. In all cases, the line might just contain an address, with no
627   additional data. Otherwise, the possibilities are as follows:
628
629   Exim 3 type:       <address><space><digits>,<digits>,<digits>
630
631     The second set of digits is the parent number for one_time addresses. The
632     other values were remnants of earlier experiments that were abandoned.
633
634   Exim 4 first type: <address><space><digits>
635
636     The digits are the parent number for one_time addresses.
637
638   Exim 4 new type:   <address><space><data>#<type bits>
639
640     The type bits indicate what the contents of the data are.
641
642     Bit 01 indicates that, reading from right to left, the data
643       ends with <errors_to address><space><len>,<pno> where pno is
644       the parent number for one_time addresses, and len is the length
645       of the errors_to address (zero meaning none).
646    */
647
648   while (isdigit(*p)) p--;
649
650   /* Handle Exim 3 spool files */
651
652   if (*p == ',')
653     {
654     int dummy;
655     while (isdigit(*(--p)) || *p == ',');
656     if (*p == ' ')
657       {
658       *p++ = 0;
659       (void)sscanf(CS p, "%d,%d", &dummy, &pno);
660       }
661     }
662
663   /* Handle early Exim 4 spool files */
664
665   else if (*p == ' ')
666     {
667     *p++ = 0;
668     (void)sscanf(CS p, "%d", &pno);
669     }
670
671   /* Handle current format Exim 4 spool files */
672
673   else if (*p == '#')
674     {
675     int flags;
676     (void)sscanf(CS p+1, "%d", &flags);
677
678     if ((flags & 0x01) != 0)      /* one_time data exists */
679       {
680       int len;
681       while (isdigit(*(--p)) || *p == ',' || *p == '-');
682       (void)sscanf(CS p+1, "%d,%d", &len, &pno);
683       *p = 0;
684       if (len > 0)
685         {
686         p -= len;
687         errors_to = string_copy(p);
688         }
689       }
690
691     *(--p) = 0;   /* Terminate address */
692     }
693
694   recipients_list[recipients_count].address = string_copy(big_buffer);
695   recipients_list[recipients_count].pno = pno;
696   recipients_list[recipients_count].errors_to = errors_to;
697   }
698
699 /* The remainder of the spool header file contains the headers for the message,
700 separated off from the previous data by a blank line. Each header is preceded
701 by a count of its length and either a certain letter (for various identified
702 headers), space (for a miscellaneous live header) or an asterisk (for a header
703 that has been rewritten). Count the Received: headers. We read the headers
704 always, in order to check on the format of the file, but only create a header
705 list if requested to do so. */
706
707 inheader = TRUE;
708 if (Ufgets(big_buffer, big_buffer_size, f) == NULL) goto SPOOL_READ_ERROR;
709 if (big_buffer[0] != '\n') goto SPOOL_FORMAT_ERROR;
710
711 while ((n = fgetc(f)) != EOF)
712   {
713   header_line *h;
714   uschar flag[4];
715   int i;
716
717   if (!isdigit(n)) goto SPOOL_FORMAT_ERROR;
718   (void)ungetc(n, f);
719   (void)fscanf(f, "%d%c ", &n, flag);
720   if (flag[0] != '*') message_size += n;  /* Omit non-transmitted headers */
721
722   if (read_headers)
723     {
724     h = store_get(sizeof(header_line));
725     h->next = NULL;
726     h->type = flag[0];
727     h->slen = n;
728     h->text = store_get(n+1);
729
730     if (h->type == htype_received) received_count++;
731
732     if (header_list == NULL) header_list = h;
733       else header_last->next = h;
734     header_last = h;
735
736     for (i = 0; i < n; i++)
737       {
738       int c = fgetc(f);
739       if (c == 0 || c == EOF) goto SPOOL_FORMAT_ERROR;
740       if (c == '\n' && h->type != htype_old) message_linecount++;
741       h->text[i] = c;
742       }
743     h->text[i] = 0;
744     }
745
746   /* Not requiring header data, just skip through the bytes */
747
748   else for (i = 0; i < n; i++)
749     {
750     int c = fgetc(f);
751     if (c == 0 || c == EOF) goto SPOOL_FORMAT_ERROR;
752     }
753   }
754
755 /* We have successfully read the data in the header file. Update the message
756 line count by adding the body linecount to the header linecount. Close the file
757 and give a positive response. */
758
759 #ifndef COMPILE_UTILITY
760 DEBUG(D_deliver) debug_printf("body_linecount=%d message_linecount=%d\n",
761   body_linecount, message_linecount);
762 #endif  /* COMPILE_UTILITY */
763
764 message_linecount += body_linecount;
765
766 fclose(f);
767 return spool_read_OK;
768
769
770 /* There was an error reading the spool or there was missing data,
771 or there was a format error. A "read error" with no errno means an
772 unexpected EOF, which we treat as a format error. */
773
774 SPOOL_READ_ERROR:
775 if (errno != 0)
776   {
777   n = errno;
778
779   #ifndef COMPILE_UTILITY
780   DEBUG(D_any) debug_printf("Error while reading spool file %s\n", name);
781   #endif  /* COMPILE_UTILITY */
782
783   fclose(f);
784   errno = n;
785   return inheader? spool_read_hdrerror : spool_read_enverror;
786   }
787
788 SPOOL_FORMAT_ERROR:
789
790 #ifndef COMPILE_UTILITY
791 DEBUG(D_any) debug_printf("Format error in spool file %s\n", name);
792 #endif  /* COMPILE_UTILITY */
793
794 fclose(f);
795 errno = ERRNO_SPOOLFORMAT;
796 return inheader? spool_read_hdrerror : spool_read_enverror;
797 }
798
799 /* End of spool_in.c */