03d73f9ba28751a5b860991c137c591c3c74a1b4
[users/jgh/exim.git] / src / src / transport.c
1 /* $Cambridge: exim/src/src/transport.c,v 1.17 2006/10/30 22:06:33 tom Exp $ */
2
3 /*************************************************
4 *     Exim - an Internet mail transport agent    *
5 *************************************************/
6
7 /* Copyright (c) University of Cambridge 1995 - 2006 */
8 /* See the file NOTICE for conditions of use and distribution. */
9
10 /* General functions concerned with transportation, and generic options for all
11 transports. */
12
13
14 #include "exim.h"
15
16 #ifdef HAVE_LINUX_SENDFILE
17 #include <sys/sendfile.h>
18 #endif
19
20 /* Structure for keeping list of addresses that have been added to
21 Envelope-To:, in order to avoid duplication. */
22
23 struct aci {
24   struct aci *next;
25   address_item *ptr;
26   };
27
28
29 /* Static data for write_chunk() */
30
31 static uschar *chunk_ptr;           /* chunk pointer */
32 static uschar *nl_check;            /* string to look for at line start */
33 static int     nl_check_length;     /* length of same */
34 static uschar *nl_escape;           /* string to insert */
35 static int     nl_escape_length;    /* length of same */
36 static int     nl_partial_match;    /* length matched at chunk end */
37
38
39 /* Generic options for transports, all of which live inside transport_instance
40 data blocks and which therefore have the opt_public flag set. Note that there
41 are other options living inside this structure which can be set only from
42 certain transports. */
43
44 optionlist optionlist_transports[] = {
45   { "*expand_group",    opt_stringptr|opt_hidden|opt_public,
46                  (void *)offsetof(transport_instance, expand_gid) },
47   { "*expand_user",     opt_stringptr|opt_hidden|opt_public,
48                  (void *)offsetof(transport_instance, expand_uid) },
49   { "*headers_rewrite_flags", opt_int|opt_public|opt_hidden,
50                  (void *)offsetof(transport_instance, rewrite_existflags) },
51   { "*headers_rewrite_rules", opt_void|opt_public|opt_hidden,
52                  (void *)offsetof(transport_instance, rewrite_rules) },
53   { "*set_group",       opt_bool|opt_hidden|opt_public,
54                  (void *)offsetof(transport_instance, gid_set) },
55   { "*set_user",        opt_bool|opt_hidden|opt_public,
56                  (void *)offsetof(transport_instance, uid_set) },
57   { "body_only",        opt_bool|opt_public,
58                  (void *)offsetof(transport_instance, body_only) },
59   { "current_directory", opt_stringptr|opt_public,
60                  (void *)offsetof(transport_instance, current_dir) },
61   { "debug_print",      opt_stringptr | opt_public,
62                  (void *)offsetof(transport_instance, debug_string) },
63   { "delivery_date_add", opt_bool|opt_public,
64                  (void *)(offsetof(transport_instance, delivery_date_add)) },
65   { "disable_logging",  opt_bool|opt_public,
66                  (void *)(offsetof(transport_instance, disable_logging)) },
67   { "driver",           opt_stringptr|opt_public,
68                  (void *)offsetof(transport_instance, driver_name) },
69   { "envelope_to_add",   opt_bool|opt_public,
70                  (void *)(offsetof(transport_instance, envelope_to_add)) },
71   { "group",             opt_expand_gid|opt_public,
72                  (void *)offsetof(transport_instance, gid) },
73   { "headers_add",      opt_stringptr|opt_public,
74                  (void *)offsetof(transport_instance, add_headers) },
75   { "headers_only",     opt_bool|opt_public,
76                  (void *)offsetof(transport_instance, headers_only) },
77   { "headers_remove",   opt_stringptr|opt_public,
78                  (void *)offsetof(transport_instance, remove_headers) },
79   { "headers_rewrite",  opt_rewrite|opt_public,
80                  (void *)offsetof(transport_instance, headers_rewrite) },
81   { "home_directory",   opt_stringptr|opt_public,
82                  (void *)offsetof(transport_instance, home_dir) },
83   { "initgroups",       opt_bool|opt_public,
84                  (void *)offsetof(transport_instance, initgroups) },
85   { "message_size_limit", opt_stringptr|opt_public,
86                  (void *)offsetof(transport_instance, message_size_limit) },
87   { "rcpt_include_affixes", opt_bool|opt_public,
88                  (void *)offsetof(transport_instance, rcpt_include_affixes) },
89   { "retry_use_local_part", opt_bool|opt_public,
90                  (void *)offsetof(transport_instance, retry_use_local_part) },
91   { "return_path",      opt_stringptr|opt_public,
92                  (void *)(offsetof(transport_instance, return_path)) },
93   { "return_path_add",   opt_bool|opt_public,
94                  (void *)(offsetof(transport_instance, return_path_add)) },
95   { "shadow_condition", opt_stringptr|opt_public,
96                  (void *)offsetof(transport_instance, shadow_condition) },
97   { "shadow_transport", opt_stringptr|opt_public,
98                  (void *)offsetof(transport_instance, shadow) },
99   { "transport_filter", opt_stringptr|opt_public,
100                  (void *)offsetof(transport_instance, filter_command) },
101   { "transport_filter_timeout", opt_time|opt_public,
102                  (void *)offsetof(transport_instance, filter_timeout) },
103   { "user",             opt_expand_uid|opt_public,
104                  (void *)offsetof(transport_instance, uid) }
105 };
106
107 int optionlist_transports_size =
108   sizeof(optionlist_transports)/sizeof(optionlist);
109
110
111 /*************************************************
112 *             Initialize transport list           *
113 *************************************************/
114
115 /* Read the transports section of the configuration file, and set up a chain of
116 transport instances according to its contents. Each transport has generic
117 options and may also have its own private options. This function is only ever
118 called when transports == NULL. We use generic code in readconf to do most of
119 the work. */
120
121 void
122 transport_init(void)
123 {
124 transport_instance *t;
125
126 readconf_driver_init(US"transport",
127   (driver_instance **)(&transports),     /* chain anchor */
128   (driver_info *)transports_available,   /* available drivers */
129   sizeof(transport_info),                /* size of info block */
130   &transport_defaults,                   /* default values for generic options */
131   sizeof(transport_instance),            /* size of instance block */
132   optionlist_transports,                 /* generic options */
133   optionlist_transports_size);
134
135 /* Now scan the configured transports and check inconsistencies. A shadow
136 transport is permitted only for local transports. */
137
138 for (t = transports; t != NULL; t = t->next)
139   {
140   if (!t->info->local)
141     {
142     if (t->shadow != NULL)
143       log_write(0, LOG_PANIC_DIE|LOG_CONFIG,
144         "shadow transport not allowed on non-local transport %s", t->name);
145     }
146
147   if (t->body_only && t->headers_only)
148     log_write(0, LOG_PANIC_DIE|LOG_CONFIG,
149       "%s transport: body_only and headers_only are mutually exclusive",
150       t->name);
151   }
152 }
153
154
155
156 /*************************************************
157 *             Write block of data                *
158 *************************************************/
159
160 /* Subroutine called by write_chunk() and at the end of the message actually
161 to write a data block. Also called directly by some transports to write
162 additional data to the file descriptor (e.g. prefix, suffix).
163
164 If a transport wants data transfers to be timed, it sets a non-zero value in
165 transport_write_timeout. A non-zero transport_write_timeout causes a timer to
166 be set for each block of data written from here. If time runs out, then write()
167 fails and provokes an error return. The caller can then inspect sigalrm_seen to
168 check for a timeout.
169
170 On some systems, if a quota is exceeded during the write, the yield is the
171 number of bytes written rather than an immediate error code. This also happens
172 on some systems in other cases, for example a pipe that goes away because the
173 other end's process terminates (Linux). On other systems, (e.g. Solaris 2) you
174 get the error codes the first time.
175
176 The write() function is also interruptible; the Solaris 2.6 man page says:
177
178      If write() is interrupted by a signal before it writes any
179      data, it will return -1 with errno set to EINTR.
180
181      If write() is interrupted by a signal after it successfully
182      writes some data, it will return the number of bytes written.
183
184 To handle these cases, we want to restart the write() to output the remainder
185 of the data after a non-negative return from write(), except after a timeout.
186 In the error cases (EDQUOT, EPIPE) no bytes get written the second time, and a
187 proper error then occurs. In principle, after an interruption, the second
188 write() could suffer the same fate, but we do not want to continue for
189 evermore, so stick a maximum repetition count on the loop to act as a
190 longstop.
191
192 Arguments:
193   fd        file descriptor to write to
194   block     block of bytes to write
195   len       number of bytes to write
196
197 Returns:    TRUE on success, FALSE on failure (with errno preserved);
198               transport_count is incremented by the number of bytes written
199 */
200
201 BOOL
202 transport_write_block(int fd, uschar *block, int len)
203 {
204 int i, rc, save_errno;
205 int local_timeout = transport_write_timeout;
206
207 /* This loop is for handling incomplete writes and other retries. In most
208 normal cases, it is only ever executed once. */
209
210 for (i = 0; i < 100; i++)
211   {
212   DEBUG(D_transport)
213     debug_printf("writing data block fd=%d size=%d timeout=%d\n",
214       fd, len, local_timeout);
215
216   /* This code makes use of alarm() in order to implement the timeout. This
217   isn't a very tidy way of doing things. Using non-blocking I/O with select()
218   provides a neater approach. However, I don't know how to do this when TLS is
219   in use. */
220
221   if (transport_write_timeout <= 0)   /* No timeout wanted */
222     {
223     #ifdef SUPPORT_TLS
224     if (tls_active == fd) rc = tls_write(block, len); else
225     #endif
226     rc = write(fd, block, len);
227     save_errno = errno;
228     }
229
230   /* Timeout wanted. */
231
232   else
233     {
234     alarm(local_timeout);
235     #ifdef SUPPORT_TLS
236     if (tls_active == fd) rc = tls_write(block, len); else
237     #endif
238     rc = write(fd, block, len);
239     save_errno = errno;
240     local_timeout = alarm(0);
241     if (sigalrm_seen)
242       {
243       errno = ETIMEDOUT;
244       return FALSE;
245       }
246     }
247
248   /* Hopefully, the most common case is success, so test that first. */
249
250   if (rc == len) { transport_count += len; return TRUE; }
251
252   /* A non-negative return code is an incomplete write. Try again for the rest
253   of the block. If we have exactly hit the timeout, give up. */
254
255   if (rc >= 0)
256     {
257     len -= rc;
258     block += rc;
259     transport_count += rc;
260     DEBUG(D_transport) debug_printf("write incomplete (%d)\n", rc);
261     goto CHECK_TIMEOUT;   /* A few lines below */
262     }
263
264   /* A negative return code with an EINTR error is another form of
265   incomplete write, zero bytes having been written */
266
267   if (save_errno == EINTR)
268     {
269     DEBUG(D_transport)
270       debug_printf("write interrupted before anything written\n");
271     goto CHECK_TIMEOUT;   /* A few lines below */
272     }
273
274   /* A response of EAGAIN from write() is likely only in the case of writing
275   to a FIFO that is not swallowing the data as fast as Exim is writing it. */
276
277   if (save_errno == EAGAIN)
278     {
279     DEBUG(D_transport)
280       debug_printf("write temporarily locked out, waiting 1 sec\n");
281     sleep(1);
282
283     /* Before continuing to try another write, check that we haven't run out of
284     time. */
285
286     CHECK_TIMEOUT:
287     if (transport_write_timeout > 0 && local_timeout <= 0)
288       {
289       errno = ETIMEDOUT;
290       return FALSE;
291       }
292     continue;
293     }
294
295   /* Otherwise there's been an error */
296
297   DEBUG(D_transport) debug_printf("writing error %d: %s\n", save_errno,
298     strerror(save_errno));
299   errno = save_errno;
300   return FALSE;
301   }
302
303 /* We've tried and tried and tried but still failed */
304
305 errno = ERRNO_WRITEINCOMPLETE;
306 return FALSE;
307 }
308
309
310
311
312 /*************************************************
313 *             Write formatted string             *
314 *************************************************/
315
316 /* This is called by various transports. It is a convenience function.
317
318 Arguments:
319   fd          file descriptor
320   format      string format
321   ...         arguments for format
322
323 Returns:      the yield of transport_write_block()
324 */
325
326 BOOL
327 transport_write_string(int fd, char *format, ...)
328 {
329 va_list ap;
330 va_start(ap, format);
331 if (!string_vformat(big_buffer, big_buffer_size, format, ap))
332   log_write(0, LOG_MAIN|LOG_PANIC_DIE, "overlong formatted string in transport");
333 va_end(ap);
334 return transport_write_block(fd, big_buffer, Ustrlen(big_buffer));
335 }
336
337
338
339
340 /*************************************************
341 *              Write character chunk             *
342 *************************************************/
343
344 /* Subroutine used by transport_write_message() to scan character chunks for
345 newlines and act appropriately. The object is to minimise the number of writes.
346 The output byte stream is buffered up in deliver_out_buffer, which is written
347 only when it gets full, thus minimizing write operations and TCP packets.
348
349 Static data is used to handle the case when the last character of the previous
350 chunk was NL, or matched part of the data that has to be escaped.
351
352 Arguments:
353   fd         file descript to write to
354   chunk      pointer to data to write
355   len        length of data to write
356   usr_crlf   TRUE if CR LF is wanted at the end of each line
357
358 In addition, the static nl_xxx variables must be set as required.
359
360 Returns:     TRUE on success, FALSE on failure (with errno preserved)
361 */
362
363 static BOOL
364 write_chunk(int fd, uschar *chunk, int len, BOOL use_crlf)
365 {
366 uschar *start = chunk;
367 uschar *end = chunk + len;
368 register uschar *ptr;
369 int mlen = DELIVER_OUT_BUFFER_SIZE - nl_escape_length - 2;
370
371 /* The assumption is made that the check string will never stretch over move
372 than one chunk since the only time there are partial matches is when copying
373 the body in large buffers. There is always enough room in the buffer for an
374 escape string, since the loop below ensures this for each character it
375 processes, and it won't have stuck in the escape string if it left a partial
376 match. */
377
378 if (nl_partial_match >= 0)
379   {
380   if (nl_check_length > 0 && len >= nl_check_length &&
381       Ustrncmp(start, nl_check + nl_partial_match,
382         nl_check_length - nl_partial_match) == 0)
383     {
384     Ustrncpy(chunk_ptr, nl_escape, nl_escape_length);
385     chunk_ptr += nl_escape_length;
386     start += nl_check_length - nl_partial_match;
387     }
388
389   /* The partial match was a false one. Insert the characters carried over
390   from the previous chunk. */
391
392   else if (nl_partial_match > 0)
393     {
394     Ustrncpy(chunk_ptr, nl_check, nl_partial_match);
395     chunk_ptr += nl_partial_match;
396     }
397
398   nl_partial_match = -1;
399   }
400
401 /* Now process the characters in the chunk. Whenever we hit a newline we check
402 for possible escaping. The code for the non-NL route should be as fast as
403 possible. */
404
405 for (ptr = start; ptr < end; ptr++)
406   {
407   register int ch;
408
409   /* Flush the buffer if it has reached the threshold - we want to leave enough
410   room for the next uschar, plus a possible extra CR for an LF, plus the escape
411   string. */
412
413   if (chunk_ptr - deliver_out_buffer > mlen)
414     {
415     if (!transport_write_block(fd, deliver_out_buffer,
416           chunk_ptr - deliver_out_buffer))
417       return FALSE;
418     chunk_ptr = deliver_out_buffer;
419     }
420
421   if ((ch = *ptr) == '\n')
422     {
423     int left = end - ptr - 1;  /* count of chars left after NL */
424
425     /* Insert CR before NL if required */
426
427     if (use_crlf) *chunk_ptr++ = '\r';
428     *chunk_ptr++ = '\n';
429
430     /* The check_string test (formerly "from hack") replaces the specific
431     string at the start of a line with an escape string (e.g. "From " becomes
432     ">From " or "." becomes "..". It is a case-sensitive test. The length
433     check above ensures there is always enough room to insert this string. */
434
435     if (nl_check_length > 0)
436       {
437       if (left >= nl_check_length &&
438           Ustrncmp(ptr+1, nl_check, nl_check_length) == 0)
439         {
440         Ustrncpy(chunk_ptr, nl_escape, nl_escape_length);
441         chunk_ptr += nl_escape_length;
442         ptr += nl_check_length;
443         }
444
445       /* Handle the case when there isn't enough left to match the whole
446       check string, but there may be a partial match. We remember how many
447       characters matched, and finish processing this chunk. */
448
449       else if (left <= 0) nl_partial_match = 0;
450
451       else if (Ustrncmp(ptr+1, nl_check, left) == 0)
452         {
453         nl_partial_match = left;
454         ptr = end;
455         }
456       }
457     }
458
459   /* Not a NL character */
460
461   else *chunk_ptr++ = ch;
462   }
463
464 return TRUE;
465 }
466
467
468
469
470 /*************************************************
471 *        Generate address for RCPT TO            *
472 *************************************************/
473
474 /* This function puts together an address for RCPT to, using the caseful
475 version of the local part and the caseful version of the domain. If there is no
476 prefix or suffix, or if affixes are to be retained, we can just use the
477 original address. Otherwise, if there is a prefix but no suffix we can use a
478 pointer into the original address. If there is a suffix, however, we have to
479 build a new string.
480
481 Arguments:
482   addr              the address item
483   include_affixes   TRUE if affixes are to be included
484
485 Returns:            a string
486 */
487
488 uschar *
489 transport_rcpt_address(address_item *addr, BOOL include_affixes)
490 {
491 uschar *at;
492 int plen, slen;
493
494 if (include_affixes)
495   {
496   setflag(addr, af_include_affixes);  /* Affects logged => line */
497   return addr->address;
498   }
499
500 if (addr->suffix == NULL)
501   {
502   if (addr->prefix == NULL) return addr->address;
503   return addr->address + Ustrlen(addr->prefix);
504   }
505
506 at = Ustrrchr(addr->address, '@');
507 plen = (addr->prefix == NULL)? 0 : Ustrlen(addr->prefix);
508 slen = Ustrlen(addr->suffix);
509
510 return string_sprintf("%.*s@%s", (at - addr->address - plen - slen),
511    addr->address + plen, at + 1);
512 }
513
514
515 /*************************************************
516 *  Output Envelope-To: address & scan duplicates *
517 *************************************************/
518
519 /* This function is called from internal_transport_write_message() below, when
520 generating an Envelope-To: header line. It checks for duplicates of the given
521 address and its ancestors. When one is found, this function calls itself
522 recursively, to output the envelope address of the duplicate.
523
524 We want to avoid duplication in the list, which can arise for example when
525 A->B,C and then both B and C alias to D. This can also happen when there are
526 unseen drivers in use. So a list of addresses that have been output is kept in
527 the plist variable.
528
529 It is also possible to have loops in the address ancestry/duplication graph,
530 for example if there are two top level addresses A and B and we have A->B,C and
531 B->A. To break the loop, we use a list of processed addresses in the dlist
532 variable.
533
534 After handling duplication, this function outputs the progenitor of the given
535 address.
536
537 Arguments:
538   p         the address we are interested in
539   pplist    address of anchor of the list of addresses not to output
540   pdlist    address of anchor of the list of processed addresses
541   first     TRUE if this is the first address; set it FALSE afterwards
542   fd        the file descriptor to write to
543   use_crlf  to be passed on to write_chunk()
544
545 Returns:    FALSE if writing failed
546 */
547
548 static BOOL
549 write_env_to(address_item *p, struct aci **pplist, struct aci **pdlist,
550   BOOL *first, int fd, BOOL use_crlf)
551 {
552 address_item *pp;
553 struct aci *ppp;
554
555 /* Do nothing if we have already handled this address. If not, remember it
556 so that we don't handle it again. */
557
558 for (ppp = *pdlist; ppp != NULL; ppp = ppp->next)
559   { if (p == ppp->ptr) return TRUE; }
560
561 ppp = store_get(sizeof(struct aci));
562 ppp->next = *pdlist;
563 *pdlist = ppp;
564 ppp->ptr = p;
565
566 /* Now scan up the ancestry, checking for duplicates at each generation. */
567
568 for (pp = p;; pp = pp->parent)
569   {
570   address_item *dup;
571   for (dup = addr_duplicate; dup != NULL; dup = dup->next)
572     {
573     if (dup->dupof != pp) continue;   /* Not a dup of our address */
574     if (!write_env_to(dup, pplist, pdlist, first, fd, use_crlf)) return FALSE;
575     }
576   if (pp->parent == NULL) break;
577   }
578
579 /* Check to see if we have already output the progenitor. */
580
581 for (ppp = *pplist; ppp != NULL; ppp = ppp->next)
582   { if (pp == ppp->ptr) break; }
583 if (ppp != NULL) return TRUE;
584
585 /* Remember what we have output, and output it. */
586
587 ppp = store_get(sizeof(struct aci));
588 ppp->next = *pplist;
589 *pplist = ppp;
590 ppp->ptr = pp;
591
592 if (!(*first) && !write_chunk(fd, US",\n ", 3, use_crlf)) return FALSE;
593 *first = FALSE;
594 return write_chunk(fd, pp->address, Ustrlen(pp->address), use_crlf);
595 }
596
597
598
599
600 /*************************************************
601 *                Write the message               *
602 *************************************************/
603
604 /* This function writes the message to the given file descriptor. The headers
605 are in the in-store data structure, and the rest of the message is in the open
606 file descriptor deliver_datafile. Make sure we start it at the beginning.
607
608 . If add_return_path is TRUE, a "return-path:" header is added to the message,
609   containing the envelope sender's address.
610
611 . If add_envelope_to is TRUE, a "envelope-to:" header is added to the message,
612   giving the top-level envelope address that caused this delivery to happen.
613
614 . If add_delivery_date is TRUE, a "delivery-date:" header is added to the
615   message. It gives the time and date that delivery took place.
616
617 . If check_string is not null, the start of each line is checked for that
618   string. If it is found, it is replaced by escape_string. This used to be
619   the "from hack" for files, and "smtp_dots" for escaping SMTP dots.
620
621 . If use_crlf is true, newlines are turned into CRLF (SMTP output).
622
623 The yield is TRUE if all went well, and FALSE if not. Exit *immediately* after
624 any writing or reading error, leaving the code in errno intact. Error exits
625 can include timeouts for certain transports, which are requested by setting
626 transport_write_timeout non-zero.
627
628 Arguments:
629   addr                  (chain of) addresses (for extra headers), or NULL;
630                           only the first address is used
631   fd                    file descriptor to write the message to
632   options               bit-wise options:
633     add_return_path       if TRUE, add a "return-path" header
634     add_envelope_to       if TRUE, add a "envelope-to" header
635     add_delivery_date     if TRUE, add a "delivery-date" header
636     use_crlf              if TRUE, turn NL into CR LF
637     end_dot               if TRUE, send a terminating "." line at the end
638     no_headers            if TRUE, omit the headers
639     no_body               if TRUE, omit the body
640   size_limit            if > 0, this is a limit to the size of message written;
641                           it is used when returning messages to their senders,
642                           and is approximate rather than exact, owing to chunk
643                           buffering
644   add_headers           a string containing one or more headers to add; it is
645                           expanded, and must be in correct RFC 822 format as
646                           it is transmitted verbatim; NULL => no additions,
647                           and so does empty string or forced expansion fail
648   remove_headers        a colon-separated list of headers to remove, or NULL
649   check_string          a string to check for at the start of lines, or NULL
650   escape_string         a string to insert in front of any check string
651   rewrite_rules         chain of header rewriting rules
652   rewrite_existflags    flags for the rewriting rules
653
654 Returns:                TRUE on success; FALSE (with errno) on failure.
655                         In addition, the global variable transport_count
656                         is incremented by the number of bytes written.
657 */
658
659 static BOOL
660 internal_transport_write_message(address_item *addr, int fd, int options,
661   int size_limit, uschar *add_headers, uschar *remove_headers, uschar *check_string,
662   uschar *escape_string, rewrite_rule *rewrite_rules, int rewrite_existflags)
663 {
664 int written = 0;
665 int len;
666 header_line *h;
667 BOOL use_crlf  = (options & topt_use_crlf)  != 0;
668
669 /* Initialize pointer in output buffer. */
670
671 chunk_ptr = deliver_out_buffer;
672
673 /* Set up the data for start-of-line data checking and escaping */
674
675 nl_partial_match = -1;
676 if (check_string != NULL && escape_string != NULL)
677   {
678   nl_check = check_string;
679   nl_check_length = Ustrlen(nl_check);
680   nl_escape = escape_string;
681   nl_escape_length = Ustrlen(nl_escape);
682   }
683 else nl_check_length = nl_escape_length = 0;
684
685 /* Whether the escaping mechanism is applied to headers or not is controlled by
686 an option (set for SMTP, not otherwise). Negate the length if not wanted till
687 after the headers. */
688
689 if ((options & topt_escape_headers) == 0) nl_check_length = -nl_check_length;
690
691 /* Write the headers if required, including any that have to be added. If there
692 are header rewriting rules, apply them. */
693
694 if ((options & topt_no_headers) == 0)
695   {
696   /* Add return-path: if requested. */
697
698   if ((options & topt_add_return_path) != 0)
699     {
700     uschar buffer[ADDRESS_MAXLENGTH + 20];
701     sprintf(CS buffer, "Return-path: <%.*s>\n", ADDRESS_MAXLENGTH,
702       return_path);
703     if (!write_chunk(fd, buffer, Ustrlen(buffer), use_crlf)) return FALSE;
704     }
705
706   /* Add envelope-to: if requested */
707
708   if ((options & topt_add_envelope_to) != 0)
709     {
710     BOOL first = TRUE;
711     address_item *p;
712     struct aci *plist = NULL;
713     struct aci *dlist = NULL;
714     void *reset_point = store_get(0);
715
716     if (!write_chunk(fd, US"Envelope-to: ", 13, use_crlf)) return FALSE;
717
718     /* Pick up from all the addresses. The plist and dlist variables are
719     anchors for lists of addresses already handled; they have to be defined at
720     this level becuase write_env_to() calls itself recursively. */
721
722     for (p = addr; p != NULL; p = p->next)
723       {
724       if (!write_env_to(p, &plist, &dlist, &first, fd, use_crlf)) return FALSE;
725       }
726
727     /* Add a final newline and reset the store used for tracking duplicates */
728
729     if (!write_chunk(fd, US"\n", 1, use_crlf)) return FALSE;
730     store_reset(reset_point);
731     }
732
733   /* Add delivery-date: if requested. */
734
735   if ((options & topt_add_delivery_date) != 0)
736     {
737     uschar buffer[100];
738     sprintf(CS buffer, "Delivery-date: %s\n", tod_stamp(tod_full));
739     if (!write_chunk(fd, buffer, Ustrlen(buffer), use_crlf)) return FALSE;
740     }
741
742   /* Then the message's headers. Don't write any that are flagged as "old";
743   that means they were rewritten, or are a record of envelope rewriting, or
744   were removed (e.g. Bcc). If remove_headers is not null, skip any headers that
745   match any entries therein. Then check addr->p.remove_headers too, provided that
746   addr is not NULL. */
747
748   if (remove_headers != NULL)
749     {
750     uschar *s = expand_string(remove_headers);
751     if (s == NULL && !expand_string_forcedfail)
752       {
753       errno = ERRNO_CHHEADER_FAIL;
754       return FALSE;
755       }
756     remove_headers = s;
757     }
758
759   for (h = header_list; h != NULL; h = h->next)
760     {
761     int i;
762     uschar *list = NULL;
763     BOOL include_header;
764
765     if (h->type == htype_old) continue;
766
767     include_header = TRUE;
768     list = remove_headers;
769
770     for (i = 0; i < 2; i++)    /* For remove_headers && addr->p.remove_headers */
771       {
772       if (list != NULL)
773         {
774         int sep = ':';         /* This is specified as a colon-separated list */
775         uschar *s, *ss;
776         uschar buffer[128];
777         while ((s = string_nextinlist(&list, &sep, buffer, sizeof(buffer)))
778                 != NULL)
779           {
780           int len = Ustrlen(s);
781           if (strncmpic(h->text, s, len) != 0) continue;
782           ss = h->text + len;
783           while (*ss == ' ' || *ss == '\t') ss++;
784           if (*ss == ':') break;
785           }
786         if (s != NULL) { include_header = FALSE; break; }
787         }
788       if (addr != NULL) list = addr->p.remove_headers;
789       }
790
791     /* If this header is to be output, try to rewrite it if there are rewriting
792     rules. */
793
794     if (include_header)
795       {
796       if (rewrite_rules != NULL)
797         {
798         void *reset_point = store_get(0);
799         header_line *hh =
800           rewrite_header(h, NULL, NULL, rewrite_rules, rewrite_existflags,
801             FALSE);
802         if (hh != NULL)
803           {
804           if (!write_chunk(fd, hh->text, hh->slen, use_crlf)) return FALSE;
805           store_reset(reset_point);
806           continue;     /* With the next header line */
807           }
808         }
809
810       /* Either no rewriting rules, or it didn't get rewritten */
811
812       if (!write_chunk(fd, h->text, h->slen, use_crlf)) return FALSE;
813       }
814
815     /* Header removed */
816
817     else
818       {
819       DEBUG(D_transport) debug_printf("removed header line:\n%s---\n",
820         h->text);
821       }
822     }
823
824   /* Add on any address-specific headers. If there are multiple addresses,
825   they will all have the same headers in order to be batched. The headers
826   are chained in reverse order of adding (so several addresses from the
827   same alias might share some of them) but we want to output them in the
828   opposite order. This is a bit tedious, but there shouldn't be very many
829   of them. We just walk the list twice, reversing the pointers each time,
830   but on the second time, write out the items.
831
832   Headers added to an address by a router are guaranteed to end with a newline.
833   */
834
835   if (addr != NULL)
836     {
837     int i;
838     header_line *hprev = addr->p.extra_headers;
839     header_line *hnext;
840     for (i = 0; i < 2; i++)
841       {
842       for (h = hprev, hprev = NULL; h != NULL; h = hnext)
843         {
844         hnext = h->next;
845         h->next = hprev;
846         hprev = h;
847         if (i == 1)
848           {
849           if (!write_chunk(fd, h->text, h->slen, use_crlf)) return FALSE;
850           DEBUG(D_transport)
851             debug_printf("added header line(s):\n%s---\n", h->text);
852           }
853         }
854       }
855     }
856
857   /* If a string containing additional headers exists, expand it and write
858   out the result. This is done last so that if it (deliberately or accidentally)
859   isn't in header format, it won't mess up any other headers. An empty string
860   or a forced expansion failure are noops. An added header string from a
861   transport may not end with a newline; add one if it does not. */
862
863   if (add_headers != NULL)
864     {
865     uschar *s = expand_string(add_headers);
866     if (s == NULL)
867       {
868       if (!expand_string_forcedfail)
869         {
870         errno = ERRNO_CHHEADER_FAIL;
871         return FALSE;
872         }
873       }
874     else
875       {
876       int len = Ustrlen(s);
877       if (len > 0)
878         {
879         if (!write_chunk(fd, s, len, use_crlf)) return FALSE;
880         if (s[len-1] != '\n' && !write_chunk(fd, US"\n", 1, use_crlf))
881           return FALSE;
882         DEBUG(D_transport)
883           {
884           debug_printf("added header line(s):\n%s", s);
885           if (s[len-1] != '\n') debug_printf("\n");
886           debug_printf("---\n");
887           }
888         }
889       }
890     }
891
892   /* Separate headers from body with a blank line */
893
894   if (!write_chunk(fd, US"\n", 1, use_crlf)) return FALSE;
895   }
896
897 /* If the body is required, ensure that the data for check strings (formerly
898 the "from hack") is enabled by negating the length if necessary. (It will be
899 negative in cases where it isn't to apply to the headers). Then ensure the body
900 is positioned at the start of its file (following the message id), then write
901 it, applying the size limit if required. */
902
903 if ((options & topt_no_body) == 0)
904   {
905   nl_check_length = abs(nl_check_length);
906   nl_partial_match = 0;
907   lseek(deliver_datafile, SPOOL_DATA_START_OFFSET, SEEK_SET);
908   while ((len = read(deliver_datafile, deliver_in_buffer,
909            DELIVER_IN_BUFFER_SIZE)) > 0)
910     {
911     if (!write_chunk(fd, deliver_in_buffer, len, use_crlf)) return FALSE;
912     if (size_limit > 0)
913       {
914       written += len;
915       if (written > size_limit)
916         {
917         len = 0;    /* Pretend EOF */
918         break;
919         }
920       }
921     }
922
923   /* Finished with the check string */
924
925   nl_check_length = nl_escape_length = 0;
926
927   /* A read error on the body will have left len == -1 and errno set. */
928
929   if (len != 0) return FALSE;
930
931   /* If requested, add a terminating "." line (SMTP output). */
932
933   if ((options & topt_end_dot) != 0 && !write_chunk(fd, US".\n", 2, use_crlf))
934     return FALSE;
935   }
936
937 /* Write out any remaining data in the buffer before returning. */
938
939 return (len = chunk_ptr - deliver_out_buffer) <= 0 ||
940   transport_write_block(fd, deliver_out_buffer, len);
941 }
942
943
944 #ifdef EXPERIMENTAL_DOMAINKEYS
945
946 /**********************************************************************************
947 *    External interface to write the message, while signing it with domainkeys    *
948 **********************************************************************************/
949
950 /* This function is a wrapper around transport_write_message(). It is only called
951    from the smtp transport if
952    (1) Domainkeys support is compiled in.
953    (2) The dk_private_key option on the smtp transport is set.
954    The function sets up a replacement fd into a -K file, then calls the normal
955    function. This way, the exact bits that exim would have put "on the wire" will
956    end up in the file (except for TLS encapsulation, which is the very
957    very last thing). When we are done signing the file, send the
958    signed message down the original fd (or TLS fd).
959
960 Arguments:     as for internal_transport_write_message() above, with additional
961                arguments:
962                uschar *dk_private_key         The private key to use (filename or plain data)
963                uschar *dk_domain              Override domain (normally NULL)
964                uschar *dk_selector            The selector to use.
965                uschar *dk_canon               The canonalization scheme to use, "simple" or "nofws"
966                uschar *dk_headers             Colon-separated header list to include in the signing
967                                               process.
968                uschar *dk_strict              What to do if signing fails: 1/true  => throw error
969                                                                            0/false => send anyway
970
971 Returns:       TRUE on success; FALSE (with errno) for any failure
972 */
973
974 BOOL
975 dk_transport_write_message(address_item *addr, int fd, int options,
976   int size_limit, uschar *add_headers, uschar *remove_headers,
977   uschar *check_string, uschar *escape_string, rewrite_rule *rewrite_rules,
978   int rewrite_existflags, uschar *dk_private_key, uschar *dk_domain,
979   uschar *dk_selector, uschar *dk_canon, uschar *dk_headers, uschar *dk_strict)
980 {
981   int dk_fd;
982   int save_errno = 0;
983   BOOL rc;
984   uschar dk_spool_name[256];
985   char sbuf[2048];
986   int sread = 0;
987   int wwritten = 0;
988   uschar *dk_signature = NULL;
989   off_t size = 0;
990
991   (void)string_format(dk_spool_name, 256, "%s/input/%s/%s-%d-K",
992           spool_directory, message_subdir, message_id, (int)getpid());
993   dk_fd = Uopen(dk_spool_name, O_RDWR|O_CREAT|O_TRUNC, SPOOL_MODE);
994   if (dk_fd < 0)
995     {
996     /* Can't create spool file. Ugh. */
997     rc = FALSE;
998     save_errno = errno;
999     goto CLEANUP;
1000     }
1001
1002   /* Call original function */
1003   rc = transport_write_message(addr, dk_fd, options,
1004     size_limit, add_headers, remove_headers,
1005     check_string, escape_string, rewrite_rules,
1006     rewrite_existflags);
1007
1008   /* Save error state. We must clean up before returning. */
1009   if (!rc)
1010     {
1011     save_errno = errno;
1012     goto CLEANUP;
1013     }
1014
1015   /* Rewind file and feed it to the goats^W DK lib */
1016   lseek(dk_fd, 0, SEEK_SET);
1017   dk_signature = dk_exim_sign(dk_fd,
1018                               dk_private_key,
1019                               dk_domain,
1020                               dk_selector,
1021                               dk_canon);
1022
1023   if (dk_signature != NULL)
1024     {
1025     /* Send the signature first */
1026     int siglen = Ustrlen(dk_signature);
1027     while(siglen > 0)
1028       {
1029       #ifdef SUPPORT_TLS
1030       if (tls_active == fd) wwritten = tls_write(dk_signature, siglen); else
1031       #endif
1032       wwritten = write(fd,dk_signature,siglen);
1033       if (wwritten == -1)
1034         {
1035         /* error, bail out */
1036         save_errno = errno;
1037         rc = FALSE;
1038         goto CLEANUP;
1039         }
1040       siglen -= wwritten;
1041       dk_signature += wwritten;
1042       }
1043     }
1044   else if (dk_strict != NULL)
1045     {
1046     uschar *dk_strict_result = expand_string(dk_strict);
1047     if (dk_strict_result != NULL)
1048       {
1049       if ( (strcmpic(dk_strict,US"1") == 0) ||
1050            (strcmpic(dk_strict,US"true") == 0) )
1051         {
1052         save_errno = errno;
1053         rc = FALSE;
1054         goto CLEANUP;
1055         }
1056       }
1057     }
1058
1059   /* Fetch file positition (the size) */
1060   size = lseek(dk_fd,0,SEEK_CUR);
1061
1062   /* Rewind file */
1063   lseek(dk_fd, 0, SEEK_SET);
1064
1065 #ifdef HAVE_LINUX_SENDFILE
1066   /* We can use sendfile() to shove the file contents
1067      to the socket. However only if we don't use TLS,
1068      in which case theres another layer of indirection
1069      before the data finally hits the socket. */
1070   if (tls_active != fd)
1071     {
1072     ssize_t copied = 0;
1073     off_t offset = 0;
1074     while((copied >= 0) && (offset<size))
1075       {
1076       copied = sendfile(fd, dk_fd, &offset, (size - offset));
1077       }
1078     if (copied < 0)
1079       {
1080       save_errno = errno;
1081       rc = FALSE;
1082       }
1083     goto CLEANUP;
1084     }
1085 #endif
1086
1087   /* Send file down the original fd */
1088   while((sread = read(dk_fd,sbuf,2048)) > 0)
1089     {
1090     char *p = sbuf;
1091     /* write the chunk */
1092     DK_WRITE:
1093     #ifdef SUPPORT_TLS
1094     if (tls_active == fd) wwritten = tls_write(US p, sread); else
1095     #endif
1096     wwritten = write(fd,p,sread);
1097     if (wwritten == -1)
1098       {
1099       /* error, bail out */
1100       save_errno = errno;
1101       rc = FALSE;
1102       goto CLEANUP;
1103       }
1104     if (wwritten < sread)
1105       {
1106       /* short write, try again */
1107       p += wwritten;
1108       sread -= wwritten;
1109       goto DK_WRITE;
1110       }
1111     }
1112
1113   if (sread == -1)
1114     {
1115     save_errno = errno;
1116     rc = FALSE;
1117     goto CLEANUP;
1118     }
1119
1120   CLEANUP:
1121   /* unlink -K file */
1122   (void)close(dk_fd);
1123   Uunlink(dk_spool_name);
1124   errno = save_errno;
1125   return rc;
1126 }
1127 #endif
1128
1129
1130 /*************************************************
1131 *    External interface to write the message     *
1132 *************************************************/
1133
1134 /* If there is no filtering required, call the internal function above to do
1135 the real work, passing over all the arguments from this function. Otherwise,
1136 set up a filtering process, fork another process to call the internal function
1137 to write to the filter, and in this process just suck from the filter and write
1138 down the given fd. At the end, tidy up the pipes and the processes.
1139
1140 Arguments:     as for internal_transport_write_message() above
1141
1142 Returns:       TRUE on success; FALSE (with errno) for any failure
1143                transport_count is incremented by the number of bytes written
1144 */
1145
1146 BOOL
1147 transport_write_message(address_item *addr, int fd, int options,
1148   int size_limit, uschar *add_headers, uschar *remove_headers,
1149   uschar *check_string, uschar *escape_string, rewrite_rule *rewrite_rules,
1150   int rewrite_existflags)
1151 {
1152 BOOL use_crlf;
1153 BOOL last_filter_was_NL = TRUE;
1154 int rc, len, yield, fd_read, fd_write, save_errno;
1155 int pfd[2];
1156 pid_t filter_pid, write_pid;
1157
1158 transport_filter_timed_out = FALSE;
1159
1160 /* If there is no filter command set up, call the internal function that does
1161 the actual work, passing it the incoming fd, and return its result. */
1162
1163 if (transport_filter_argv == NULL)
1164   return internal_transport_write_message(addr, fd, options, size_limit,
1165     add_headers, remove_headers, check_string, escape_string,
1166     rewrite_rules, rewrite_existflags);
1167
1168 /* Otherwise the message must be written to a filter process and read back
1169 before being written to the incoming fd. First set up the special processing to
1170 be done during the copying. */
1171
1172 use_crlf  = (options & topt_use_crlf) != 0;
1173 nl_partial_match = -1;
1174
1175 if (check_string != NULL && escape_string != NULL)
1176   {
1177   nl_check = check_string;
1178   nl_check_length = Ustrlen(nl_check);
1179   nl_escape = escape_string;
1180   nl_escape_length = Ustrlen(nl_escape);
1181   }
1182 else nl_check_length = nl_escape_length = 0;
1183
1184 /* Start up a subprocess to run the command. Ensure that our main fd will
1185 be closed when the subprocess execs, but remove the flag afterwards.
1186 (Otherwise, if this is a TCP/IP socket, it can't get passed on to another
1187 process to deliver another message.) We get back stdin/stdout file descriptors.
1188 If the process creation failed, give an error return. */
1189
1190 fd_read = -1;
1191 fd_write = -1;
1192 save_errno = 0;
1193 yield = FALSE;
1194 write_pid = (pid_t)(-1);
1195
1196 (void)fcntl(fd, F_SETFD, fcntl(fd, F_GETFD) | FD_CLOEXEC);
1197 filter_pid = child_open(transport_filter_argv, NULL, 077, &fd_write, &fd_read,
1198   FALSE);
1199 (void)fcntl(fd, F_SETFD, fcntl(fd, F_GETFD) & ~FD_CLOEXEC);
1200 if (filter_pid < 0) goto TIDY_UP;      /* errno set */
1201
1202 DEBUG(D_transport)
1203   debug_printf("process %d running as transport filter: write=%d read=%d\n",
1204     (int)filter_pid, fd_write, fd_read);
1205
1206 /* Fork subprocess to write the message to the filter, and return the result
1207 via a(nother) pipe. While writing to the filter, we do not do the CRLF,
1208 smtp dots, or check string processing. */
1209
1210 if (pipe(pfd) != 0) goto TIDY_UP;      /* errno set */
1211 if ((write_pid = fork()) == 0)
1212   {
1213   BOOL rc;
1214   (void)close(fd_read);
1215   (void)close(pfd[pipe_read]);
1216   nl_check_length = nl_escape_length = 0;
1217   rc = internal_transport_write_message(addr, fd_write,
1218     (options & ~(topt_use_crlf | topt_end_dot)),
1219     size_limit, add_headers, remove_headers, NULL, NULL,
1220     rewrite_rules, rewrite_existflags);
1221   save_errno = errno;
1222   (void)write(pfd[pipe_write], (void *)&rc, sizeof(BOOL));
1223   (void)write(pfd[pipe_write], (void *)&save_errno, sizeof(int));
1224   (void)write(pfd[pipe_write], (void *)&(addr->more_errno), sizeof(int));
1225   _exit(0);
1226   }
1227 save_errno = errno;
1228
1229 /* Parent process: close our copy of the writing subprocess' pipes. */
1230
1231 (void)close(pfd[pipe_write]);
1232 (void)close(fd_write);
1233 fd_write = -1;
1234
1235 /* Writing process creation failed */
1236
1237 if (write_pid < 0)
1238   {
1239   errno = save_errno;    /* restore */
1240   goto TIDY_UP;
1241   }
1242
1243 /* When testing, let the subprocess get going */
1244
1245 if (running_in_test_harness) millisleep(250);
1246
1247 DEBUG(D_transport)
1248   debug_printf("process %d writing to transport filter\n", (int)write_pid);
1249
1250 /* Copy the message from the filter to the output fd. A read error leaves len
1251 == -1 and errno set. We need to apply a timeout to the read, to cope with
1252 the case when the filter gets stuck, but it can be quite a long one. The
1253 default is 5m, but this is now configurable. */
1254
1255 DEBUG(D_transport) debug_printf("copying from the filter\n");
1256
1257 /* Copy the output of the filter, remembering if the last character was NL. If
1258 no data is returned, that counts as "ended with NL" (default setting of the
1259 variable is TRUE). */
1260
1261 chunk_ptr = deliver_out_buffer;
1262
1263 for (;;)
1264   {
1265   sigalrm_seen = FALSE;
1266   alarm(transport_filter_timeout);
1267   len = read(fd_read, deliver_in_buffer, DELIVER_IN_BUFFER_SIZE);
1268   alarm(0);
1269   if (sigalrm_seen)
1270     {
1271     errno = ETIMEDOUT;
1272     transport_filter_timed_out = TRUE;
1273     goto TIDY_UP;
1274     }
1275
1276   /* If the read was successful, write the block down the original fd,
1277   remembering whether it ends in \n or not. */
1278
1279   if (len > 0)
1280     {
1281     if (!write_chunk(fd, deliver_in_buffer, len, use_crlf)) goto TIDY_UP;
1282     last_filter_was_NL = (deliver_in_buffer[len-1] == '\n');
1283     }
1284
1285   /* Otherwise, break the loop. If we have hit EOF, set yield = TRUE. */
1286
1287   else
1288     {
1289     if (len == 0) yield = TRUE;
1290     break;
1291     }
1292   }
1293
1294 /* Tidying up code. If yield = FALSE there has been an error and errno is set
1295 to something. Ensure the pipes are all closed and the processes are removed. If
1296 there has been an error, kill the processes before waiting for them, just to be
1297 sure. Also apply a paranoia timeout. */
1298
1299 TIDY_UP:
1300 save_errno = errno;
1301
1302 (void)close(fd_read);
1303 if (fd_write > 0) (void)close(fd_write);
1304
1305 if (!yield)
1306   {
1307   if (filter_pid > 0) kill(filter_pid, SIGKILL);
1308   if (write_pid > 0)  kill(write_pid, SIGKILL);
1309   }
1310
1311 /* Wait for the filter process to complete. */
1312
1313 DEBUG(D_transport) debug_printf("waiting for filter process\n");
1314 if (filter_pid > 0 && (rc = child_close(filter_pid, 30)) != 0 && yield)
1315   {
1316   yield = FALSE;
1317   save_errno = ERRNO_FILTER_FAIL;
1318   addr->more_errno = rc;
1319   DEBUG(D_transport) debug_printf("filter process returned %d\n", rc);
1320   }
1321
1322 /* Wait for the writing process to complete. If it ends successfully,
1323 read the results from its pipe, provided we haven't already had a filter
1324 process failure. */
1325
1326 DEBUG(D_transport) debug_printf("waiting for writing process\n");
1327 if (write_pid > 0)
1328   {
1329   rc = child_close(write_pid, 30);
1330   if (yield)
1331     {
1332     if (rc == 0)
1333       {
1334       BOOL ok;
1335       (void)read(pfd[pipe_read], (void *)&ok, sizeof(BOOL));
1336       if (!ok)
1337         {
1338         (void)read(pfd[pipe_read], (void *)&save_errno, sizeof(int));
1339         (void)read(pfd[pipe_read], (void *)&(addr->more_errno), sizeof(int));
1340         yield = FALSE;
1341         }
1342       }
1343     else
1344       {
1345       yield = FALSE;
1346       save_errno = ERRNO_FILTER_FAIL;
1347       addr->more_errno = rc;
1348       DEBUG(D_transport) debug_printf("writing process returned %d\n", rc);
1349       }
1350     }
1351   }
1352 (void)close(pfd[pipe_read]);
1353
1354 /* If there have been no problems we can now add the terminating "." if this is
1355 SMTP output, turning off escaping beforehand. If the last character from the
1356 filter was not NL, insert a NL to make the SMTP protocol work. */
1357
1358 if (yield)
1359   {
1360   nl_check_length = nl_escape_length = 0;
1361   if ((options & topt_end_dot) != 0 && (last_filter_was_NL?
1362         !write_chunk(fd, US".\n", 2, use_crlf) :
1363         !write_chunk(fd, US"\n.\n", 3, use_crlf)))
1364     {
1365     yield = FALSE;
1366     }
1367
1368   /* Write out any remaining data in the buffer. */
1369
1370   else
1371     {
1372     yield = (len = chunk_ptr - deliver_out_buffer) <= 0 ||
1373       transport_write_block(fd, deliver_out_buffer, len);
1374     }
1375   }
1376 else errno = save_errno;      /* From some earlier error */
1377
1378 DEBUG(D_transport)
1379   {
1380   debug_printf("end of filtering transport writing: yield=%d\n", yield);
1381   if (!yield)
1382     debug_printf("errno=%d more_errno=%d\n", errno, addr->more_errno);
1383   }
1384
1385 return yield;
1386 }
1387
1388
1389
1390
1391
1392 /*************************************************
1393 *            Update waiting database             *
1394 *************************************************/
1395
1396 /* This is called when an address is deferred by remote transports that are
1397 capable of sending more than one message over one connection. A database is
1398 maintained for each transport, keeping track of which messages are waiting for
1399 which hosts. The transport can then consult this when eventually a successful
1400 delivery happens, and if it finds that another message is waiting for the same
1401 host, it can fire up a new process to deal with it using the same connection.
1402
1403 The database records are keyed by host name. They can get full if there are
1404 lots of messages waiting, and so there is a continuation mechanism for them.
1405
1406 Each record contains a list of message ids, packed end to end without any
1407 zeros. Each one is MESSAGE_ID_LENGTH bytes long. The count field says how many
1408 in this record, and the sequence field says if there are any other records for
1409 this host. If the sequence field is 0, there are none. If it is 1, then another
1410 record with the name <hostname>:0 exists; if it is 2, then two other records
1411 with sequence numbers 0 and 1 exist, and so on.
1412
1413 Currently, an exhaustive search of all continuation records has to be done to
1414 determine whether to add a message id to a given record. This shouldn't be
1415 too bad except in extreme cases. I can't figure out a *simple* way of doing
1416 better.
1417
1418 Old records should eventually get swept up by the exim_tidydb utility.
1419
1420 Arguments:
1421   hostlist  list of hosts that this message could be sent to
1422   tpname    name of the transport
1423
1424 Returns:    nothing
1425 */
1426
1427 void
1428 transport_update_waiting(host_item *hostlist, uschar *tpname)
1429 {
1430 uschar buffer[256];
1431 uschar *prevname = US"";
1432 host_item *host;
1433 open_db dbblock;
1434 open_db *dbm_file;
1435
1436 /* Open the database for this transport */
1437
1438 sprintf(CS buffer, "wait-%.200s", tpname);
1439 dbm_file = dbfn_open(buffer, O_RDWR, &dbblock, TRUE);
1440 if (dbm_file == NULL) return;
1441
1442 /* Scan the list of hosts for which this message is waiting, and ensure
1443 that the message id is in each host record. */
1444
1445 for (host = hostlist; host!= NULL; host = host->next)
1446   {
1447   BOOL already = FALSE;
1448   dbdata_wait *host_record;
1449   uschar *s;
1450   int i, host_length;
1451
1452   /* Skip if this is the same host as we just processed; otherwise remember
1453   the name for next time. */
1454
1455   if (Ustrcmp(prevname, host->name) == 0) continue;
1456   prevname = host->name;
1457
1458   /* Look up the host record; if there isn't one, make an empty one. */
1459
1460   host_record = dbfn_read(dbm_file, host->name);
1461   if (host_record == NULL)
1462     {
1463     host_record = store_get(sizeof(dbdata_wait) + MESSAGE_ID_LENGTH);
1464     host_record->count = host_record->sequence = 0;
1465     }
1466
1467   /* Compute the current length */
1468
1469   host_length = host_record->count * MESSAGE_ID_LENGTH;
1470
1471   /* Search the record to see if the current message is already in it. */
1472
1473   for (s = host_record->text; s < host_record->text + host_length;
1474        s += MESSAGE_ID_LENGTH)
1475     {
1476     if (Ustrncmp(s, message_id, MESSAGE_ID_LENGTH) == 0)
1477       { already = TRUE; break; }
1478     }
1479
1480   /* If we haven't found this message in the main record, search any
1481   continuation records that exist. */
1482
1483   for (i = host_record->sequence - 1; i >= 0 && !already; i--)
1484     {
1485     dbdata_wait *cont;
1486     sprintf(CS buffer, "%.200s:%d", host->name, i);
1487     cont = dbfn_read(dbm_file, buffer);
1488     if (cont != NULL)
1489       {
1490       int clen = cont->count * MESSAGE_ID_LENGTH;
1491       for (s = cont->text; s < cont->text + clen; s += MESSAGE_ID_LENGTH)
1492         {
1493         if (Ustrncmp(s, message_id, MESSAGE_ID_LENGTH) == 0)
1494           { already = TRUE; break; }
1495         }
1496       }
1497     }
1498
1499   /* If this message is already in a record, no need to update. */
1500
1501   if (already) continue;
1502
1503
1504   /* If this record is full, write it out with a new name constructed
1505   from the sequence number, increase the sequence number, and empty
1506   the record. */
1507
1508   if (host_record->count >= WAIT_NAME_MAX)
1509     {
1510     sprintf(CS buffer, "%.200s:%d", host->name, host_record->sequence);
1511     dbfn_write(dbm_file, buffer, host_record, sizeof(dbdata_wait) + host_length);
1512     host_record->sequence++;
1513     host_record->count = 0;
1514     host_length = 0;
1515     }
1516
1517   /* If this record is not full, increase the size of the record to
1518   allow for one new message id. */
1519
1520   else
1521     {
1522     dbdata_wait *newr =
1523       store_get(sizeof(dbdata_wait) + host_length + MESSAGE_ID_LENGTH);
1524     memcpy(newr, host_record, sizeof(dbdata_wait) + host_length);
1525     host_record = newr;
1526     }
1527
1528   /* Now add the new name on the end */
1529
1530   memcpy(host_record->text + host_length, message_id, MESSAGE_ID_LENGTH);
1531   host_record->count++;
1532   host_length += MESSAGE_ID_LENGTH;
1533
1534   /* Update the database */
1535
1536   dbfn_write(dbm_file, host->name, host_record, sizeof(dbdata_wait) + host_length);
1537   }
1538
1539 /* All now done */
1540
1541 dbfn_close(dbm_file);
1542 }
1543
1544
1545
1546
1547 /*************************************************
1548 *         Test for waiting messages              *
1549 *************************************************/
1550
1551 /* This function is called by a remote transport which uses the previous
1552 function to remember which messages are waiting for which remote hosts. It's
1553 called after a successful delivery and its job is to check whether there is
1554 another message waiting for the same host. However, it doesn't do this if the
1555 current continue sequence is greater than the maximum supplied as an argument,
1556 or greater than the global connection_max_messages, which, if set, overrides.
1557
1558 Arguments:
1559   transport_name     name of the transport
1560   hostname           name of the host
1561   local_message_max  maximum number of messages down one connection
1562                        as set by the caller transport
1563   new_message_id     set to the message id of a waiting message
1564   more               set TRUE if there are yet more messages waiting
1565
1566 Returns:             TRUE if new_message_id set; FALSE otherwise
1567 */
1568
1569 BOOL
1570 transport_check_waiting(uschar *transport_name, uschar *hostname,
1571   int local_message_max, uschar *new_message_id, BOOL *more)
1572 {
1573 dbdata_wait *host_record;
1574 int host_length, path_len;
1575 open_db dbblock;
1576 open_db *dbm_file;
1577 uschar buffer[256];
1578
1579 *more = FALSE;
1580
1581 DEBUG(D_transport)
1582   {
1583   debug_printf("transport_check_waiting entered\n");
1584   debug_printf("  sequence=%d local_max=%d global_max=%d\n",
1585     continue_sequence, local_message_max, connection_max_messages);
1586   }
1587
1588 /* Do nothing if we have hit the maximum number that can be send down one
1589 connection. */
1590
1591 if (connection_max_messages >= 0) local_message_max = connection_max_messages;
1592 if (local_message_max > 0 && continue_sequence >= local_message_max)
1593   {
1594   DEBUG(D_transport)
1595     debug_printf("max messages for one connection reached: returning\n");
1596   return FALSE;
1597   }
1598
1599 /* Open the waiting information database. */
1600
1601 sprintf(CS buffer, "wait-%.200s", transport_name);
1602 dbm_file = dbfn_open(buffer, O_RDWR, &dbblock, TRUE);
1603 if (dbm_file == NULL) return FALSE;
1604
1605 /* See if there is a record for this host; if not, there's nothing to do. */
1606
1607 host_record = dbfn_read(dbm_file, hostname);
1608 if (host_record == NULL)
1609   {
1610   dbfn_close(dbm_file);
1611   DEBUG(D_transport) debug_printf("no messages waiting for %s\n", hostname);
1612   return FALSE;
1613   }
1614
1615 /* If the data in the record looks corrupt, just log something and
1616 don't try to use it. */
1617
1618 if (host_record->count > WAIT_NAME_MAX)
1619   {
1620   dbfn_close(dbm_file);
1621   log_write(0, LOG_MAIN|LOG_PANIC, "smtp-wait database entry for %s has bad "
1622     "count=%d (max=%d)", hostname, host_record->count, WAIT_NAME_MAX);
1623   return FALSE;
1624   }
1625
1626 /* Scan the message ids in the record from the end towards the beginning,
1627 until one is found for which a spool file actually exists. If the record gets
1628 emptied, delete it and continue with any continuation records that may exist.
1629 */
1630
1631 host_length = host_record->count * MESSAGE_ID_LENGTH;
1632
1633 /* Loop to handle continuation host records in the database */
1634
1635 for (;;)
1636   {
1637   BOOL found = FALSE;
1638
1639   sprintf(CS buffer, "%s/input/", spool_directory);
1640   path_len = Ustrlen(buffer);
1641
1642   for (host_length -= MESSAGE_ID_LENGTH; host_length >= 0;
1643        host_length -= MESSAGE_ID_LENGTH)
1644     {
1645     struct stat statbuf;
1646     Ustrncpy(new_message_id, host_record->text + host_length,
1647       MESSAGE_ID_LENGTH);
1648     new_message_id[MESSAGE_ID_LENGTH] = 0;
1649
1650     if (split_spool_directory)
1651       sprintf(CS(buffer + path_len), "%c/%s-D", new_message_id[5], new_message_id);
1652     else
1653       sprintf(CS(buffer + path_len), "%s-D", new_message_id);
1654
1655     /* The listed message may be the one we are currently processing. If
1656     so, we want to remove it from the list without doing anything else.
1657     If not, do a stat to see if it is an existing message. If it is, break
1658     the loop to handle it. No need to bother about locks; as this is all
1659     "hint" processing, it won't matter if it doesn't exist by the time exim
1660     actually tries to deliver it. */
1661
1662     if (Ustrcmp(new_message_id, message_id) != 0 &&
1663         Ustat(buffer, &statbuf) == 0)
1664       {
1665       found = TRUE;
1666       break;
1667       }
1668     }
1669
1670   /* If we have removed all the message ids from the record delete the record.
1671   If there is a continuation record, fetch it and remove it from the file,
1672   as it will be rewritten as the main record. Repeat in the case of an
1673   empty continuation. */
1674
1675   while (host_length <= 0)
1676     {
1677     int i;
1678     dbdata_wait *newr = NULL;
1679
1680     /* Search for a continuation */
1681
1682     for (i = host_record->sequence - 1; i >= 0 && newr == NULL; i--)
1683       {
1684       sprintf(CS buffer, "%.200s:%d", hostname, i);
1685       newr = dbfn_read(dbm_file, buffer);
1686       }
1687
1688     /* If no continuation, delete the current and break the loop */
1689
1690     if (newr == NULL)
1691       {
1692       dbfn_delete(dbm_file, hostname);
1693       break;
1694       }
1695
1696     /* Else replace the current with the continuation */
1697
1698     dbfn_delete(dbm_file, buffer);
1699     host_record = newr;
1700     host_length = host_record->count * MESSAGE_ID_LENGTH;
1701     }
1702
1703   /* If we found an existing message, break the continuation loop. */
1704
1705   if (found) break;
1706
1707   /* If host_length <= 0 we have emptied a record and not found a good message,
1708   and there are no continuation records. Otherwise there is a continuation
1709   record to process. */
1710
1711   if (host_length <= 0)
1712     {
1713     dbfn_close(dbm_file);
1714     DEBUG(D_transport) debug_printf("waiting messages already delivered\n");
1715     return FALSE;
1716     }
1717   }
1718
1719 /* Control gets here when an existing message has been encountered; its
1720 id is in new_message_id, and host_length is the revised length of the
1721 host record. If it is zero, the record has been removed. Update the
1722 record if required, close the database, and return TRUE. */
1723
1724 if (host_length > 0)
1725   {
1726   host_record->count = host_length/MESSAGE_ID_LENGTH;
1727   dbfn_write(dbm_file, hostname, host_record, (int)sizeof(dbdata_wait) + host_length);
1728   *more = TRUE;
1729   }
1730
1731 dbfn_close(dbm_file);
1732 return TRUE;
1733 }
1734
1735
1736
1737 /*************************************************
1738 *    Deliver waiting message down same socket    *
1739 *************************************************/
1740
1741 /* Fork a new exim process to deliver the message, and do a re-exec, both to
1742 get a clean delivery process, and to regain root privilege in cases where it
1743 has been given away.
1744
1745 Arguments:
1746   transport_name  to pass to the new process
1747   hostname        ditto
1748   hostaddress     ditto
1749   id              the new message to process
1750   socket_fd       the connected socket
1751
1752 Returns:          FALSE if fork fails; TRUE otherwise
1753 */
1754
1755 BOOL
1756 transport_pass_socket(uschar *transport_name, uschar *hostname,
1757   uschar *hostaddress, uschar *id, int socket_fd)
1758 {
1759 pid_t pid;
1760 int status;
1761
1762 DEBUG(D_transport) debug_printf("transport_pass_socket entered\n");
1763
1764 if ((pid = fork()) == 0)
1765   {
1766   int i = 16;
1767   uschar **argv;
1768
1769   /* Disconnect entirely from the parent process. If we are running in the
1770   test harness, wait for a bit to allow the previous process time to finish,
1771   write the log, etc., so that the output is always in the same order for
1772   automatic comparison. */
1773
1774   if ((pid = fork()) != 0) _exit(EXIT_SUCCESS);
1775   if (running_in_test_harness) sleep(1);
1776
1777   /* Set up the calling arguments; use the standard function for the basics,
1778   but we have a number of extras that may be added. */
1779
1780   argv = child_exec_exim(CEE_RETURN_ARGV, TRUE, &i, FALSE, 0);
1781
1782   if (smtp_authenticated) argv[i++] = US"-MCA";
1783
1784   #ifdef SUPPORT_TLS
1785   if (tls_offered) argv[i++] = US"-MCT";
1786   #endif
1787
1788   if (smtp_use_size) argv[i++] = US"-MCS";
1789   if (smtp_use_pipelining) argv[i++] = US"-MCP";
1790
1791   if (queue_run_pid != (pid_t)0)
1792     {
1793     argv[i++] = US"-MCQ";
1794     argv[i++] = string_sprintf("%d", queue_run_pid);
1795     argv[i++] = string_sprintf("%d", queue_run_pipe);
1796     }
1797
1798   argv[i++] = US"-MC";
1799   argv[i++] = transport_name;
1800   argv[i++] = hostname;
1801   argv[i++] = hostaddress;
1802   argv[i++] = string_sprintf("%d", continue_sequence + 1);
1803   argv[i++] = id;
1804   argv[i++] = NULL;
1805
1806   /* Arrange for the channel to be on stdin. */
1807
1808   if (socket_fd != 0)
1809     {
1810     (void)dup2(socket_fd, 0);
1811     (void)close(socket_fd);
1812     }
1813
1814   DEBUG(D_exec) debug_print_argv(argv);
1815   exim_nullstd();                          /* Ensure std{out,err} exist */
1816   execv(CS argv[0], (char *const *)argv);
1817
1818   DEBUG(D_any) debug_printf("execv failed: %s\n", strerror(errno));
1819   _exit(errno);         /* Note: must be _exit(), NOT exit() */
1820   }
1821
1822 /* If the process creation succeeded, wait for the first-level child, which
1823 immediately exits, leaving the second level process entirely disconnected from
1824 this one. */
1825
1826 if (pid > 0)
1827   {
1828   int rc;
1829   while ((rc = wait(&status)) != pid && (rc >= 0 || errno != ECHILD));
1830   DEBUG(D_transport) debug_printf("transport_pass_socket succeeded\n");
1831   return TRUE;
1832   }
1833 else
1834   {
1835   DEBUG(D_transport) debug_printf("transport_pass_socket failed to fork: %s\n",
1836     strerror(errno));
1837   return FALSE;
1838   }
1839 }
1840
1841
1842
1843 /*************************************************
1844 *          Set up direct (non-shell) command     *
1845 *************************************************/
1846
1847 /* This function is called when a command line is to be parsed and executed
1848 directly, without the use of /bin/sh. It is called by the pipe transport,
1849 the queryprogram router, and also from the main delivery code when setting up a
1850 transport filter process. The code for ETRN also makes use of this; in that
1851 case, no addresses are passed.
1852
1853 Arguments:
1854   argvptr            pointer to anchor for argv vector
1855   cmd                points to the command string
1856   expand_arguments   true if expansion is to occur
1857   expand_failed      error value to set if expansion fails; not relevant if
1858                      addr == NULL
1859   addr               chain of addresses, or NULL
1860   etext              text for use in error messages
1861   errptr             where to put error message if addr is NULL;
1862                      otherwise it is put in the first address
1863
1864 Returns:             TRUE if all went well; otherwise an error will be
1865                      set in the first address and FALSE returned
1866 */
1867
1868 BOOL
1869 transport_set_up_command(uschar ***argvptr, uschar *cmd, BOOL expand_arguments,
1870   int expand_failed, address_item *addr, uschar *etext, uschar **errptr)
1871 {
1872 address_item *ad;
1873 uschar **argv;
1874 uschar *s, *ss;
1875 int address_count = 0;
1876 int argcount = 0;
1877 int i, max_args;
1878
1879 /* Get store in which to build an argument list. Count the number of addresses
1880 supplied, and allow for that many arguments, plus an additional 60, which
1881 should be enough for anybody. Multiple addresses happen only when the local
1882 delivery batch option is set. */
1883
1884 for (ad = addr; ad != NULL; ad = ad->next) address_count++;
1885 max_args = address_count + 60;
1886 *argvptr = argv = store_get((max_args+1)*sizeof(uschar *));
1887
1888 /* Split the command up into arguments terminated by white space. Lose
1889 trailing space at the start and end. Double-quoted arguments can contain \\ and
1890 \" escapes and so can be handled by the standard function; single-quoted
1891 arguments are verbatim. Copy each argument into a new string. */
1892
1893 s = cmd;
1894 while (isspace(*s)) s++;
1895
1896 while (*s != 0 && argcount < max_args)
1897   {
1898   if (*s == '\'')
1899     {
1900     ss = s + 1;
1901     while (*ss != 0 && *ss != '\'') ss++;
1902     argv[argcount++] = ss = store_get(ss - s++);
1903     while (*s != 0 && *s != '\'') *ss++ = *s++;
1904     if (*s != 0) s++;
1905     *ss++ = 0;
1906     }
1907   else argv[argcount++] = string_dequote(&s);
1908   while (isspace(*s)) s++;
1909   }
1910
1911 argv[argcount] = (uschar *)0;
1912
1913 /* If *s != 0 we have run out of argument slots. */
1914
1915 if (*s != 0)
1916   {
1917   uschar *msg = string_sprintf("Too many arguments in command \"%s\" in "
1918     "%s", cmd, etext);
1919   if (addr != NULL)
1920     {
1921     addr->transport_return = FAIL;
1922     addr->message = msg;
1923     }
1924   else *errptr = msg;
1925   return FALSE;
1926   }
1927
1928 /* Expand each individual argument if required. Expansion happens for pipes set
1929 up in filter files and with directly-supplied commands. It does not happen if
1930 the pipe comes from a traditional .forward file. A failing expansion is a big
1931 disaster if the command came from Exim's configuration; if it came from a user
1932 it is just a normal failure. The expand_failed value is used as the error value
1933 to cater for these two cases.
1934
1935 An argument consisting just of the text "$pipe_addresses" is treated specially.
1936 It is not passed to the general expansion function. Instead, it is replaced by
1937 a number of arguments, one for each address. This avoids problems with shell
1938 metacharacters and spaces in addresses.
1939
1940 If the parent of the top address has an original part of "system-filter", this
1941 pipe was set up by the system filter, and we can permit the expansion of
1942 $recipients. */
1943
1944 DEBUG(D_transport)
1945   {
1946   debug_printf("direct command:\n");
1947   for (i = 0; argv[i] != (uschar *)0; i++)
1948     debug_printf("  argv[%d] = %s\n", i, string_printing(argv[i]));
1949   }
1950
1951 if (expand_arguments)
1952   {
1953   BOOL allow_dollar_recipients = addr != NULL &&
1954     addr->parent != NULL &&
1955     Ustrcmp(addr->parent->address, "system-filter") == 0;
1956
1957   for (i = 0; argv[i] != (uschar *)0; i++)
1958     {
1959
1960     /* Handle special fudge for passing an address list */
1961
1962     if (addr != NULL &&
1963         (Ustrcmp(argv[i], "$pipe_addresses") == 0 ||
1964          Ustrcmp(argv[i], "${pipe_addresses}") == 0))
1965       {
1966       int additional;
1967
1968       if (argcount + address_count - 1 > max_args)
1969         {
1970         addr->transport_return = FAIL;
1971         addr->message = string_sprintf("Too many arguments to command \"%s\" "
1972           "in %s", cmd, etext);
1973         return FALSE;
1974         }
1975
1976       additional = address_count - 1;
1977       if (additional > 0)
1978         memmove(argv + i + 1 + additional, argv + i + 1,
1979           (argcount - i)*sizeof(uschar *));
1980
1981       for (ad = addr; ad != NULL; ad = ad->next) argv[i++] = ad->address;
1982       i--;
1983       }
1984
1985     /* Handle normal expansion string */
1986
1987     else
1988       {
1989       uschar *expanded_arg;
1990       enable_dollar_recipients = allow_dollar_recipients;
1991       expanded_arg = expand_string(argv[i]);
1992       enable_dollar_recipients = FALSE;
1993
1994       if (expanded_arg == NULL)
1995         {
1996         uschar *msg = string_sprintf("Expansion of \"%s\" "
1997           "from command \"%s\" in %s failed: %s",
1998           argv[i], cmd, etext, expand_string_message);
1999         if (addr != NULL)
2000           {
2001           addr->transport_return = expand_failed;
2002           addr->message = msg;
2003           }
2004         else *errptr = msg;
2005         return FALSE;
2006         }
2007       argv[i] = expanded_arg;
2008       }
2009     }
2010
2011   DEBUG(D_transport)
2012     {
2013     debug_printf("direct command after expansion:\n");
2014     for (i = 0; argv[i] != (uschar *)0; i++)
2015       debug_printf("  argv[%d] = %s\n", i, string_printing(argv[i]));
2016     }
2017   }
2018
2019 return TRUE;
2020 }
2021
2022 /* End of transport.c */