TLS: rework error logging to pass more string back to caller for logging
[exim.git] / src / src / verify.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) University of Cambridge 1995 - 2017 */
6 /* See the file NOTICE for conditions of use and distribution. */
7
8 /* Functions concerned with verifying things. The original code for callout
9 caching was contributed by Kevin Fleming (but I hacked it around a bit). */
10
11
12 #include "exim.h"
13 #include "transports/smtp.h"
14
15 #define CUTTHROUGH_CMD_TIMEOUT  30      /* timeout for cutthrough-routing calls */
16 #define CUTTHROUGH_DATA_TIMEOUT 60      /* timeout for cutthrough-routing calls */
17 static smtp_outblock ctblock;
18 uschar ctbuffer[8192];
19
20
21 /* Structure for caching DNSBL lookups */
22
23 typedef struct dnsbl_cache_block {
24   time_t expiry;
25   dns_address *rhs;
26   uschar *text;
27   int rc;
28   BOOL text_set;
29 } dnsbl_cache_block;
30
31
32 /* Anchor for DNSBL cache */
33
34 static tree_node *dnsbl_cache = NULL;
35
36
37 /* Bits for match_type in one_check_dnsbl() */
38
39 #define MT_NOT 1
40 #define MT_ALL 2
41
42 static uschar cutthrough_response(char, uschar **, int);
43
44
45
46 /*************************************************
47 *          Retrieve a callout cache record       *
48 *************************************************/
49
50 /* If a record exists, check whether it has expired.
51
52 Arguments:
53   dbm_file          an open hints file
54   key               the record key
55   type              "address" or "domain"
56   positive_expire   expire time for positive records
57   negative_expire   expire time for negative records
58
59 Returns:            the cache record if a non-expired one exists, else NULL
60 */
61
62 static dbdata_callout_cache *
63 get_callout_cache_record(open_db *dbm_file, const uschar *key, uschar *type,
64   int positive_expire, int negative_expire)
65 {
66 BOOL negative;
67 int length, expire;
68 time_t now;
69 dbdata_callout_cache *cache_record;
70
71 cache_record = dbfn_read_with_length(dbm_file, key, &length);
72
73 if (cache_record == NULL)
74   {
75   HDEBUG(D_verify) debug_printf("callout cache: no %s record found for %s\n", type, key);
76   return NULL;
77   }
78
79 /* We treat a record as "negative" if its result field is not positive, or if
80 it is a domain record and the postmaster field is negative. */
81
82 negative = cache_record->result != ccache_accept ||
83   (type[0] == 'd' && cache_record->postmaster_result == ccache_reject);
84 expire = negative? negative_expire : positive_expire;
85 now = time(NULL);
86
87 if (now - cache_record->time_stamp > expire)
88   {
89   HDEBUG(D_verify) debug_printf("callout cache: %s record expired for %s\n", type, key);
90   return NULL;
91   }
92
93 /* If this is a non-reject domain record, check for the obsolete format version
94 that doesn't have the postmaster and random timestamps, by looking at the
95 length. If so, copy it to a new-style block, replicating the record's
96 timestamp. Then check the additional timestamps. (There's no point wasting
97 effort if connections are rejected.) */
98
99 if (type[0] == 'd' && cache_record->result != ccache_reject)
100   {
101   if (length == sizeof(dbdata_callout_cache_obs))
102     {
103     dbdata_callout_cache *new = store_get(sizeof(dbdata_callout_cache));
104     memcpy(new, cache_record, length);
105     new->postmaster_stamp = new->random_stamp = new->time_stamp;
106     cache_record = new;
107     }
108
109   if (now - cache_record->postmaster_stamp > expire)
110     cache_record->postmaster_result = ccache_unknown;
111
112   if (now - cache_record->random_stamp > expire)
113     cache_record->random_result = ccache_unknown;
114   }
115
116 HDEBUG(D_verify) debug_printf("callout cache: found %s record for %s\n", type, key);
117 return cache_record;
118 }
119
120
121
122 /* Check the callout cache.
123 Options * pm_mailfrom may be modified by cache partial results.
124
125 Return: TRUE if result found
126 */
127
128 static BOOL
129 cached_callout_lookup(address_item * addr, uschar * address_key,
130   uschar * from_address, int * opt_ptr, uschar ** pm_ptr,
131   int * yield, uschar ** failure_ptr,
132   dbdata_callout_cache * new_domain_record, int * old_domain_res)
133 {
134 int options = *opt_ptr;
135 open_db dbblock;
136 open_db *dbm_file = NULL;
137
138 /* Open the callout cache database, it it exists, for reading only at this
139 stage, unless caching has been disabled. */
140
141 if (options & vopt_callout_no_cache)
142   {
143   HDEBUG(D_verify) debug_printf("callout cache: disabled by no_cache\n");
144   }
145 else if (!(dbm_file = dbfn_open(US"callout", O_RDWR, &dbblock, FALSE)))
146   {
147   HDEBUG(D_verify) debug_printf("callout cache: not available\n");
148   }
149 else
150   {
151   /* If a cache database is available see if we can avoid the need to do an
152   actual callout by making use of previously-obtained data. */
153
154   dbdata_callout_cache_address * cache_address_record;
155   dbdata_callout_cache * cache_record = get_callout_cache_record(dbm_file,
156       addr->domain, US"domain",
157       callout_cache_domain_positive_expire, callout_cache_domain_negative_expire);
158
159   /* If an unexpired cache record was found for this domain, see if the callout
160   process can be short-circuited. */
161
162   if (cache_record)
163     {
164     /* In most cases, if an early command (up to and including MAIL FROM:<>)
165     was rejected, there is no point carrying on. The callout fails. However, if
166     we are doing a recipient verification with use_sender or use_postmaster
167     set, a previous failure of MAIL FROM:<> doesn't count, because this time we
168     will be using a non-empty sender. We have to remember this situation so as
169     not to disturb the cached domain value if this whole verification succeeds
170     (we don't want it turning into "accept"). */
171
172     *old_domain_res = cache_record->result;
173
174     if (  cache_record->result == ccache_reject
175        || *from_address == 0 && cache_record->result == ccache_reject_mfnull)
176       {
177       setflag(addr, af_verify_nsfail);
178       HDEBUG(D_verify)
179         debug_printf("callout cache: domain gave initial rejection, or "
180           "does not accept HELO or MAIL FROM:<>\n");
181       setflag(addr, af_verify_nsfail);
182       addr->user_message = US"(result of an earlier callout reused).";
183       *yield = FAIL;
184       *failure_ptr = US"mail";
185       dbfn_close(dbm_file);
186       return TRUE;
187       }
188
189     /* If a previous check on a "random" local part was accepted, we assume
190     that the server does not do any checking on local parts. There is therefore
191     no point in doing the callout, because it will always be successful. If a
192     random check previously failed, arrange not to do it again, but preserve
193     the data in the new record. If a random check is required but hasn't been
194     done, skip the remaining cache processing. */
195
196     if (options & vopt_callout_random) switch(cache_record->random_result)
197       {
198       case ccache_accept:
199         HDEBUG(D_verify)
200           debug_printf("callout cache: domain accepts random addresses\n");
201         dbfn_close(dbm_file);
202         return TRUE;     /* Default yield is OK */
203
204       case ccache_reject:
205         HDEBUG(D_verify)
206           debug_printf("callout cache: domain rejects random addresses\n");
207         *opt_ptr = options & ~vopt_callout_random;
208         new_domain_record->random_result = ccache_reject;
209         new_domain_record->random_stamp = cache_record->random_stamp;
210         break;
211
212       default:
213         HDEBUG(D_verify)
214           debug_printf("callout cache: need to check random address handling "
215             "(not cached or cache expired)\n");
216         dbfn_close(dbm_file);
217         return FALSE;
218       }
219
220     /* If a postmaster check is requested, but there was a previous failure,
221     there is again no point in carrying on. If a postmaster check is required,
222     but has not been done before, we are going to have to do a callout, so skip
223     remaining cache processing. */
224
225     if (*pm_ptr)
226       {
227       if (cache_record->postmaster_result == ccache_reject)
228         {
229         setflag(addr, af_verify_pmfail);
230         HDEBUG(D_verify)
231           debug_printf("callout cache: domain does not accept "
232             "RCPT TO:<postmaster@domain>\n");
233         *yield = FAIL;
234         *failure_ptr = US"postmaster";
235         setflag(addr, af_verify_pmfail);
236         addr->user_message = US"(result of earlier verification reused).";
237         dbfn_close(dbm_file);
238         return TRUE;
239         }
240       if (cache_record->postmaster_result == ccache_unknown)
241         {
242         HDEBUG(D_verify)
243           debug_printf("callout cache: need to check RCPT "
244             "TO:<postmaster@domain> (not cached or cache expired)\n");
245         dbfn_close(dbm_file);
246         return FALSE;
247         }
248
249       /* If cache says OK, set pm_mailfrom NULL to prevent a redundant
250       postmaster check if the address itself has to be checked. Also ensure
251       that the value in the cache record is preserved (with its old timestamp).
252       */
253
254       HDEBUG(D_verify) debug_printf("callout cache: domain accepts RCPT "
255         "TO:<postmaster@domain>\n");
256       *pm_ptr = NULL;
257       new_domain_record->postmaster_result = ccache_accept;
258       new_domain_record->postmaster_stamp = cache_record->postmaster_stamp;
259       }
260     }
261
262   /* We can't give a result based on information about the domain. See if there
263   is an unexpired cache record for this specific address (combined with the
264   sender address if we are doing a recipient callout with a non-empty sender).
265   */
266
267   if (!(cache_address_record = (dbdata_callout_cache_address *)
268     get_callout_cache_record(dbm_file, address_key, US"address",
269       callout_cache_positive_expire, callout_cache_negative_expire)))
270     {
271     dbfn_close(dbm_file);
272     return FALSE;
273     }
274
275   if (cache_address_record->result == ccache_accept)
276     {
277     HDEBUG(D_verify)
278       debug_printf("callout cache: address record is positive\n");
279     }
280   else
281     {
282     HDEBUG(D_verify)
283       debug_printf("callout cache: address record is negative\n");
284     addr->user_message = US"Previous (cached) callout verification failure";
285     *failure_ptr = US"recipient";
286     *yield = FAIL;
287     }
288
289   /* Close the cache database while we actually do the callout for real. */
290
291   dbfn_close(dbm_file);
292   return TRUE;
293   }
294 return FALSE;
295 }
296
297
298 /* Write results to callout cache
299 */
300 static void
301 cache_callout_write(dbdata_callout_cache * dom_rec, const uschar * domain,
302   int done, dbdata_callout_cache_address * addr_rec, uschar * address_key)
303 {
304 open_db dbblock;
305 open_db *dbm_file = NULL;
306
307 /* If we get here with done == TRUE, a successful callout happened, and yield
308 will be set OK or FAIL according to the response to the RCPT command.
309 Otherwise, we looped through the hosts but couldn't complete the business.
310 However, there may be domain-specific information to cache in both cases.
311
312 The value of the result field in the new_domain record is ccache_unknown if
313 there was an error before or with MAIL FROM:, and errno was not zero,
314 implying some kind of I/O error. We don't want to write the cache in that case.
315 Otherwise the value is ccache_accept, ccache_reject, or ccache_reject_mfnull. */
316
317 if (dom_rec->result != ccache_unknown)
318   if (!(dbm_file = dbfn_open(US"callout", O_RDWR|O_CREAT, &dbblock, FALSE)))
319     {
320     HDEBUG(D_verify) debug_printf("callout cache: not available\n");
321     }
322   else
323     {
324     (void)dbfn_write(dbm_file, domain, dom_rec,
325       (int)sizeof(dbdata_callout_cache));
326     HDEBUG(D_verify) debug_printf("wrote callout cache domain record for %s:\n"
327       "  result=%d postmaster=%d random=%d\n",
328       domain,
329       dom_rec->result,
330       dom_rec->postmaster_result,
331       dom_rec->random_result);
332     }
333
334 /* If a definite result was obtained for the callout, cache it unless caching
335 is disabled. */
336
337 if (done  &&  addr_rec->result != ccache_unknown)
338   {
339   if (!dbm_file)
340     dbm_file = dbfn_open(US"callout", O_RDWR|O_CREAT, &dbblock, FALSE);
341   if (!dbm_file)
342     {
343     HDEBUG(D_verify) debug_printf("no callout cache available\n");
344     }
345   else
346     {
347     (void)dbfn_write(dbm_file, address_key, addr_rec,
348       (int)sizeof(dbdata_callout_cache_address));
349     HDEBUG(D_verify) debug_printf("wrote %s callout cache address record for %s\n",
350       addr_rec->result == ccache_accept ? "positive" : "negative",
351       address_key);
352     }
353   }
354
355 if (dbm_file) dbfn_close(dbm_file);
356 }
357
358
359 /* Cutthrough-multi.  If the existing cached cutthrough connection matches
360 the one we would make for a subsequent recipient, use it.  Send the RCPT TO
361 and check the result, nonpipelined as it may be wanted immediately for
362 recipient-verification.
363
364 It seems simpler to deal with this case separately from the main callout loop.
365 We will need to remember it has sent, or not, so that rcpt-acl tail code
366 can do it there for the non-rcpt-verify case.  For this we keep an addresscount.
367
368 Return: TRUE for a definitive result for the recipient
369 */
370 static int
371 cutthrough_multi(address_item * addr, host_item * host_list,
372   transport_feedback * tf, int * yield)
373 {
374 BOOL done = FALSE;
375 host_item * host;
376
377 if (addr->transport == cutthrough.addr.transport)
378   for (host = host_list; host; host = host->next)
379     if (Ustrcmp(host->address, cutthrough.host.address) == 0)
380       {
381       int host_af;
382       uschar *interface = NULL;  /* Outgoing interface to use; NULL => any */
383       int port = 25;
384
385       deliver_host = host->name;
386       deliver_host_address = host->address;
387       deliver_host_port = host->port;
388       deliver_domain = addr->domain;
389       transport_name = addr->transport->name;
390
391       host_af = (Ustrchr(host->address, ':') == NULL)? AF_INET:AF_INET6;
392
393       if (!smtp_get_interface(tf->interface, host_af, addr, &interface,
394               US"callout") ||
395           !smtp_get_port(tf->port, addr, &port, US"callout"))
396         log_write(0, LOG_MAIN|LOG_PANIC, "<%s>: %s", addr->address,
397           addr->message);
398
399       if (  (  interface == cutthrough.interface
400             || (  interface
401                && cutthrough.interface
402                && Ustrcmp(interface, cutthrough.interface) == 0
403             )  )
404          && port == cutthrough.host.port
405          )
406         {
407         uschar * resp = NULL;
408
409         /* Match!  Send the RCPT TO, set done from the response */
410         done =
411           smtp_write_command(&ctblock, FALSE, "RCPT TO:<%.1000s>\r\n",
412             transport_rcpt_address(addr,
413                addr->transport->rcpt_include_affixes)) >= 0 &&
414           cutthrough_response('2', &resp, CUTTHROUGH_DATA_TIMEOUT) == '2';
415
416         /* This would go horribly wrong if a callout fail was ignored by ACL.
417         We punt by abandoning cutthrough on a reject, like the
418         first-rcpt does. */
419
420         if (done)
421           {
422           address_item * na = store_get(sizeof(address_item));
423           *na = cutthrough.addr;
424           cutthrough.addr = *addr;
425           cutthrough.addr.host_used = &cutthrough.host;
426           cutthrough.addr.next = na;
427
428           cutthrough.nrcpt++;
429           }
430         else
431           {
432           cancel_cutthrough_connection("recipient rejected");
433           if (!resp || errno == ETIMEDOUT)
434             {
435             HDEBUG(D_verify) debug_printf("SMTP timeout\n");
436             }
437           else if (errno == 0)
438             {
439             if (*resp == 0)
440               Ustrcpy(resp, US"connection dropped");
441
442             addr->message =
443               string_sprintf("response to \"%s\" was: %s",
444                 big_buffer, string_printing(resp));
445
446             addr->user_message =
447               string_sprintf("Callout verification failed:\n%s", resp);
448
449             /* Hard rejection ends the process */
450
451             if (resp[0] == '5')   /* Address rejected */
452               {
453               *yield = FAIL;
454               done = TRUE;
455               }
456             }
457           }
458         }
459       break;    /* host_list */
460       }
461 if (!done)
462   cancel_cutthrough_connection("incompatible connection");
463 return done;
464 }
465
466
467 /*************************************************
468 *      Do callout verification for an address    *
469 *************************************************/
470
471 /* This function is called from verify_address() when the address has routed to
472 a host list, and a callout has been requested. Callouts are expensive; that is
473 why a cache is used to improve the efficiency.
474
475 Arguments:
476   addr              the address that's been routed
477   host_list         the list of hosts to try
478   tf                the transport feedback block
479
480   ifstring          "interface" option from transport, or NULL
481   portstring        "port" option from transport, or NULL
482   protocolstring    "protocol" option from transport, or NULL
483   callout           the per-command callout timeout
484   callout_overall   the overall callout timeout (if < 0 use 4*callout)
485   callout_connect   the callout connection timeout (if < 0 use callout)
486   options           the verification options - these bits are used:
487                       vopt_is_recipient => this is a recipient address
488                       vopt_callout_no_cache => don't use callout cache
489                       vopt_callout_fullpm => if postmaster check, do full one
490                       vopt_callout_random => do the "random" thing
491                       vopt_callout_recipsender => use real sender for recipient
492                       vopt_callout_recippmaster => use postmaster for recipient
493   se_mailfrom         MAIL FROM address for sender verify; NULL => ""
494   pm_mailfrom         if non-NULL, do the postmaster check with this sender
495
496 Returns:            OK/FAIL/DEFER
497 */
498
499 static int
500 do_callout(address_item *addr, host_item *host_list, transport_feedback *tf,
501   int callout, int callout_overall, int callout_connect, int options,
502   uschar *se_mailfrom, uschar *pm_mailfrom)
503 {
504 int yield = OK;
505 int old_domain_cache_result = ccache_accept;
506 BOOL done = FALSE;
507 uschar *address_key;
508 uschar *from_address;
509 uschar *random_local_part = NULL;
510 const uschar *save_deliver_domain = deliver_domain;
511 uschar **failure_ptr = options & vopt_is_recipient
512   ? &recipient_verify_failure : &sender_verify_failure;
513 dbdata_callout_cache new_domain_record;
514 dbdata_callout_cache_address new_address_record;
515 time_t callout_start_time;
516
517 new_domain_record.result = ccache_unknown;
518 new_domain_record.postmaster_result = ccache_unknown;
519 new_domain_record.random_result = ccache_unknown;
520
521 memset(&new_address_record, 0, sizeof(new_address_record));
522
523 /* For a recipient callout, the key used for the address cache record must
524 include the sender address if we are using the real sender in the callout,
525 because that may influence the result of the callout. */
526
527 if (options & vopt_is_recipient)
528   if (options & vopt_callout_recipsender)
529     {
530     from_address = sender_address;
531     address_key = string_sprintf("%s/<%s>", addr->address, sender_address);
532     if (cutthrough.delivery) options |= vopt_callout_no_cache;
533     }
534   else if (options & vopt_callout_recippmaster)
535     {
536     from_address = string_sprintf("postmaster@%s", qualify_domain_sender);
537     address_key = string_sprintf("%s/<postmaster@%s>", addr->address,
538       qualify_domain_sender);
539     }
540   else
541     {
542     from_address = US"";
543     address_key = addr->address;
544     }
545
546 /* For a sender callout, we must adjust the key if the mailfrom address is not
547 empty. */
548
549 else
550   {
551   from_address = se_mailfrom ? se_mailfrom : US"";
552   address_key = *from_address
553     ? string_sprintf("%s/<%s>", addr->address, from_address) : addr->address;
554   }
555
556 if (cached_callout_lookup(addr, address_key, from_address,
557       &options, &pm_mailfrom, &yield, failure_ptr,
558       &new_domain_record, &old_domain_cache_result))
559   goto END_CALLOUT;
560
561 if (!addr->transport)
562   {
563   HDEBUG(D_verify) debug_printf("cannot callout via null transport\n");
564   }
565 else if (Ustrcmp(addr->transport->driver_name, "smtp") != 0)
566   log_write(0, LOG_MAIN|LOG_PANIC|LOG_CONFIG_FOR, "callout transport '%s': %s is non-smtp",
567     addr->transport->name, addr->transport->driver_name);
568 else
569   {
570   smtp_transport_options_block *ob =
571     (smtp_transport_options_block *)addr->transport->options_block;
572   host_item * host;
573
574   /* The information wasn't available in the cache, so we have to do a real
575   callout and save the result in the cache for next time, unless no_cache is set,
576   or unless we have a previously cached negative random result. If we are to test
577   with a random local part, ensure that such a local part is available. If not,
578   log the fact, but carry on without randomising. */
579
580   if (options & vopt_callout_random  &&  callout_random_local_part)
581     if (!(random_local_part = expand_string(callout_random_local_part)))
582       log_write(0, LOG_MAIN|LOG_PANIC, "failed to expand "
583         "callout_random_local_part: %s", expand_string_message);
584
585   /* Default the connect and overall callout timeouts if not set, and record the
586   time we are starting so that we can enforce it. */
587
588   if (callout_overall < 0) callout_overall = 4 * callout;
589   if (callout_connect < 0) callout_connect = callout;
590   callout_start_time = time(NULL);
591
592   /* Before doing a real callout, if this is an SMTP connection, flush the SMTP
593   output because a callout might take some time. When PIPELINING is active and
594   there are many recipients, the total time for doing lots of callouts can add up
595   and cause the client to time out. So in this case we forgo the PIPELINING
596   optimization. */
597
598   if (smtp_out && !disable_callout_flush) mac_smtp_fflush();
599
600   clearflag(addr, af_verify_pmfail);  /* postmaster callout flag */
601   clearflag(addr, af_verify_nsfail);  /* null sender callout flag */
602
603 /* cutthrough-multi: if a nonfirst rcpt has the same routing as the first,
604 and we are holding a cutthrough conn open, we can just append the rcpt to
605 that conn for verification purposes (and later delivery also).  Simplest
606 coding means skipping this whole loop and doing the append separately.  */
607
608   /* Can we re-use an open cutthrough connection? */
609   if (  cutthrough.fd >= 0
610      && (options & (vopt_callout_recipsender | vopt_callout_recippmaster))
611         == vopt_callout_recipsender
612      && !random_local_part
613      && !pm_mailfrom
614      )
615     done = cutthrough_multi(addr, host_list, tf, &yield);
616
617   /* If we did not use a cached connection, make connections to the hosts
618   and do real callouts. The list of hosts is passed in as an argument. */
619
620   for (host = host_list; host && !done; host = host->next)
621     {
622     int host_af;
623     int port = 25;
624     uschar *interface = NULL;  /* Outgoing interface to use; NULL => any */
625     smtp_context sx;
626
627     if (!host->address)
628       {
629       DEBUG(D_verify) debug_printf("no IP address for host name %s: skipping\n",
630         host->name);
631       continue;
632       }
633
634     /* Check the overall callout timeout */
635
636     if (time(NULL) - callout_start_time >= callout_overall)
637       {
638       HDEBUG(D_verify) debug_printf("overall timeout for callout exceeded\n");
639       break;
640       }
641
642     /* Set IPv4 or IPv6 */
643
644     host_af = Ustrchr(host->address, ':') ? AF_INET6 : AF_INET;
645
646     /* Expand and interpret the interface and port strings. The latter will not
647     be used if there is a host-specific port (e.g. from a manualroute router).
648     This has to be delayed till now, because they may expand differently for
649     different hosts. If there's a failure, log it, but carry on with the
650     defaults. */
651
652     deliver_host = host->name;
653     deliver_host_address = host->address;
654     deliver_host_port = host->port;
655     deliver_domain = addr->domain;
656     transport_name = addr->transport->name;
657
658     if (  !smtp_get_interface(tf->interface, host_af, addr, &interface,
659             US"callout")
660        || !smtp_get_port(tf->port, addr, &port, US"callout")
661        )
662       log_write(0, LOG_MAIN|LOG_PANIC, "<%s>: %s", addr->address,
663         addr->message);
664
665     sx.addrlist = addr;
666     sx.host = host;
667     sx.host_af = host_af,
668     sx.port = port;
669     sx.interface = interface;
670     sx.helo_data = tf->helo_data;
671     sx.tblock = addr->transport;
672     sx.verify = TRUE;
673
674 tls_retry_connection:
675     /* Set the address state so that errors are recorded in it */
676
677     addr->transport_return = PENDING_DEFER;
678     ob->connect_timeout = callout_connect;
679     ob->command_timeout = callout;
680
681     /* Get the channel set up ready for a message (MAIL FROM being the next
682     SMTP command to send.  If we tried TLS but it failed, try again without
683     if permitted */
684
685     yield = smtp_setup_conn(&sx, FALSE);
686 #ifdef SUPPORT_TLS
687     if (  yield == DEFER
688        && addr->basic_errno == ERRNO_TLSFAILURE
689        && ob->tls_tempfail_tryclear
690        && verify_check_given_host(&ob->hosts_require_tls, host) != OK
691        )
692       {
693       log_write(0, LOG_MAIN,
694         "%s: callout unencrypted to %s [%s] (not in hosts_require_tls)",
695         addr->message, host->name, host->address);
696       addr->transport_return = PENDING_DEFER;
697       yield = smtp_setup_conn(&sx, TRUE);
698       }
699 #endif
700     if (yield != OK)
701       {
702       errno = addr->basic_errno;
703       transport_name = NULL;
704       deliver_host = deliver_host_address = NULL;
705       deliver_domain = save_deliver_domain;
706
707       /* Failure to accept HELO is cached; this blocks the whole domain for all
708       senders. I/O errors and defer responses are not cached. */
709
710       if (yield == FAIL && (errno == 0 || errno == ERRNO_SMTPCLOSED))
711         {
712         setflag(addr, af_verify_nsfail);
713         new_domain_record.result = ccache_reject;
714         done = TRUE;
715         }
716       else
717         done = FALSE;
718       goto no_conn;
719       }
720
721     /* If we needed to authenticate, smtp_setup_conn() did that.  Copy
722     the AUTH info for logging */
723
724     addr->authenticator = client_authenticator;
725     addr->auth_id = client_authenticated_id;
726
727     sx.from_addr = from_address;
728     sx.first_addr = sx.sync_addr = addr;
729     sx.ok = FALSE;                      /*XXX these 3 last might not be needed for verify? */
730     sx.send_rset = TRUE;
731     sx.completed_addr = FALSE;
732
733     new_domain_record.result = old_domain_cache_result == ccache_reject_mfnull
734       ? ccache_reject_mfnull : ccache_accept;
735
736     /* Do the random local part check first. Temporarily replace the recipient
737     with the "random" value */
738
739     if (random_local_part)
740       {
741       uschar * main_address = addr->address;
742       const uschar * rcpt_domain = addr->domain;
743
744 #ifdef SUPPORT_I18N
745       uschar * errstr = NULL;
746       if (  testflag(addr, af_utf8_downcvt)
747          && (rcpt_domain = string_domain_utf8_to_alabel(rcpt_domain,
748                                     &errstr), errstr)
749          )
750         {
751         addr->message = errstr;
752         errno = ERRNO_EXPANDFAIL;
753         setflag(addr, af_verify_nsfail);
754         done = FALSE;
755         rcpt_domain = US"";  /*XXX errorhandling! */
756         }
757 #endif
758
759       /* This would be ok for 1st rcpt of a cutthrough (XXX do we have a count?) , but no way to
760       handle a subsequent because of the RSET.  So refuse to support any. */
761       cancel_cutthrough_connection("random-recipient");
762
763       addr->address = string_sprintf("%s@%.1000s",
764                                     random_local_part, rcpt_domain);
765       done = FALSE;
766
767       /* If accepted, we aren't going to do any further tests below.
768       Otherwise, cache a real negative response, and get back to the right
769       state to send RCPT. Unless there's some problem such as a dropped
770       connection, we expect to succeed, because the commands succeeded above.
771       However, some servers drop the connection after responding to an
772       invalid recipient, so on (any) error we drop and remake the connection.
773       XXX We don't care about that for postmaster_full.  Should we?
774
775       XXX could we add another flag to the context, and have the common
776       code emit the RSET too?  Even pipelined after the RCPT...
777       Then the main-verify call could use it if there's to be a subsequent
778       postmaster-verify.
779       The sync_responses() would need to be taught about it and we'd
780       need another return code filtering out to here.
781       */
782
783       /* Remember when we last did a random test */
784       new_domain_record.random_stamp = time(NULL);
785
786       if (smtp_write_mail_and_rcpt_cmds(&sx, &yield) == 0)
787         switch(addr->transport_return)
788           {
789           case PENDING_OK:
790             new_domain_record.random_result = ccache_accept;
791             break;
792           case FAIL:
793             new_domain_record.random_result = ccache_reject;
794
795             /* Between each check, issue RSET, because some servers accept only
796             one recipient after MAIL FROM:<>.
797             XXX We don't care about that for postmaster_full.  Should we? */
798
799             if ((done =
800               smtp_write_command(&sx.outblock, FALSE, "RSET\r\n") >= 0 &&
801               smtp_read_response(&sx.inblock, sx.buffer, sizeof(sx.buffer),
802                 '2', callout)))
803               break;
804
805             HDEBUG(D_acl|D_v)
806               debug_printf_indent("problem after random/rset/mfrom; reopen conn\n");
807             random_local_part = NULL;
808 #ifdef SUPPORT_TLS
809             tls_close(FALSE, TRUE);
810 #endif
811             HDEBUG(D_transport|D_acl|D_v) debug_printf_indent("  SMTP(close)>>\n");
812             (void)close(sx.inblock.sock);
813             sx.inblock.sock = sx.outblock.sock = -1;
814 #ifndef DISABLE_EVENT
815             (void) event_raise(addr->transport->event_action,
816                               US"tcp:close", NULL);
817 #endif
818             addr->address = main_address;
819             addr->transport_return = PENDING_DEFER;
820             sx.first_addr = sx.sync_addr = addr;
821             sx.ok = FALSE;
822             sx.send_rset = TRUE;
823             sx.completed_addr = FALSE;
824             goto tls_retry_connection;
825           }
826
827       /* Re-setup for main verify, or for the error message when failing */
828       addr->address = main_address;
829       addr->transport_return = PENDING_DEFER;
830       sx.first_addr = sx.sync_addr = addr;
831       sx.ok = FALSE;
832       sx.send_rset = TRUE;
833       sx.completed_addr = FALSE;
834       }
835     else
836       done = TRUE;
837
838     /* Main verify. If the host is accepting all local parts, as determined
839     by the "random" check, we don't need to waste time doing any further
840     checking. */
841
842     if (done)
843       {
844       done = FALSE;
845       switch(smtp_write_mail_and_rcpt_cmds(&sx, &yield))
846         {
847         case 0:  switch(addr->transport_return) /* ok so far */
848                     {
849                     case PENDING_OK:  done = TRUE;
850                                       new_address_record.result = ccache_accept;
851                                       break;
852                     case FAIL:        done = TRUE;
853                                       yield = FAIL;
854                                       *failure_ptr = US"recipient";
855                                       new_address_record.result = ccache_reject;
856                                       break;
857                     default:          break;
858                     }
859                   break;
860
861         case -1:                                /* MAIL response error */
862                   *failure_ptr = US"mail";
863                   if (errno == 0 && sx.buffer[0] == '5')
864                     {
865                     setflag(addr, af_verify_nsfail);
866                     if (from_address[0] == 0)
867                       new_domain_record.result = ccache_reject_mfnull;
868                     }
869                   break;
870                                                 /* non-MAIL read i/o error */
871                                                 /* non-MAIL response timeout */
872                                                 /* internal error; channel still usable */
873         default:  break;                        /* transmit failed */
874         }
875       }
876
877     addr->auth_sndr = client_authenticated_sender;
878
879     deliver_host = deliver_host_address = NULL;
880     deliver_domain = save_deliver_domain;
881
882     /* Do postmaster check if requested; if a full check is required, we
883     check for RCPT TO:<postmaster> (no domain) in accordance with RFC 821. */
884
885     if (done && pm_mailfrom)
886       {
887       /* Could possibly shift before main verify, just above, and be ok
888       for cutthrough.  But no way to handle a subsequent rcpt, so just
889       refuse any */
890       cancel_cutthrough_connection("postmaster verify");
891       HDEBUG(D_acl|D_v) debug_printf_indent("Cutthrough cancelled by presence of postmaster verify\n");
892
893       done = smtp_write_command(&sx.outblock, FALSE, "RSET\r\n") >= 0
894           && smtp_read_response(&sx.inblock, sx.buffer,
895                                 sizeof(sx.buffer), '2', callout);
896
897       if (done)
898         {
899         uschar * main_address = addr->address;
900
901         /*XXX oops, affixes */
902         addr->address = string_sprintf("postmaster@%.1000s", addr->domain);
903         addr->transport_return = PENDING_DEFER;
904
905         sx.from_addr = pm_mailfrom;
906         sx.first_addr = sx.sync_addr = addr;
907         sx.ok = FALSE;
908         sx.send_rset = TRUE;
909         sx.completed_addr = FALSE;
910
911         if(  smtp_write_mail_and_rcpt_cmds(&sx, &yield) == 0
912           && addr->transport_return == PENDING_OK
913           )
914           done = TRUE;
915         else
916           done = (options & vopt_callout_fullpm) != 0
917               && smtp_write_command(&sx.outblock, FALSE,
918                             "RCPT TO:<postmaster>\r\n") >= 0
919               && smtp_read_response(&sx.inblock, sx.buffer,
920                             sizeof(sx.buffer), '2', callout);
921
922         /* Sort out the cache record */
923
924         new_domain_record.postmaster_stamp = time(NULL);
925
926         if (done)
927           new_domain_record.postmaster_result = ccache_accept;
928         else if (errno == 0 && sx.buffer[0] == '5')
929           {
930           *failure_ptr = US"postmaster";
931           setflag(addr, af_verify_pmfail);
932           new_domain_record.postmaster_result = ccache_reject;
933           }
934
935         addr->address = main_address;
936         }
937       }
938     /* For any failure of the main check, other than a negative response, we just
939     close the connection and carry on. We can identify a negative response by the
940     fact that errno is zero. For I/O errors it will be non-zero
941
942     Set up different error texts for logging and for sending back to the caller
943     as an SMTP response. Log in all cases, using a one-line format. For sender
944     callouts, give a full response to the caller, but for recipient callouts,
945     don't give the IP address because this may be an internal host whose identity
946     is not to be widely broadcast. */
947
948 no_conn:
949     switch(errno)
950       {
951       case ETIMEDOUT:
952         HDEBUG(D_verify) debug_printf("SMTP timeout\n");
953         sx.send_quit = FALSE;
954         break;
955
956 #ifdef SUPPORT_I18N
957       case ERRNO_UTF8_FWD:
958         {
959         extern int acl_where;   /* src/acl.c */
960         errno = 0;
961         addr->message = string_sprintf(
962             "response to \"EHLO\" did not include SMTPUTF8");
963         addr->user_message = acl_where == ACL_WHERE_RCPT
964           ? US"533 no support for internationalised mailbox name"
965           : US"550 mailbox unavailable";
966         yield = FAIL;
967         done = TRUE;
968         }
969         break;
970 #endif
971       case ECONNREFUSED:
972         sx.send_quit = FALSE;
973         break;
974
975       case 0:
976         if (*sx.buffer == 0) Ustrcpy(sx.buffer, US"connection dropped");
977
978         /*XXX test here is ugly; seem to have a split of responsibility for
979         building this message.  Need to reationalise.  Where is it done
980         before here, and when not?
981         Not == 5xx resp to MAIL on main-verify
982         */
983         if (!addr->message) addr->message =
984           string_sprintf("response to \"%s\" was: %s",
985                           big_buffer, string_printing(sx.buffer));
986
987         addr->user_message = options & vopt_is_recipient
988           ? string_sprintf("Callout verification failed:\n%s", sx.buffer)
989           : string_sprintf("Called:   %s\nSent:     %s\nResponse: %s",
990             host->address, big_buffer, sx.buffer);
991
992         /* Hard rejection ends the process */
993
994         if (sx.buffer[0] == '5')   /* Address rejected */
995           {
996           yield = FAIL;
997           done = TRUE;
998           }
999         break;
1000       }
1001
1002     /* End the SMTP conversation and close the connection. */
1003
1004     /* Cutthrough - on a successful connect and recipient-verify with
1005     use-sender and we are 1st rcpt and have no cutthrough conn so far
1006     here is where we want to leave the conn open */
1007     if (  cutthrough.delivery
1008        && rcpt_count == 1
1009        && done
1010        && yield == OK
1011        &&    (options & (vopt_callout_recipsender|vopt_callout_recippmaster|vopt_success_on_redirect))
1012            == vopt_callout_recipsender
1013        && !random_local_part
1014        && !pm_mailfrom
1015        && cutthrough.fd < 0
1016        && !sx.lmtp
1017        )
1018       {
1019       HDEBUG(D_acl|D_v) debug_printf_indent("holding verify callout open for cutthrough delivery\n");
1020
1021       cutthrough.fd = sx.outblock.sock; /* We assume no buffer in use in the outblock */
1022       cutthrough.nrcpt = 1;
1023       cutthrough.interface = interface;
1024       cutthrough.host = *host;
1025       cutthrough.addr = *addr;          /* Save the address_item for later logging */
1026       cutthrough.addr.next =      NULL;
1027       cutthrough.addr.host_used = &cutthrough.host;
1028       if (addr->parent)
1029         *(cutthrough.addr.parent = store_get(sizeof(address_item))) =
1030           *addr->parent;
1031       ctblock.buffer = ctbuffer;
1032       ctblock.buffersize = sizeof(ctbuffer);
1033       ctblock.ptr = ctbuffer;
1034       /* ctblock.cmd_count = 0; ctblock.authenticating = FALSE; */
1035       ctblock.sock = cutthrough.fd;
1036       }
1037     else
1038       {
1039       /* Ensure no cutthrough on multiple address verifies */
1040       if (options & vopt_callout_recipsender)
1041         cancel_cutthrough_connection("not usable for cutthrough");
1042       if (sx.send_quit)
1043         {
1044         (void) smtp_write_command(&sx.outblock, FALSE, "QUIT\r\n");
1045
1046         /* Wait a short time for response, and discard it */
1047         smtp_read_response(&sx.inblock, sx.buffer, sizeof(sx.buffer),
1048           '2', 1);
1049         }
1050
1051       if (sx.inblock.sock >= 0)
1052         {
1053 #ifdef SUPPORT_TLS
1054         tls_close(FALSE, TRUE);
1055 #endif
1056         HDEBUG(D_transport|D_acl|D_v) debug_printf_indent("  SMTP(close)>>\n");
1057         (void)close(sx.inblock.sock);
1058         sx.inblock.sock = sx.outblock.sock = -1;
1059 #ifndef DISABLE_EVENT
1060         (void) event_raise(addr->transport->event_action, US"tcp:close", NULL);
1061 #endif
1062         }
1063       }
1064
1065     if (!done || yield != OK)
1066       addr->message = string_sprintf("%s [%s] : %s", host->name, host->address,
1067                                     addr->message);
1068     }    /* Loop through all hosts, while !done */
1069   }
1070
1071 /* If we get here with done == TRUE, a successful callout happened, and yield
1072 will be set OK or FAIL according to the response to the RCPT command.
1073 Otherwise, we looped through the hosts but couldn't complete the business.
1074 However, there may be domain-specific information to cache in both cases. */
1075
1076 if (!(options & vopt_callout_no_cache))
1077   cache_callout_write(&new_domain_record, addr->domain,
1078     done, &new_address_record, address_key);
1079
1080 /* Failure to connect to any host, or any response other than 2xx or 5xx is a
1081 temporary error. If there was only one host, and a response was received, leave
1082 it alone if supplying details. Otherwise, give a generic response. */
1083
1084 if (!done)
1085   {
1086   uschar * dullmsg = string_sprintf("Could not complete %s verify callout",
1087     options & vopt_is_recipient ? "recipient" : "sender");
1088   yield = DEFER;
1089
1090   addr->message = host_list->next || !addr->message
1091     ? dullmsg : string_sprintf("%s: %s", dullmsg, addr->message);
1092
1093   addr->user_message = smtp_return_error_details
1094     ? string_sprintf("%s for <%s>.\n"
1095       "The mail server(s) for the domain may be temporarily unreachable, or\n"
1096       "they may be permanently unreachable from this server. In the latter case,\n%s",
1097       dullmsg, addr->address,
1098       options & vopt_is_recipient
1099         ? "the address will never be accepted."
1100         : "you need to change the address or create an MX record for its domain\n"
1101           "if it is supposed to be generally accessible from the Internet.\n"
1102           "Talk to your mail administrator for details.")
1103     : dullmsg;
1104
1105   /* Force a specific error code */
1106
1107   addr->basic_errno = ERRNO_CALLOUTDEFER;
1108   }
1109
1110 /* Come here from within the cache-reading code on fast-track exit. */
1111
1112 END_CALLOUT:
1113 tls_modify_variables(&tls_in);
1114 return yield;
1115 }
1116
1117
1118
1119 /* Called after recipient-acl to get a cutthrough connection open when
1120    one was requested and a recipient-verify wasn't subsequently done.
1121 */
1122 int
1123 open_cutthrough_connection( address_item * addr )
1124 {
1125 address_item addr2;
1126 int rc;
1127
1128 /* Use a recipient-verify-callout to set up the cutthrough connection. */
1129 /* We must use a copy of the address for verification, because it might
1130 get rewritten. */
1131
1132 addr2 = *addr;
1133 HDEBUG(D_acl) debug_printf_indent("----------- %s cutthrough setup ------------\n",
1134   rcpt_count > 1 ? "more" : "start");
1135 rc = verify_address(&addr2, NULL,
1136         vopt_is_recipient | vopt_callout_recipsender | vopt_callout_no_cache,
1137         CUTTHROUGH_CMD_TIMEOUT, -1, -1,
1138         NULL, NULL, NULL);
1139 addr->message = addr2.message;
1140 addr->user_message = addr2.user_message;
1141 HDEBUG(D_acl) debug_printf_indent("----------- end cutthrough setup ------------\n");
1142 return rc;
1143 }
1144
1145
1146
1147 /* Send given number of bytes from the buffer */
1148 static BOOL
1149 cutthrough_send(int n)
1150 {
1151 if(cutthrough.fd < 0)
1152   return TRUE;
1153
1154 if(
1155 #ifdef SUPPORT_TLS
1156    (tls_out.active == cutthrough.fd) ? tls_write(FALSE, ctblock.buffer, n) :
1157 #endif
1158    send(cutthrough.fd, ctblock.buffer, n, 0) > 0
1159   )
1160 {
1161   transport_count += n;
1162   ctblock.ptr= ctblock.buffer;
1163   return TRUE;
1164 }
1165
1166 HDEBUG(D_transport|D_acl) debug_printf_indent("cutthrough_send failed: %s\n", strerror(errno));
1167 return FALSE;
1168 }
1169
1170
1171
1172 static BOOL
1173 _cutthrough_puts(uschar * cp, int n)
1174 {
1175 while(n--)
1176  {
1177  if(ctblock.ptr >= ctblock.buffer+ctblock.buffersize)
1178    if(!cutthrough_send(ctblock.buffersize))
1179      return FALSE;
1180
1181  *ctblock.ptr++ = *cp++;
1182  }
1183 return TRUE;
1184 }
1185
1186 /* Buffered output of counted data block.   Return boolean success */
1187 BOOL
1188 cutthrough_puts(uschar * cp, int n)
1189 {
1190 if (cutthrough.fd < 0)       return TRUE;
1191 if (_cutthrough_puts(cp, n)) return TRUE;
1192 cancel_cutthrough_connection("transmit failed");
1193 return FALSE;
1194 }
1195
1196
1197 static BOOL
1198 _cutthrough_flush_send(void)
1199 {
1200 int n= ctblock.ptr-ctblock.buffer;
1201
1202 if(n>0)
1203   if(!cutthrough_send(n))
1204     return FALSE;
1205 return TRUE;
1206 }
1207
1208
1209 /* Send out any bufferred output.  Return boolean success. */
1210 BOOL
1211 cutthrough_flush_send(void)
1212 {
1213 if (_cutthrough_flush_send()) return TRUE;
1214 cancel_cutthrough_connection("transmit failed");
1215 return FALSE;
1216 }
1217
1218
1219 BOOL
1220 cutthrough_put_nl(void)
1221 {
1222 return cutthrough_puts(US"\r\n", 2);
1223 }
1224
1225
1226 /* Get and check response from cutthrough target */
1227 static uschar
1228 cutthrough_response(char expect, uschar ** copy, int timeout)
1229 {
1230 smtp_inblock inblock;
1231 uschar inbuffer[4096];
1232 uschar responsebuffer[4096];
1233
1234 inblock.buffer = inbuffer;
1235 inblock.buffersize = sizeof(inbuffer);
1236 inblock.ptr = inbuffer;
1237 inblock.ptrend = inbuffer;
1238 inblock.sock = cutthrough.fd;
1239 /* this relies on (inblock.sock == tls_out.active) */
1240 if(!smtp_read_response(&inblock, responsebuffer, sizeof(responsebuffer), expect, timeout))
1241   cancel_cutthrough_connection("target timeout on read");
1242
1243 if(copy != NULL)
1244   {
1245   uschar * cp;
1246   *copy = cp = string_copy(responsebuffer);
1247   /* Trim the trailing end of line */
1248   cp += Ustrlen(responsebuffer);
1249   if(cp > *copy  &&  cp[-1] == '\n') *--cp = '\0';
1250   if(cp > *copy  &&  cp[-1] == '\r') *--cp = '\0';
1251   }
1252
1253 return responsebuffer[0];
1254 }
1255
1256
1257 /* Negotiate dataphase with the cutthrough target, returning success boolean */
1258 BOOL
1259 cutthrough_predata(void)
1260 {
1261 if(cutthrough.fd < 0)
1262   return FALSE;
1263
1264 HDEBUG(D_transport|D_acl|D_v) debug_printf_indent("  SMTP>> DATA\n");
1265 cutthrough_puts(US"DATA\r\n", 6);
1266 cutthrough_flush_send();
1267
1268 /* Assume nothing buffered.  If it was it gets ignored. */
1269 return cutthrough_response('3', NULL, CUTTHROUGH_DATA_TIMEOUT) == '3';
1270 }
1271
1272
1273 /* fd and tctx args only to match write_chunk() */
1274 static BOOL
1275 cutthrough_write_chunk(int fd, transport_ctx * tctx, uschar * s, int len)
1276 {
1277 uschar * s2;
1278 while(s && (s2 = Ustrchr(s, '\n')))
1279  {
1280  if(!cutthrough_puts(s, s2-s) || !cutthrough_put_nl())
1281   return FALSE;
1282  s = s2+1;
1283  }
1284 return TRUE;
1285 }
1286
1287
1288 /* Buffered send of headers.  Return success boolean. */
1289 /* Expands newlines to wire format (CR,NL).           */
1290 /* Also sends header-terminating blank line.          */
1291 BOOL
1292 cutthrough_headers_send(void)
1293 {
1294 transport_ctx tctx;
1295
1296 if(cutthrough.fd < 0)
1297   return FALSE;
1298
1299 /* We share a routine with the mainline transport to handle header add/remove/rewrites,
1300    but having a separate buffered-output function (for now)
1301 */
1302 HDEBUG(D_acl) debug_printf_indent("----------- start cutthrough headers send -----------\n");
1303
1304 tctx.tblock = cutthrough.addr.transport;
1305 tctx.addr = &cutthrough.addr;
1306 tctx.check_string = US".";
1307 tctx.escape_string = US"..";
1308 tctx.options = topt_use_crlf;
1309
1310 if (!transport_headers_send(cutthrough.fd, &tctx, &cutthrough_write_chunk))
1311   return FALSE;
1312
1313 HDEBUG(D_acl) debug_printf_indent("----------- done cutthrough headers send ------------\n");
1314 return TRUE;
1315 }
1316
1317
1318 static void
1319 close_cutthrough_connection(const char * why)
1320 {
1321 if(cutthrough.fd >= 0)
1322   {
1323   /* We could be sending this after a bunch of data, but that is ok as
1324      the only way to cancel the transfer in dataphase is to drop the tcp
1325      conn before the final dot.
1326   */
1327   ctblock.ptr = ctbuffer;
1328   HDEBUG(D_transport|D_acl|D_v) debug_printf_indent("  SMTP>> QUIT\n");
1329   _cutthrough_puts(US"QUIT\r\n", 6);    /* avoid recursion */
1330   _cutthrough_flush_send();
1331
1332   /* Wait a short time for response, and discard it */
1333   cutthrough_response('2', NULL, 1);
1334
1335   #ifdef SUPPORT_TLS
1336   tls_close(FALSE, TRUE);
1337   #endif
1338   HDEBUG(D_transport|D_acl|D_v) debug_printf_indent("  SMTP(close)>>\n");
1339   (void)close(cutthrough.fd);
1340   cutthrough.fd = -1;
1341   HDEBUG(D_acl) debug_printf_indent("----------- cutthrough shutdown (%s) ------------\n", why);
1342   }
1343 ctblock.ptr = ctbuffer;
1344 }
1345
1346 void
1347 cancel_cutthrough_connection(const char * why)
1348 {
1349 close_cutthrough_connection(why);
1350 cutthrough.delivery = FALSE;
1351 }
1352
1353
1354
1355
1356 /* Have senders final-dot.  Send one to cutthrough target, and grab the response.
1357    Log an OK response as a transmission.
1358    Close the connection.
1359    Return smtp response-class digit.
1360 */
1361 uschar *
1362 cutthrough_finaldot(void)
1363 {
1364 uschar res;
1365 address_item * addr;
1366 HDEBUG(D_transport|D_acl|D_v) debug_printf_indent("  SMTP>> .\n");
1367
1368 /* Assume data finshed with new-line */
1369 if(  !cutthrough_puts(US".", 1)
1370   || !cutthrough_put_nl()
1371   || !cutthrough_flush_send()
1372   )
1373   return cutthrough.addr.message;
1374
1375 res = cutthrough_response('2', &cutthrough.addr.message, CUTTHROUGH_DATA_TIMEOUT);
1376 for (addr = &cutthrough.addr; addr; addr = addr->next)
1377   {
1378   addr->message = cutthrough.addr.message;
1379   switch(res)
1380     {
1381     case '2':
1382       delivery_log(LOG_MAIN, addr, (int)'>', NULL);
1383       close_cutthrough_connection("delivered");
1384       break;
1385
1386     case '4':
1387       delivery_log(LOG_MAIN, addr, 0,
1388         US"tmp-reject from cutthrough after DATA:");
1389       break;
1390
1391     case '5':
1392       delivery_log(LOG_MAIN|LOG_REJECT, addr, 0,
1393         US"rejected after DATA:");
1394       break;
1395
1396     default:
1397       break;
1398     }
1399   }
1400 return cutthrough.addr.message;
1401 }
1402
1403
1404
1405 /*************************************************
1406 *           Copy error to toplevel address       *
1407 *************************************************/
1408
1409 /* This function is used when a verify fails or defers, to ensure that the
1410 failure or defer information is in the original toplevel address. This applies
1411 when an address is redirected to a single new address, and the failure or
1412 deferral happens to the child address.
1413
1414 Arguments:
1415   vaddr       the verify address item
1416   addr        the final address item
1417   yield       FAIL or DEFER
1418
1419 Returns:      the value of YIELD
1420 */
1421
1422 static int
1423 copy_error(address_item *vaddr, address_item *addr, int yield)
1424 {
1425 if (addr != vaddr)
1426   {
1427   vaddr->message = addr->message;
1428   vaddr->user_message = addr->user_message;
1429   vaddr->basic_errno = addr->basic_errno;
1430   vaddr->more_errno = addr->more_errno;
1431   vaddr->prop.address_data = addr->prop.address_data;
1432   copyflag(vaddr, addr, af_pass_message);
1433   }
1434 return yield;
1435 }
1436
1437
1438
1439
1440 /**************************************************
1441 * printf that automatically handles TLS if needed *
1442 ***************************************************/
1443
1444 /* This function is used by verify_address() as a substitute for all fprintf()
1445 calls; a direct fprintf() will not produce output in a TLS SMTP session, such
1446 as a response to an EXPN command.  smtp_in.c makes smtp_printf available but
1447 that assumes that we always use the smtp_out FILE* when not using TLS or the
1448 ssl buffer when we are.  Instead we take a FILE* parameter and check to see if
1449 that is smtp_out; if so, smtp_printf() with TLS support, otherwise regular
1450 fprintf().
1451
1452 Arguments:
1453   f           the candidate FILE* to write to
1454   format      format string
1455   ...         optional arguments
1456
1457 Returns:
1458               nothing
1459 */
1460
1461 static void PRINTF_FUNCTION(2,3)
1462 respond_printf(FILE *f, const char *format, ...)
1463 {
1464 va_list ap;
1465
1466 va_start(ap, format);
1467 if (smtp_out && (f == smtp_out))
1468   smtp_vprintf(format, ap);
1469 else
1470   vfprintf(f, format, ap);
1471 va_end(ap);
1472 }
1473
1474
1475
1476 /*************************************************
1477 *            Verify an email address             *
1478 *************************************************/
1479
1480 /* This function is used both for verification (-bv and at other times) and
1481 address testing (-bt), which is indicated by address_test_mode being set.
1482
1483 Arguments:
1484   vaddr            contains the address to verify; the next field in this block
1485                      must be NULL
1486   f                if not NULL, write the result to this file
1487   options          various option bits:
1488                      vopt_fake_sender => this sender verify is not for the real
1489                        sender (it was verify=sender=xxxx or an address from a
1490                        header line) - rewriting must not change sender_address
1491                      vopt_is_recipient => this is a recipient address, otherwise
1492                        it's a sender address - this affects qualification and
1493                        rewriting and messages from callouts
1494                      vopt_qualify => qualify an unqualified address; else error
1495                      vopt_expn => called from SMTP EXPN command
1496                      vopt_success_on_redirect => when a new address is generated
1497                        the verification instantly succeeds
1498
1499                      These ones are used by do_callout() -- the options variable
1500                        is passed to it.
1501
1502                      vopt_callout_fullpm => if postmaster check, do full one
1503                      vopt_callout_no_cache => don't use callout cache
1504                      vopt_callout_random => do the "random" thing
1505                      vopt_callout_recipsender => use real sender for recipient
1506                      vopt_callout_recippmaster => use postmaster for recipient
1507
1508   callout          if > 0, specifies that callout is required, and gives timeout
1509                      for individual commands
1510   callout_overall  if > 0, gives overall timeout for the callout function;
1511                    if < 0, a default is used (see do_callout())
1512   callout_connect  the connection timeout for callouts
1513   se_mailfrom      when callout is requested to verify a sender, use this
1514                      in MAIL FROM; NULL => ""
1515   pm_mailfrom      when callout is requested, if non-NULL, do the postmaster
1516                      thing and use this as the sender address (may be "")
1517
1518   routed           if not NULL, set TRUE if routing succeeded, so we can
1519                      distinguish between routing failed and callout failed
1520
1521 Returns:           OK      address verified
1522                    FAIL    address failed to verify
1523                    DEFER   can't tell at present
1524 */
1525
1526 int
1527 verify_address(address_item *vaddr, FILE *f, int options, int callout,
1528   int callout_overall, int callout_connect, uschar *se_mailfrom,
1529   uschar *pm_mailfrom, BOOL *routed)
1530 {
1531 BOOL allok = TRUE;
1532 BOOL full_info = (f == NULL)? FALSE : (debug_selector != 0);
1533 BOOL expn         = (options & vopt_expn) != 0;
1534 BOOL success_on_redirect = (options & vopt_success_on_redirect) != 0;
1535 int i;
1536 int yield = OK;
1537 int verify_type = expn? v_expn :
1538      address_test_mode? v_none :
1539           options & vopt_is_recipient? v_recipient : v_sender;
1540 address_item *addr_list;
1541 address_item *addr_new = NULL;
1542 address_item *addr_remote = NULL;
1543 address_item *addr_local = NULL;
1544 address_item *addr_succeed = NULL;
1545 uschar **failure_ptr = options & vopt_is_recipient
1546   ? &recipient_verify_failure : &sender_verify_failure;
1547 uschar *ko_prefix, *cr;
1548 uschar *address = vaddr->address;
1549 uschar *save_sender;
1550 uschar null_sender[] = { 0 };             /* Ensure writeable memory */
1551
1552 /* Clear, just in case */
1553
1554 *failure_ptr = NULL;
1555
1556 /* Set up a prefix and suffix for error message which allow us to use the same
1557 output statements both in EXPN mode (where an SMTP response is needed) and when
1558 debugging with an output file. */
1559
1560 if (expn)
1561   {
1562   ko_prefix = US"553 ";
1563   cr = US"\r";
1564   }
1565 else ko_prefix = cr = US"";
1566
1567 /* Add qualify domain if permitted; otherwise an unqualified address fails. */
1568
1569 if (parse_find_at(address) == NULL)
1570   {
1571   if ((options & vopt_qualify) == 0)
1572     {
1573     if (f != NULL)
1574       respond_printf(f, "%sA domain is required for \"%s\"%s\n",
1575         ko_prefix, address, cr);
1576     *failure_ptr = US"qualify";
1577     return FAIL;
1578     }
1579   address = rewrite_address_qualify(address, options & vopt_is_recipient);
1580   }
1581
1582 DEBUG(D_verify)
1583   {
1584   debug_printf(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>\n");
1585   debug_printf("%s %s\n", address_test_mode? "Testing" : "Verifying", address);
1586   }
1587
1588 /* Rewrite and report on it. Clear the domain and local part caches - these
1589 may have been set by domains and local part tests during an ACL. */
1590
1591 if (global_rewrite_rules != NULL)
1592   {
1593   uschar *old = address;
1594   address = rewrite_address(address, options & vopt_is_recipient, FALSE,
1595     global_rewrite_rules, rewrite_existflags);
1596   if (address != old)
1597     {
1598     for (i = 0; i < (MAX_NAMED_LIST * 2)/32; i++) vaddr->localpart_cache[i] = 0;
1599     for (i = 0; i < (MAX_NAMED_LIST * 2)/32; i++) vaddr->domain_cache[i] = 0;
1600     if (f != NULL && !expn) fprintf(f, "Address rewritten as: %s\n", address);
1601     }
1602   }
1603
1604 /* If this is the real sender address, we must update sender_address at
1605 this point, because it may be referred to in the routers. */
1606
1607 if ((options & (vopt_fake_sender|vopt_is_recipient)) == 0)
1608   sender_address = address;
1609
1610 /* If the address was rewritten to <> no verification can be done, and we have
1611 to return OK. This rewriting is permitted only for sender addresses; for other
1612 addresses, such rewriting fails. */
1613
1614 if (address[0] == 0) return OK;
1615
1616 /* Flip the legacy TLS-related variables over to the outbound set in case
1617 they're used in the context of a transport used by verification. Reset them
1618 at exit from this routine (so no returns allowed from here on). */
1619
1620 tls_modify_variables(&tls_out);
1621
1622 /* Save a copy of the sender address for re-instating if we change it to <>
1623 while verifying a sender address (a nice bit of self-reference there). */
1624
1625 save_sender = sender_address;
1626
1627 /* Observability variable for router/transport use */
1628
1629 verify_mode = options & vopt_is_recipient ? US"R" : US"S";
1630
1631 /* Update the address structure with the possibly qualified and rewritten
1632 address. Set it up as the starting address on the chain of new addresses. */
1633
1634 vaddr->address = address;
1635 addr_new = vaddr;
1636
1637 /* We need a loop, because an address can generate new addresses. We must also
1638 cope with generated pipes and files at the top level. (See also the code and
1639 comment in deliver.c.) However, it is usually the case that the router for
1640 user's .forward files has its verify flag turned off.
1641
1642 If an address generates more than one child, the loop is used only when
1643 full_info is set, and this can only be set locally. Remote enquiries just get
1644 information about the top level address, not anything that it generated. */
1645
1646 while (addr_new)
1647   {
1648   int rc;
1649   address_item *addr = addr_new;
1650
1651   addr_new = addr->next;
1652   addr->next = NULL;
1653
1654   DEBUG(D_verify)
1655     {
1656     debug_printf(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>\n");
1657     debug_printf("Considering %s\n", addr->address);
1658     }
1659
1660   /* Handle generated pipe, file or reply addresses. We don't get these
1661   when handling EXPN, as it does only one level of expansion. */
1662
1663   if (testflag(addr, af_pfr))
1664     {
1665     allok = FALSE;
1666     if (f != NULL)
1667       {
1668       BOOL allow;
1669
1670       if (addr->address[0] == '>')
1671         {
1672         allow = testflag(addr, af_allow_reply);
1673         fprintf(f, "%s -> mail %s", addr->parent->address, addr->address + 1);
1674         }
1675       else
1676         {
1677         allow = (addr->address[0] == '|')?
1678           testflag(addr, af_allow_pipe) : testflag(addr, af_allow_file);
1679         fprintf(f, "%s -> %s", addr->parent->address, addr->address);
1680         }
1681
1682       if (addr->basic_errno == ERRNO_BADTRANSPORT)
1683         fprintf(f, "\n*** Error in setting up pipe, file, or autoreply:\n"
1684           "%s\n", addr->message);
1685       else if (allow)
1686         fprintf(f, "\n  transport = %s\n", addr->transport->name);
1687       else
1688         fprintf(f, " *** forbidden ***\n");
1689       }
1690     continue;
1691     }
1692
1693   /* Just in case some router parameter refers to it. */
1694
1695   return_path = addr->prop.errors_address
1696     ? addr->prop.errors_address : sender_address;
1697
1698   /* Split the address into domain and local part, handling the %-hack if
1699   necessary, and then route it. While routing a sender address, set
1700   $sender_address to <> because that is what it will be if we were trying to
1701   send a bounce to the sender. */
1702
1703   if (routed) *routed = FALSE;
1704   if ((rc = deliver_split_address(addr)) == OK)
1705     {
1706     if (!(options & vopt_is_recipient)) sender_address = null_sender;
1707     rc = route_address(addr, &addr_local, &addr_remote, &addr_new,
1708       &addr_succeed, verify_type);
1709     sender_address = save_sender;     /* Put back the real sender */
1710     }
1711
1712   /* If routing an address succeeded, set the flag that remembers, for use when
1713   an ACL cached a sender verify (in case a callout fails). Then if routing set
1714   up a list of hosts or the transport has a host list, and the callout option
1715   is set, and we aren't in a host checking run, do the callout verification,
1716   and set another flag that notes that a callout happened. */
1717
1718   if (rc == OK)
1719     {
1720     if (routed) *routed = TRUE;
1721     if (callout > 0)
1722       {
1723       transport_instance * tp;
1724       host_item * host_list = addr->host_list;
1725
1726       /* Make up some data for use in the case where there is no remote
1727       transport. */
1728
1729       transport_feedback tf = {
1730         NULL,                       /* interface (=> any) */
1731         US"smtp",                   /* port */
1732         US"smtp",                   /* protocol */
1733         NULL,                       /* hosts */
1734         US"$smtp_active_hostname",  /* helo_data */
1735         FALSE,                      /* hosts_override */
1736         FALSE,                      /* hosts_randomize */
1737         FALSE,                      /* gethostbyname */
1738         TRUE,                       /* qualify_single */
1739         FALSE                       /* search_parents */
1740         };
1741
1742       /* If verification yielded a remote transport, we want to use that
1743       transport's options, so as to mimic what would happen if we were really
1744       sending a message to this address. */
1745
1746       if ((tp = addr->transport) && !tp->info->local)
1747         {
1748         (void)(tp->setup)(tp, addr, &tf, 0, 0, NULL);
1749
1750         /* If the transport has hosts and the router does not, or if the
1751         transport is configured to override the router's hosts, we must build a
1752         host list of the transport's hosts, and find the IP addresses */
1753
1754         if (tf.hosts && (!host_list || tf.hosts_override))
1755           {
1756           uschar *s;
1757           const uschar *save_deliver_domain = deliver_domain;
1758           uschar *save_deliver_localpart = deliver_localpart;
1759
1760           host_list = NULL;    /* Ignore the router's hosts */
1761
1762           deliver_domain = addr->domain;
1763           deliver_localpart = addr->local_part;
1764           s = expand_string(tf.hosts);
1765           deliver_domain = save_deliver_domain;
1766           deliver_localpart = save_deliver_localpart;
1767
1768           if (!s)
1769             {
1770             log_write(0, LOG_MAIN|LOG_PANIC, "failed to expand list of hosts "
1771               "\"%s\" in %s transport for callout: %s", tf.hosts,
1772               tp->name, expand_string_message);
1773             }
1774           else
1775             {
1776             int flags;
1777             host_item *host, *nexthost;
1778             host_build_hostlist(&host_list, s, tf.hosts_randomize);
1779
1780             /* Just ignore failures to find a host address. If we don't manage
1781             to find any addresses, the callout will defer. Note that more than
1782             one address may be found for a single host, which will result in
1783             additional host items being inserted into the chain. Hence we must
1784             save the next host first. */
1785
1786             flags = HOST_FIND_BY_A;
1787             if (tf.qualify_single) flags |= HOST_FIND_QUALIFY_SINGLE;
1788             if (tf.search_parents) flags |= HOST_FIND_SEARCH_PARENTS;
1789
1790             for (host = host_list; host; host = nexthost)
1791               {
1792               nexthost = host->next;
1793               if (tf.gethostbyname ||
1794                   string_is_ip_address(host->name, NULL) != 0)
1795                 (void)host_find_byname(host, NULL, flags, NULL, TRUE);
1796               else
1797                 {
1798                 dnssec_domains * dnssec_domains = NULL;
1799                 if (Ustrcmp(tp->driver_name, "smtp") == 0)
1800                   {
1801                   smtp_transport_options_block * ob =
1802                       (smtp_transport_options_block *) tp->options_block;
1803                   dnssec_domains = &ob->dnssec;
1804                   }
1805
1806                 (void)host_find_bydns(host, NULL, flags, NULL, NULL, NULL,
1807                   dnssec_domains, NULL, NULL);
1808                 }
1809               }
1810             }
1811           }
1812         }
1813
1814       /* Can only do a callout if we have at least one host! If the callout
1815       fails, it will have set ${sender,recipient}_verify_failure. */
1816
1817       if (host_list)
1818         {
1819         HDEBUG(D_verify) debug_printf("Attempting full verification using callout\n");
1820         if (host_checking && !host_checking_callout)
1821           {
1822           HDEBUG(D_verify)
1823             debug_printf("... callout omitted by default when host testing\n"
1824               "(Use -bhc if you want the callouts to happen.)\n");
1825           }
1826         else
1827           {
1828 #ifdef SUPPORT_TLS
1829           deliver_set_expansions(addr);
1830 #endif
1831           rc = do_callout(addr, host_list, &tf, callout, callout_overall,
1832             callout_connect, options, se_mailfrom, pm_mailfrom);
1833           }
1834         }
1835       else
1836         {
1837         HDEBUG(D_verify) debug_printf("Cannot do callout: neither router nor "
1838           "transport provided a host list\n");
1839         }
1840       }
1841     }
1842
1843   /* Otherwise, any failure is a routing failure */
1844
1845   else *failure_ptr = US"route";
1846
1847   /* A router may return REROUTED if it has set up a child address as a result
1848   of a change of domain name (typically from widening). In this case we always
1849   want to continue to verify the new child. */
1850
1851   if (rc == REROUTED) continue;
1852
1853   /* Handle hard failures */
1854
1855   if (rc == FAIL)
1856     {
1857     allok = FALSE;
1858     if (f)
1859       {
1860       address_item *p = addr->parent;
1861
1862       respond_printf(f, "%s%s %s", ko_prefix,
1863         full_info ? addr->address : address,
1864         address_test_mode ? "is undeliverable" : "failed to verify");
1865       if (!expn && admin_user)
1866         {
1867         if (addr->basic_errno > 0)
1868           respond_printf(f, ": %s", strerror(addr->basic_errno));
1869         if (addr->message)
1870           respond_printf(f, ": %s", addr->message);
1871         }
1872
1873       /* Show parents iff doing full info */
1874
1875       if (full_info) while (p)
1876         {
1877         respond_printf(f, "%s\n    <-- %s", cr, p->address);
1878         p = p->parent;
1879         }
1880       respond_printf(f, "%s\n", cr);
1881       }
1882     cancel_cutthrough_connection("routing hard fail");
1883
1884     if (!full_info)
1885       {
1886       yield = copy_error(vaddr, addr, FAIL);
1887       goto out;
1888       }
1889     yield = FAIL;
1890     }
1891
1892   /* Soft failure */
1893
1894   else if (rc == DEFER)
1895     {
1896     allok = FALSE;
1897     if (f)
1898       {
1899       address_item *p = addr->parent;
1900       respond_printf(f, "%s%s cannot be resolved at this time", ko_prefix,
1901         full_info? addr->address : address);
1902       if (!expn && admin_user)
1903         {
1904         if (addr->basic_errno > 0)
1905           respond_printf(f, ": %s", strerror(addr->basic_errno));
1906         if (addr->message)
1907           respond_printf(f, ": %s", addr->message);
1908         else if (addr->basic_errno <= 0)
1909           respond_printf(f, ": unknown error");
1910         }
1911
1912       /* Show parents iff doing full info */
1913
1914       if (full_info) while (p)
1915         {
1916         respond_printf(f, "%s\n    <-- %s", cr, p->address);
1917         p = p->parent;
1918         }
1919       respond_printf(f, "%s\n", cr);
1920       }
1921     cancel_cutthrough_connection("routing soft fail");
1922
1923     if (!full_info)
1924       {
1925       yield = copy_error(vaddr, addr, DEFER);
1926       goto out;
1927       }
1928     if (yield == OK) yield = DEFER;
1929     }
1930
1931   /* If we are handling EXPN, we do not want to continue to route beyond
1932   the top level (whose address is in "address"). */
1933
1934   else if (expn)
1935     {
1936     uschar *ok_prefix = US"250-";
1937
1938     if (!addr_new)
1939       if (!addr_local && !addr_remote)
1940         respond_printf(f, "250 mail to <%s> is discarded\r\n", address);
1941       else
1942         respond_printf(f, "250 <%s>\r\n", address);
1943
1944     else do
1945       {
1946       address_item *addr2 = addr_new;
1947       addr_new = addr2->next;
1948       if (!addr_new) ok_prefix = US"250 ";
1949       respond_printf(f, "%s<%s>\r\n", ok_prefix, addr2->address);
1950       } while (addr_new);
1951     yield = OK;
1952     goto out;
1953     }
1954
1955   /* Successful routing other than EXPN. */
1956
1957   else
1958     {
1959     /* Handle successful routing when short info wanted. Otherwise continue for
1960     other (generated) addresses. Short info is the operational case. Full info
1961     can be requested only when debug_selector != 0 and a file is supplied.
1962
1963     There is a conflict between the use of aliasing as an alternate email
1964     address, and as a sort of mailing list. If an alias turns the incoming
1965     address into just one address (e.g. J.Caesar->jc44) you may well want to
1966     carry on verifying the generated address to ensure it is valid when
1967     checking incoming mail. If aliasing generates multiple addresses, you
1968     probably don't want to do this. Exim therefore treats the generation of
1969     just a single new address as a special case, and continues on to verify the
1970     generated address. */
1971
1972     if (  !full_info                    /* Stop if short info wanted AND */
1973        && (  (  !addr_new               /* No new address OR */
1974              || addr_new->next          /* More than one new address OR */
1975              || testflag(addr_new, af_pfr)      /* New address is pfr */
1976              )
1977           ||                            /* OR */
1978              (  addr_new                /* At least one new address AND */
1979              && success_on_redirect     /* success_on_redirect is set */
1980           )  )
1981        )
1982       {
1983       if (f) fprintf(f, "%s %s\n",
1984         address, address_test_mode ? "is deliverable" : "verified");
1985
1986       /* If we have carried on to verify a child address, we want the value
1987       of $address_data to be that of the child */
1988
1989       vaddr->prop.address_data = addr->prop.address_data;
1990
1991       /* If stopped because more than one new address, cannot cutthrough */
1992
1993       if (addr_new && addr_new->next)
1994         cancel_cutthrough_connection("multiple addresses from routing");
1995
1996       yield = OK;
1997       goto out;
1998       }
1999     }
2000   }     /* Loop for generated addresses */
2001
2002 /* Display the full results of the successful routing, including any generated
2003 addresses. Control gets here only when full_info is set, which requires f not
2004 to be NULL, and this occurs only when a top-level verify is called with the
2005 debugging switch on.
2006
2007 If there are no local and no remote addresses, and there were no pipes, files,
2008 or autoreplies, and there were no errors or deferments, the message is to be
2009 discarded, usually because of the use of :blackhole: in an alias file. */
2010
2011 if (allok && !addr_local && !addr_remote)
2012   {
2013   fprintf(f, "mail to %s is discarded\n", address);
2014   goto out;
2015   }
2016
2017 for (addr_list = addr_local, i = 0; i < 2; addr_list = addr_remote, i++)
2018   while (addr_list)
2019     {
2020     address_item *addr = addr_list;
2021     address_item *p = addr->parent;
2022     transport_instance * tp = addr->transport;
2023
2024     addr_list = addr->next;
2025
2026     fprintf(f, "%s", CS addr->address);
2027 #ifdef EXPERIMENTAL_SRS
2028     if(addr->prop.srs_sender)
2029       fprintf(f, "    [srs = %s]", addr->prop.srs_sender);
2030 #endif
2031
2032     /* If the address is a duplicate, show something about it. */
2033
2034     if (!testflag(addr, af_pfr))
2035       {
2036       tree_node *tnode;
2037       if ((tnode = tree_search(tree_duplicates, addr->unique)))
2038         fprintf(f, "   [duplicate, would not be delivered]");
2039       else tree_add_duplicate(addr->unique, addr);
2040       }
2041
2042     /* Now show its parents */
2043
2044     for (p = addr->parent; p; p = p->parent)
2045       fprintf(f, "\n    <-- %s", p->address);
2046     fprintf(f, "\n  ");
2047
2048     /* Show router, and transport */
2049
2050     fprintf(f, "router = %s, transport = %s\n",
2051       addr->router->name, tp ? tp->name : US"unset");
2052
2053     /* Show any hosts that are set up by a router unless the transport
2054     is going to override them; fiddle a bit to get a nice format. */
2055
2056     if (addr->host_list && tp && !tp->overrides_hosts)
2057       {
2058       host_item *h;
2059       int maxlen = 0;
2060       int maxaddlen = 0;
2061       for (h = addr->host_list; h; h = h->next)
2062         {                               /* get max lengths of host names, addrs */
2063         int len = Ustrlen(h->name);
2064         if (len > maxlen) maxlen = len;
2065         len = h->address ? Ustrlen(h->address) : 7;
2066         if (len > maxaddlen) maxaddlen = len;
2067         }
2068       for (h = addr->host_list; h; h = h->next)
2069         {
2070         fprintf(f, "  host %-*s ", maxlen, h->name);
2071
2072         if (h->address)
2073           fprintf(f, "[%s%-*c", h->address, maxaddlen+1 - Ustrlen(h->address), ']');
2074         else if (tp->info->local)
2075           fprintf(f, " %-*s ", maxaddlen, "");  /* Omit [unknown] for local */
2076         else
2077           fprintf(f, "[%s%-*c", "unknown", maxaddlen+1 - 7, ']');
2078
2079         if (h->mx >= 0) fprintf(f, " MX=%d", h->mx);
2080         if (h->port != PORT_NONE) fprintf(f, " port=%d", h->port);
2081         if (running_in_test_harness  &&  h->dnssec == DS_YES) fputs(" AD", f);
2082         if (h->status == hstatus_unusable) fputs(" ** unusable **", f);
2083         fputc('\n', f);
2084         }
2085       }
2086     }
2087
2088 /* Yield will be DEFER or FAIL if any one address has, only for full_info (which is
2089 the -bv or -bt case). */
2090
2091 out:
2092 verify_mode = NULL;
2093 tls_modify_variables(&tls_in);
2094
2095 return yield;
2096 }
2097
2098
2099
2100
2101 /*************************************************
2102 *      Check headers for syntax errors           *
2103 *************************************************/
2104
2105 /* This function checks those header lines that contain addresses, and verifies
2106 that all the addresses therein are syntactially correct.
2107
2108 Arguments:
2109   msgptr     where to put an error message
2110
2111 Returns:     OK
2112              FAIL
2113 */
2114
2115 int
2116 verify_check_headers(uschar **msgptr)
2117 {
2118 header_line *h;
2119 uschar *colon, *s;
2120 int yield = OK;
2121
2122 for (h = header_list; h != NULL && yield == OK; h = h->next)
2123   {
2124   if (h->type != htype_from &&
2125       h->type != htype_reply_to &&
2126       h->type != htype_sender &&
2127       h->type != htype_to &&
2128       h->type != htype_cc &&
2129       h->type != htype_bcc)
2130     continue;
2131
2132   colon = Ustrchr(h->text, ':');
2133   s = colon + 1;
2134   while (isspace(*s)) s++;
2135
2136   /* Loop for multiple addresses in the header, enabling group syntax. Note
2137   that we have to reset this after the header has been scanned. */
2138
2139   parse_allow_group = TRUE;
2140
2141   while (*s != 0)
2142     {
2143     uschar *ss = parse_find_address_end(s, FALSE);
2144     uschar *recipient, *errmess;
2145     int terminator = *ss;
2146     int start, end, domain;
2147
2148     /* Temporarily terminate the string at this point, and extract the
2149     operative address within, allowing group syntax. */
2150
2151     *ss = 0;
2152     recipient = parse_extract_address(s,&errmess,&start,&end,&domain,FALSE);
2153     *ss = terminator;
2154
2155     /* Permit an unqualified address only if the message is local, or if the
2156     sending host is configured to be permitted to send them. */
2157
2158     if (recipient != NULL && domain == 0)
2159       {
2160       if (h->type == htype_from || h->type == htype_sender)
2161         {
2162         if (!allow_unqualified_sender) recipient = NULL;
2163         }
2164       else
2165         {
2166         if (!allow_unqualified_recipient) recipient = NULL;
2167         }
2168       if (recipient == NULL) errmess = US"unqualified address not permitted";
2169       }
2170
2171     /* It's an error if no address could be extracted, except for the special
2172     case of an empty address. */
2173
2174     if (recipient == NULL && Ustrcmp(errmess, "empty address") != 0)
2175       {
2176       uschar *verb = US"is";
2177       uschar *t = ss;
2178       uschar *tt = colon;
2179       int len;
2180
2181       /* Arrange not to include any white space at the end in the
2182       error message or the header name. */
2183
2184       while (t > s && isspace(t[-1])) t--;
2185       while (tt > h->text && isspace(tt[-1])) tt--;
2186
2187       /* Add the address that failed to the error message, since in a
2188       header with very many addresses it is sometimes hard to spot
2189       which one is at fault. However, limit the amount of address to
2190       quote - cases have been seen where, for example, a missing double
2191       quote in a humungous To: header creates an "address" that is longer
2192       than string_sprintf can handle. */
2193
2194       len = t - s;
2195       if (len > 1024)
2196         {
2197         len = 1024;
2198         verb = US"begins";
2199         }
2200
2201       /* deconst cast ok as we're passing a non-const to string_printing() */
2202       *msgptr = US string_printing(
2203         string_sprintf("%s: failing address in \"%.*s:\" header %s: %.*s",
2204           errmess, tt - h->text, h->text, verb, len, s));
2205
2206       yield = FAIL;
2207       break;          /* Out of address loop */
2208       }
2209
2210     /* Advance to the next address */
2211
2212     s = ss + (terminator? 1:0);
2213     while (isspace(*s)) s++;
2214     }   /* Next address */
2215
2216   parse_allow_group = FALSE;
2217   parse_found_group = FALSE;
2218   }     /* Next header unless yield has been set FALSE */
2219
2220 return yield;
2221 }
2222
2223
2224 /*************************************************
2225 *      Check header names for 8-bit characters   *
2226 *************************************************/
2227
2228 /* This function checks for invalid characters in header names. See
2229 RFC 5322, 2.2. and RFC 6532, 3.
2230
2231 Arguments:
2232   msgptr     where to put an error message
2233
2234 Returns:     OK
2235              FAIL
2236 */
2237
2238 int
2239 verify_check_header_names_ascii(uschar **msgptr)
2240 {
2241 header_line *h;
2242 uschar *colon, *s;
2243
2244 for (h = header_list; h != NULL; h = h->next)
2245   {
2246    colon = Ustrchr(h->text, ':');
2247    for(s = h->text; s < colon; s++)
2248      {
2249         if ((*s < 33) || (*s > 126))
2250         {
2251                 *msgptr = string_sprintf("Invalid character in header \"%.*s\" found",
2252                                          colon - h->text, h->text);
2253                 return FAIL;
2254         }
2255      }
2256   }
2257 return OK;
2258 }
2259
2260 /*************************************************
2261 *          Check for blind recipients            *
2262 *************************************************/
2263
2264 /* This function checks that every (envelope) recipient is mentioned in either
2265 the To: or Cc: header lines, thus detecting blind carbon copies.
2266
2267 There are two ways of scanning that could be used: either scan the header lines
2268 and tick off the recipients, or scan the recipients and check the header lines.
2269 The original proposed patch did the former, but I have chosen to do the latter,
2270 because (a) it requires no memory and (b) will use fewer resources when there
2271 are many addresses in To: and/or Cc: and only one or two envelope recipients.
2272
2273 Arguments:   none
2274 Returns:     OK    if there are no blind recipients
2275              FAIL  if there is at least one blind recipient
2276 */
2277
2278 int
2279 verify_check_notblind(void)
2280 {
2281 int i;
2282 for (i = 0; i < recipients_count; i++)
2283   {
2284   header_line *h;
2285   BOOL found = FALSE;
2286   uschar *address = recipients_list[i].address;
2287
2288   for (h = header_list; !found && h != NULL; h = h->next)
2289     {
2290     uschar *colon, *s;
2291
2292     if (h->type != htype_to && h->type != htype_cc) continue;
2293
2294     colon = Ustrchr(h->text, ':');
2295     s = colon + 1;
2296     while (isspace(*s)) s++;
2297
2298     /* Loop for multiple addresses in the header, enabling group syntax. Note
2299     that we have to reset this after the header has been scanned. */
2300
2301     parse_allow_group = TRUE;
2302
2303     while (*s != 0)
2304       {
2305       uschar *ss = parse_find_address_end(s, FALSE);
2306       uschar *recipient,*errmess;
2307       int terminator = *ss;
2308       int start, end, domain;
2309
2310       /* Temporarily terminate the string at this point, and extract the
2311       operative address within, allowing group syntax. */
2312
2313       *ss = 0;
2314       recipient = parse_extract_address(s,&errmess,&start,&end,&domain,FALSE);
2315       *ss = terminator;
2316
2317       /* If we found a valid recipient that has a domain, compare it with the
2318       envelope recipient. Local parts are compared case-sensitively, domains
2319       case-insensitively. By comparing from the start with length "domain", we
2320       include the "@" at the end, which ensures that we are comparing the whole
2321       local part of each address. */
2322
2323       if (recipient != NULL && domain != 0)
2324         {
2325         found = Ustrncmp(recipient, address, domain) == 0 &&
2326                 strcmpic(recipient + domain, address + domain) == 0;
2327         if (found) break;
2328         }
2329
2330       /* Advance to the next address */
2331
2332       s = ss + (terminator? 1:0);
2333       while (isspace(*s)) s++;
2334       }   /* Next address */
2335
2336     parse_allow_group = FALSE;
2337     parse_found_group = FALSE;
2338     }     /* Next header (if found is false) */
2339
2340   if (!found) return FAIL;
2341   }       /* Next recipient */
2342
2343 return OK;
2344 }
2345
2346
2347
2348 /*************************************************
2349 *          Find if verified sender               *
2350 *************************************************/
2351
2352 /* Usually, just a single address is verified as the sender of the message.
2353 However, Exim can be made to verify other addresses as well (often related in
2354 some way), and this is useful in some environments. There may therefore be a
2355 chain of such addresses that have previously been tested. This function finds
2356 whether a given address is on the chain.
2357
2358 Arguments:   the address to be verified
2359 Returns:     pointer to an address item, or NULL
2360 */
2361
2362 address_item *
2363 verify_checked_sender(uschar *sender)
2364 {
2365 address_item *addr;
2366 for (addr = sender_verified_list; addr != NULL; addr = addr->next)
2367   if (Ustrcmp(sender, addr->address) == 0) break;
2368 return addr;
2369 }
2370
2371
2372
2373
2374
2375 /*************************************************
2376 *             Get valid header address           *
2377 *************************************************/
2378
2379 /* Scan the originator headers of the message, looking for an address that
2380 verifies successfully. RFC 822 says:
2381
2382     o   The "Sender" field mailbox should be sent  notices  of
2383         any  problems in transport or delivery of the original
2384         messages.  If there is no  "Sender"  field,  then  the
2385         "From" field mailbox should be used.
2386
2387     o   If the "Reply-To" field exists, then the reply  should
2388         go to the addresses indicated in that field and not to
2389         the address(es) indicated in the "From" field.
2390
2391 So we check a Sender field if there is one, else a Reply_to field, else a From
2392 field. As some strange messages may have more than one of these fields,
2393 especially if they are resent- fields, check all of them if there is more than
2394 one.
2395
2396 Arguments:
2397   user_msgptr      points to where to put a user error message
2398   log_msgptr       points to where to put a log error message
2399   callout          timeout for callout check (passed to verify_address())
2400   callout_overall  overall callout timeout (ditto)
2401   callout_connect  connect callout timeout (ditto)
2402   se_mailfrom      mailfrom for verify; NULL => ""
2403   pm_mailfrom      sender for pm callout check (passed to verify_address())
2404   options          callout options (passed to verify_address())
2405   verrno           where to put the address basic_errno
2406
2407 If log_msgptr is set to something without setting user_msgptr, the caller
2408 normally uses log_msgptr for both things.
2409
2410 Returns:           result of the verification attempt: OK, FAIL, or DEFER;
2411                    FAIL is given if no appropriate headers are found
2412 */
2413
2414 int
2415 verify_check_header_address(uschar **user_msgptr, uschar **log_msgptr,
2416   int callout, int callout_overall, int callout_connect, uschar *se_mailfrom,
2417   uschar *pm_mailfrom, int options, int *verrno)
2418 {
2419 static int header_types[] = { htype_sender, htype_reply_to, htype_from };
2420 BOOL done = FALSE;
2421 int yield = FAIL;
2422 int i;
2423
2424 for (i = 0; i < 3 && !done; i++)
2425   {
2426   header_line *h;
2427   for (h = header_list; h != NULL && !done; h = h->next)
2428     {
2429     int terminator, new_ok;
2430     uschar *s, *ss, *endname;
2431
2432     if (h->type != header_types[i]) continue;
2433     s = endname = Ustrchr(h->text, ':') + 1;
2434
2435     /* Scan the addresses in the header, enabling group syntax. Note that we
2436     have to reset this after the header has been scanned. */
2437
2438     parse_allow_group = TRUE;
2439
2440     while (*s != 0)
2441       {
2442       address_item *vaddr;
2443
2444       while (isspace(*s) || *s == ',') s++;
2445       if (*s == 0) break;        /* End of header */
2446
2447       ss = parse_find_address_end(s, FALSE);
2448
2449       /* The terminator is a comma or end of header, but there may be white
2450       space preceding it (including newline for the last address). Move back
2451       past any white space so we can check against any cached envelope sender
2452       address verifications. */
2453
2454       while (isspace(ss[-1])) ss--;
2455       terminator = *ss;
2456       *ss = 0;
2457
2458       HDEBUG(D_verify) debug_printf("verifying %.*s header address %s\n",
2459         (int)(endname - h->text), h->text, s);
2460
2461       /* See if we have already verified this address as an envelope sender,
2462       and if so, use the previous answer. */
2463
2464       vaddr = verify_checked_sender(s);
2465
2466       if (vaddr != NULL &&                   /* Previously checked */
2467            (callout <= 0 ||                  /* No callout needed; OR */
2468             vaddr->special_action > 256))    /* Callout was done */
2469         {
2470         new_ok = vaddr->special_action & 255;
2471         HDEBUG(D_verify) debug_printf("previously checked as envelope sender\n");
2472         *ss = terminator;  /* Restore shortened string */
2473         }
2474
2475       /* Otherwise we run the verification now. We must restore the shortened
2476       string before running the verification, so the headers are correct, in
2477       case there is any rewriting. */
2478
2479       else
2480         {
2481         int start, end, domain;
2482         uschar *address = parse_extract_address(s, log_msgptr, &start, &end,
2483           &domain, FALSE);
2484
2485         *ss = terminator;
2486
2487         /* If we found an empty address, just carry on with the next one, but
2488         kill the message. */
2489
2490         if (address == NULL && Ustrcmp(*log_msgptr, "empty address") == 0)
2491           {
2492           *log_msgptr = NULL;
2493           s = ss;
2494           continue;
2495           }
2496
2497         /* If verification failed because of a syntax error, fail this
2498         function, and ensure that the failing address gets added to the error
2499         message. */
2500
2501         if (address == NULL)
2502           {
2503           new_ok = FAIL;
2504           while (ss > s && isspace(ss[-1])) ss--;
2505           *log_msgptr = string_sprintf("syntax error in '%.*s' header when "
2506             "scanning for sender: %s in \"%.*s\"",
2507             endname - h->text, h->text, *log_msgptr, ss - s, s);
2508           yield = FAIL;
2509           done = TRUE;
2510           break;
2511           }
2512
2513         /* Else go ahead with the sender verification. But it isn't *the*
2514         sender of the message, so set vopt_fake_sender to stop sender_address
2515         being replaced after rewriting or qualification. */
2516
2517         else
2518           {
2519           vaddr = deliver_make_addr(address, FALSE);
2520           new_ok = verify_address(vaddr, NULL, options | vopt_fake_sender,
2521             callout, callout_overall, callout_connect, se_mailfrom,
2522             pm_mailfrom, NULL);
2523           }
2524         }
2525
2526       /* We now have the result, either newly found, or cached. If we are
2527       giving out error details, set a specific user error. This means that the
2528       last of these will be returned to the user if all three fail. We do not
2529       set a log message - the generic one below will be used. */
2530
2531       if (new_ok != OK)
2532         {
2533         *verrno = vaddr->basic_errno;
2534         if (smtp_return_error_details)
2535           {
2536           *user_msgptr = string_sprintf("Rejected after DATA: "
2537             "could not verify \"%.*s\" header address\n%s: %s",
2538             endname - h->text, h->text, vaddr->address, vaddr->message);
2539           }
2540         }
2541
2542       /* Success or defer */
2543
2544       if (new_ok == OK)
2545         {
2546         yield = OK;
2547         done = TRUE;
2548         break;
2549         }
2550
2551       if (new_ok == DEFER) yield = DEFER;
2552
2553       /* Move on to any more addresses in the header */
2554
2555       s = ss;
2556       }     /* Next address */
2557
2558     parse_allow_group = FALSE;
2559     parse_found_group = FALSE;
2560     }       /* Next header, unless done */
2561   }         /* Next header type unless done */
2562
2563 if (yield == FAIL && *log_msgptr == NULL)
2564   *log_msgptr = US"there is no valid sender in any header line";
2565
2566 if (yield == DEFER && *log_msgptr == NULL)
2567   *log_msgptr = US"all attempts to verify a sender in a header line deferred";
2568
2569 return yield;
2570 }
2571
2572
2573
2574
2575 /*************************************************
2576 *            Get RFC 1413 identification         *
2577 *************************************************/
2578
2579 /* Attempt to get an id from the sending machine via the RFC 1413 protocol. If
2580 the timeout is set to zero, then the query is not done. There may also be lists
2581 of hosts and nets which are exempt. To guard against malefactors sending
2582 non-printing characters which could, for example, disrupt a message's headers,
2583 make sure the string consists of printing characters only.
2584
2585 Argument:
2586   port    the port to connect to; usually this is IDENT_PORT (113), but when
2587           running in the test harness with -bh a different value is used.
2588
2589 Returns:  nothing
2590
2591 Side effect: any received ident value is put in sender_ident (NULL otherwise)
2592 */
2593
2594 void
2595 verify_get_ident(int port)
2596 {
2597 int sock, host_af, qlen;
2598 int received_sender_port, received_interface_port, n;
2599 uschar *p;
2600 uschar buffer[2048];
2601
2602 /* Default is no ident. Check whether we want to do an ident check for this
2603 host. */
2604
2605 sender_ident = NULL;
2606 if (rfc1413_query_timeout <= 0 || verify_check_host(&rfc1413_hosts) != OK)
2607   return;
2608
2609 DEBUG(D_ident) debug_printf("doing ident callback\n");
2610
2611 /* Set up a connection to the ident port of the remote host. Bind the local end
2612 to the incoming interface address. If the sender host address is an IPv6
2613 address, the incoming interface address will also be IPv6. */
2614
2615 host_af = Ustrchr(sender_host_address, ':') == NULL ? AF_INET : AF_INET6;
2616 if ((sock = ip_socket(SOCK_STREAM, host_af)) < 0) return;
2617
2618 if (ip_bind(sock, host_af, interface_address, 0) < 0)
2619   {
2620   DEBUG(D_ident) debug_printf("bind socket for ident failed: %s\n",
2621     strerror(errno));
2622   goto END_OFF;
2623   }
2624
2625 if (ip_connect(sock, host_af, sender_host_address, port,
2626                 rfc1413_query_timeout, TRUE) < 0)
2627   {
2628   if (errno == ETIMEDOUT && LOGGING(ident_timeout))
2629     log_write(0, LOG_MAIN, "ident connection to %s timed out",
2630       sender_host_address);
2631   else
2632     DEBUG(D_ident) debug_printf("ident connection to %s failed: %s\n",
2633       sender_host_address, strerror(errno));
2634   goto END_OFF;
2635   }
2636
2637 /* Construct and send the query. */
2638
2639 sprintf(CS buffer, "%d , %d\r\n", sender_host_port, interface_port);
2640 qlen = Ustrlen(buffer);
2641 if (send(sock, buffer, qlen, 0) < 0)
2642   {
2643   DEBUG(D_ident) debug_printf("ident send failed: %s\n", strerror(errno));
2644   goto END_OFF;
2645   }
2646
2647 /* Read a response line. We put it into the rest of the buffer, using several
2648 recv() calls if necessary. */
2649
2650 p = buffer + qlen;
2651
2652 for (;;)
2653   {
2654   uschar *pp;
2655   int count;
2656   int size = sizeof(buffer) - (p - buffer);
2657
2658   if (size <= 0) goto END_OFF;   /* Buffer filled without seeing \n. */
2659   count = ip_recv(sock, p, size, rfc1413_query_timeout);
2660   if (count <= 0) goto END_OFF;  /* Read error or EOF */
2661
2662   /* Scan what we just read, to see if we have reached the terminating \r\n. Be
2663   generous, and accept a plain \n terminator as well. The only illegal
2664   character is 0. */
2665
2666   for (pp = p; pp < p + count; pp++)
2667     {
2668     if (*pp == 0) goto END_OFF;   /* Zero octet not allowed */
2669     if (*pp == '\n')
2670       {
2671       if (pp[-1] == '\r') pp--;
2672       *pp = 0;
2673       goto GOT_DATA;             /* Break out of both loops */
2674       }
2675     }
2676
2677   /* Reached the end of the data without finding \n. Let the loop continue to
2678   read some more, if there is room. */
2679
2680   p = pp;
2681   }
2682
2683 GOT_DATA:
2684
2685 /* We have received a line of data. Check it carefully. It must start with the
2686 same two port numbers that we sent, followed by data as defined by the RFC. For
2687 example,
2688
2689   12345 , 25 : USERID : UNIX :root
2690
2691 However, the amount of white space may be different to what we sent. In the
2692 "osname" field there may be several sub-fields, comma separated. The data we
2693 actually want to save follows the third colon. Some systems put leading spaces
2694 in it - we discard those. */
2695
2696 if (sscanf(CS buffer + qlen, "%d , %d%n", &received_sender_port,
2697       &received_interface_port, &n) != 2 ||
2698     received_sender_port != sender_host_port ||
2699     received_interface_port != interface_port)
2700   goto END_OFF;
2701
2702 p = buffer + qlen + n;
2703 while(isspace(*p)) p++;
2704 if (*p++ != ':') goto END_OFF;
2705 while(isspace(*p)) p++;
2706 if (Ustrncmp(p, "USERID", 6) != 0) goto END_OFF;
2707 p += 6;
2708 while(isspace(*p)) p++;
2709 if (*p++ != ':') goto END_OFF;
2710 while (*p != 0 && *p != ':') p++;
2711 if (*p++ == 0) goto END_OFF;
2712 while(isspace(*p)) p++;
2713 if (*p == 0) goto END_OFF;
2714
2715 /* The rest of the line is the data we want. We turn it into printing
2716 characters when we save it, so that it cannot mess up the format of any logging
2717 or Received: lines into which it gets inserted. We keep a maximum of 127
2718 characters. The deconst cast is ok as we fed a nonconst to string_printing() */
2719
2720 sender_ident = US string_printing(string_copyn(p, 127));
2721 DEBUG(D_ident) debug_printf("sender_ident = %s\n", sender_ident);
2722
2723 END_OFF:
2724 (void)close(sock);
2725 return;
2726 }
2727
2728
2729
2730
2731 /*************************************************
2732 *      Match host to a single host-list item     *
2733 *************************************************/
2734
2735 /* This function compares a host (name or address) against a single item
2736 from a host list. The host name gets looked up if it is needed and is not
2737 already known. The function is called from verify_check_this_host() via
2738 match_check_list(), which is why most of its arguments are in a single block.
2739
2740 Arguments:
2741   arg            the argument block (see below)
2742   ss             the host-list item
2743   valueptr       where to pass back looked up data, or NULL
2744   error          for error message when returning ERROR
2745
2746 The block contains:
2747   host_name      (a) the host name, or
2748                  (b) NULL, implying use sender_host_name and
2749                        sender_host_aliases, looking them up if required, or
2750                  (c) the empty string, meaning that only IP address matches
2751                        are permitted
2752   host_address   the host address
2753   host_ipv4      the IPv4 address taken from an IPv6 one
2754
2755 Returns:         OK      matched
2756                  FAIL    did not match
2757                  DEFER   lookup deferred
2758                  ERROR   (a) failed to find the host name or IP address, or
2759                          (b) unknown lookup type specified, or
2760                          (c) host name encountered when only IP addresses are
2761                                being matched
2762 */
2763
2764 int
2765 check_host(void *arg, const uschar *ss, const uschar **valueptr, uschar **error)
2766 {
2767 check_host_block *cb = (check_host_block *)arg;
2768 int mlen = -1;
2769 int maskoffset;
2770 BOOL iplookup = FALSE;
2771 BOOL isquery = FALSE;
2772 BOOL isiponly = cb->host_name != NULL && cb->host_name[0] == 0;
2773 const uschar *t;
2774 uschar *semicolon;
2775 uschar **aliases;
2776
2777 /* Optimize for the special case when the pattern is "*". */
2778
2779 if (*ss == '*' && ss[1] == 0) return OK;
2780
2781 /* If the pattern is empty, it matches only in the case when there is no host -
2782 this can occur in ACL checking for SMTP input using the -bs option. In this
2783 situation, the host address is the empty string. */
2784
2785 if (cb->host_address[0] == 0) return (*ss == 0)? OK : FAIL;
2786 if (*ss == 0) return FAIL;
2787
2788 /* If the pattern is precisely "@" then match against the primary host name,
2789 provided that host name matching is permitted; if it's "@[]" match against the
2790 local host's IP addresses. */
2791
2792 if (*ss == '@')
2793   {
2794   if (ss[1] == 0)
2795     {
2796     if (isiponly) return ERROR;
2797     ss = primary_hostname;
2798     }
2799   else if (Ustrcmp(ss, "@[]") == 0)
2800     {
2801     ip_address_item *ip;
2802     for (ip = host_find_interfaces(); ip != NULL; ip = ip->next)
2803       if (Ustrcmp(ip->address, cb->host_address) == 0) return OK;
2804     return FAIL;
2805     }
2806   }
2807
2808 /* If the pattern is an IP address, optionally followed by a bitmask count, do
2809 a (possibly masked) comparison with the current IP address. */
2810
2811 if (string_is_ip_address(ss, &maskoffset) != 0)
2812   return (host_is_in_net(cb->host_address, ss, maskoffset)? OK : FAIL);
2813
2814 /* The pattern is not an IP address. A common error that people make is to omit
2815 one component of an IPv4 address, either by accident, or believing that, for
2816 example, 1.2.3/24 is the same as 1.2.3.0/24, or 1.2.3 is the same as 1.2.3.0,
2817 which it isn't. (Those applications that do accept 1.2.3 as an IP address
2818 interpret it as 1.2.0.3 because the final component becomes 16-bit - this is an
2819 ancient specification.) To aid in debugging these cases, we give a specific
2820 error if the pattern contains only digits and dots or contains a slash preceded
2821 only by digits and dots (a slash at the start indicates a file name and of
2822 course slashes may be present in lookups, but not preceded only by digits and
2823 dots). */
2824
2825 for (t = ss; isdigit(*t) || *t == '.'; t++);
2826 if (*t == 0 || (*t == '/' && t != ss))
2827   {
2828   *error = US"malformed IPv4 address or address mask";
2829   return ERROR;
2830   }
2831
2832 /* See if there is a semicolon in the pattern */
2833
2834 semicolon = Ustrchr(ss, ';');
2835
2836 /* If we are doing an IP address only match, then all lookups must be IP
2837 address lookups, even if there is no "net-". */
2838
2839 if (isiponly)
2840   {
2841   iplookup = semicolon != NULL;
2842   }
2843
2844 /* Otherwise, if the item is of the form net[n]-lookup;<file|query> then it is
2845 a lookup on a masked IP network, in textual form. We obey this code even if we
2846 have already set iplookup, so as to skip over the "net-" prefix and to set the
2847 mask length. The net- stuff really only applies to single-key lookups where the
2848 key is implicit. For query-style lookups the key is specified in the query.
2849 From release 4.30, the use of net- for query style is no longer needed, but we
2850 retain it for backward compatibility. */
2851
2852 if (Ustrncmp(ss, "net", 3) == 0 && semicolon != NULL)
2853   {
2854   mlen = 0;
2855   for (t = ss + 3; isdigit(*t); t++) mlen = mlen * 10 + *t - '0';
2856   if (mlen == 0 && t == ss+3) mlen = -1;  /* No mask supplied */
2857   iplookup = (*t++ == '-');
2858   }
2859 else t = ss;
2860
2861 /* Do the IP address lookup if that is indeed what we have */
2862
2863 if (iplookup)
2864   {
2865   int insize;
2866   int search_type;
2867   int incoming[4];
2868   void *handle;
2869   uschar *filename, *key, *result;
2870   uschar buffer[64];
2871
2872   /* Find the search type */
2873
2874   search_type = search_findtype(t, semicolon - t);
2875
2876   if (search_type < 0) log_write(0, LOG_MAIN|LOG_PANIC_DIE, "%s",
2877     search_error_message);
2878
2879   /* Adjust parameters for the type of lookup. For a query-style lookup, there
2880   is no file name, and the "key" is just the query. For query-style with a file
2881   name, we have to fish the file off the start of the query. For a single-key
2882   lookup, the key is the current IP address, masked appropriately, and
2883   reconverted to text form, with the mask appended. For IPv6 addresses, specify
2884   dot separators instead of colons, except when the lookup type is "iplsearch".
2885   */
2886
2887   if (mac_islookup(search_type, lookup_absfilequery))
2888     {
2889     filename = semicolon + 1;
2890     key = filename;
2891     while (*key != 0 && !isspace(*key)) key++;
2892     filename = string_copyn(filename, key - filename);
2893     while (isspace(*key)) key++;
2894     }
2895   else if (mac_islookup(search_type, lookup_querystyle))
2896     {
2897     filename = NULL;
2898     key = semicolon + 1;
2899     }
2900   else   /* Single-key style */
2901     {
2902     int sep = (Ustrcmp(lookup_list[search_type]->name, "iplsearch") == 0)?
2903       ':' : '.';
2904     insize = host_aton(cb->host_address, incoming);
2905     host_mask(insize, incoming, mlen);
2906     (void)host_nmtoa(insize, incoming, mlen, buffer, sep);
2907     key = buffer;
2908     filename = semicolon + 1;
2909     }
2910
2911   /* Now do the actual lookup; note that there is no search_close() because
2912   of the caching arrangements. */
2913
2914   if (!(handle = search_open(filename, search_type, 0, NULL, NULL)))
2915     log_write(0, LOG_MAIN|LOG_PANIC_DIE, "%s", search_error_message);
2916
2917   result = search_find(handle, filename, key, -1, NULL, 0, 0, NULL);
2918   if (valueptr != NULL) *valueptr = result;
2919   return (result != NULL)? OK : search_find_defer? DEFER: FAIL;
2920   }
2921
2922 /* The pattern is not an IP address or network reference of any kind. That is,
2923 it is a host name pattern. If this is an IP only match, there's an error in the
2924 host list. */
2925
2926 if (isiponly)
2927   {
2928   *error = US"cannot match host name in match_ip list";
2929   return ERROR;
2930   }
2931
2932 /* Check the characters of the pattern to see if they comprise only letters,
2933 digits, full stops, and hyphens (the constituents of domain names). Allow
2934 underscores, as they are all too commonly found. Sigh. Also, if
2935 allow_utf8_domains is set, allow top-bit characters. */
2936
2937 for (t = ss; *t != 0; t++)
2938   if (!isalnum(*t) && *t != '.' && *t != '-' && *t != '_' &&
2939       (!allow_utf8_domains || *t < 128)) break;
2940
2941 /* If the pattern is a complete domain name, with no fancy characters, look up
2942 its IP address and match against that. Note that a multi-homed host will add
2943 items to the chain. */
2944
2945 if (*t == 0)
2946   {
2947   int rc;
2948   host_item h;
2949   h.next = NULL;
2950   h.name = ss;
2951   h.address = NULL;
2952   h.mx = MX_NONE;
2953
2954   /* Using byname rather than bydns here means we cannot determine dnssec
2955   status.  On the other hand it is unclear how that could be either
2956   propagated up or enforced. */
2957
2958   rc = host_find_byname(&h, NULL, HOST_FIND_QUALIFY_SINGLE, NULL, FALSE);
2959   if (rc == HOST_FOUND || rc == HOST_FOUND_LOCAL)
2960     {
2961     host_item *hh;
2962     for (hh = &h; hh != NULL; hh = hh->next)
2963       {
2964       if (host_is_in_net(hh->address, cb->host_address, 0)) return OK;
2965       }
2966     return FAIL;
2967     }
2968   if (rc == HOST_FIND_AGAIN) return DEFER;
2969   *error = string_sprintf("failed to find IP address for %s", ss);
2970   return ERROR;
2971   }
2972
2973 /* Almost all subsequent comparisons require the host name, and can be done
2974 using the general string matching function. When this function is called for
2975 outgoing hosts, the name is always given explicitly. If it is NULL, it means we
2976 must use sender_host_name and its aliases, looking them up if necessary. */
2977
2978 if (cb->host_name != NULL)   /* Explicit host name given */
2979   return match_check_string(cb->host_name, ss, -1, TRUE, TRUE, TRUE,
2980     valueptr);
2981
2982 /* Host name not given; in principle we need the sender host name and its
2983 aliases. However, for query-style lookups, we do not need the name if the
2984 query does not contain $sender_host_name. From release 4.23, a reference to
2985 $sender_host_name causes it to be looked up, so we don't need to do the lookup
2986 on spec. */
2987
2988 if ((semicolon = Ustrchr(ss, ';')) != NULL)
2989   {
2990   const uschar *affix;
2991   int partial, affixlen, starflags, id;
2992
2993   *semicolon = 0;
2994   id = search_findtype_partial(ss, &partial, &affix, &affixlen, &starflags);
2995   *semicolon=';';
2996
2997   if (id < 0)                           /* Unknown lookup type */
2998     {
2999     log_write(0, LOG_MAIN|LOG_PANIC, "%s in host list item \"%s\"",
3000       search_error_message, ss);
3001     return DEFER;
3002     }
3003   isquery = mac_islookup(id, lookup_querystyle|lookup_absfilequery);
3004   }
3005
3006 if (isquery)
3007   {
3008   switch(match_check_string(US"", ss, -1, TRUE, TRUE, TRUE, valueptr))
3009     {
3010     case OK:    return OK;
3011     case DEFER: return DEFER;
3012     default:    return FAIL;
3013     }
3014   }
3015
3016 /* Not a query-style lookup; must ensure the host name is present, and then we
3017 do a check on the name and all its aliases. */
3018
3019 if (sender_host_name == NULL)
3020   {
3021   HDEBUG(D_host_lookup)
3022     debug_printf("sender host name required, to match against %s\n", ss);
3023   if (host_lookup_failed || host_name_lookup() != OK)
3024     {
3025     *error = string_sprintf("failed to find host name for %s",
3026       sender_host_address);;
3027     return ERROR;
3028     }
3029   host_build_sender_fullhost();
3030   }
3031
3032 /* Match on the sender host name, using the general matching function */
3033
3034 switch(match_check_string(sender_host_name, ss, -1, TRUE, TRUE, TRUE,
3035        valueptr))
3036   {
3037   case OK:    return OK;
3038   case DEFER: return DEFER;
3039   }
3040
3041 /* If there are aliases, try matching on them. */
3042
3043 aliases = sender_host_aliases;
3044 while (*aliases != NULL)
3045   {
3046   switch(match_check_string(*aliases++, ss, -1, TRUE, TRUE, TRUE, valueptr))
3047     {
3048     case OK:    return OK;
3049     case DEFER: return DEFER;
3050     }
3051   }
3052 return FAIL;
3053 }
3054
3055
3056
3057
3058 /*************************************************
3059 *    Check a specific host matches a host list   *
3060 *************************************************/
3061
3062 /* This function is passed a host list containing items in a number of
3063 different formats and the identity of a host. Its job is to determine whether
3064 the given host is in the set of hosts defined by the list. The host name is
3065 passed as a pointer so that it can be looked up if needed and not already
3066 known. This is commonly the case when called from verify_check_host() to check
3067 an incoming connection. When called from elsewhere the host name should usually
3068 be set.
3069
3070 This function is now just a front end to match_check_list(), which runs common
3071 code for scanning a list. We pass it the check_host() function to perform a
3072 single test.
3073
3074 Arguments:
3075   listptr              pointer to the host list
3076   cache_bits           pointer to cache for named lists, or NULL
3077   host_name            the host name or NULL, implying use sender_host_name and
3078                          sender_host_aliases, looking them up if required
3079   host_address         the IP address
3080   valueptr             if not NULL, data from a lookup is passed back here
3081
3082 Returns:    OK    if the host is in the defined set
3083             FAIL  if the host is not in the defined set,
3084             DEFER if a data lookup deferred (not a host lookup)
3085
3086 If the host name was needed in order to make a comparison, and could not be
3087 determined from the IP address, the result is FAIL unless the item
3088 "+allow_unknown" was met earlier in the list, in which case OK is returned. */
3089
3090 int
3091 verify_check_this_host(const uschar **listptr, unsigned int *cache_bits,
3092   const uschar *host_name, const uschar *host_address, const uschar **valueptr)
3093 {
3094 int rc;
3095 unsigned int *local_cache_bits = cache_bits;
3096 const uschar *save_host_address = deliver_host_address;
3097 check_host_block cb;
3098 cb.host_name = host_name;
3099 cb.host_address = host_address;
3100
3101 if (valueptr != NULL) *valueptr = NULL;
3102
3103 /* If the host address starts off ::ffff: it is an IPv6 address in
3104 IPv4-compatible mode. Find the IPv4 part for checking against IPv4
3105 addresses. */
3106
3107 cb.host_ipv4 = (Ustrncmp(host_address, "::ffff:", 7) == 0)?
3108   host_address + 7 : host_address;
3109
3110 /* During the running of the check, put the IP address into $host_address. In
3111 the case of calls from the smtp transport, it will already be there. However,
3112 in other calls (e.g. when testing ignore_target_hosts), it won't. Just to be on
3113 the safe side, any existing setting is preserved, though as I write this
3114 (November 2004) I can't see any cases where it is actually needed. */
3115
3116 deliver_host_address = host_address;
3117 rc = match_check_list(
3118        listptr,                                /* the list */
3119        0,                                      /* separator character */
3120        &hostlist_anchor,                       /* anchor pointer */
3121        &local_cache_bits,                      /* cache pointer */
3122        check_host,                             /* function for testing */
3123        &cb,                                    /* argument for function */
3124        MCL_HOST,                               /* type of check */
3125        (host_address == sender_host_address)?
3126          US"host" : host_address,              /* text for debugging */
3127        valueptr);                              /* where to pass back data */
3128 deliver_host_address = save_host_address;
3129 return rc;
3130 }
3131
3132
3133
3134
3135 /*************************************************
3136 *      Check the given host item matches a list  *
3137 *************************************************/
3138 int
3139 verify_check_given_host(uschar **listptr, host_item *host)
3140 {
3141 return verify_check_this_host(CUSS listptr, NULL, host->name, host->address, NULL);
3142 }
3143
3144 /*************************************************
3145 *      Check the remote host matches a list      *
3146 *************************************************/
3147
3148 /* This is a front end to verify_check_this_host(), created because checking
3149 the remote host is a common occurrence. With luck, a good compiler will spot
3150 the tail recursion and optimize it. If there's no host address, this is
3151 command-line SMTP input - check against an empty string for the address.
3152
3153 Arguments:
3154   listptr              pointer to the host list
3155
3156 Returns:               the yield of verify_check_this_host(),
3157                        i.e. OK, FAIL, or DEFER
3158 */
3159
3160 int
3161 verify_check_host(uschar **listptr)
3162 {
3163 return verify_check_this_host(CUSS listptr, sender_host_cache, NULL,
3164   (sender_host_address == NULL)? US"" : sender_host_address, NULL);
3165 }
3166
3167
3168
3169
3170
3171 /*************************************************
3172 *              Invert an IP address              *
3173 *************************************************/
3174
3175 /* Originally just used for DNS xBL lists, now also used for the
3176 reverse_ip expansion operator.
3177
3178 Arguments:
3179   buffer         where to put the answer
3180   address        the address to invert
3181 */
3182
3183 void
3184 invert_address(uschar *buffer, uschar *address)
3185 {
3186 int bin[4];
3187 uschar *bptr = buffer;
3188
3189 /* If this is an IPv4 address mapped into IPv6 format, adjust the pointer
3190 to the IPv4 part only. */
3191
3192 if (Ustrncmp(address, "::ffff:", 7) == 0) address += 7;
3193
3194 /* Handle IPv4 address: when HAVE_IPV6 is false, the result of host_aton() is
3195 always 1. */
3196
3197 if (host_aton(address, bin) == 1)
3198   {
3199   int i;
3200   int x = bin[0];
3201   for (i = 0; i < 4; i++)
3202     {
3203     sprintf(CS bptr, "%d.", x & 255);
3204     while (*bptr) bptr++;
3205     x >>= 8;
3206     }
3207   }
3208
3209 /* Handle IPv6 address. Actually, as far as I know, there are no IPv6 addresses
3210 in any DNS black lists, and the format in which they will be looked up is
3211 unknown. This is just a guess. */
3212
3213 #if HAVE_IPV6
3214 else
3215   {
3216   int i, j;
3217   for (j = 3; j >= 0; j--)
3218     {
3219     int x = bin[j];
3220     for (i = 0; i < 8; i++)
3221       {
3222       sprintf(CS bptr, "%x.", x & 15);
3223       while (*bptr) bptr++;
3224       x >>= 4;
3225       }
3226     }
3227   }
3228 #endif
3229
3230 /* Remove trailing period -- this is needed so that both arbitrary
3231 dnsbl keydomains and inverted addresses may be combined with the
3232 same format string, "%s.%s" */
3233
3234 *(--bptr) = 0;
3235 }
3236
3237
3238
3239 /*************************************************
3240 *          Perform a single dnsbl lookup         *
3241 *************************************************/
3242
3243 /* This function is called from verify_check_dnsbl() below. It is also called
3244 recursively from within itself when domain and domain_txt are different
3245 pointers, in order to get the TXT record from the alternate domain.
3246
3247 Arguments:
3248   domain         the outer dnsbl domain
3249   domain_txt     alternate domain to lookup TXT record on success; when the
3250                    same domain is to be used, domain_txt == domain (that is,
3251                    the pointers must be identical, not just the text)
3252   keydomain      the current keydomain (for debug message)
3253   prepend        subdomain to lookup (like keydomain, but
3254                    reversed if IP address)
3255   iplist         the list of matching IP addresses, or NULL for "any"
3256   bitmask        true if bitmask matching is wanted
3257   match_type     condition for 'succeed' result
3258                    0 => Any RR in iplist     (=)
3259                    1 => No RR in iplist      (!=)
3260                    2 => All RRs in iplist    (==)
3261                    3 => Some RRs not in iplist (!==)
3262                    the two bits are defined as MT_NOT and MT_ALL
3263   defer_return   what to return for a defer
3264
3265 Returns:         OK if lookup succeeded
3266                  FAIL if not
3267 */
3268
3269 static int
3270 one_check_dnsbl(uschar *domain, uschar *domain_txt, uschar *keydomain,
3271   uschar *prepend, uschar *iplist, BOOL bitmask, int match_type,
3272   int defer_return)
3273 {
3274 dns_answer dnsa;
3275 dns_scan dnss;
3276 tree_node *t;
3277 dnsbl_cache_block *cb;
3278 int old_pool = store_pool;
3279 uschar query[256];         /* DNS domain max length */
3280
3281 /* Construct the specific query domainname */
3282
3283 if (!string_format(query, sizeof(query), "%s.%s", prepend, domain))
3284   {
3285   log_write(0, LOG_MAIN|LOG_PANIC, "dnslist query is too long "
3286     "(ignored): %s...", query);
3287   return FAIL;
3288   }
3289
3290 /* Look for this query in the cache. */
3291
3292 if (  (t = tree_search(dnsbl_cache, query))
3293    && (cb = t->data.ptr)->expiry > time(NULL)
3294    )
3295
3296 /* Previous lookup was cached */
3297
3298   {
3299   HDEBUG(D_dnsbl) debug_printf("using result of previous DNS lookup\n");
3300   }
3301
3302 /* If not cached from a previous lookup, we must do a DNS lookup, and
3303 cache the result in permanent memory. */
3304
3305 else
3306   {
3307   uint ttl = 3600;
3308
3309   store_pool = POOL_PERM;
3310
3311   if (t)
3312     {
3313     HDEBUG(D_dnsbl) debug_printf("cached data found but past valid time; ");
3314     }
3315
3316   else
3317     {   /* Set up a tree entry to cache the lookup */
3318     t = store_get(sizeof(tree_node) + Ustrlen(query));
3319     Ustrcpy(t->name, query);
3320     t->data.ptr = cb = store_get(sizeof(dnsbl_cache_block));
3321     (void)tree_insertnode(&dnsbl_cache, t);
3322     }
3323
3324   /* Do the DNS lookup . */
3325
3326   HDEBUG(D_dnsbl) debug_printf("new DNS lookup for %s\n", query);
3327   cb->rc = dns_basic_lookup(&dnsa, query, T_A);
3328   cb->text_set = FALSE;
3329   cb->text = NULL;
3330   cb->rhs = NULL;
3331
3332   /* If the lookup succeeded, cache the RHS address. The code allows for
3333   more than one address - this was for complete generality and the possible
3334   use of A6 records. However, A6 records have been reduced to experimental
3335   status (August 2001) and may die out. So they may never get used at all,
3336   let alone in dnsbl records. However, leave the code here, just in case.
3337
3338   Quite apart from one A6 RR generating multiple addresses, there are DNS
3339   lists that return more than one A record, so we must handle multiple
3340   addresses generated in that way as well.
3341
3342   Mark the cache entry with the "now" plus the minimum of the address TTLs,
3343   or some suitably far-future time if none were found. */
3344
3345   if (cb->rc == DNS_SUCCEED)
3346     {
3347     dns_record *rr;
3348     dns_address **addrp = &(cb->rhs);
3349     for (rr = dns_next_rr(&dnsa, &dnss, RESET_ANSWERS);
3350          rr;
3351          rr = dns_next_rr(&dnsa, &dnss, RESET_NEXT))
3352       {
3353       if (rr->type == T_A)
3354         {
3355         dns_address *da = dns_address_from_rr(&dnsa, rr);
3356         if (da)
3357           {
3358           *addrp = da;
3359           while (da->next != NULL) da = da->next;
3360           addrp = &(da->next);
3361           if (ttl > rr->ttl) ttl = rr->ttl;
3362           }
3363         }
3364       }
3365
3366     /* If we didn't find any A records, change the return code. This can
3367     happen when there is a CNAME record but there are no A records for what
3368     it points to. */
3369
3370     if (cb->rhs == NULL) cb->rc = DNS_NODATA;
3371     }
3372
3373   cb->expiry = time(NULL)+ttl;
3374   store_pool = old_pool;
3375   }
3376
3377 /* We now have the result of the DNS lookup, either newly done, or cached
3378 from a previous call. If the lookup succeeded, check against the address
3379 list if there is one. This may be a positive equality list (introduced by
3380 "="), a negative equality list (introduced by "!="), a positive bitmask
3381 list (introduced by "&"), or a negative bitmask list (introduced by "!&").*/
3382
3383 if (cb->rc == DNS_SUCCEED)
3384   {
3385   dns_address *da = NULL;
3386   uschar *addlist = cb->rhs->address;
3387
3388   /* For A and AAAA records, there may be multiple addresses from multiple
3389   records. For A6 records (currently not expected to be used) there may be
3390   multiple addresses from a single record. */
3391
3392   for (da = cb->rhs->next; da != NULL; da = da->next)
3393     addlist = string_sprintf("%s, %s", addlist, da->address);
3394
3395   HDEBUG(D_dnsbl) debug_printf("DNS lookup for %s succeeded (yielding %s)\n",
3396     query, addlist);
3397
3398   /* Address list check; this can be either for equality, or via a bitmask.
3399   In the latter case, all the bits must match. */
3400
3401   if (iplist != NULL)
3402     {
3403     for (da = cb->rhs; da != NULL; da = da->next)
3404       {
3405       int ipsep = ',';
3406       uschar ip[46];
3407       const uschar *ptr = iplist;
3408       uschar *res;
3409
3410       /* Handle exact matching */
3411
3412       if (!bitmask)
3413         {
3414         while ((res = string_nextinlist(&ptr, &ipsep, ip, sizeof(ip))) != NULL)
3415           {
3416           if (Ustrcmp(CS da->address, ip) == 0) break;
3417           }
3418         }
3419
3420       /* Handle bitmask matching */
3421
3422       else
3423         {
3424         int address[4];
3425         int mask = 0;
3426
3427         /* At present, all known DNS blocking lists use A records, with
3428         IPv4 addresses on the RHS encoding the information they return. I
3429         wonder if this will linger on as the last vestige of IPv4 when IPv6
3430         is ubiquitous? Anyway, for now we use paranoia code to completely
3431         ignore IPv6 addresses. The default mask is 0, which always matches.
3432         We change this only for IPv4 addresses in the list. */
3433
3434         if (host_aton(da->address, address) == 1) mask = address[0];
3435
3436         /* Scan the returned addresses, skipping any that are IPv6 */
3437
3438         while ((res = string_nextinlist(&ptr, &ipsep, ip, sizeof(ip))) != NULL)
3439           {
3440           if (host_aton(ip, address) != 1) continue;
3441           if ((address[0] & mask) == address[0]) break;
3442           }
3443         }
3444
3445       /* If either
3446
3447          (a) An IP address in an any ('=') list matched, or
3448          (b) No IP address in an all ('==') list matched
3449
3450       then we're done searching. */
3451
3452       if (((match_type & MT_ALL) != 0) == (res == NULL)) break;
3453       }
3454
3455     /* If da == NULL, either
3456
3457        (a) No IP address in an any ('=') list matched, or
3458        (b) An IP address in an all ('==') list didn't match
3459
3460     so behave as if the DNSBL lookup had not succeeded, i.e. the host is not on
3461     the list. */
3462
3463     if ((match_type == MT_NOT || match_type == MT_ALL) != (da == NULL))
3464       {
3465       HDEBUG(D_dnsbl)
3466         {
3467         uschar *res = NULL;
3468         switch(match_type)
3469           {
3470           case 0:
3471           res = US"was no match";
3472           break;
3473           case MT_NOT:
3474           res = US"was an exclude match";
3475           break;
3476           case MT_ALL:
3477           res = US"was an IP address that did not match";
3478           break;
3479           case MT_NOT|MT_ALL:
3480           res = US"were no IP addresses that did not match";
3481           break;
3482           }
3483         debug_printf("=> but we are not accepting this block class because\n");
3484         debug_printf("=> there %s for %s%c%s\n",
3485           res,
3486           ((match_type & MT_ALL) == 0)? "" : "=",
3487           bitmask? '&' : '=', iplist);
3488         }
3489       return FAIL;
3490       }
3491     }
3492
3493   /* Either there was no IP list, or the record matched, implying that the
3494   domain is on the list. We now want to find a corresponding TXT record. If an
3495   alternate domain is specified for the TXT record, call this function
3496   recursively to look that up; this has the side effect of re-checking that
3497   there is indeed an A record at the alternate domain. */
3498
3499   if (domain_txt != domain)
3500     return one_check_dnsbl(domain_txt, domain_txt, keydomain, prepend, NULL,
3501       FALSE, match_type, defer_return);
3502
3503   /* If there is no alternate domain, look up a TXT record in the main domain
3504   if it has not previously been cached. */
3505
3506   if (!cb->text_set)
3507     {
3508     cb->text_set = TRUE;
3509     if (dns_basic_lookup(&dnsa, query, T_TXT) == DNS_SUCCEED)
3510       {
3511       dns_record *rr;
3512       for (rr = dns_next_rr(&dnsa, &dnss, RESET_ANSWERS);
3513            rr != NULL;
3514            rr = dns_next_rr(&dnsa, &dnss, RESET_NEXT))
3515         if (rr->type == T_TXT) break;
3516       if (rr != NULL)
3517         {
3518         int len = (rr->data)[0];
3519         if (len > 511) len = 127;
3520         store_pool = POOL_PERM;
3521         cb->text = string_sprintf("%.*s", len, (const uschar *)(rr->data+1));
3522         store_pool = old_pool;
3523         }
3524       }
3525     }
3526
3527   dnslist_value = addlist;
3528   dnslist_text = cb->text;
3529   return OK;
3530   }
3531
3532 /* There was a problem with the DNS lookup */
3533
3534 if (cb->rc != DNS_NOMATCH && cb->rc != DNS_NODATA)
3535   {
3536   log_write(L_dnslist_defer, LOG_MAIN,
3537     "DNS list lookup defer (probably timeout) for %s: %s", query,
3538     (defer_return == OK)?   US"assumed in list" :
3539     (defer_return == FAIL)? US"assumed not in list" :
3540                             US"returned DEFER");
3541   return defer_return;
3542   }
3543
3544 /* No entry was found in the DNS; continue for next domain */
3545
3546 HDEBUG(D_dnsbl)
3547   {
3548   debug_printf("DNS lookup for %s failed\n", query);
3549   debug_printf("=> that means %s is not listed at %s\n",
3550      keydomain, domain);
3551   }
3552
3553 return FAIL;
3554 }
3555
3556
3557
3558
3559 /*************************************************
3560 *        Check host against DNS black lists      *
3561 *************************************************/
3562
3563 /* This function runs checks against a list of DNS black lists, until one
3564 matches. Each item on the list can be of the form
3565
3566   domain=ip-address/key
3567
3568 The domain is the right-most domain that is used for the query, for example,
3569 blackholes.mail-abuse.org. If the IP address is present, there is a match only
3570 if the DNS lookup returns a matching IP address. Several addresses may be
3571 given, comma-separated, for example: x.y.z=127.0.0.1,127.0.0.2.
3572
3573 If no key is given, what is looked up in the domain is the inverted IP address
3574 of the current client host. If a key is given, it is used to construct the
3575 domain for the lookup. For example:
3576
3577   dsn.rfc-ignorant.org/$sender_address_domain
3578
3579 After finding a match in the DNS, the domain is placed in $dnslist_domain, and
3580 then we check for a TXT record for an error message, and if found, save its
3581 value in $dnslist_text. We also cache everything in a tree, to optimize
3582 multiple lookups.
3583
3584 The TXT record is normally looked up in the same domain as the A record, but
3585 when many lists are combined in a single DNS domain, this will not be a very
3586 specific message. It is possible to specify a different domain for looking up
3587 TXT records; this is given before the main domain, comma-separated. For
3588 example:
3589
3590   dnslists = http.dnsbl.sorbs.net,dnsbl.sorbs.net=127.0.0.2 : \
3591              socks.dnsbl.sorbs.net,dnsbl.sorbs.net=127.0.0.3
3592
3593 The caching ensures that only one lookup in dnsbl.sorbs.net is done.
3594
3595 Note: an address for testing RBL is 192.203.178.39
3596 Note: an address for testing DUL is 192.203.178.4
3597 Note: a domain for testing RFCI is example.tld.dsn.rfc-ignorant.org
3598
3599 Arguments:
3600   where        the acl type
3601   listptr      the domain/address/data list
3602   log_msgptr   log message on error
3603
3604 Returns:    OK      successful lookup (i.e. the address is on the list), or
3605                       lookup deferred after +include_unknown
3606             FAIL    name not found, or no data found for the given type, or
3607                       lookup deferred after +exclude_unknown (default)
3608             DEFER   lookup failure, if +defer_unknown was set
3609 */
3610
3611 int
3612 verify_check_dnsbl(int where, const uschar ** listptr, uschar ** log_msgptr)
3613 {
3614 int sep = 0;
3615 int defer_return = FAIL;
3616 const uschar *list = *listptr;
3617 uschar *domain;
3618 uschar *s;
3619 uschar buffer[1024];
3620 uschar revadd[128];        /* Long enough for IPv6 address */
3621
3622 /* Indicate that the inverted IP address is not yet set up */
3623
3624 revadd[0] = 0;
3625
3626 /* In case this is the first time the DNS resolver is being used. */
3627
3628 dns_init(FALSE, FALSE, FALSE);  /*XXX dnssec? */
3629
3630 /* Loop through all the domains supplied, until something matches */
3631
3632 while ((domain = string_nextinlist(&list, &sep, buffer, sizeof(buffer))) != NULL)
3633   {
3634   int rc;
3635   BOOL bitmask = FALSE;
3636   int match_type = 0;
3637   uschar *domain_txt;
3638   uschar *comma;
3639   uschar *iplist;
3640   uschar *key;
3641
3642   HDEBUG(D_dnsbl) debug_printf("DNS list check: %s\n", domain);
3643
3644   /* Deal with special values that change the behaviour on defer */
3645
3646   if (domain[0] == '+')
3647     {
3648     if      (strcmpic(domain, US"+include_unknown") == 0) defer_return = OK;
3649     else if (strcmpic(domain, US"+exclude_unknown") == 0) defer_return = FAIL;
3650     else if (strcmpic(domain, US"+defer_unknown") == 0)   defer_return = DEFER;
3651     else
3652       log_write(0, LOG_MAIN|LOG_PANIC, "unknown item in dnslist (ignored): %s",
3653         domain);
3654     continue;
3655     }
3656
3657   /* See if there's explicit data to be looked up */
3658
3659   if ((key = Ustrchr(domain, '/'))) *key++ = 0;
3660
3661   /* See if there's a list of addresses supplied after the domain name. This is
3662   introduced by an = or a & character; if preceded by = we require all matches
3663   and if preceded by ! we invert the result. */
3664
3665   if (!(iplist = Ustrchr(domain, '=')))
3666     {
3667     bitmask = TRUE;
3668     iplist = Ustrchr(domain, '&');
3669     }
3670
3671   if (iplist)                                  /* Found either = or & */
3672     {
3673     if (iplist > domain && iplist[-1] == '!')  /* Handle preceding ! */
3674       {
3675       match_type |= MT_NOT;
3676       iplist[-1] = 0;
3677       }
3678
3679     *iplist++ = 0;                             /* Terminate domain, move on */
3680
3681     /* If we found = (bitmask == FALSE), check for == or =& */
3682
3683     if (!bitmask && (*iplist == '=' || *iplist == '&'))
3684       {
3685       bitmask = *iplist++ == '&';
3686       match_type |= MT_ALL;
3687       }
3688     }
3689
3690
3691   /* If there is a comma in the domain, it indicates that a second domain for
3692   looking up TXT records is provided, before the main domain. Otherwise we must
3693   set domain_txt == domain. */
3694
3695   domain_txt = domain;
3696   comma = Ustrchr(domain, ',');
3697   if (comma != NULL)
3698     {
3699     *comma++ = 0;
3700     domain = comma;
3701     }
3702
3703   /* Check that what we have left is a sensible domain name. There is no reason
3704   why these domains should in fact use the same syntax as hosts and email
3705   domains, but in practice they seem to. However, there is little point in
3706   actually causing an error here, because that would no doubt hold up incoming
3707   mail. Instead, I'll just log it. */
3708
3709   for (s = domain; *s != 0; s++)
3710     {
3711     if (!isalnum(*s) && *s != '-' && *s != '.' && *s != '_')
3712       {
3713       log_write(0, LOG_MAIN, "dnslists domain \"%s\" contains "
3714         "strange characters - is this right?", domain);
3715       break;
3716       }
3717     }
3718
3719   /* Check the alternate domain if present */
3720
3721   if (domain_txt != domain) for (s = domain_txt; *s != 0; s++)
3722     {
3723     if (!isalnum(*s) && *s != '-' && *s != '.' && *s != '_')
3724       {
3725       log_write(0, LOG_MAIN, "dnslists domain \"%s\" contains "
3726         "strange characters - is this right?", domain_txt);
3727       break;
3728       }
3729     }
3730
3731   /* If there is no key string, construct the query by adding the domain name
3732   onto the inverted host address, and perform a single DNS lookup. */
3733
3734   if (key == NULL)
3735     {
3736     if (where == ACL_WHERE_NOTSMTP_START || where == ACL_WHERE_NOTSMTP)
3737       {
3738       *log_msgptr = string_sprintf
3739         ("cannot test auto-keyed dnslists condition in %s ACL",
3740           acl_wherenames[where]);
3741       return ERROR;
3742       }
3743     if (sender_host_address == NULL) return FAIL;    /* can never match */
3744     if (revadd[0] == 0) invert_address(revadd, sender_host_address);
3745     rc = one_check_dnsbl(domain, domain_txt, sender_host_address, revadd,
3746       iplist, bitmask, match_type, defer_return);
3747     if (rc == OK)
3748       {
3749       dnslist_domain = string_copy(domain_txt);
3750       dnslist_matched = string_copy(sender_host_address);
3751       HDEBUG(D_dnsbl) debug_printf("=> that means %s is listed at %s\n",
3752         sender_host_address, dnslist_domain);
3753       }
3754     if (rc != FAIL) return rc;     /* OK or DEFER */
3755     }
3756
3757   /* If there is a key string, it can be a list of domains or IP addresses to
3758   be concatenated with the main domain. */
3759
3760   else
3761     {
3762     int keysep = 0;
3763     BOOL defer = FALSE;
3764     uschar *keydomain;
3765     uschar keybuffer[256];
3766     uschar keyrevadd[128];
3767
3768     while ((keydomain = string_nextinlist(CUSS &key, &keysep, keybuffer,
3769             sizeof(keybuffer))) != NULL)
3770       {
3771       uschar *prepend = keydomain;
3772
3773       if (string_is_ip_address(keydomain, NULL) != 0)
3774         {
3775         invert_address(keyrevadd, keydomain);
3776         prepend = keyrevadd;
3777         }
3778
3779       rc = one_check_dnsbl(domain, domain_txt, keydomain, prepend, iplist,
3780         bitmask, match_type, defer_return);
3781
3782       if (rc == OK)
3783         {
3784         dnslist_domain = string_copy(domain_txt);
3785         dnslist_matched = string_copy(keydomain);
3786         HDEBUG(D_dnsbl) debug_printf("=> that means %s is listed at %s\n",
3787           keydomain, dnslist_domain);
3788         return OK;
3789         }
3790
3791       /* If the lookup deferred, remember this fact. We keep trying the rest
3792       of the list to see if we get a useful result, and if we don't, we return
3793       DEFER at the end. */
3794
3795       if (rc == DEFER) defer = TRUE;
3796       }    /* continue with next keystring domain/address */
3797
3798     if (defer) return DEFER;
3799     }
3800   }        /* continue with next dnsdb outer domain */
3801
3802 return FAIL;
3803 }
3804
3805 /* vi: aw ai sw=2
3806 */
3807 /* End of verify.c */