Add tls_verify_hosts and tls_try_verify_hosts to smtp transport. Bug 1371
[exim.git] / src / src / verify.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) University of Cambridge 1995 - 2014 */
6 /* See the file NOTICE for conditions of use and distribution. */
7
8 /* Functions concerned with verifying things. The original code for callout
9 caching was contributed by Kevin Fleming (but I hacked it around a bit). */
10
11
12 #include "exim.h"
13 #include "transports/smtp.h"
14
15 #define CUTTHROUGH_CMD_TIMEOUT  30      /* timeout for cutthrough-routing calls */
16 #define CUTTHROUGH_DATA_TIMEOUT 60      /* timeout for cutthrough-routing calls */
17 address_item cutthrough_addr;
18 static smtp_outblock ctblock;
19 uschar ctbuffer[8192];
20
21
22 /* Structure for caching DNSBL lookups */
23
24 typedef struct dnsbl_cache_block {
25   dns_address *rhs;
26   uschar *text;
27   int rc;
28   BOOL text_set;
29 } dnsbl_cache_block;
30
31
32 /* Anchor for DNSBL cache */
33
34 static tree_node *dnsbl_cache = NULL;
35
36
37 /* Bits for match_type in one_check_dnsbl() */
38
39 #define MT_NOT 1
40 #define MT_ALL 2
41
42
43
44 /*************************************************
45 *          Retrieve a callout cache record       *
46 *************************************************/
47
48 /* If a record exists, check whether it has expired.
49
50 Arguments:
51   dbm_file          an open hints file
52   key               the record key
53   type              "address" or "domain"
54   positive_expire   expire time for positive records
55   negative_expire   expire time for negative records
56
57 Returns:            the cache record if a non-expired one exists, else NULL
58 */
59
60 static dbdata_callout_cache *
61 get_callout_cache_record(open_db *dbm_file, uschar *key, uschar *type,
62   int positive_expire, int negative_expire)
63 {
64 BOOL negative;
65 int length, expire;
66 time_t now;
67 dbdata_callout_cache *cache_record;
68
69 cache_record = dbfn_read_with_length(dbm_file, key, &length);
70
71 if (cache_record == NULL)
72   {
73   HDEBUG(D_verify) debug_printf("callout cache: no %s record found\n", type);
74   return NULL;
75   }
76
77 /* We treat a record as "negative" if its result field is not positive, or if
78 it is a domain record and the postmaster field is negative. */
79
80 negative = cache_record->result != ccache_accept ||
81   (type[0] == 'd' && cache_record->postmaster_result == ccache_reject);
82 expire = negative? negative_expire : positive_expire;
83 now = time(NULL);
84
85 if (now - cache_record->time_stamp > expire)
86   {
87   HDEBUG(D_verify) debug_printf("callout cache: %s record expired\n", type);
88   return NULL;
89   }
90
91 /* If this is a non-reject domain record, check for the obsolete format version
92 that doesn't have the postmaster and random timestamps, by looking at the
93 length. If so, copy it to a new-style block, replicating the record's
94 timestamp. Then check the additional timestamps. (There's no point wasting
95 effort if connections are rejected.) */
96
97 if (type[0] == 'd' && cache_record->result != ccache_reject)
98   {
99   if (length == sizeof(dbdata_callout_cache_obs))
100     {
101     dbdata_callout_cache *new = store_get(sizeof(dbdata_callout_cache));
102     memcpy(new, cache_record, length);
103     new->postmaster_stamp = new->random_stamp = new->time_stamp;
104     cache_record = new;
105     }
106
107   if (now - cache_record->postmaster_stamp > expire)
108     cache_record->postmaster_result = ccache_unknown;
109
110   if (now - cache_record->random_stamp > expire)
111     cache_record->random_result = ccache_unknown;
112   }
113
114 HDEBUG(D_verify) debug_printf("callout cache: found %s record\n", type);
115 return cache_record;
116 }
117
118
119
120 /*************************************************
121 *      Do callout verification for an address    *
122 *************************************************/
123
124 /* This function is called from verify_address() when the address has routed to
125 a host list, and a callout has been requested. Callouts are expensive; that is
126 why a cache is used to improve the efficiency.
127
128 Arguments:
129   addr              the address that's been routed
130   host_list         the list of hosts to try
131   tf                the transport feedback block
132
133   ifstring          "interface" option from transport, or NULL
134   portstring        "port" option from transport, or NULL
135   protocolstring    "protocol" option from transport, or NULL
136   callout           the per-command callout timeout
137   callout_overall   the overall callout timeout (if < 0 use 4*callout)
138   callout_connect   the callout connection timeout (if < 0 use callout)
139   options           the verification options - these bits are used:
140                       vopt_is_recipient => this is a recipient address
141                       vopt_callout_no_cache => don't use callout cache
142                       vopt_callout_fullpm => if postmaster check, do full one
143                       vopt_callout_random => do the "random" thing
144                       vopt_callout_recipsender => use real sender for recipient
145                       vopt_callout_recippmaster => use postmaster for recipient
146   se_mailfrom         MAIL FROM address for sender verify; NULL => ""
147   pm_mailfrom         if non-NULL, do the postmaster check with this sender
148
149 Returns:            OK/FAIL/DEFER
150 */
151
152 static int
153 do_callout(address_item *addr, host_item *host_list, transport_feedback *tf,
154   int callout, int callout_overall, int callout_connect, int options,
155   uschar *se_mailfrom, uschar *pm_mailfrom)
156 {
157 BOOL is_recipient = (options & vopt_is_recipient) != 0;
158 BOOL callout_no_cache = (options & vopt_callout_no_cache) != 0;
159 BOOL callout_random = (options & vopt_callout_random) != 0;
160
161 int yield = OK;
162 int old_domain_cache_result = ccache_accept;
163 BOOL done = FALSE;
164 uschar *address_key;
165 uschar *from_address;
166 uschar *random_local_part = NULL;
167 uschar *save_deliver_domain = deliver_domain;
168 uschar **failure_ptr = is_recipient?
169   &recipient_verify_failure : &sender_verify_failure;
170 open_db dbblock;
171 open_db *dbm_file = NULL;
172 dbdata_callout_cache new_domain_record;
173 dbdata_callout_cache_address new_address_record;
174 host_item *host;
175 time_t callout_start_time;
176
177 new_domain_record.result = ccache_unknown;
178 new_domain_record.postmaster_result = ccache_unknown;
179 new_domain_record.random_result = ccache_unknown;
180
181 memset(&new_address_record, 0, sizeof(new_address_record));
182
183 /* For a recipient callout, the key used for the address cache record must
184 include the sender address if we are using the real sender in the callout,
185 because that may influence the result of the callout. */
186
187 address_key = addr->address;
188 from_address = US"";
189
190 if (is_recipient)
191   {
192   if ((options & vopt_callout_recipsender) != 0)
193     {
194     address_key = string_sprintf("%s/<%s>", addr->address, sender_address);
195     from_address = sender_address;
196     }
197   else if ((options & vopt_callout_recippmaster) != 0)
198     {
199     address_key = string_sprintf("%s/<postmaster@%s>", addr->address,
200       qualify_domain_sender);
201     from_address = string_sprintf("postmaster@%s", qualify_domain_sender);
202     }
203   }
204
205 /* For a sender callout, we must adjust the key if the mailfrom address is not
206 empty. */
207
208 else
209   {
210   from_address = (se_mailfrom == NULL)? US"" : se_mailfrom;
211   if (from_address[0] != 0)
212     address_key = string_sprintf("%s/<%s>", addr->address, from_address);
213   }
214
215 /* Open the callout cache database, it it exists, for reading only at this
216 stage, unless caching has been disabled. */
217
218 if (callout_no_cache)
219   {
220   HDEBUG(D_verify) debug_printf("callout cache: disabled by no_cache\n");
221   }
222 else if ((dbm_file = dbfn_open(US"callout", O_RDWR, &dbblock, FALSE)) == NULL)
223   {
224   HDEBUG(D_verify) debug_printf("callout cache: not available\n");
225   }
226
227 /* If a cache database is available see if we can avoid the need to do an
228 actual callout by making use of previously-obtained data. */
229
230 if (dbm_file != NULL)
231   {
232   dbdata_callout_cache_address *cache_address_record;
233   dbdata_callout_cache *cache_record = get_callout_cache_record(dbm_file,
234     addr->domain, US"domain",
235     callout_cache_domain_positive_expire,
236     callout_cache_domain_negative_expire);
237
238   /* If an unexpired cache record was found for this domain, see if the callout
239   process can be short-circuited. */
240
241   if (cache_record != NULL)
242     {
243     /* In most cases, if an early command (up to and including MAIL FROM:<>)
244     was rejected, there is no point carrying on. The callout fails. However, if
245     we are doing a recipient verification with use_sender or use_postmaster
246     set, a previous failure of MAIL FROM:<> doesn't count, because this time we
247     will be using a non-empty sender. We have to remember this situation so as
248     not to disturb the cached domain value if this whole verification succeeds
249     (we don't want it turning into "accept"). */
250
251     old_domain_cache_result = cache_record->result;
252
253     if (cache_record->result == ccache_reject ||
254          (*from_address == 0 && cache_record->result == ccache_reject_mfnull))
255       {
256       setflag(addr, af_verify_nsfail);
257       HDEBUG(D_verify)
258         debug_printf("callout cache: domain gave initial rejection, or "
259           "does not accept HELO or MAIL FROM:<>\n");
260       setflag(addr, af_verify_nsfail);
261       addr->user_message = US"(result of an earlier callout reused).";
262       yield = FAIL;
263       *failure_ptr = US"mail";
264       goto END_CALLOUT;
265       }
266
267     /* If a previous check on a "random" local part was accepted, we assume
268     that the server does not do any checking on local parts. There is therefore
269     no point in doing the callout, because it will always be successful. If a
270     random check previously failed, arrange not to do it again, but preserve
271     the data in the new record. If a random check is required but hasn't been
272     done, skip the remaining cache processing. */
273
274     if (callout_random) switch(cache_record->random_result)
275       {
276       case ccache_accept:
277       HDEBUG(D_verify)
278         debug_printf("callout cache: domain accepts random addresses\n");
279       goto END_CALLOUT;     /* Default yield is OK */
280
281       case ccache_reject:
282       HDEBUG(D_verify)
283         debug_printf("callout cache: domain rejects random addresses\n");
284       callout_random = FALSE;
285       new_domain_record.random_result = ccache_reject;
286       new_domain_record.random_stamp = cache_record->random_stamp;
287       break;
288
289       default:
290       HDEBUG(D_verify)
291         debug_printf("callout cache: need to check random address handling "
292           "(not cached or cache expired)\n");
293       goto END_CACHE;
294       }
295
296     /* If a postmaster check is requested, but there was a previous failure,
297     there is again no point in carrying on. If a postmaster check is required,
298     but has not been done before, we are going to have to do a callout, so skip
299     remaining cache processing. */
300
301     if (pm_mailfrom != NULL)
302       {
303       if (cache_record->postmaster_result == ccache_reject)
304         {
305         setflag(addr, af_verify_pmfail);
306         HDEBUG(D_verify)
307           debug_printf("callout cache: domain does not accept "
308             "RCPT TO:<postmaster@domain>\n");
309         yield = FAIL;
310         *failure_ptr = US"postmaster";
311         setflag(addr, af_verify_pmfail);
312         addr->user_message = US"(result of earlier verification reused).";
313         goto END_CALLOUT;
314         }
315       if (cache_record->postmaster_result == ccache_unknown)
316         {
317         HDEBUG(D_verify)
318           debug_printf("callout cache: need to check RCPT "
319             "TO:<postmaster@domain> (not cached or cache expired)\n");
320         goto END_CACHE;
321         }
322
323       /* If cache says OK, set pm_mailfrom NULL to prevent a redundant
324       postmaster check if the address itself has to be checked. Also ensure
325       that the value in the cache record is preserved (with its old timestamp).
326       */
327
328       HDEBUG(D_verify) debug_printf("callout cache: domain accepts RCPT "
329         "TO:<postmaster@domain>\n");
330       pm_mailfrom = NULL;
331       new_domain_record.postmaster_result = ccache_accept;
332       new_domain_record.postmaster_stamp = cache_record->postmaster_stamp;
333       }
334     }
335
336   /* We can't give a result based on information about the domain. See if there
337   is an unexpired cache record for this specific address (combined with the
338   sender address if we are doing a recipient callout with a non-empty sender).
339   */
340
341   cache_address_record = (dbdata_callout_cache_address *)
342     get_callout_cache_record(dbm_file,
343       address_key, US"address",
344       callout_cache_positive_expire,
345       callout_cache_negative_expire);
346
347   if (cache_address_record != NULL)
348     {
349     if (cache_address_record->result == ccache_accept)
350       {
351       HDEBUG(D_verify)
352         debug_printf("callout cache: address record is positive\n");
353       }
354     else
355       {
356       HDEBUG(D_verify)
357         debug_printf("callout cache: address record is negative\n");
358       addr->user_message = US"Previous (cached) callout verification failure";
359       *failure_ptr = US"recipient";
360       yield = FAIL;
361       }
362     goto END_CALLOUT;
363     }
364
365   /* Close the cache database while we actually do the callout for real. */
366
367   END_CACHE:
368   dbfn_close(dbm_file);
369   dbm_file = NULL;
370   }
371
372 if (!addr->transport)
373   {
374   HDEBUG(D_verify) debug_printf("cannot callout via null transport\n");
375   }
376 else
377   {
378   smtp_transport_options_block *ob =
379     (smtp_transport_options_block *)(addr->transport->options_block);
380
381   /* The information wasn't available in the cache, so we have to do a real
382   callout and save the result in the cache for next time, unless no_cache is set,
383   or unless we have a previously cached negative random result. If we are to test
384   with a random local part, ensure that such a local part is available. If not,
385   log the fact, but carry on without randomming. */
386
387   if (callout_random && callout_random_local_part != NULL)
388     {
389     random_local_part = expand_string(callout_random_local_part);
390     if (random_local_part == NULL)
391       log_write(0, LOG_MAIN|LOG_PANIC, "failed to expand "
392         "callout_random_local_part: %s", expand_string_message);
393     }
394
395   /* Default the connect and overall callout timeouts if not set, and record the
396   time we are starting so that we can enforce it. */
397
398   if (callout_overall < 0) callout_overall = 4 * callout;
399   if (callout_connect < 0) callout_connect = callout;
400   callout_start_time = time(NULL);
401
402   /* Before doing a real callout, if this is an SMTP connection, flush the SMTP
403   output because a callout might take some time. When PIPELINING is active and
404   there are many recipients, the total time for doing lots of callouts can add up
405   and cause the client to time out. So in this case we forgo the PIPELINING
406   optimization. */
407
408   if (smtp_out != NULL && !disable_callout_flush) mac_smtp_fflush();
409
410   /* Now make connections to the hosts and do real callouts. The list of hosts
411   is passed in as an argument. */
412
413   for (host = host_list; host != NULL && !done; host = host->next)
414     {
415     smtp_inblock inblock;
416     smtp_outblock outblock;
417     int host_af;
418     int port = 25;
419     BOOL send_quit = TRUE;
420     uschar *active_hostname = smtp_active_hostname;
421     BOOL lmtp;
422     BOOL smtps;
423     BOOL esmtp;
424     BOOL suppress_tls = FALSE;
425     uschar *interface = NULL;  /* Outgoing interface to use; NULL => any */
426     uschar inbuffer[4096];
427     uschar outbuffer[1024];
428     uschar responsebuffer[4096];
429
430     clearflag(addr, af_verify_pmfail);  /* postmaster callout flag */
431     clearflag(addr, af_verify_nsfail);  /* null sender callout flag */
432
433     /* Skip this host if we don't have an IP address for it. */
434
435     if (host->address == NULL)
436       {
437       DEBUG(D_verify) debug_printf("no IP address for host name %s: skipping\n",
438         host->name);
439       continue;
440       }
441
442     /* Check the overall callout timeout */
443
444     if (time(NULL) - callout_start_time >= callout_overall)
445       {
446       HDEBUG(D_verify) debug_printf("overall timeout for callout exceeded\n");
447       break;
448       }
449
450     /* Set IPv4 or IPv6 */
451
452     host_af = (Ustrchr(host->address, ':') == NULL)? AF_INET:AF_INET6;
453
454     /* Expand and interpret the interface and port strings. The latter will not
455     be used if there is a host-specific port (e.g. from a manualroute router).
456     This has to be delayed till now, because they may expand differently for
457     different hosts. If there's a failure, log it, but carry on with the
458     defaults. */
459
460     deliver_host = host->name;
461     deliver_host_address = host->address;
462     deliver_domain = addr->domain;
463
464     if (!smtp_get_interface(tf->interface, host_af, addr, NULL, &interface,
465             US"callout") ||
466         !smtp_get_port(tf->port, addr, &port, US"callout"))
467       log_write(0, LOG_MAIN|LOG_PANIC, "<%s>: %s", addr->address,
468         addr->message);
469
470     /* Set HELO string according to the protocol */
471     lmtp= Ustrcmp(tf->protocol, "lmtp") == 0;
472     smtps= Ustrcmp(tf->protocol, "smtps") == 0;
473
474
475     HDEBUG(D_verify) debug_printf("interface=%s port=%d\n", interface, port);
476
477     /* Set up the buffer for reading SMTP response packets. */
478
479     inblock.buffer = inbuffer;
480     inblock.buffersize = sizeof(inbuffer);
481     inblock.ptr = inbuffer;
482     inblock.ptrend = inbuffer;
483
484     /* Set up the buffer for holding SMTP commands while pipelining */
485
486     outblock.buffer = outbuffer;
487     outblock.buffersize = sizeof(outbuffer);
488     outblock.ptr = outbuffer;
489     outblock.cmd_count = 0;
490     outblock.authenticating = FALSE;
491
492     /* Reset the parameters of a TLS session */
493     tls_out.cipher = tls_out.peerdn = NULL;
494
495     /* Connect to the host; on failure, just loop for the next one, but we
496     set the error for the last one. Use the callout_connect timeout. */
497
498     tls_retry_connection:
499
500     inblock.sock = outblock.sock =
501       smtp_connect(host, host_af, port, interface, callout_connect, TRUE, NULL);
502     /* reconsider DSCP here */
503     if (inblock.sock < 0)
504       {
505       addr->message = string_sprintf("could not connect to %s [%s]: %s",
506           host->name, host->address, strerror(errno));
507       deliver_host = deliver_host_address = NULL;
508       deliver_domain = save_deliver_domain;
509       continue;
510       }
511
512     /* Expand the helo_data string to find the host name to use. */
513
514     if (tf->helo_data != NULL)
515       {
516       uschar *s = expand_string(tf->helo_data);
517       if (s == NULL)
518         log_write(0, LOG_MAIN|LOG_PANIC, "<%s>: failed to expand transport's "
519           "helo_data value for callout: %s", addr->address,
520           expand_string_message);
521       else active_hostname = s;
522       }
523
524     deliver_host = deliver_host_address = NULL;
525     deliver_domain = save_deliver_domain;
526
527     /* Wait for initial response, and send HELO. The smtp_write_command()
528     function leaves its command in big_buffer. This is used in error responses.
529     Initialize it in case the connection is rejected. */
530
531     Ustrcpy(big_buffer, "initial connection");
532
533     /* Unless ssl-on-connect, wait for the initial greeting */
534     smtps_redo_greeting:
535
536     #ifdef SUPPORT_TLS
537     if (!smtps || (smtps && tls_out.active >= 0))
538     #endif
539       if (!(done= smtp_read_response(&inblock, responsebuffer, sizeof(responsebuffer), '2', callout)))
540         goto RESPONSE_FAILED;
541
542     /* Not worth checking greeting line for ESMTP support */
543     if (!(esmtp = verify_check_this_host(&(ob->hosts_avoid_esmtp), NULL,
544       host->name, host->address, NULL) != OK))
545       DEBUG(D_transport)
546         debug_printf("not sending EHLO (host matches hosts_avoid_esmtp)\n");
547
548     tls_redo_helo:
549
550     #ifdef SUPPORT_TLS
551     if (smtps  &&  tls_out.active < 0)  /* ssl-on-connect, first pass */
552       {
553       tls_offered = TRUE;
554       ob->tls_tempfail_tryclear = FALSE;
555       }
556       else                              /* all other cases */
557     #endif
558
559       { esmtp_retry:
560
561       if (!(done= smtp_write_command(&outblock, FALSE, "%s %s\r\n",
562         !esmtp? "HELO" : lmtp? "LHLO" : "EHLO", active_hostname) >= 0))
563         goto SEND_FAILED;
564       if (!smtp_read_response(&inblock, responsebuffer, sizeof(responsebuffer), '2', callout))
565         {
566         if (errno != 0 || responsebuffer[0] == 0 || lmtp || !esmtp || tls_out.active >= 0)
567           {
568           done= FALSE;
569           goto RESPONSE_FAILED;
570           }
571         #ifdef SUPPORT_TLS
572         tls_offered = FALSE;
573         #endif
574         esmtp = FALSE;
575         goto esmtp_retry;                       /* fallback to HELO */
576         }
577
578       /* Set tls_offered if the response to EHLO specifies support for STARTTLS. */
579       #ifdef SUPPORT_TLS
580       if (esmtp && !suppress_tls &&  tls_out.active < 0)
581         {
582           if (regex_STARTTLS == NULL) regex_STARTTLS =
583             regex_must_compile(US"\\n250[\\s\\-]STARTTLS(\\s|\\n|$)", FALSE, TRUE);
584
585           tls_offered = pcre_exec(regex_STARTTLS, NULL, CS responsebuffer,
586                         Ustrlen(responsebuffer), 0, PCRE_EOPT, NULL, 0) >= 0;
587         }
588       else
589         tls_offered = FALSE;
590       #endif
591       }
592
593     /* If TLS is available on this connection attempt to
594     start up a TLS session, unless the host is in hosts_avoid_tls. If successful,
595     send another EHLO - the server may give a different answer in secure mode. We
596     use a separate buffer for reading the response to STARTTLS so that if it is
597     negative, the original EHLO data is available for subsequent analysis, should
598     the client not be required to use TLS. If the response is bad, copy the buffer
599     for error analysis. */
600
601     #ifdef SUPPORT_TLS
602     if (tls_offered &&
603         verify_check_this_host(&(ob->hosts_avoid_tls), NULL, host->name,
604           host->address, NULL) != OK &&
605         verify_check_this_host(&(ob->hosts_verify_avoid_tls), NULL, host->name,
606           host->address, NULL) != OK
607        )
608       {
609       uschar buffer2[4096];
610       if (  !smtps
611          && !(done= smtp_write_command(&outblock, FALSE, "STARTTLS\r\n") >= 0))
612         goto SEND_FAILED;
613
614       /* If there is an I/O error, transmission of this message is deferred. If
615       there is a temporary rejection of STARRTLS and tls_tempfail_tryclear is
616       false, we also defer. However, if there is a temporary rejection of STARTTLS
617       and tls_tempfail_tryclear is true, or if there is an outright rejection of
618       STARTTLS, we carry on. This means we will try to send the message in clear,
619       unless the host is in hosts_require_tls (tested below). */
620
621       if (!smtps && !smtp_read_response(&inblock, buffer2, sizeof(buffer2), '2',
622                         ob->command_timeout))
623         {
624         if (errno != 0 || buffer2[0] == 0 ||
625                 (buffer2[0] == '4' && !ob->tls_tempfail_tryclear))
626         {
627         Ustrncpy(responsebuffer, buffer2, sizeof(responsebuffer));
628         done= FALSE;
629         goto RESPONSE_FAILED;
630         }
631         }
632
633        /* STARTTLS accepted or ssl-on-connect: try to negotiate a TLS session. */
634       else
635         {
636         int rc = tls_client_start(inblock.sock, host, addr,
637          ob->tls_certificate, ob->tls_privatekey,
638          ob->tls_sni,
639          ob->tls_verify_certificates, ob->tls_crl,
640          ob->tls_require_ciphers,
641 #ifdef EXPERIMENTAL_OCSP
642          ob->hosts_require_ocsp,
643 #endif
644          ob->tls_dh_min_bits, callout,
645          ob->tls_verify_hosts, ob->tls_try_verify_hosts);
646
647         /* TLS negotiation failed; give an error.  Try in clear on a new connection,
648            if the options permit it for this host. */
649         if (rc != OK)
650           {
651         if (rc == DEFER && ob->tls_tempfail_tryclear && !smtps &&
652            verify_check_this_host(&(ob->hosts_require_tls), NULL, host->name,
653              host->address, NULL) != OK)
654           {
655             (void)close(inblock.sock);
656           log_write(0, LOG_MAIN, "TLS session failure: delivering unencrypted "
657             "to %s [%s] (not in hosts_require_tls)", host->name, host->address);
658           suppress_tls = TRUE;
659           goto tls_retry_connection;
660           }
661         /*save_errno = ERRNO_TLSFAILURE;*/
662         /*message = US"failure while setting up TLS session";*/
663         send_quit = FALSE;
664         done= FALSE;
665         goto TLS_FAILED;
666         }
667
668         /* TLS session is set up.  Copy info for logging. */
669         addr->cipher = tls_out.cipher;
670         addr->peerdn = tls_out.peerdn;
671
672         /* For SMTPS we need to wait for the initial OK response, then do HELO. */
673         if (smtps)
674          goto smtps_redo_greeting;
675
676         /* For STARTTLS we need to redo EHLO */
677         goto tls_redo_helo;
678         }
679       }
680
681     /* If the host is required to use a secure channel, ensure that we have one. */
682     if (tls_out.active < 0)
683       if (verify_check_this_host(&(ob->hosts_require_tls), NULL, host->name,
684         host->address, NULL) == OK)
685         {
686         /*save_errno = ERRNO_TLSREQUIRED;*/
687         log_write(0, LOG_MAIN, "a TLS session is required for %s [%s], but %s",
688           host->name, host->address,
689         tls_offered? "an attempt to start TLS failed" : "the server did not offer TLS support");
690         done= FALSE;
691         goto TLS_FAILED;
692         }
693
694     #endif /*SUPPORT_TLS*/
695
696     done = TRUE; /* so far so good; have response to HELO */
697
698     /*XXX the EHLO response would be analyzed here for IGNOREQUOTA, SIZE, PIPELINING */
699
700     /* For now, transport_filter by cutthrough-delivery is not supported */
701     /* Need proper integration with the proper transport mechanism. */
702     if (cutthrough_delivery)
703       {
704       if (addr->transport->filter_command)
705         {
706         cutthrough_delivery= FALSE;
707         HDEBUG(D_acl|D_v) debug_printf("Cutthrough cancelled by presence of transport filter\n");
708         }
709       #ifndef DISABLE_DKIM
710       if (ob->dkim_domain)
711         {
712         cutthrough_delivery= FALSE;
713         HDEBUG(D_acl|D_v) debug_printf("Cutthrough cancelled by presence of DKIM signing\n");
714         }
715       #endif
716       }
717
718     SEND_FAILED:
719     RESPONSE_FAILED:
720     TLS_FAILED:
721     ;
722     /* Clear down of the TLS, SMTP and TCP layers on error is handled below.  */
723
724
725     /* Failure to accept HELO is cached; this blocks the whole domain for all
726     senders. I/O errors and defer responses are not cached. */
727
728     if (!done)
729       {
730       *failure_ptr = US"mail";     /* At or before MAIL */
731       if (errno == 0 && responsebuffer[0] == '5')
732         {
733         setflag(addr, af_verify_nsfail);
734         new_domain_record.result = ccache_reject;
735         }
736       }
737
738     /* If we haven't authenticated, but are required to, give up. */
739     /* Try to AUTH */
740
741     else done = smtp_auth(responsebuffer, sizeof(responsebuffer),
742         addr, host, ob, esmtp, &inblock, &outblock) == OK  &&
743
744                 /* Copy AUTH info for logging */
745       ( (addr->authenticator = client_authenticator),
746         (addr->auth_id = client_authenticated_id),
747
748     /* Build a mail-AUTH string (re-using responsebuffer for convenience */
749         !smtp_mail_auth_str(responsebuffer, sizeof(responsebuffer), addr, ob)
750       )  &&
751
752       ( (addr->auth_sndr = client_authenticated_sender),
753
754     /* Send the MAIL command */
755         (smtp_write_command(&outblock, FALSE, "MAIL FROM:<%s>%s\r\n",
756           from_address, responsebuffer) >= 0)
757       )  &&
758
759       smtp_read_response(&inblock, responsebuffer, sizeof(responsebuffer),
760         '2', callout);
761
762     /* If the host does not accept MAIL FROM:<>, arrange to cache this
763     information, but again, don't record anything for an I/O error or a defer. Do
764     not cache rejections of MAIL when a non-empty sender has been used, because
765     that blocks the whole domain for all senders. */
766
767     if (!done)
768       {
769       *failure_ptr = US"mail";     /* At or before MAIL */
770       if (errno == 0 && responsebuffer[0] == '5')
771         {
772         setflag(addr, af_verify_nsfail);
773         if (from_address[0] == 0)
774           new_domain_record.result = ccache_reject_mfnull;
775         }
776       }
777
778     /* Otherwise, proceed to check a "random" address (if required), then the
779     given address, and the postmaster address (if required). Between each check,
780     issue RSET, because some servers accept only one recipient after MAIL
781     FROM:<>.
782
783     Before doing this, set the result in the domain cache record to "accept",
784     unless its previous value was ccache_reject_mfnull. In that case, the domain
785     rejects MAIL FROM:<> and we want to continue to remember that. When that is
786     the case, we have got here only in the case of a recipient verification with
787     a non-null sender. */
788
789     else
790       {
791       new_domain_record.result =
792         (old_domain_cache_result == ccache_reject_mfnull)?
793           ccache_reject_mfnull: ccache_accept;
794
795       /* Do the random local part check first */
796
797       if (random_local_part != NULL)
798         {
799         uschar randombuffer[1024];
800         BOOL random_ok =
801           smtp_write_command(&outblock, FALSE,
802             "RCPT TO:<%.1000s@%.1000s>\r\n", random_local_part,
803             addr->domain) >= 0 &&
804           smtp_read_response(&inblock, randombuffer,
805             sizeof(randombuffer), '2', callout);
806
807         /* Remember when we last did a random test */
808
809         new_domain_record.random_stamp = time(NULL);
810
811         /* If accepted, we aren't going to do any further tests below. */
812
813         if (random_ok)
814           {
815           new_domain_record.random_result = ccache_accept;
816           }
817
818         /* Otherwise, cache a real negative response, and get back to the right
819         state to send RCPT. Unless there's some problem such as a dropped
820         connection, we expect to succeed, because the commands succeeded above. */
821
822         else if (errno == 0)
823           {
824           if (randombuffer[0] == '5')
825             new_domain_record.random_result = ccache_reject;
826
827           done =
828             smtp_write_command(&outblock, FALSE, "RSET\r\n") >= 0 &&
829             smtp_read_response(&inblock, responsebuffer, sizeof(responsebuffer),
830               '2', callout) &&
831
832             smtp_write_command(&outblock, FALSE, "MAIL FROM:<%s>\r\n",
833               from_address) >= 0 &&
834             smtp_read_response(&inblock, responsebuffer, sizeof(responsebuffer),
835               '2', callout);
836           }
837         else done = FALSE;    /* Some timeout/connection problem */
838         }                     /* Random check */
839
840       /* If the host is accepting all local parts, as determined by the "random"
841       check, we don't need to waste time doing any further checking. */
842
843       if (new_domain_record.random_result != ccache_accept && done)
844         {
845         /* Get the rcpt_include_affixes flag from the transport if there is one,
846         but assume FALSE if there is not. */
847
848         done =
849           smtp_write_command(&outblock, FALSE, "RCPT TO:<%.1000s>\r\n",
850             transport_rcpt_address(addr,
851               (addr->transport == NULL)? FALSE :
852                addr->transport->rcpt_include_affixes)) >= 0 &&
853           smtp_read_response(&inblock, responsebuffer, sizeof(responsebuffer),
854             '2', callout);
855
856         if (done)
857           new_address_record.result = ccache_accept;
858         else if (errno == 0 && responsebuffer[0] == '5')
859           {
860           *failure_ptr = US"recipient";
861           new_address_record.result = ccache_reject;
862           }
863
864         /* Do postmaster check if requested; if a full check is required, we
865         check for RCPT TO:<postmaster> (no domain) in accordance with RFC 821. */
866
867         if (done && pm_mailfrom != NULL)
868           {
869           /*XXX not suitable for cutthrough - sequencing problems */
870         cutthrough_delivery= FALSE;
871         HDEBUG(D_acl|D_v) debug_printf("Cutthrough cancelled by presence of postmaster verify\n");
872
873           done =
874             smtp_write_command(&outblock, FALSE, "RSET\r\n") >= 0 &&
875             smtp_read_response(&inblock, responsebuffer,
876               sizeof(responsebuffer), '2', callout) &&
877
878             smtp_write_command(&outblock, FALSE,
879               "MAIL FROM:<%s>\r\n", pm_mailfrom) >= 0 &&
880             smtp_read_response(&inblock, responsebuffer,
881               sizeof(responsebuffer), '2', callout) &&
882
883             /* First try using the current domain */
884
885             ((
886             smtp_write_command(&outblock, FALSE,
887               "RCPT TO:<postmaster@%.1000s>\r\n", addr->domain) >= 0 &&
888             smtp_read_response(&inblock, responsebuffer,
889               sizeof(responsebuffer), '2', callout)
890             )
891
892             ||
893
894             /* If that doesn't work, and a full check is requested,
895             try without the domain. */
896
897             (
898             (options & vopt_callout_fullpm) != 0 &&
899             smtp_write_command(&outblock, FALSE,
900               "RCPT TO:<postmaster>\r\n") >= 0 &&
901             smtp_read_response(&inblock, responsebuffer,
902               sizeof(responsebuffer), '2', callout)
903             ));
904
905           /* Sort out the cache record */
906
907           new_domain_record.postmaster_stamp = time(NULL);
908
909           if (done)
910             new_domain_record.postmaster_result = ccache_accept;
911           else if (errno == 0 && responsebuffer[0] == '5')
912             {
913             *failure_ptr = US"postmaster";
914             setflag(addr, af_verify_pmfail);
915             new_domain_record.postmaster_result = ccache_reject;
916             }
917           }
918         }           /* Random not accepted */
919       }             /* MAIL FROM: accepted */
920
921     /* For any failure of the main check, other than a negative response, we just
922     close the connection and carry on. We can identify a negative response by the
923     fact that errno is zero. For I/O errors it will be non-zero
924
925     Set up different error texts for logging and for sending back to the caller
926     as an SMTP response. Log in all cases, using a one-line format. For sender
927     callouts, give a full response to the caller, but for recipient callouts,
928     don't give the IP address because this may be an internal host whose identity
929     is not to be widely broadcast. */
930
931     if (!done)
932       {
933       if (errno == ETIMEDOUT)
934         {
935         HDEBUG(D_verify) debug_printf("SMTP timeout\n");
936         send_quit = FALSE;
937         }
938       else if (errno == 0)
939         {
940         if (*responsebuffer == 0) Ustrcpy(responsebuffer, US"connection dropped");
941
942         addr->message =
943           string_sprintf("response to \"%s\" from %s [%s] was: %s",
944             big_buffer, host->name, host->address,
945             string_printing(responsebuffer));
946
947         addr->user_message = is_recipient?
948           string_sprintf("Callout verification failed:\n%s", responsebuffer)
949           :
950           string_sprintf("Called:   %s\nSent:     %s\nResponse: %s",
951             host->address, big_buffer, responsebuffer);
952
953         /* Hard rejection ends the process */
954
955         if (responsebuffer[0] == '5')   /* Address rejected */
956           {
957           yield = FAIL;
958           done = TRUE;
959           }
960         }
961       }
962
963     /* End the SMTP conversation and close the connection. */
964
965     /* Cutthrough - on a successfull connect and recipient-verify with use-sender
966     and we have no cutthrough conn so far
967     here is where we want to leave the conn open */
968     if (  cutthrough_delivery
969        && done
970        && yield == OK
971        && (options & (vopt_callout_recipsender|vopt_callout_recippmaster)) == vopt_callout_recipsender
972        && !random_local_part
973        && !pm_mailfrom
974        && cutthrough_fd < 0
975        )
976       {
977       cutthrough_fd= outblock.sock;     /* We assume no buffer in use in the outblock */
978       cutthrough_addr = *addr;          /* Save the address_item for later logging */
979       cutthrough_addr.host_used = store_get(sizeof(host_item));
980       cutthrough_addr.host_used->name =    host->name;
981       cutthrough_addr.host_used->address = host->address;
982       cutthrough_addr.host_used->port =    port;
983       if (addr->parent)
984         *(cutthrough_addr.parent = store_get(sizeof(address_item)))= *addr->parent;
985       ctblock.buffer = ctbuffer;
986       ctblock.buffersize = sizeof(ctbuffer);
987       ctblock.ptr = ctbuffer;
988       /* ctblock.cmd_count = 0; ctblock.authenticating = FALSE; */
989       ctblock.sock = cutthrough_fd;
990       }
991     else
992       {
993       /* Ensure no cutthrough on multiple address verifies */
994       if (options & vopt_callout_recipsender)
995         cancel_cutthrough_connection("multiple verify calls");
996       if (send_quit) (void)smtp_write_command(&outblock, FALSE, "QUIT\r\n");
997
998       #ifdef SUPPORT_TLS
999       tls_close(FALSE, TRUE);
1000       #endif
1001       (void)close(inblock.sock);
1002       }
1003
1004     }    /* Loop through all hosts, while !done */
1005   }
1006
1007 /* If we get here with done == TRUE, a successful callout happened, and yield
1008 will be set OK or FAIL according to the response to the RCPT command.
1009 Otherwise, we looped through the hosts but couldn't complete the business.
1010 However, there may be domain-specific information to cache in both cases.
1011
1012 The value of the result field in the new_domain record is ccache_unknown if
1013 there was an error before or with MAIL FROM:, and errno was not zero,
1014 implying some kind of I/O error. We don't want to write the cache in that case.
1015 Otherwise the value is ccache_accept, ccache_reject, or ccache_reject_mfnull. */
1016
1017 if (!callout_no_cache && new_domain_record.result != ccache_unknown)
1018   {
1019   if ((dbm_file = dbfn_open(US"callout", O_RDWR|O_CREAT, &dbblock, FALSE))
1020        == NULL)
1021     {
1022     HDEBUG(D_verify) debug_printf("callout cache: not available\n");
1023     }
1024   else
1025     {
1026     (void)dbfn_write(dbm_file, addr->domain, &new_domain_record,
1027       (int)sizeof(dbdata_callout_cache));
1028     HDEBUG(D_verify) debug_printf("wrote callout cache domain record:\n"
1029       "  result=%d postmaster=%d random=%d\n",
1030       new_domain_record.result,
1031       new_domain_record.postmaster_result,
1032       new_domain_record.random_result);
1033     }
1034   }
1035
1036 /* If a definite result was obtained for the callout, cache it unless caching
1037 is disabled. */
1038
1039 if (done)
1040   {
1041   if (!callout_no_cache && new_address_record.result != ccache_unknown)
1042     {
1043     if (dbm_file == NULL)
1044       dbm_file = dbfn_open(US"callout", O_RDWR|O_CREAT, &dbblock, FALSE);
1045     if (dbm_file == NULL)
1046       {
1047       HDEBUG(D_verify) debug_printf("no callout cache available\n");
1048       }
1049     else
1050       {
1051       (void)dbfn_write(dbm_file, address_key, &new_address_record,
1052         (int)sizeof(dbdata_callout_cache_address));
1053       HDEBUG(D_verify) debug_printf("wrote %s callout cache address record\n",
1054         (new_address_record.result == ccache_accept)? "positive" : "negative");
1055       }
1056     }
1057   }    /* done */
1058
1059 /* Failure to connect to any host, or any response other than 2xx or 5xx is a
1060 temporary error. If there was only one host, and a response was received, leave
1061 it alone if supplying details. Otherwise, give a generic response. */
1062
1063 else   /* !done */
1064   {
1065   uschar *dullmsg = string_sprintf("Could not complete %s verify callout",
1066     is_recipient? "recipient" : "sender");
1067   yield = DEFER;
1068
1069   if (host_list->next != NULL || addr->message == NULL) addr->message = dullmsg;
1070
1071   addr->user_message = (!smtp_return_error_details)? dullmsg :
1072     string_sprintf("%s for <%s>.\n"
1073       "The mail server(s) for the domain may be temporarily unreachable, or\n"
1074       "they may be permanently unreachable from this server. In the latter case,\n%s",
1075       dullmsg, addr->address,
1076       is_recipient?
1077         "the address will never be accepted."
1078         :
1079         "you need to change the address or create an MX record for its domain\n"
1080         "if it is supposed to be generally accessible from the Internet.\n"
1081         "Talk to your mail administrator for details.");
1082
1083   /* Force a specific error code */
1084
1085   addr->basic_errno = ERRNO_CALLOUTDEFER;
1086   }
1087
1088 /* Come here from within the cache-reading code on fast-track exit. */
1089
1090 END_CALLOUT:
1091 if (dbm_file != NULL) dbfn_close(dbm_file);
1092 return yield;
1093 }
1094
1095
1096
1097 /* Called after recipient-acl to get a cutthrough connection open when
1098    one was requested and a recipient-verify wasn't subsequently done.
1099 */
1100 void
1101 open_cutthrough_connection( address_item * addr )
1102 {
1103 address_item addr2;
1104
1105 /* Use a recipient-verify-callout to set up the cutthrough connection. */
1106 /* We must use a copy of the address for verification, because it might
1107 get rewritten. */
1108
1109 addr2 = *addr;
1110 HDEBUG(D_acl) debug_printf("----------- start cutthrough setup ------------\n");
1111 (void) verify_address(&addr2, NULL,
1112         vopt_is_recipient | vopt_callout_recipsender | vopt_callout_no_cache,
1113         CUTTHROUGH_CMD_TIMEOUT, -1, -1,
1114         NULL, NULL, NULL);
1115 HDEBUG(D_acl) debug_printf("----------- end cutthrough setup ------------\n");
1116 return;
1117 }
1118
1119
1120
1121 /* Send given number of bytes from the buffer */
1122 static BOOL
1123 cutthrough_send(int n)
1124 {
1125 if(cutthrough_fd < 0)
1126   return TRUE;
1127
1128 if(
1129 #ifdef SUPPORT_TLS
1130    (tls_out.active == cutthrough_fd) ? tls_write(FALSE, ctblock.buffer, n) :
1131 #endif
1132    send(cutthrough_fd, ctblock.buffer, n, 0) > 0
1133   )
1134 {
1135   transport_count += n;
1136   ctblock.ptr= ctblock.buffer;
1137   return TRUE;
1138 }
1139
1140 HDEBUG(D_transport|D_acl) debug_printf("cutthrough_send failed: %s\n", strerror(errno));
1141 return FALSE;
1142 }
1143
1144
1145
1146 static BOOL
1147 _cutthrough_puts(uschar * cp, int n)
1148 {
1149 while(n--)
1150  {
1151  if(ctblock.ptr >= ctblock.buffer+ctblock.buffersize)
1152    if(!cutthrough_send(ctblock.buffersize))
1153      return FALSE;
1154
1155  *ctblock.ptr++ = *cp++;
1156  }
1157 return TRUE;
1158 }
1159
1160 /* Buffered output of counted data block.   Return boolean success */
1161 BOOL
1162 cutthrough_puts(uschar * cp, int n)
1163 {
1164 if (cutthrough_fd < 0)       return TRUE;
1165 if (_cutthrough_puts(cp, n)) return TRUE;
1166 cancel_cutthrough_connection("transmit failed");
1167 return FALSE;
1168 }
1169
1170
1171 static BOOL
1172 _cutthrough_flush_send( void )
1173 {
1174 int n= ctblock.ptr-ctblock.buffer;
1175
1176 if(n>0)
1177   if(!cutthrough_send(n))
1178     return FALSE;
1179 return TRUE;
1180 }
1181
1182
1183 /* Send out any bufferred output.  Return boolean success. */
1184 BOOL
1185 cutthrough_flush_send( void )
1186 {
1187 if (_cutthrough_flush_send()) return TRUE;
1188 cancel_cutthrough_connection("transmit failed");
1189 return FALSE;
1190 }
1191
1192
1193 BOOL
1194 cutthrough_put_nl( void )
1195 {
1196 return cutthrough_puts(US"\r\n", 2);
1197 }
1198
1199
1200 /* Get and check response from cutthrough target */
1201 static uschar
1202 cutthrough_response(char expect, uschar ** copy)
1203 {
1204 smtp_inblock inblock;
1205 uschar inbuffer[4096];
1206 uschar responsebuffer[4096];
1207
1208 inblock.buffer = inbuffer;
1209 inblock.buffersize = sizeof(inbuffer);
1210 inblock.ptr = inbuffer;
1211 inblock.ptrend = inbuffer;
1212 inblock.sock = cutthrough_fd;
1213 /* this relies on (inblock.sock == tls_out.active) */
1214 if(!smtp_read_response(&inblock, responsebuffer, sizeof(responsebuffer), expect, CUTTHROUGH_DATA_TIMEOUT))
1215   cancel_cutthrough_connection("target timeout on read");
1216
1217 if(copy != NULL)
1218   {
1219   uschar * cp;
1220   *copy= cp= string_copy(responsebuffer);
1221   /* Trim the trailing end of line */
1222   cp += Ustrlen(responsebuffer);
1223   if(cp > *copy  &&  cp[-1] == '\n') *--cp = '\0';
1224   if(cp > *copy  &&  cp[-1] == '\r') *--cp = '\0';
1225   }
1226
1227 return responsebuffer[0];
1228 }
1229
1230
1231 /* Negotiate dataphase with the cutthrough target, returning success boolean */
1232 BOOL
1233 cutthrough_predata( void )
1234 {
1235 if(cutthrough_fd < 0)
1236   return FALSE;
1237
1238 HDEBUG(D_transport|D_acl|D_v) debug_printf("  SMTP>> DATA\n");
1239 cutthrough_puts(US"DATA\r\n", 6);
1240 cutthrough_flush_send();
1241
1242 /* Assume nothing buffered.  If it was it gets ignored. */
1243 return cutthrough_response('3', NULL) == '3';
1244 }
1245
1246
1247 /* Buffered send of headers.  Return success boolean. */
1248 /* Expands newlines to wire format (CR,NL).           */
1249 /* Also sends header-terminating blank line.          */
1250 BOOL
1251 cutthrough_headers_send( void )
1252 {
1253 header_line * h;
1254 uschar * cp1, * cp2;
1255
1256 if(cutthrough_fd < 0)
1257   return FALSE;
1258
1259 for(h= header_list; h != NULL; h= h->next)
1260   if(h->type != htype_old  &&  h->text != NULL)
1261     for (cp1 = h->text; *cp1 && (cp2 = Ustrchr(cp1, '\n')); cp1 = cp2+1)
1262       if(  !cutthrough_puts(cp1, cp2-cp1)
1263         || !cutthrough_put_nl())
1264         return FALSE;
1265
1266 HDEBUG(D_transport|D_acl|D_v) debug_printf("  SMTP>>(nl)\n");
1267 return cutthrough_put_nl();
1268 }
1269
1270
1271 static void
1272 close_cutthrough_connection( const char * why )
1273 {
1274 if(cutthrough_fd >= 0)
1275   {
1276   /* We could be sending this after a bunch of data, but that is ok as
1277      the only way to cancel the transfer in dataphase is to drop the tcp
1278      conn before the final dot.
1279   */
1280   ctblock.ptr = ctbuffer;
1281   HDEBUG(D_transport|D_acl|D_v) debug_printf("  SMTP>> QUIT\n");
1282   _cutthrough_puts(US"QUIT\r\n", 6);    /* avoid recursion */
1283   _cutthrough_flush_send();
1284   /* No wait for response */
1285
1286   #ifdef SUPPORT_TLS
1287   tls_close(FALSE, TRUE);
1288   #endif
1289   (void)close(cutthrough_fd);
1290   cutthrough_fd= -1;
1291   HDEBUG(D_acl) debug_printf("----------- cutthrough shutdown (%s) ------------\n", why);
1292   }
1293 ctblock.ptr = ctbuffer;
1294 }
1295
1296 void
1297 cancel_cutthrough_connection( const char * why )
1298 {
1299 close_cutthrough_connection(why);
1300 cutthrough_delivery= FALSE;
1301 }
1302
1303
1304
1305
1306 /* Have senders final-dot.  Send one to cutthrough target, and grab the response.
1307    Log an OK response as a transmission.
1308    Close the connection.
1309    Return smtp response-class digit.
1310 */
1311 uschar *
1312 cutthrough_finaldot( void )
1313 {
1314 HDEBUG(D_transport|D_acl|D_v) debug_printf("  SMTP>> .\n");
1315
1316 /* Assume data finshed with new-line */
1317 if(!cutthrough_puts(US".", 1) || !cutthrough_put_nl() || !cutthrough_flush_send())
1318   return cutthrough_addr.message;
1319
1320 switch(cutthrough_response('2', &cutthrough_addr.message))
1321   {
1322   case '2':
1323     delivery_log(LOG_MAIN, &cutthrough_addr, (int)'>', NULL);
1324     close_cutthrough_connection("delivered");
1325     break;
1326
1327   case '4':
1328     delivery_log(LOG_MAIN, &cutthrough_addr, 0, US"tmp-reject from cutthrough after DATA:");
1329     break;
1330
1331   case '5':
1332     delivery_log(LOG_MAIN|LOG_REJECT, &cutthrough_addr, 0, US"rejected after DATA:");
1333     break;
1334
1335   default:
1336     break;
1337   }
1338   return cutthrough_addr.message;
1339 }
1340
1341
1342
1343 /*************************************************
1344 *           Copy error to toplevel address       *
1345 *************************************************/
1346
1347 /* This function is used when a verify fails or defers, to ensure that the
1348 failure or defer information is in the original toplevel address. This applies
1349 when an address is redirected to a single new address, and the failure or
1350 deferral happens to the child address.
1351
1352 Arguments:
1353   vaddr       the verify address item
1354   addr        the final address item
1355   yield       FAIL or DEFER
1356
1357 Returns:      the value of YIELD
1358 */
1359
1360 static int
1361 copy_error(address_item *vaddr, address_item *addr, int yield)
1362 {
1363 if (addr != vaddr)
1364   {
1365   vaddr->message = addr->message;
1366   vaddr->user_message = addr->user_message;
1367   vaddr->basic_errno = addr->basic_errno;
1368   vaddr->more_errno = addr->more_errno;
1369   vaddr->p.address_data = addr->p.address_data;
1370   copyflag(vaddr, addr, af_pass_message);
1371   }
1372 return yield;
1373 }
1374
1375
1376
1377
1378 /**************************************************
1379 * printf that automatically handles TLS if needed *
1380 ***************************************************/
1381
1382 /* This function is used by verify_address() as a substitute for all fprintf()
1383 calls; a direct fprintf() will not produce output in a TLS SMTP session, such
1384 as a response to an EXPN command.  smtp_in.c makes smtp_printf available but
1385 that assumes that we always use the smtp_out FILE* when not using TLS or the
1386 ssl buffer when we are.  Instead we take a FILE* parameter and check to see if
1387 that is smtp_out; if so, smtp_printf() with TLS support, otherwise regular
1388 fprintf().
1389
1390 Arguments:
1391   f           the candidate FILE* to write to
1392   format      format string
1393   ...         optional arguments
1394
1395 Returns:
1396               nothing
1397 */
1398
1399 static void PRINTF_FUNCTION(2,3)
1400 respond_printf(FILE *f, const char *format, ...)
1401 {
1402 va_list ap;
1403
1404 va_start(ap, format);
1405 if (smtp_out && (f == smtp_out))
1406   smtp_vprintf(format, ap);
1407 else
1408   vfprintf(f, format, ap);
1409 va_end(ap);
1410 }
1411
1412
1413
1414 /*************************************************
1415 *            Verify an email address             *
1416 *************************************************/
1417
1418 /* This function is used both for verification (-bv and at other times) and
1419 address testing (-bt), which is indicated by address_test_mode being set.
1420
1421 Arguments:
1422   vaddr            contains the address to verify; the next field in this block
1423                      must be NULL
1424   f                if not NULL, write the result to this file
1425   options          various option bits:
1426                      vopt_fake_sender => this sender verify is not for the real
1427                        sender (it was verify=sender=xxxx or an address from a
1428                        header line) - rewriting must not change sender_address
1429                      vopt_is_recipient => this is a recipient address, otherwise
1430                        it's a sender address - this affects qualification and
1431                        rewriting and messages from callouts
1432                      vopt_qualify => qualify an unqualified address; else error
1433                      vopt_expn => called from SMTP EXPN command
1434                      vopt_success_on_redirect => when a new address is generated
1435                        the verification instantly succeeds
1436
1437                      These ones are used by do_callout() -- the options variable
1438                        is passed to it.
1439
1440                      vopt_callout_fullpm => if postmaster check, do full one
1441                      vopt_callout_no_cache => don't use callout cache
1442                      vopt_callout_random => do the "random" thing
1443                      vopt_callout_recipsender => use real sender for recipient
1444                      vopt_callout_recippmaster => use postmaster for recipient
1445
1446   callout          if > 0, specifies that callout is required, and gives timeout
1447                      for individual commands
1448   callout_overall  if > 0, gives overall timeout for the callout function;
1449                    if < 0, a default is used (see do_callout())
1450   callout_connect  the connection timeout for callouts
1451   se_mailfrom      when callout is requested to verify a sender, use this
1452                      in MAIL FROM; NULL => ""
1453   pm_mailfrom      when callout is requested, if non-NULL, do the postmaster
1454                      thing and use this as the sender address (may be "")
1455
1456   routed           if not NULL, set TRUE if routing succeeded, so we can
1457                      distinguish between routing failed and callout failed
1458
1459 Returns:           OK      address verified
1460                    FAIL    address failed to verify
1461                    DEFER   can't tell at present
1462 */
1463
1464 int
1465 verify_address(address_item *vaddr, FILE *f, int options, int callout,
1466   int callout_overall, int callout_connect, uschar *se_mailfrom,
1467   uschar *pm_mailfrom, BOOL *routed)
1468 {
1469 BOOL allok = TRUE;
1470 BOOL full_info = (f == NULL)? FALSE : (debug_selector != 0);
1471 BOOL is_recipient = (options & vopt_is_recipient) != 0;
1472 BOOL expn         = (options & vopt_expn) != 0;
1473 BOOL success_on_redirect = (options & vopt_success_on_redirect) != 0;
1474 int i;
1475 int yield = OK;
1476 int verify_type = expn? v_expn :
1477      address_test_mode? v_none :
1478           is_recipient? v_recipient : v_sender;
1479 address_item *addr_list;
1480 address_item *addr_new = NULL;
1481 address_item *addr_remote = NULL;
1482 address_item *addr_local = NULL;
1483 address_item *addr_succeed = NULL;
1484 uschar **failure_ptr = is_recipient?
1485   &recipient_verify_failure : &sender_verify_failure;
1486 uschar *ko_prefix, *cr;
1487 uschar *address = vaddr->address;
1488 uschar *save_sender;
1489 uschar null_sender[] = { 0 };             /* Ensure writeable memory */
1490
1491 /* Clear, just in case */
1492
1493 *failure_ptr = NULL;
1494
1495 /* Set up a prefix and suffix for error message which allow us to use the same
1496 output statements both in EXPN mode (where an SMTP response is needed) and when
1497 debugging with an output file. */
1498
1499 if (expn)
1500   {
1501   ko_prefix = US"553 ";
1502   cr = US"\r";
1503   }
1504 else ko_prefix = cr = US"";
1505
1506 /* Add qualify domain if permitted; otherwise an unqualified address fails. */
1507
1508 if (parse_find_at(address) == NULL)
1509   {
1510   if ((options & vopt_qualify) == 0)
1511     {
1512     if (f != NULL)
1513       respond_printf(f, "%sA domain is required for \"%s\"%s\n",
1514         ko_prefix, address, cr);
1515     *failure_ptr = US"qualify";
1516     return FAIL;
1517     }
1518   address = rewrite_address_qualify(address, is_recipient);
1519   }
1520
1521 DEBUG(D_verify)
1522   {
1523   debug_printf(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>\n");
1524   debug_printf("%s %s\n", address_test_mode? "Testing" : "Verifying", address);
1525   }
1526
1527 /* Rewrite and report on it. Clear the domain and local part caches - these
1528 may have been set by domains and local part tests during an ACL. */
1529
1530 if (global_rewrite_rules != NULL)
1531   {
1532   uschar *old = address;
1533   address = rewrite_address(address, is_recipient, FALSE,
1534     global_rewrite_rules, rewrite_existflags);
1535   if (address != old)
1536     {
1537     for (i = 0; i < (MAX_NAMED_LIST * 2)/32; i++) vaddr->localpart_cache[i] = 0;
1538     for (i = 0; i < (MAX_NAMED_LIST * 2)/32; i++) vaddr->domain_cache[i] = 0;
1539     if (f != NULL && !expn) fprintf(f, "Address rewritten as: %s\n", address);
1540     }
1541   }
1542
1543 /* If this is the real sender address, we must update sender_address at
1544 this point, because it may be referred to in the routers. */
1545
1546 if ((options & (vopt_fake_sender|vopt_is_recipient)) == 0)
1547   sender_address = address;
1548
1549 /* If the address was rewritten to <> no verification can be done, and we have
1550 to return OK. This rewriting is permitted only for sender addresses; for other
1551 addresses, such rewriting fails. */
1552
1553 if (address[0] == 0) return OK;
1554
1555 /* Flip the legacy TLS-related variables over to the outbound set in case
1556 they're used in the context of a transport used by verification. Reset them
1557 at exit from this routine. */
1558
1559 modify_variable(US"tls_bits",                 &tls_out.bits);
1560 modify_variable(US"tls_certificate_verified", &tls_out.certificate_verified);
1561 modify_variable(US"tls_cipher",               &tls_out.cipher);
1562 modify_variable(US"tls_peerdn",               &tls_out.peerdn);
1563 #if defined(SUPPORT_TLS) && !defined(USE_GNUTLS)
1564 modify_variable(US"tls_sni",                  &tls_out.sni);
1565 #endif
1566
1567 /* Save a copy of the sender address for re-instating if we change it to <>
1568 while verifying a sender address (a nice bit of self-reference there). */
1569
1570 save_sender = sender_address;
1571
1572 /* Update the address structure with the possibly qualified and rewritten
1573 address. Set it up as the starting address on the chain of new addresses. */
1574
1575 vaddr->address = address;
1576 addr_new = vaddr;
1577
1578 /* We need a loop, because an address can generate new addresses. We must also
1579 cope with generated pipes and files at the top level. (See also the code and
1580 comment in deliver.c.) However, it is usually the case that the router for
1581 user's .forward files has its verify flag turned off.
1582
1583 If an address generates more than one child, the loop is used only when
1584 full_info is set, and this can only be set locally. Remote enquiries just get
1585 information about the top level address, not anything that it generated. */
1586
1587 while (addr_new != NULL)
1588   {
1589   int rc;
1590   address_item *addr = addr_new;
1591
1592   addr_new = addr->next;
1593   addr->next = NULL;
1594
1595   DEBUG(D_verify)
1596     {
1597     debug_printf(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>\n");
1598     debug_printf("Considering %s\n", addr->address);
1599     }
1600
1601   /* Handle generated pipe, file or reply addresses. We don't get these
1602   when handling EXPN, as it does only one level of expansion. */
1603
1604   if (testflag(addr, af_pfr))
1605     {
1606     allok = FALSE;
1607     if (f != NULL)
1608       {
1609       BOOL allow;
1610
1611       if (addr->address[0] == '>')
1612         {
1613         allow = testflag(addr, af_allow_reply);
1614         fprintf(f, "%s -> mail %s", addr->parent->address, addr->address + 1);
1615         }
1616       else
1617         {
1618         allow = (addr->address[0] == '|')?
1619           testflag(addr, af_allow_pipe) : testflag(addr, af_allow_file);
1620         fprintf(f, "%s -> %s", addr->parent->address, addr->address);
1621         }
1622
1623       if (addr->basic_errno == ERRNO_BADTRANSPORT)
1624         fprintf(f, "\n*** Error in setting up pipe, file, or autoreply:\n"
1625           "%s\n", addr->message);
1626       else if (allow)
1627         fprintf(f, "\n  transport = %s\n", addr->transport->name);
1628       else
1629         fprintf(f, " *** forbidden ***\n");
1630       }
1631     continue;
1632     }
1633
1634   /* Just in case some router parameter refers to it. */
1635
1636   return_path = (addr->p.errors_address != NULL)?
1637     addr->p.errors_address : sender_address;
1638
1639   /* Split the address into domain and local part, handling the %-hack if
1640   necessary, and then route it. While routing a sender address, set
1641   $sender_address to <> because that is what it will be if we were trying to
1642   send a bounce to the sender. */
1643
1644   if (routed != NULL) *routed = FALSE;
1645   if ((rc = deliver_split_address(addr)) == OK)
1646     {
1647     if (!is_recipient) sender_address = null_sender;
1648     rc = route_address(addr, &addr_local, &addr_remote, &addr_new,
1649       &addr_succeed, verify_type);
1650     sender_address = save_sender;     /* Put back the real sender */
1651     }
1652
1653   /* If routing an address succeeded, set the flag that remembers, for use when
1654   an ACL cached a sender verify (in case a callout fails). Then if routing set
1655   up a list of hosts or the transport has a host list, and the callout option
1656   is set, and we aren't in a host checking run, do the callout verification,
1657   and set another flag that notes that a callout happened. */
1658
1659   if (rc == OK)
1660     {
1661     if (routed != NULL) *routed = TRUE;
1662     if (callout > 0)
1663       {
1664       host_item *host_list = addr->host_list;
1665
1666       /* Make up some data for use in the case where there is no remote
1667       transport. */
1668
1669       transport_feedback tf = {
1670         NULL,                       /* interface (=> any) */
1671         US"smtp",                   /* port */
1672         US"smtp",                   /* protocol */
1673         NULL,                       /* hosts */
1674         US"$smtp_active_hostname",  /* helo_data */
1675         FALSE,                      /* hosts_override */
1676         FALSE,                      /* hosts_randomize */
1677         FALSE,                      /* gethostbyname */
1678         TRUE,                       /* qualify_single */
1679         FALSE                       /* search_parents */
1680         };
1681
1682       /* If verification yielded a remote transport, we want to use that
1683       transport's options, so as to mimic what would happen if we were really
1684       sending a message to this address. */
1685
1686       if (addr->transport != NULL && !addr->transport->info->local)
1687         {
1688         (void)(addr->transport->setup)(addr->transport, addr, &tf, 0, 0, NULL);
1689
1690         /* If the transport has hosts and the router does not, or if the
1691         transport is configured to override the router's hosts, we must build a
1692         host list of the transport's hosts, and find the IP addresses */
1693
1694         if (tf.hosts != NULL && (host_list == NULL || tf.hosts_override))
1695           {
1696           uschar *s;
1697           uschar *save_deliver_domain = deliver_domain;
1698           uschar *save_deliver_localpart = deliver_localpart;
1699
1700           host_list = NULL;    /* Ignore the router's hosts */
1701
1702           deliver_domain = addr->domain;
1703           deliver_localpart = addr->local_part;
1704           s = expand_string(tf.hosts);
1705           deliver_domain = save_deliver_domain;
1706           deliver_localpart = save_deliver_localpart;
1707
1708           if (s == NULL)
1709             {
1710             log_write(0, LOG_MAIN|LOG_PANIC, "failed to expand list of hosts "
1711               "\"%s\" in %s transport for callout: %s", tf.hosts,
1712               addr->transport->name, expand_string_message);
1713             }
1714           else
1715             {
1716             int flags;
1717             uschar *canonical_name;
1718             host_item *host, *nexthost;
1719             host_build_hostlist(&host_list, s, tf.hosts_randomize);
1720
1721             /* Just ignore failures to find a host address. If we don't manage
1722             to find any addresses, the callout will defer. Note that more than
1723             one address may be found for a single host, which will result in
1724             additional host items being inserted into the chain. Hence we must
1725             save the next host first. */
1726
1727             flags = HOST_FIND_BY_A;
1728             if (tf.qualify_single) flags |= HOST_FIND_QUALIFY_SINGLE;
1729             if (tf.search_parents) flags |= HOST_FIND_SEARCH_PARENTS;
1730
1731             for (host = host_list; host != NULL; host = nexthost)
1732               {
1733               nexthost = host->next;
1734               if (tf.gethostbyname ||
1735                   string_is_ip_address(host->name, NULL) != 0)
1736                 (void)host_find_byname(host, NULL, flags, &canonical_name, TRUE);
1737               else
1738                 (void)host_find_bydns(host, NULL, flags, NULL, NULL, NULL,
1739                   &canonical_name, NULL);
1740               }
1741             }
1742           }
1743         }
1744
1745       /* Can only do a callout if we have at least one host! If the callout
1746       fails, it will have set ${sender,recipient}_verify_failure. */
1747
1748       if (host_list != NULL)
1749         {
1750         HDEBUG(D_verify) debug_printf("Attempting full verification using callout\n");
1751         if (host_checking && !host_checking_callout)
1752           {
1753           HDEBUG(D_verify)
1754             debug_printf("... callout omitted by default when host testing\n"
1755               "(Use -bhc if you want the callouts to happen.)\n");
1756           }
1757         else
1758           {
1759 #ifdef SUPPORT_TLS
1760           deliver_set_expansions(addr);
1761 #endif
1762           rc = do_callout(addr, host_list, &tf, callout, callout_overall,
1763             callout_connect, options, se_mailfrom, pm_mailfrom);
1764           }
1765         }
1766       else
1767         {
1768         HDEBUG(D_verify) debug_printf("Cannot do callout: neither router nor "
1769           "transport provided a host list\n");
1770         }
1771       }
1772     }
1773
1774   /* Otherwise, any failure is a routing failure */
1775
1776   else *failure_ptr = US"route";
1777
1778   /* A router may return REROUTED if it has set up a child address as a result
1779   of a change of domain name (typically from widening). In this case we always
1780   want to continue to verify the new child. */
1781
1782   if (rc == REROUTED) continue;
1783
1784   /* Handle hard failures */
1785
1786   if (rc == FAIL)
1787     {
1788     allok = FALSE;
1789     if (f != NULL)
1790       {
1791       address_item *p = addr->parent;
1792
1793       respond_printf(f, "%s%s %s", ko_prefix,
1794         full_info? addr->address : address,
1795         address_test_mode? "is undeliverable" : "failed to verify");
1796       if (!expn && admin_user)
1797         {
1798         if (addr->basic_errno > 0)
1799           respond_printf(f, ": %s", strerror(addr->basic_errno));
1800         if (addr->message != NULL)
1801           respond_printf(f, ": %s", addr->message);
1802         }
1803
1804       /* Show parents iff doing full info */
1805
1806       if (full_info) while (p != NULL)
1807         {
1808         respond_printf(f, "%s\n    <-- %s", cr, p->address);
1809         p = p->parent;
1810         }
1811       respond_printf(f, "%s\n", cr);
1812       }
1813     cancel_cutthrough_connection("routing hard fail");
1814
1815     if (!full_info)
1816     {
1817       yield = copy_error(vaddr, addr, FAIL);
1818       goto out;
1819     }
1820     else yield = FAIL;
1821     }
1822
1823   /* Soft failure */
1824
1825   else if (rc == DEFER)
1826     {
1827     allok = FALSE;
1828     if (f != NULL)
1829       {
1830       address_item *p = addr->parent;
1831       respond_printf(f, "%s%s cannot be resolved at this time", ko_prefix,
1832         full_info? addr->address : address);
1833       if (!expn && admin_user)
1834         {
1835         if (addr->basic_errno > 0)
1836           respond_printf(f, ": %s", strerror(addr->basic_errno));
1837         if (addr->message != NULL)
1838           respond_printf(f, ": %s", addr->message);
1839         else if (addr->basic_errno <= 0)
1840           respond_printf(f, ": unknown error");
1841         }
1842
1843       /* Show parents iff doing full info */
1844
1845       if (full_info) while (p != NULL)
1846         {
1847         respond_printf(f, "%s\n    <-- %s", cr, p->address);
1848         p = p->parent;
1849         }
1850       respond_printf(f, "%s\n", cr);
1851       }
1852     cancel_cutthrough_connection("routing soft fail");
1853
1854     if (!full_info)
1855       {
1856       yield = copy_error(vaddr, addr, DEFER);
1857       goto out;
1858       }
1859     else if (yield == OK) yield = DEFER;
1860     }
1861
1862   /* If we are handling EXPN, we do not want to continue to route beyond
1863   the top level (whose address is in "address"). */
1864
1865   else if (expn)
1866     {
1867     uschar *ok_prefix = US"250-";
1868     if (addr_new == NULL)
1869       {
1870       if (addr_local == NULL && addr_remote == NULL)
1871         respond_printf(f, "250 mail to <%s> is discarded\r\n", address);
1872       else
1873         respond_printf(f, "250 <%s>\r\n", address);
1874       }
1875     else while (addr_new != NULL)
1876       {
1877       address_item *addr2 = addr_new;
1878       addr_new = addr2->next;
1879       if (addr_new == NULL) ok_prefix = US"250 ";
1880       respond_printf(f, "%s<%s>\r\n", ok_prefix, addr2->address);
1881       }
1882     yield = OK;
1883     goto out;
1884     }
1885
1886   /* Successful routing other than EXPN. */
1887
1888   else
1889     {
1890     /* Handle successful routing when short info wanted. Otherwise continue for
1891     other (generated) addresses. Short info is the operational case. Full info
1892     can be requested only when debug_selector != 0 and a file is supplied.
1893
1894     There is a conflict between the use of aliasing as an alternate email
1895     address, and as a sort of mailing list. If an alias turns the incoming
1896     address into just one address (e.g. J.Caesar->jc44) you may well want to
1897     carry on verifying the generated address to ensure it is valid when
1898     checking incoming mail. If aliasing generates multiple addresses, you
1899     probably don't want to do this. Exim therefore treats the generation of
1900     just a single new address as a special case, and continues on to verify the
1901     generated address. */
1902
1903     if (!full_info &&                    /* Stop if short info wanted AND */
1904          (((addr_new == NULL ||          /* No new address OR */
1905            addr_new->next != NULL ||     /* More than one new address OR */
1906            testflag(addr_new, af_pfr)))  /* New address is pfr */
1907          ||                              /* OR */
1908          (addr_new != NULL &&            /* At least one new address AND */
1909           success_on_redirect)))         /* success_on_redirect is set */
1910       {
1911       if (f != NULL) fprintf(f, "%s %s\n", address,
1912         address_test_mode? "is deliverable" : "verified");
1913
1914       /* If we have carried on to verify a child address, we want the value
1915       of $address_data to be that of the child */
1916
1917       vaddr->p.address_data = addr->p.address_data;
1918       yield = OK;
1919       goto out;
1920       }
1921     }
1922   }     /* Loop for generated addresses */
1923
1924 /* Display the full results of the successful routing, including any generated
1925 addresses. Control gets here only when full_info is set, which requires f not
1926 to be NULL, and this occurs only when a top-level verify is called with the
1927 debugging switch on.
1928
1929 If there are no local and no remote addresses, and there were no pipes, files,
1930 or autoreplies, and there were no errors or deferments, the message is to be
1931 discarded, usually because of the use of :blackhole: in an alias file. */
1932
1933 if (allok && addr_local == NULL && addr_remote == NULL)
1934   {
1935   fprintf(f, "mail to %s is discarded\n", address);
1936   goto out;
1937   }
1938
1939 for (addr_list = addr_local, i = 0; i < 2; addr_list = addr_remote, i++)
1940   {
1941   while (addr_list != NULL)
1942     {
1943     address_item *addr = addr_list;
1944     address_item *p = addr->parent;
1945     addr_list = addr->next;
1946
1947     fprintf(f, "%s", CS addr->address);
1948 #ifdef EXPERIMENTAL_SRS
1949     if(addr->p.srs_sender)
1950       fprintf(f, "    [srs = %s]", addr->p.srs_sender);
1951 #endif
1952
1953     /* If the address is a duplicate, show something about it. */
1954
1955     if (!testflag(addr, af_pfr))
1956       {
1957       tree_node *tnode;
1958       if ((tnode = tree_search(tree_duplicates, addr->unique)) != NULL)
1959         fprintf(f, "   [duplicate, would not be delivered]");
1960       else tree_add_duplicate(addr->unique, addr);
1961       }
1962
1963     /* Now show its parents */
1964
1965     while (p != NULL)
1966       {
1967       fprintf(f, "\n    <-- %s", p->address);
1968       p = p->parent;
1969       }
1970     fprintf(f, "\n  ");
1971
1972     /* Show router, and transport */
1973
1974     fprintf(f, "router = %s, ", addr->router->name);
1975     fprintf(f, "transport = %s\n", (addr->transport == NULL)? US"unset" :
1976       addr->transport->name);
1977
1978     /* Show any hosts that are set up by a router unless the transport
1979     is going to override them; fiddle a bit to get a nice format. */
1980
1981     if (addr->host_list != NULL && addr->transport != NULL &&
1982         !addr->transport->overrides_hosts)
1983       {
1984       host_item *h;
1985       int maxlen = 0;
1986       int maxaddlen = 0;
1987       for (h = addr->host_list; h != NULL; h = h->next)
1988         {
1989         int len = Ustrlen(h->name);
1990         if (len > maxlen) maxlen = len;
1991         len = (h->address != NULL)? Ustrlen(h->address) : 7;
1992         if (len > maxaddlen) maxaddlen = len;
1993         }
1994       for (h = addr->host_list; h != NULL; h = h->next)
1995         {
1996         int len = Ustrlen(h->name);
1997         fprintf(f, "  host %s ", h->name);
1998         while (len++ < maxlen) fprintf(f, " ");
1999         if (h->address != NULL)
2000           {
2001           fprintf(f, "[%s] ", h->address);
2002           len = Ustrlen(h->address);
2003           }
2004         else if (!addr->transport->info->local)  /* Omit [unknown] for local */
2005           {
2006           fprintf(f, "[unknown] ");
2007           len = 7;
2008           }
2009         else len = -3;
2010         while (len++ < maxaddlen) fprintf(f," ");
2011         if (h->mx >= 0) fprintf(f, "MX=%d", h->mx);
2012         if (h->port != PORT_NONE) fprintf(f, " port=%d", h->port);
2013         if (h->status == hstatus_unusable) fprintf(f, " ** unusable **");
2014         fprintf(f, "\n");
2015         }
2016       }
2017     }
2018   }
2019
2020 /* Yield will be DEFER or FAIL if any one address has, only for full_info (which is
2021 the -bv or -bt case). */
2022
2023 out:
2024
2025 modify_variable(US"tls_bits",                 &tls_in.bits);
2026 modify_variable(US"tls_certificate_verified", &tls_in.certificate_verified);
2027 modify_variable(US"tls_cipher",               &tls_in.cipher);
2028 modify_variable(US"tls_peerdn",               &tls_in.peerdn);
2029 #if defined(SUPPORT_TLS) && !defined(USE_GNUTLS)
2030 modify_variable(US"tls_sni",                  &tls_in.sni);
2031 #endif
2032
2033 return yield;
2034 }
2035
2036
2037
2038
2039 /*************************************************
2040 *      Check headers for syntax errors           *
2041 *************************************************/
2042
2043 /* This function checks those header lines that contain addresses, and verifies
2044 that all the addresses therein are syntactially correct.
2045
2046 Arguments:
2047   msgptr     where to put an error message
2048
2049 Returns:     OK
2050              FAIL
2051 */
2052
2053 int
2054 verify_check_headers(uschar **msgptr)
2055 {
2056 header_line *h;
2057 uschar *colon, *s;
2058 int yield = OK;
2059
2060 for (h = header_list; h != NULL && yield == OK; h = h->next)
2061   {
2062   if (h->type != htype_from &&
2063       h->type != htype_reply_to &&
2064       h->type != htype_sender &&
2065       h->type != htype_to &&
2066       h->type != htype_cc &&
2067       h->type != htype_bcc)
2068     continue;
2069
2070   colon = Ustrchr(h->text, ':');
2071   s = colon + 1;
2072   while (isspace(*s)) s++;
2073
2074   /* Loop for multiple addresses in the header, enabling group syntax. Note
2075   that we have to reset this after the header has been scanned. */
2076
2077   parse_allow_group = TRUE;
2078
2079   while (*s != 0)
2080     {
2081     uschar *ss = parse_find_address_end(s, FALSE);
2082     uschar *recipient, *errmess;
2083     int terminator = *ss;
2084     int start, end, domain;
2085
2086     /* Temporarily terminate the string at this point, and extract the
2087     operative address within, allowing group syntax. */
2088
2089     *ss = 0;
2090     recipient = parse_extract_address(s,&errmess,&start,&end,&domain,FALSE);
2091     *ss = terminator;
2092
2093     /* Permit an unqualified address only if the message is local, or if the
2094     sending host is configured to be permitted to send them. */
2095
2096     if (recipient != NULL && domain == 0)
2097       {
2098       if (h->type == htype_from || h->type == htype_sender)
2099         {
2100         if (!allow_unqualified_sender) recipient = NULL;
2101         }
2102       else
2103         {
2104         if (!allow_unqualified_recipient) recipient = NULL;
2105         }
2106       if (recipient == NULL) errmess = US"unqualified address not permitted";
2107       }
2108
2109     /* It's an error if no address could be extracted, except for the special
2110     case of an empty address. */
2111
2112     if (recipient == NULL && Ustrcmp(errmess, "empty address") != 0)
2113       {
2114       uschar *verb = US"is";
2115       uschar *t = ss;
2116       uschar *tt = colon;
2117       int len;
2118
2119       /* Arrange not to include any white space at the end in the
2120       error message or the header name. */
2121
2122       while (t > s && isspace(t[-1])) t--;
2123       while (tt > h->text && isspace(tt[-1])) tt--;
2124
2125       /* Add the address that failed to the error message, since in a
2126       header with very many addresses it is sometimes hard to spot
2127       which one is at fault. However, limit the amount of address to
2128       quote - cases have been seen where, for example, a missing double
2129       quote in a humungous To: header creates an "address" that is longer
2130       than string_sprintf can handle. */
2131
2132       len = t - s;
2133       if (len > 1024)
2134         {
2135         len = 1024;
2136         verb = US"begins";
2137         }
2138
2139       *msgptr = string_printing(
2140         string_sprintf("%s: failing address in \"%.*s:\" header %s: %.*s",
2141           errmess, tt - h->text, h->text, verb, len, s));
2142
2143       yield = FAIL;
2144       break;          /* Out of address loop */
2145       }
2146
2147     /* Advance to the next address */
2148
2149     s = ss + (terminator? 1:0);
2150     while (isspace(*s)) s++;
2151     }   /* Next address */
2152
2153   parse_allow_group = FALSE;
2154   parse_found_group = FALSE;
2155   }     /* Next header unless yield has been set FALSE */
2156
2157 return yield;
2158 }
2159
2160
2161 /*************************************************
2162 *      Check header names for 8-bit characters   *
2163 *************************************************/
2164
2165 /* This function checks for invalid charcters in header names. See
2166 RFC 5322, 2.2. and RFC 6532, 3.
2167
2168 Arguments:
2169   msgptr     where to put an error message
2170
2171 Returns:     OK
2172              FAIL
2173 */
2174
2175 int
2176 verify_check_header_names_ascii(uschar **msgptr)
2177 {
2178 header_line *h;
2179 uschar *colon, *s;
2180
2181 for (h = header_list; h != NULL; h = h->next)
2182   {
2183    colon = Ustrchr(h->text, ':');
2184    for(s = h->text; s < colon; s++)
2185      {
2186         if ((*s < 33) || (*s > 126))
2187         {
2188                 *msgptr = string_sprintf("Invalid character in header \"%.*s\" found",
2189                                          colon - h->text, h->text);
2190                 return FAIL;
2191         }
2192      }
2193   }
2194 return OK;
2195 }
2196
2197 /*************************************************
2198 *          Check for blind recipients            *
2199 *************************************************/
2200
2201 /* This function checks that every (envelope) recipient is mentioned in either
2202 the To: or Cc: header lines, thus detecting blind carbon copies.
2203
2204 There are two ways of scanning that could be used: either scan the header lines
2205 and tick off the recipients, or scan the recipients and check the header lines.
2206 The original proposed patch did the former, but I have chosen to do the latter,
2207 because (a) it requires no memory and (b) will use fewer resources when there
2208 are many addresses in To: and/or Cc: and only one or two envelope recipients.
2209
2210 Arguments:   none
2211 Returns:     OK    if there are no blind recipients
2212              FAIL  if there is at least one blind recipient
2213 */
2214
2215 int
2216 verify_check_notblind(void)
2217 {
2218 int i;
2219 for (i = 0; i < recipients_count; i++)
2220   {
2221   header_line *h;
2222   BOOL found = FALSE;
2223   uschar *address = recipients_list[i].address;
2224
2225   for (h = header_list; !found && h != NULL; h = h->next)
2226     {
2227     uschar *colon, *s;
2228
2229     if (h->type != htype_to && h->type != htype_cc) continue;
2230
2231     colon = Ustrchr(h->text, ':');
2232     s = colon + 1;
2233     while (isspace(*s)) s++;
2234
2235     /* Loop for multiple addresses in the header, enabling group syntax. Note
2236     that we have to reset this after the header has been scanned. */
2237
2238     parse_allow_group = TRUE;
2239
2240     while (*s != 0)
2241       {
2242       uschar *ss = parse_find_address_end(s, FALSE);
2243       uschar *recipient,*errmess;
2244       int terminator = *ss;
2245       int start, end, domain;
2246
2247       /* Temporarily terminate the string at this point, and extract the
2248       operative address within, allowing group syntax. */
2249
2250       *ss = 0;
2251       recipient = parse_extract_address(s,&errmess,&start,&end,&domain,FALSE);
2252       *ss = terminator;
2253
2254       /* If we found a valid recipient that has a domain, compare it with the
2255       envelope recipient. Local parts are compared case-sensitively, domains
2256       case-insensitively. By comparing from the start with length "domain", we
2257       include the "@" at the end, which ensures that we are comparing the whole
2258       local part of each address. */
2259
2260       if (recipient != NULL && domain != 0)
2261         {
2262         found = Ustrncmp(recipient, address, domain) == 0 &&
2263                 strcmpic(recipient + domain, address + domain) == 0;
2264         if (found) break;
2265         }
2266
2267       /* Advance to the next address */
2268
2269       s = ss + (terminator? 1:0);
2270       while (isspace(*s)) s++;
2271       }   /* Next address */
2272
2273     parse_allow_group = FALSE;
2274     parse_found_group = FALSE;
2275     }     /* Next header (if found is false) */
2276
2277   if (!found) return FAIL;
2278   }       /* Next recipient */
2279
2280 return OK;
2281 }
2282
2283
2284
2285 /*************************************************
2286 *          Find if verified sender               *
2287 *************************************************/
2288
2289 /* Usually, just a single address is verified as the sender of the message.
2290 However, Exim can be made to verify other addresses as well (often related in
2291 some way), and this is useful in some environments. There may therefore be a
2292 chain of such addresses that have previously been tested. This function finds
2293 whether a given address is on the chain.
2294
2295 Arguments:   the address to be verified
2296 Returns:     pointer to an address item, or NULL
2297 */
2298
2299 address_item *
2300 verify_checked_sender(uschar *sender)
2301 {
2302 address_item *addr;
2303 for (addr = sender_verified_list; addr != NULL; addr = addr->next)
2304   if (Ustrcmp(sender, addr->address) == 0) break;
2305 return addr;
2306 }
2307
2308
2309
2310
2311
2312 /*************************************************
2313 *             Get valid header address           *
2314 *************************************************/
2315
2316 /* Scan the originator headers of the message, looking for an address that
2317 verifies successfully. RFC 822 says:
2318
2319     o   The "Sender" field mailbox should be sent  notices  of
2320         any  problems in transport or delivery of the original
2321         messages.  If there is no  "Sender"  field,  then  the
2322         "From" field mailbox should be used.
2323
2324     o   If the "Reply-To" field exists, then the reply  should
2325         go to the addresses indicated in that field and not to
2326         the address(es) indicated in the "From" field.
2327
2328 So we check a Sender field if there is one, else a Reply_to field, else a From
2329 field. As some strange messages may have more than one of these fields,
2330 especially if they are resent- fields, check all of them if there is more than
2331 one.
2332
2333 Arguments:
2334   user_msgptr      points to where to put a user error message
2335   log_msgptr       points to where to put a log error message
2336   callout          timeout for callout check (passed to verify_address())
2337   callout_overall  overall callout timeout (ditto)
2338   callout_connect  connect callout timeout (ditto)
2339   se_mailfrom      mailfrom for verify; NULL => ""
2340   pm_mailfrom      sender for pm callout check (passed to verify_address())
2341   options          callout options (passed to verify_address())
2342   verrno           where to put the address basic_errno
2343
2344 If log_msgptr is set to something without setting user_msgptr, the caller
2345 normally uses log_msgptr for both things.
2346
2347 Returns:           result of the verification attempt: OK, FAIL, or DEFER;
2348                    FAIL is given if no appropriate headers are found
2349 */
2350
2351 int
2352 verify_check_header_address(uschar **user_msgptr, uschar **log_msgptr,
2353   int callout, int callout_overall, int callout_connect, uschar *se_mailfrom,
2354   uschar *pm_mailfrom, int options, int *verrno)
2355 {
2356 static int header_types[] = { htype_sender, htype_reply_to, htype_from };
2357 BOOL done = FALSE;
2358 int yield = FAIL;
2359 int i;
2360
2361 for (i = 0; i < 3 && !done; i++)
2362   {
2363   header_line *h;
2364   for (h = header_list; h != NULL && !done; h = h->next)
2365     {
2366     int terminator, new_ok;
2367     uschar *s, *ss, *endname;
2368
2369     if (h->type != header_types[i]) continue;
2370     s = endname = Ustrchr(h->text, ':') + 1;
2371
2372     /* Scan the addresses in the header, enabling group syntax. Note that we
2373     have to reset this after the header has been scanned. */
2374
2375     parse_allow_group = TRUE;
2376
2377     while (*s != 0)
2378       {
2379       address_item *vaddr;
2380
2381       while (isspace(*s) || *s == ',') s++;
2382       if (*s == 0) break;        /* End of header */
2383
2384       ss = parse_find_address_end(s, FALSE);
2385
2386       /* The terminator is a comma or end of header, but there may be white
2387       space preceding it (including newline for the last address). Move back
2388       past any white space so we can check against any cached envelope sender
2389       address verifications. */
2390
2391       while (isspace(ss[-1])) ss--;
2392       terminator = *ss;
2393       *ss = 0;
2394
2395       HDEBUG(D_verify) debug_printf("verifying %.*s header address %s\n",
2396         (int)(endname - h->text), h->text, s);
2397
2398       /* See if we have already verified this address as an envelope sender,
2399       and if so, use the previous answer. */
2400
2401       vaddr = verify_checked_sender(s);
2402
2403       if (vaddr != NULL &&                   /* Previously checked */
2404            (callout <= 0 ||                  /* No callout needed; OR */
2405             vaddr->special_action > 256))    /* Callout was done */
2406         {
2407         new_ok = vaddr->special_action & 255;
2408         HDEBUG(D_verify) debug_printf("previously checked as envelope sender\n");
2409         *ss = terminator;  /* Restore shortened string */
2410         }
2411
2412       /* Otherwise we run the verification now. We must restore the shortened
2413       string before running the verification, so the headers are correct, in
2414       case there is any rewriting. */
2415
2416       else
2417         {
2418         int start, end, domain;
2419         uschar *address = parse_extract_address(s, log_msgptr, &start, &end,
2420           &domain, FALSE);
2421
2422         *ss = terminator;
2423
2424         /* If we found an empty address, just carry on with the next one, but
2425         kill the message. */
2426
2427         if (address == NULL && Ustrcmp(*log_msgptr, "empty address") == 0)
2428           {
2429           *log_msgptr = NULL;
2430           s = ss;
2431           continue;
2432           }
2433
2434         /* If verification failed because of a syntax error, fail this
2435         function, and ensure that the failing address gets added to the error
2436         message. */
2437
2438         if (address == NULL)
2439           {
2440           new_ok = FAIL;
2441           while (ss > s && isspace(ss[-1])) ss--;
2442           *log_msgptr = string_sprintf("syntax error in '%.*s' header when "
2443             "scanning for sender: %s in \"%.*s\"",
2444             endname - h->text, h->text, *log_msgptr, ss - s, s);
2445           yield = FAIL;
2446           done = TRUE;
2447           break;
2448           }
2449
2450         /* Else go ahead with the sender verification. But it isn't *the*
2451         sender of the message, so set vopt_fake_sender to stop sender_address
2452         being replaced after rewriting or qualification. */
2453
2454         else
2455           {
2456           vaddr = deliver_make_addr(address, FALSE);
2457           new_ok = verify_address(vaddr, NULL, options | vopt_fake_sender,
2458             callout, callout_overall, callout_connect, se_mailfrom,
2459             pm_mailfrom, NULL);
2460           }
2461         }
2462
2463       /* We now have the result, either newly found, or cached. If we are
2464       giving out error details, set a specific user error. This means that the
2465       last of these will be returned to the user if all three fail. We do not
2466       set a log message - the generic one below will be used. */
2467
2468       if (new_ok != OK)
2469         {
2470         *verrno = vaddr->basic_errno;
2471         if (smtp_return_error_details)
2472           {
2473           *user_msgptr = string_sprintf("Rejected after DATA: "
2474             "could not verify \"%.*s\" header address\n%s: %s",
2475             endname - h->text, h->text, vaddr->address, vaddr->message);
2476           }
2477         }
2478
2479       /* Success or defer */
2480
2481       if (new_ok == OK)
2482         {
2483         yield = OK;
2484         done = TRUE;
2485         break;
2486         }
2487
2488       if (new_ok == DEFER) yield = DEFER;
2489
2490       /* Move on to any more addresses in the header */
2491
2492       s = ss;
2493       }     /* Next address */
2494
2495     parse_allow_group = FALSE;
2496     parse_found_group = FALSE;
2497     }       /* Next header, unless done */
2498   }         /* Next header type unless done */
2499
2500 if (yield == FAIL && *log_msgptr == NULL)
2501   *log_msgptr = US"there is no valid sender in any header line";
2502
2503 if (yield == DEFER && *log_msgptr == NULL)
2504   *log_msgptr = US"all attempts to verify a sender in a header line deferred";
2505
2506 return yield;
2507 }
2508
2509
2510
2511
2512 /*************************************************
2513 *            Get RFC 1413 identification         *
2514 *************************************************/
2515
2516 /* Attempt to get an id from the sending machine via the RFC 1413 protocol. If
2517 the timeout is set to zero, then the query is not done. There may also be lists
2518 of hosts and nets which are exempt. To guard against malefactors sending
2519 non-printing characters which could, for example, disrupt a message's headers,
2520 make sure the string consists of printing characters only.
2521
2522 Argument:
2523   port    the port to connect to; usually this is IDENT_PORT (113), but when
2524           running in the test harness with -bh a different value is used.
2525
2526 Returns:  nothing
2527
2528 Side effect: any received ident value is put in sender_ident (NULL otherwise)
2529 */
2530
2531 void
2532 verify_get_ident(int port)
2533 {
2534 int sock, host_af, qlen;
2535 int received_sender_port, received_interface_port, n;
2536 uschar *p;
2537 uschar buffer[2048];
2538
2539 /* Default is no ident. Check whether we want to do an ident check for this
2540 host. */
2541
2542 sender_ident = NULL;
2543 if (rfc1413_query_timeout <= 0 || verify_check_host(&rfc1413_hosts) != OK)
2544   return;
2545
2546 DEBUG(D_ident) debug_printf("doing ident callback\n");
2547
2548 /* Set up a connection to the ident port of the remote host. Bind the local end
2549 to the incoming interface address. If the sender host address is an IPv6
2550 address, the incoming interface address will also be IPv6. */
2551
2552 host_af = (Ustrchr(sender_host_address, ':') == NULL)? AF_INET : AF_INET6;
2553 sock = ip_socket(SOCK_STREAM, host_af);
2554 if (sock < 0) return;
2555
2556 if (ip_bind(sock, host_af, interface_address, 0) < 0)
2557   {
2558   DEBUG(D_ident) debug_printf("bind socket for ident failed: %s\n",
2559     strerror(errno));
2560   goto END_OFF;
2561   }
2562
2563 if (ip_connect(sock, host_af, sender_host_address, port, rfc1413_query_timeout)
2564      < 0)
2565   {
2566   if (errno == ETIMEDOUT && (log_extra_selector & LX_ident_timeout) != 0)
2567     {
2568     log_write(0, LOG_MAIN, "ident connection to %s timed out",
2569       sender_host_address);
2570     }
2571   else
2572     {
2573     DEBUG(D_ident) debug_printf("ident connection to %s failed: %s\n",
2574       sender_host_address, strerror(errno));
2575     }
2576   goto END_OFF;
2577   }
2578
2579 /* Construct and send the query. */
2580
2581 sprintf(CS buffer, "%d , %d\r\n", sender_host_port, interface_port);
2582 qlen = Ustrlen(buffer);
2583 if (send(sock, buffer, qlen, 0) < 0)
2584   {
2585   DEBUG(D_ident) debug_printf("ident send failed: %s\n", strerror(errno));
2586   goto END_OFF;
2587   }
2588
2589 /* Read a response line. We put it into the rest of the buffer, using several
2590 recv() calls if necessary. */
2591
2592 p = buffer + qlen;
2593
2594 for (;;)
2595   {
2596   uschar *pp;
2597   int count;
2598   int size = sizeof(buffer) - (p - buffer);
2599
2600   if (size <= 0) goto END_OFF;   /* Buffer filled without seeing \n. */
2601   count = ip_recv(sock, p, size, rfc1413_query_timeout);
2602   if (count <= 0) goto END_OFF;  /* Read error or EOF */
2603
2604   /* Scan what we just read, to see if we have reached the terminating \r\n. Be
2605   generous, and accept a plain \n terminator as well. The only illegal
2606   character is 0. */
2607
2608   for (pp = p; pp < p + count; pp++)
2609     {
2610     if (*pp == 0) goto END_OFF;   /* Zero octet not allowed */
2611     if (*pp == '\n')
2612       {
2613       if (pp[-1] == '\r') pp--;
2614       *pp = 0;
2615       goto GOT_DATA;             /* Break out of both loops */
2616       }
2617     }
2618
2619   /* Reached the end of the data without finding \n. Let the loop continue to
2620   read some more, if there is room. */
2621
2622   p = pp;
2623   }
2624
2625 GOT_DATA:
2626
2627 /* We have received a line of data. Check it carefully. It must start with the
2628 same two port numbers that we sent, followed by data as defined by the RFC. For
2629 example,
2630
2631   12345 , 25 : USERID : UNIX :root
2632
2633 However, the amount of white space may be different to what we sent. In the
2634 "osname" field there may be several sub-fields, comma separated. The data we
2635 actually want to save follows the third colon. Some systems put leading spaces
2636 in it - we discard those. */
2637
2638 if (sscanf(CS buffer + qlen, "%d , %d%n", &received_sender_port,
2639       &received_interface_port, &n) != 2 ||
2640     received_sender_port != sender_host_port ||
2641     received_interface_port != interface_port)
2642   goto END_OFF;
2643
2644 p = buffer + qlen + n;
2645 while(isspace(*p)) p++;
2646 if (*p++ != ':') goto END_OFF;
2647 while(isspace(*p)) p++;
2648 if (Ustrncmp(p, "USERID", 6) != 0) goto END_OFF;
2649 p += 6;
2650 while(isspace(*p)) p++;
2651 if (*p++ != ':') goto END_OFF;
2652 while (*p != 0 && *p != ':') p++;
2653 if (*p++ == 0) goto END_OFF;
2654 while(isspace(*p)) p++;
2655 if (*p == 0) goto END_OFF;
2656
2657 /* The rest of the line is the data we want. We turn it into printing
2658 characters when we save it, so that it cannot mess up the format of any logging
2659 or Received: lines into which it gets inserted. We keep a maximum of 127
2660 characters. */
2661
2662 sender_ident = string_printing(string_copyn(p, 127));
2663 DEBUG(D_ident) debug_printf("sender_ident = %s\n", sender_ident);
2664
2665 END_OFF:
2666 (void)close(sock);
2667 return;
2668 }
2669
2670
2671
2672
2673 /*************************************************
2674 *      Match host to a single host-list item     *
2675 *************************************************/
2676
2677 /* This function compares a host (name or address) against a single item
2678 from a host list. The host name gets looked up if it is needed and is not
2679 already known. The function is called from verify_check_this_host() via
2680 match_check_list(), which is why most of its arguments are in a single block.
2681
2682 Arguments:
2683   arg            the argument block (see below)
2684   ss             the host-list item
2685   valueptr       where to pass back looked up data, or NULL
2686   error          for error message when returning ERROR
2687
2688 The block contains:
2689   host_name      (a) the host name, or
2690                  (b) NULL, implying use sender_host_name and
2691                        sender_host_aliases, looking them up if required, or
2692                  (c) the empty string, meaning that only IP address matches
2693                        are permitted
2694   host_address   the host address
2695   host_ipv4      the IPv4 address taken from an IPv6 one
2696
2697 Returns:         OK      matched
2698                  FAIL    did not match
2699                  DEFER   lookup deferred
2700                  ERROR   (a) failed to find the host name or IP address, or
2701                          (b) unknown lookup type specified, or
2702                          (c) host name encountered when only IP addresses are
2703                                being matched
2704 */
2705
2706 int
2707 check_host(void *arg, uschar *ss, uschar **valueptr, uschar **error)
2708 {
2709 check_host_block *cb = (check_host_block *)arg;
2710 int mlen = -1;
2711 int maskoffset;
2712 BOOL iplookup = FALSE;
2713 BOOL isquery = FALSE;
2714 BOOL isiponly = cb->host_name != NULL && cb->host_name[0] == 0;
2715 uschar *t;
2716 uschar *semicolon;
2717 uschar **aliases;
2718
2719 /* Optimize for the special case when the pattern is "*". */
2720
2721 if (*ss == '*' && ss[1] == 0) return OK;
2722
2723 /* If the pattern is empty, it matches only in the case when there is no host -
2724 this can occur in ACL checking for SMTP input using the -bs option. In this
2725 situation, the host address is the empty string. */
2726
2727 if (cb->host_address[0] == 0) return (*ss == 0)? OK : FAIL;
2728 if (*ss == 0) return FAIL;
2729
2730 /* If the pattern is precisely "@" then match against the primary host name,
2731 provided that host name matching is permitted; if it's "@[]" match against the
2732 local host's IP addresses. */
2733
2734 if (*ss == '@')
2735   {
2736   if (ss[1] == 0)
2737     {
2738     if (isiponly) return ERROR;
2739     ss = primary_hostname;
2740     }
2741   else if (Ustrcmp(ss, "@[]") == 0)
2742     {
2743     ip_address_item *ip;
2744     for (ip = host_find_interfaces(); ip != NULL; ip = ip->next)
2745       if (Ustrcmp(ip->address, cb->host_address) == 0) return OK;
2746     return FAIL;
2747     }
2748   }
2749
2750 /* If the pattern is an IP address, optionally followed by a bitmask count, do
2751 a (possibly masked) comparision with the current IP address. */
2752
2753 if (string_is_ip_address(ss, &maskoffset) != 0)
2754   return (host_is_in_net(cb->host_address, ss, maskoffset)? OK : FAIL);
2755
2756 /* The pattern is not an IP address. A common error that people make is to omit
2757 one component of an IPv4 address, either by accident, or believing that, for
2758 example, 1.2.3/24 is the same as 1.2.3.0/24, or 1.2.3 is the same as 1.2.3.0,
2759 which it isn't. (Those applications that do accept 1.2.3 as an IP address
2760 interpret it as 1.2.0.3 because the final component becomes 16-bit - this is an
2761 ancient specification.) To aid in debugging these cases, we give a specific
2762 error if the pattern contains only digits and dots or contains a slash preceded
2763 only by digits and dots (a slash at the start indicates a file name and of
2764 course slashes may be present in lookups, but not preceded only by digits and
2765 dots). */
2766
2767 for (t = ss; isdigit(*t) || *t == '.'; t++);
2768 if (*t == 0 || (*t == '/' && t != ss))
2769   {
2770   *error = US"malformed IPv4 address or address mask";
2771   return ERROR;
2772   }
2773
2774 /* See if there is a semicolon in the pattern */
2775
2776 semicolon = Ustrchr(ss, ';');
2777
2778 /* If we are doing an IP address only match, then all lookups must be IP
2779 address lookups, even if there is no "net-". */
2780
2781 if (isiponly)
2782   {
2783   iplookup = semicolon != NULL;
2784   }
2785
2786 /* Otherwise, if the item is of the form net[n]-lookup;<file|query> then it is
2787 a lookup on a masked IP network, in textual form. We obey this code even if we
2788 have already set iplookup, so as to skip over the "net-" prefix and to set the
2789 mask length. The net- stuff really only applies to single-key lookups where the
2790 key is implicit. For query-style lookups the key is specified in the query.
2791 From release 4.30, the use of net- for query style is no longer needed, but we
2792 retain it for backward compatibility. */
2793
2794 if (Ustrncmp(ss, "net", 3) == 0 && semicolon != NULL)
2795   {
2796   mlen = 0;
2797   for (t = ss + 3; isdigit(*t); t++) mlen = mlen * 10 + *t - '0';
2798   if (mlen == 0 && t == ss+3) mlen = -1;  /* No mask supplied */
2799   iplookup = (*t++ == '-');
2800   }
2801 else t = ss;
2802
2803 /* Do the IP address lookup if that is indeed what we have */
2804
2805 if (iplookup)
2806   {
2807   int insize;
2808   int search_type;
2809   int incoming[4];
2810   void *handle;
2811   uschar *filename, *key, *result;
2812   uschar buffer[64];
2813
2814   /* Find the search type */
2815
2816   search_type = search_findtype(t, semicolon - t);
2817
2818   if (search_type < 0) log_write(0, LOG_MAIN|LOG_PANIC_DIE, "%s",
2819     search_error_message);
2820
2821   /* Adjust parameters for the type of lookup. For a query-style lookup, there
2822   is no file name, and the "key" is just the query. For query-style with a file
2823   name, we have to fish the file off the start of the query. For a single-key
2824   lookup, the key is the current IP address, masked appropriately, and
2825   reconverted to text form, with the mask appended. For IPv6 addresses, specify
2826   dot separators instead of colons, except when the lookup type is "iplsearch".
2827   */
2828
2829   if (mac_islookup(search_type, lookup_absfilequery))
2830     {
2831     filename = semicolon + 1;
2832     key = filename;
2833     while (*key != 0 && !isspace(*key)) key++;
2834     filename = string_copyn(filename, key - filename);
2835     while (isspace(*key)) key++;
2836     }
2837   else if (mac_islookup(search_type, lookup_querystyle))
2838     {
2839     filename = NULL;
2840     key = semicolon + 1;
2841     }
2842   else   /* Single-key style */
2843     {
2844     int sep = (Ustrcmp(lookup_list[search_type]->name, "iplsearch") == 0)?
2845       ':' : '.';
2846     insize = host_aton(cb->host_address, incoming);
2847     host_mask(insize, incoming, mlen);
2848     (void)host_nmtoa(insize, incoming, mlen, buffer, sep);
2849     key = buffer;
2850     filename = semicolon + 1;
2851     }
2852
2853   /* Now do the actual lookup; note that there is no search_close() because
2854   of the caching arrangements. */
2855
2856   handle = search_open(filename, search_type, 0, NULL, NULL);
2857   if (handle == NULL) log_write(0, LOG_MAIN|LOG_PANIC_DIE, "%s",
2858     search_error_message);
2859   result = search_find(handle, filename, key, -1, NULL, 0, 0, NULL);
2860   if (valueptr != NULL) *valueptr = result;
2861   return (result != NULL)? OK : search_find_defer? DEFER: FAIL;
2862   }
2863
2864 /* The pattern is not an IP address or network reference of any kind. That is,
2865 it is a host name pattern. If this is an IP only match, there's an error in the
2866 host list. */
2867
2868 if (isiponly)
2869   {
2870   *error = US"cannot match host name in match_ip list";
2871   return ERROR;
2872   }
2873
2874 /* Check the characters of the pattern to see if they comprise only letters,
2875 digits, full stops, and hyphens (the constituents of domain names). Allow
2876 underscores, as they are all too commonly found. Sigh. Also, if
2877 allow_utf8_domains is set, allow top-bit characters. */
2878
2879 for (t = ss; *t != 0; t++)
2880   if (!isalnum(*t) && *t != '.' && *t != '-' && *t != '_' &&
2881       (!allow_utf8_domains || *t < 128)) break;
2882
2883 /* If the pattern is a complete domain name, with no fancy characters, look up
2884 its IP address and match against that. Note that a multi-homed host will add
2885 items to the chain. */
2886
2887 if (*t == 0)
2888   {
2889   int rc;
2890   host_item h;
2891   h.next = NULL;
2892   h.name = ss;
2893   h.address = NULL;
2894   h.mx = MX_NONE;
2895
2896   rc = host_find_byname(&h, NULL, HOST_FIND_QUALIFY_SINGLE, NULL, FALSE);
2897   if (rc == HOST_FOUND || rc == HOST_FOUND_LOCAL)
2898     {
2899     host_item *hh;
2900     for (hh = &h; hh != NULL; hh = hh->next)
2901       {
2902       if (host_is_in_net(hh->address, cb->host_address, 0)) return OK;
2903       }
2904     return FAIL;
2905     }
2906   if (rc == HOST_FIND_AGAIN) return DEFER;
2907   *error = string_sprintf("failed to find IP address for %s", ss);
2908   return ERROR;
2909   }
2910
2911 /* Almost all subsequent comparisons require the host name, and can be done
2912 using the general string matching function. When this function is called for
2913 outgoing hosts, the name is always given explicitly. If it is NULL, it means we
2914 must use sender_host_name and its aliases, looking them up if necessary. */
2915
2916 if (cb->host_name != NULL)   /* Explicit host name given */
2917   return match_check_string(cb->host_name, ss, -1, TRUE, TRUE, TRUE,
2918     valueptr);
2919
2920 /* Host name not given; in principle we need the sender host name and its
2921 aliases. However, for query-style lookups, we do not need the name if the
2922 query does not contain $sender_host_name. From release 4.23, a reference to
2923 $sender_host_name causes it to be looked up, so we don't need to do the lookup
2924 on spec. */
2925
2926 if ((semicolon = Ustrchr(ss, ';')) != NULL)
2927   {
2928   uschar *affix;
2929   int partial, affixlen, starflags, id;
2930
2931   *semicolon = 0;
2932   id = search_findtype_partial(ss, &partial, &affix, &affixlen, &starflags);
2933   *semicolon=';';
2934
2935   if (id < 0)                           /* Unknown lookup type */
2936     {
2937     log_write(0, LOG_MAIN|LOG_PANIC, "%s in host list item \"%s\"",
2938       search_error_message, ss);
2939     return DEFER;
2940     }
2941   isquery = mac_islookup(id, lookup_querystyle|lookup_absfilequery);
2942   }
2943
2944 if (isquery)
2945   {
2946   switch(match_check_string(US"", ss, -1, TRUE, TRUE, TRUE, valueptr))
2947     {
2948     case OK:    return OK;
2949     case DEFER: return DEFER;
2950     default:    return FAIL;
2951     }
2952   }
2953
2954 /* Not a query-style lookup; must ensure the host name is present, and then we
2955 do a check on the name and all its aliases. */
2956
2957 if (sender_host_name == NULL)
2958   {
2959   HDEBUG(D_host_lookup)
2960     debug_printf("sender host name required, to match against %s\n", ss);
2961   if (host_lookup_failed || host_name_lookup() != OK)
2962     {
2963     *error = string_sprintf("failed to find host name for %s",
2964       sender_host_address);;
2965     return ERROR;
2966     }
2967   host_build_sender_fullhost();
2968   }
2969
2970 /* Match on the sender host name, using the general matching function */
2971
2972 switch(match_check_string(sender_host_name, ss, -1, TRUE, TRUE, TRUE,
2973        valueptr))
2974   {
2975   case OK:    return OK;
2976   case DEFER: return DEFER;
2977   }
2978
2979 /* If there are aliases, try matching on them. */
2980
2981 aliases = sender_host_aliases;
2982 while (*aliases != NULL)
2983   {
2984   switch(match_check_string(*aliases++, ss, -1, TRUE, TRUE, TRUE, valueptr))
2985     {
2986     case OK:    return OK;
2987     case DEFER: return DEFER;
2988     }
2989   }
2990 return FAIL;
2991 }
2992
2993
2994
2995
2996 /*************************************************
2997 *    Check a specific host matches a host list   *
2998 *************************************************/
2999
3000 /* This function is passed a host list containing items in a number of
3001 different formats and the identity of a host. Its job is to determine whether
3002 the given host is in the set of hosts defined by the list. The host name is
3003 passed as a pointer so that it can be looked up if needed and not already
3004 known. This is commonly the case when called from verify_check_host() to check
3005 an incoming connection. When called from elsewhere the host name should usually
3006 be set.
3007
3008 This function is now just a front end to match_check_list(), which runs common
3009 code for scanning a list. We pass it the check_host() function to perform a
3010 single test.
3011
3012 Arguments:
3013   listptr              pointer to the host list
3014   cache_bits           pointer to cache for named lists, or NULL
3015   host_name            the host name or NULL, implying use sender_host_name and
3016                          sender_host_aliases, looking them up if required
3017   host_address         the IP address
3018   valueptr             if not NULL, data from a lookup is passed back here
3019
3020 Returns:    OK    if the host is in the defined set
3021             FAIL  if the host is not in the defined set,
3022             DEFER if a data lookup deferred (not a host lookup)
3023
3024 If the host name was needed in order to make a comparison, and could not be
3025 determined from the IP address, the result is FAIL unless the item
3026 "+allow_unknown" was met earlier in the list, in which case OK is returned. */
3027
3028 int
3029 verify_check_this_host(uschar **listptr, unsigned int *cache_bits,
3030   uschar *host_name, uschar *host_address, uschar **valueptr)
3031 {
3032 int rc;
3033 unsigned int *local_cache_bits = cache_bits;
3034 uschar *save_host_address = deliver_host_address;
3035 check_host_block cb;
3036 cb.host_name = host_name;
3037 cb.host_address = host_address;
3038
3039 if (valueptr != NULL) *valueptr = NULL;
3040
3041 /* If the host address starts off ::ffff: it is an IPv6 address in
3042 IPv4-compatible mode. Find the IPv4 part for checking against IPv4
3043 addresses. */
3044
3045 cb.host_ipv4 = (Ustrncmp(host_address, "::ffff:", 7) == 0)?
3046   host_address + 7 : host_address;
3047
3048 /* During the running of the check, put the IP address into $host_address. In
3049 the case of calls from the smtp transport, it will already be there. However,
3050 in other calls (e.g. when testing ignore_target_hosts), it won't. Just to be on
3051 the safe side, any existing setting is preserved, though as I write this
3052 (November 2004) I can't see any cases where it is actually needed. */
3053
3054 deliver_host_address = host_address;
3055 rc = match_check_list(
3056        listptr,                                /* the list */
3057        0,                                      /* separator character */
3058        &hostlist_anchor,                       /* anchor pointer */
3059        &local_cache_bits,                      /* cache pointer */
3060        check_host,                             /* function for testing */
3061        &cb,                                    /* argument for function */
3062        MCL_HOST,                               /* type of check */
3063        (host_address == sender_host_address)?
3064          US"host" : host_address,              /* text for debugging */
3065        valueptr);                              /* where to pass back data */
3066 deliver_host_address = save_host_address;
3067 return rc;
3068 }
3069
3070
3071
3072
3073 /*************************************************
3074 *      Check the remote host matches a list      *
3075 *************************************************/
3076
3077 /* This is a front end to verify_check_this_host(), created because checking
3078 the remote host is a common occurrence. With luck, a good compiler will spot
3079 the tail recursion and optimize it. If there's no host address, this is
3080 command-line SMTP input - check against an empty string for the address.
3081
3082 Arguments:
3083   listptr              pointer to the host list
3084
3085 Returns:               the yield of verify_check_this_host(),
3086                        i.e. OK, FAIL, or DEFER
3087 */
3088
3089 int
3090 verify_check_host(uschar **listptr)
3091 {
3092 return verify_check_this_host(listptr, sender_host_cache, NULL,
3093   (sender_host_address == NULL)? US"" : sender_host_address, NULL);
3094 }
3095
3096
3097
3098
3099
3100 /*************************************************
3101 *              Invert an IP address              *
3102 *************************************************/
3103
3104 /* Originally just used for DNS xBL lists, now also used for the
3105 reverse_ip expansion operator.
3106
3107 Arguments:
3108   buffer         where to put the answer
3109   address        the address to invert
3110 */
3111
3112 void
3113 invert_address(uschar *buffer, uschar *address)
3114 {
3115 int bin[4];
3116 uschar *bptr = buffer;
3117
3118 /* If this is an IPv4 address mapped into IPv6 format, adjust the pointer
3119 to the IPv4 part only. */
3120
3121 if (Ustrncmp(address, "::ffff:", 7) == 0) address += 7;
3122
3123 /* Handle IPv4 address: when HAVE_IPV6 is false, the result of host_aton() is
3124 always 1. */
3125
3126 if (host_aton(address, bin) == 1)
3127   {
3128   int i;
3129   int x = bin[0];
3130   for (i = 0; i < 4; i++)
3131     {
3132     sprintf(CS bptr, "%d.", x & 255);
3133     while (*bptr) bptr++;
3134     x >>= 8;
3135     }
3136   }
3137
3138 /* Handle IPv6 address. Actually, as far as I know, there are no IPv6 addresses
3139 in any DNS black lists, and the format in which they will be looked up is
3140 unknown. This is just a guess. */
3141
3142 #if HAVE_IPV6
3143 else
3144   {
3145   int i, j;
3146   for (j = 3; j >= 0; j--)
3147     {
3148     int x = bin[j];
3149     for (i = 0; i < 8; i++)
3150       {
3151       sprintf(CS bptr, "%x.", x & 15);
3152       while (*bptr) bptr++;
3153       x >>= 4;
3154       }
3155     }
3156   }
3157 #endif
3158
3159 /* Remove trailing period -- this is needed so that both arbitrary
3160 dnsbl keydomains and inverted addresses may be combined with the
3161 same format string, "%s.%s" */
3162
3163 *(--bptr) = 0;
3164 }
3165
3166
3167
3168 /*************************************************
3169 *          Perform a single dnsbl lookup         *
3170 *************************************************/
3171
3172 /* This function is called from verify_check_dnsbl() below. It is also called
3173 recursively from within itself when domain and domain_txt are different
3174 pointers, in order to get the TXT record from the alternate domain.
3175
3176 Arguments:
3177   domain         the outer dnsbl domain
3178   domain_txt     alternate domain to lookup TXT record on success; when the
3179                    same domain is to be used, domain_txt == domain (that is,
3180                    the pointers must be identical, not just the text)
3181   keydomain      the current keydomain (for debug message)
3182   prepend        subdomain to lookup (like keydomain, but
3183                    reversed if IP address)
3184   iplist         the list of matching IP addresses, or NULL for "any"
3185   bitmask        true if bitmask matching is wanted
3186   match_type     condition for 'succeed' result
3187                    0 => Any RR in iplist     (=)
3188                    1 => No RR in iplist      (!=)
3189                    2 => All RRs in iplist    (==)
3190                    3 => Some RRs not in iplist (!==)
3191                    the two bits are defined as MT_NOT and MT_ALL
3192   defer_return   what to return for a defer
3193
3194 Returns:         OK if lookup succeeded
3195                  FAIL if not
3196 */
3197
3198 static int
3199 one_check_dnsbl(uschar *domain, uschar *domain_txt, uschar *keydomain,
3200   uschar *prepend, uschar *iplist, BOOL bitmask, int match_type,
3201   int defer_return)
3202 {
3203 dns_answer dnsa;
3204 dns_scan dnss;
3205 tree_node *t;
3206 dnsbl_cache_block *cb;
3207 int old_pool = store_pool;
3208 uschar query[256];         /* DNS domain max length */
3209
3210 /* Construct the specific query domainname */
3211
3212 if (!string_format(query, sizeof(query), "%s.%s", prepend, domain))
3213   {
3214   log_write(0, LOG_MAIN|LOG_PANIC, "dnslist query is too long "
3215     "(ignored): %s...", query);
3216   return FAIL;
3217   }
3218
3219 /* Look for this query in the cache. */
3220
3221 t = tree_search(dnsbl_cache, query);
3222
3223 /* If not cached from a previous lookup, we must do a DNS lookup, and
3224 cache the result in permanent memory. */
3225
3226 if (t == NULL)
3227   {
3228   store_pool = POOL_PERM;
3229
3230   /* Set up a tree entry to cache the lookup */
3231
3232   t = store_get(sizeof(tree_node) + Ustrlen(query));
3233   Ustrcpy(t->name, query);
3234   t->data.ptr = cb = store_get(sizeof(dnsbl_cache_block));
3235   (void)tree_insertnode(&dnsbl_cache, t);
3236
3237   /* Do the DNS loopup . */
3238
3239   HDEBUG(D_dnsbl) debug_printf("new DNS lookup for %s\n", query);
3240   cb->rc = dns_basic_lookup(&dnsa, query, T_A);
3241   cb->text_set = FALSE;
3242   cb->text = NULL;
3243   cb->rhs = NULL;
3244
3245   /* If the lookup succeeded, cache the RHS address. The code allows for
3246   more than one address - this was for complete generality and the possible
3247   use of A6 records. However, A6 records have been reduced to experimental
3248   status (August 2001) and may die out. So they may never get used at all,
3249   let alone in dnsbl records. However, leave the code here, just in case.
3250
3251   Quite apart from one A6 RR generating multiple addresses, there are DNS
3252   lists that return more than one A record, so we must handle multiple
3253   addresses generated in that way as well. */
3254
3255   if (cb->rc == DNS_SUCCEED)
3256     {
3257     dns_record *rr;
3258     dns_address **addrp = &(cb->rhs);
3259     for (rr = dns_next_rr(&dnsa, &dnss, RESET_ANSWERS);
3260          rr != NULL;
3261          rr = dns_next_rr(&dnsa, &dnss, RESET_NEXT))
3262       {
3263       if (rr->type == T_A)
3264         {
3265         dns_address *da = dns_address_from_rr(&dnsa, rr);
3266         if (da != NULL)
3267           {
3268           *addrp = da;
3269           while (da->next != NULL) da = da->next;
3270           addrp = &(da->next);
3271           }
3272         }
3273       }
3274
3275     /* If we didn't find any A records, change the return code. This can
3276     happen when there is a CNAME record but there are no A records for what
3277     it points to. */
3278
3279     if (cb->rhs == NULL) cb->rc = DNS_NODATA;
3280     }
3281
3282   store_pool = old_pool;
3283   }
3284
3285 /* Previous lookup was cached */
3286
3287 else
3288   {
3289   HDEBUG(D_dnsbl) debug_printf("using result of previous DNS lookup\n");
3290   cb = t->data.ptr;
3291   }
3292
3293 /* We now have the result of the DNS lookup, either newly done, or cached
3294 from a previous call. If the lookup succeeded, check against the address
3295 list if there is one. This may be a positive equality list (introduced by
3296 "="), a negative equality list (introduced by "!="), a positive bitmask
3297 list (introduced by "&"), or a negative bitmask list (introduced by "!&").*/
3298
3299 if (cb->rc == DNS_SUCCEED)
3300   {
3301   dns_address *da = NULL;
3302   uschar *addlist = cb->rhs->address;
3303
3304   /* For A and AAAA records, there may be multiple addresses from multiple
3305   records. For A6 records (currently not expected to be used) there may be
3306   multiple addresses from a single record. */
3307
3308   for (da = cb->rhs->next; da != NULL; da = da->next)
3309     addlist = string_sprintf("%s, %s", addlist, da->address);
3310
3311   HDEBUG(D_dnsbl) debug_printf("DNS lookup for %s succeeded (yielding %s)\n",
3312     query, addlist);
3313
3314   /* Address list check; this can be either for equality, or via a bitmask.
3315   In the latter case, all the bits must match. */
3316
3317   if (iplist != NULL)
3318     {
3319     for (da = cb->rhs; da != NULL; da = da->next)
3320       {
3321       int ipsep = ',';
3322       uschar ip[46];
3323       uschar *ptr = iplist;
3324       uschar *res;
3325
3326       /* Handle exact matching */
3327
3328       if (!bitmask)
3329         {
3330         while ((res = string_nextinlist(&ptr, &ipsep, ip, sizeof(ip))) != NULL)
3331           {
3332           if (Ustrcmp(CS da->address, ip) == 0) break;
3333           }
3334         }
3335
3336       /* Handle bitmask matching */
3337
3338       else
3339         {
3340         int address[4];
3341         int mask = 0;
3342
3343         /* At present, all known DNS blocking lists use A records, with
3344         IPv4 addresses on the RHS encoding the information they return. I
3345         wonder if this will linger on as the last vestige of IPv4 when IPv6
3346         is ubiquitous? Anyway, for now we use paranoia code to completely
3347         ignore IPv6 addresses. The default mask is 0, which always matches.
3348         We change this only for IPv4 addresses in the list. */
3349
3350         if (host_aton(da->address, address) == 1) mask = address[0];
3351
3352         /* Scan the returned addresses, skipping any that are IPv6 */
3353
3354         while ((res = string_nextinlist(&ptr, &ipsep, ip, sizeof(ip))) != NULL)
3355           {
3356           if (host_aton(ip, address) != 1) continue;
3357           if ((address[0] & mask) == address[0]) break;
3358           }
3359         }
3360
3361       /* If either
3362
3363          (a) An IP address in an any ('=') list matched, or
3364          (b) No IP address in an all ('==') list matched
3365
3366       then we're done searching. */
3367
3368       if (((match_type & MT_ALL) != 0) == (res == NULL)) break;
3369       }
3370
3371     /* If da == NULL, either
3372
3373        (a) No IP address in an any ('=') list matched, or
3374        (b) An IP address in an all ('==') list didn't match
3375
3376     so behave as if the DNSBL lookup had not succeeded, i.e. the host is not on
3377     the list. */
3378
3379     if ((match_type == MT_NOT || match_type == MT_ALL) != (da == NULL))
3380       {
3381       HDEBUG(D_dnsbl)
3382         {
3383         uschar *res = NULL;
3384         switch(match_type)
3385           {
3386           case 0:
3387           res = US"was no match";
3388           break;
3389           case MT_NOT:
3390           res = US"was an exclude match";
3391           break;
3392           case MT_ALL:
3393           res = US"was an IP address that did not match";
3394           break;
3395           case MT_NOT|MT_ALL:
3396           res = US"were no IP addresses that did not match";
3397           break;
3398           }
3399         debug_printf("=> but we are not accepting this block class because\n");
3400         debug_printf("=> there %s for %s%c%s\n",
3401           res,
3402           ((match_type & MT_ALL) == 0)? "" : "=",
3403           bitmask? '&' : '=', iplist);
3404         }
3405       return FAIL;
3406       }
3407     }
3408
3409   /* Either there was no IP list, or the record matched, implying that the
3410   domain is on the list. We now want to find a corresponding TXT record. If an
3411   alternate domain is specified for the TXT record, call this function
3412   recursively to look that up; this has the side effect of re-checking that
3413   there is indeed an A record at the alternate domain. */
3414
3415   if (domain_txt != domain)
3416     return one_check_dnsbl(domain_txt, domain_txt, keydomain, prepend, NULL,
3417       FALSE, match_type, defer_return);
3418
3419   /* If there is no alternate domain, look up a TXT record in the main domain
3420   if it has not previously been cached. */
3421
3422   if (!cb->text_set)
3423     {
3424     cb->text_set = TRUE;
3425     if (dns_basic_lookup(&dnsa, query, T_TXT) == DNS_SUCCEED)
3426       {
3427       dns_record *rr;
3428       for (rr = dns_next_rr(&dnsa, &dnss, RESET_ANSWERS);
3429            rr != NULL;
3430            rr = dns_next_rr(&dnsa, &dnss, RESET_NEXT))
3431         if (rr->type == T_TXT) break;
3432       if (rr != NULL)
3433         {
3434         int len = (rr->data)[0];
3435         if (len > 511) len = 127;
3436         store_pool = POOL_PERM;
3437         cb->text = string_sprintf("%.*s", len, (const uschar *)(rr->data+1));
3438         store_pool = old_pool;
3439         }
3440       }
3441     }
3442
3443   dnslist_value = addlist;
3444   dnslist_text = cb->text;
3445   return OK;
3446   }
3447
3448 /* There was a problem with the DNS lookup */
3449
3450 if (cb->rc != DNS_NOMATCH && cb->rc != DNS_NODATA)
3451   {
3452   log_write(L_dnslist_defer, LOG_MAIN,
3453     "DNS list lookup defer (probably timeout) for %s: %s", query,
3454     (defer_return == OK)?   US"assumed in list" :
3455     (defer_return == FAIL)? US"assumed not in list" :
3456                             US"returned DEFER");
3457   return defer_return;
3458   }
3459
3460 /* No entry was found in the DNS; continue for next domain */
3461
3462 HDEBUG(D_dnsbl)
3463   {
3464   debug_printf("DNS lookup for %s failed\n", query);
3465   debug_printf("=> that means %s is not listed at %s\n",
3466      keydomain, domain);
3467   }
3468
3469 return FAIL;
3470 }
3471
3472
3473
3474
3475 /*************************************************
3476 *        Check host against DNS black lists      *
3477 *************************************************/
3478
3479 /* This function runs checks against a list of DNS black lists, until one
3480 matches. Each item on the list can be of the form
3481
3482   domain=ip-address/key
3483
3484 The domain is the right-most domain that is used for the query, for example,
3485 blackholes.mail-abuse.org. If the IP address is present, there is a match only
3486 if the DNS lookup returns a matching IP address. Several addresses may be
3487 given, comma-separated, for example: x.y.z=127.0.0.1,127.0.0.2.
3488
3489 If no key is given, what is looked up in the domain is the inverted IP address
3490 of the current client host. If a key is given, it is used to construct the
3491 domain for the lookup. For example:
3492
3493   dsn.rfc-ignorant.org/$sender_address_domain
3494
3495 After finding a match in the DNS, the domain is placed in $dnslist_domain, and
3496 then we check for a TXT record for an error message, and if found, save its
3497 value in $dnslist_text. We also cache everything in a tree, to optimize
3498 multiple lookups.
3499
3500 The TXT record is normally looked up in the same domain as the A record, but
3501 when many lists are combined in a single DNS domain, this will not be a very
3502 specific message. It is possible to specify a different domain for looking up
3503 TXT records; this is given before the main domain, comma-separated. For
3504 example:
3505
3506   dnslists = http.dnsbl.sorbs.net,dnsbl.sorbs.net=127.0.0.2 : \
3507              socks.dnsbl.sorbs.net,dnsbl.sorbs.net=127.0.0.3
3508
3509 The caching ensures that only one lookup in dnsbl.sorbs.net is done.
3510
3511 Note: an address for testing RBL is 192.203.178.39
3512 Note: an address for testing DUL is 192.203.178.4
3513 Note: a domain for testing RFCI is example.tld.dsn.rfc-ignorant.org
3514
3515 Arguments:
3516   listptr      the domain/address/data list
3517
3518 Returns:    OK      successful lookup (i.e. the address is on the list), or
3519                       lookup deferred after +include_unknown
3520             FAIL    name not found, or no data found for the given type, or
3521                       lookup deferred after +exclude_unknown (default)
3522             DEFER   lookup failure, if +defer_unknown was set
3523 */
3524
3525 int
3526 verify_check_dnsbl(uschar **listptr)
3527 {
3528 int sep = 0;
3529 int defer_return = FAIL;
3530 uschar *list = *listptr;
3531 uschar *domain;
3532 uschar *s;
3533 uschar buffer[1024];
3534 uschar revadd[128];        /* Long enough for IPv6 address */
3535
3536 /* Indicate that the inverted IP address is not yet set up */
3537
3538 revadd[0] = 0;
3539
3540 /* In case this is the first time the DNS resolver is being used. */
3541
3542 dns_init(FALSE, FALSE);
3543
3544 /* Loop through all the domains supplied, until something matches */
3545
3546 while ((domain = string_nextinlist(&list, &sep, buffer, sizeof(buffer))) != NULL)
3547   {
3548   int rc;
3549   BOOL bitmask = FALSE;
3550   int match_type = 0;
3551   uschar *domain_txt;
3552   uschar *comma;
3553   uschar *iplist;
3554   uschar *key;
3555
3556   HDEBUG(D_dnsbl) debug_printf("DNS list check: %s\n", domain);
3557
3558   /* Deal with special values that change the behaviour on defer */
3559
3560   if (domain[0] == '+')
3561     {
3562     if      (strcmpic(domain, US"+include_unknown") == 0) defer_return = OK;
3563     else if (strcmpic(domain, US"+exclude_unknown") == 0) defer_return = FAIL;
3564     else if (strcmpic(domain, US"+defer_unknown") == 0)   defer_return = DEFER;
3565     else
3566       log_write(0, LOG_MAIN|LOG_PANIC, "unknown item in dnslist (ignored): %s",
3567         domain);
3568     continue;
3569     }
3570
3571   /* See if there's explicit data to be looked up */
3572
3573   key = Ustrchr(domain, '/');
3574   if (key != NULL) *key++ = 0;
3575
3576   /* See if there's a list of addresses supplied after the domain name. This is
3577   introduced by an = or a & character; if preceded by = we require all matches
3578   and if preceded by ! we invert the result. */
3579
3580   iplist = Ustrchr(domain, '=');
3581   if (iplist == NULL)
3582     {
3583     bitmask = TRUE;
3584     iplist = Ustrchr(domain, '&');
3585     }
3586
3587   if (iplist != NULL)                          /* Found either = or & */
3588     {
3589     if (iplist > domain && iplist[-1] == '!')  /* Handle preceding ! */
3590       {
3591       match_type |= MT_NOT;
3592       iplist[-1] = 0;
3593       }
3594
3595     *iplist++ = 0;                             /* Terminate domain, move on */
3596
3597     /* If we found = (bitmask == FALSE), check for == or =& */
3598
3599     if (!bitmask && (*iplist == '=' || *iplist == '&'))
3600       {
3601       bitmask = *iplist++ == '&';
3602       match_type |= MT_ALL;
3603       }
3604     }
3605
3606   /* If there is a comma in the domain, it indicates that a second domain for
3607   looking up TXT records is provided, before the main domain. Otherwise we must
3608   set domain_txt == domain. */
3609
3610   domain_txt = domain;
3611   comma = Ustrchr(domain, ',');
3612   if (comma != NULL)
3613     {
3614     *comma++ = 0;
3615     domain = comma;
3616     }
3617
3618   /* Check that what we have left is a sensible domain name. There is no reason
3619   why these domains should in fact use the same syntax as hosts and email
3620   domains, but in practice they seem to. However, there is little point in
3621   actually causing an error here, because that would no doubt hold up incoming
3622   mail. Instead, I'll just log it. */
3623
3624   for (s = domain; *s != 0; s++)
3625     {
3626     if (!isalnum(*s) && *s != '-' && *s != '.' && *s != '_')
3627       {
3628       log_write(0, LOG_MAIN, "dnslists domain \"%s\" contains "
3629         "strange characters - is this right?", domain);
3630       break;
3631       }
3632     }
3633
3634   /* Check the alternate domain if present */
3635
3636   if (domain_txt != domain) for (s = domain_txt; *s != 0; s++)
3637     {
3638     if (!isalnum(*s) && *s != '-' && *s != '.' && *s != '_')
3639       {
3640       log_write(0, LOG_MAIN, "dnslists domain \"%s\" contains "
3641         "strange characters - is this right?", domain_txt);
3642       break;
3643       }
3644     }
3645
3646   /* If there is no key string, construct the query by adding the domain name
3647   onto the inverted host address, and perform a single DNS lookup. */
3648
3649   if (key == NULL)
3650     {
3651     if (sender_host_address == NULL) return FAIL;    /* can never match */
3652     if (revadd[0] == 0) invert_address(revadd, sender_host_address);
3653     rc = one_check_dnsbl(domain, domain_txt, sender_host_address, revadd,
3654       iplist, bitmask, match_type, defer_return);
3655     if (rc == OK)
3656       {
3657       dnslist_domain = string_copy(domain_txt);
3658       dnslist_matched = string_copy(sender_host_address);
3659       HDEBUG(D_dnsbl) debug_printf("=> that means %s is listed at %s\n",
3660         sender_host_address, dnslist_domain);
3661       }
3662     if (rc != FAIL) return rc;     /* OK or DEFER */
3663     }
3664
3665   /* If there is a key string, it can be a list of domains or IP addresses to
3666   be concatenated with the main domain. */
3667
3668   else
3669     {
3670     int keysep = 0;
3671     BOOL defer = FALSE;
3672     uschar *keydomain;
3673     uschar keybuffer[256];
3674     uschar keyrevadd[128];
3675
3676     while ((keydomain = string_nextinlist(&key, &keysep, keybuffer,
3677             sizeof(keybuffer))) != NULL)
3678       {
3679       uschar *prepend = keydomain;
3680
3681       if (string_is_ip_address(keydomain, NULL) != 0)
3682         {
3683         invert_address(keyrevadd, keydomain);
3684         prepend = keyrevadd;
3685         }
3686
3687       rc = one_check_dnsbl(domain, domain_txt, keydomain, prepend, iplist,
3688         bitmask, match_type, defer_return);
3689
3690       if (rc == OK)
3691         {
3692         dnslist_domain = string_copy(domain_txt);
3693         dnslist_matched = string_copy(keydomain);
3694         HDEBUG(D_dnsbl) debug_printf("=> that means %s is listed at %s\n",
3695           keydomain, dnslist_domain);
3696         return OK;
3697         }
3698
3699       /* If the lookup deferred, remember this fact. We keep trying the rest
3700       of the list to see if we get a useful result, and if we don't, we return
3701       DEFER at the end. */
3702
3703       if (rc == DEFER) defer = TRUE;
3704       }    /* continue with next keystring domain/address */
3705
3706     if (defer) return DEFER;
3707     }
3708   }        /* continue with next dnsdb outer domain */
3709
3710 return FAIL;
3711 }
3712
3713 /* End of verify.c */