Use smtp_setup_conn() for verify callout
[users/jgh/exim.git] / src / src / verify.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) University of Cambridge 1995 - 2016 */
6 /* See the file NOTICE for conditions of use and distribution. */
7
8 /* Functions concerned with verifying things. The original code for callout
9 caching was contributed by Kevin Fleming (but I hacked it around a bit). */
10
11
12 #include "exim.h"
13 #include "transports/smtp.h"
14
15 #define CUTTHROUGH_CMD_TIMEOUT  30      /* timeout for cutthrough-routing calls */
16 #define CUTTHROUGH_DATA_TIMEOUT 60      /* timeout for cutthrough-routing calls */
17 static smtp_outblock ctblock;
18 uschar ctbuffer[8192];
19
20
21 /* Structure for caching DNSBL lookups */
22
23 typedef struct dnsbl_cache_block {
24   time_t expiry;
25   dns_address *rhs;
26   uschar *text;
27   int rc;
28   BOOL text_set;
29 } dnsbl_cache_block;
30
31
32 /* Anchor for DNSBL cache */
33
34 static tree_node *dnsbl_cache = NULL;
35
36
37 /* Bits for match_type in one_check_dnsbl() */
38
39 #define MT_NOT 1
40 #define MT_ALL 2
41
42 static uschar cutthrough_response(char, uschar **, int);
43
44
45
46 /*************************************************
47 *          Retrieve a callout cache record       *
48 *************************************************/
49
50 /* If a record exists, check whether it has expired.
51
52 Arguments:
53   dbm_file          an open hints file
54   key               the record key
55   type              "address" or "domain"
56   positive_expire   expire time for positive records
57   negative_expire   expire time for negative records
58
59 Returns:            the cache record if a non-expired one exists, else NULL
60 */
61
62 static dbdata_callout_cache *
63 get_callout_cache_record(open_db *dbm_file, const uschar *key, uschar *type,
64   int positive_expire, int negative_expire)
65 {
66 BOOL negative;
67 int length, expire;
68 time_t now;
69 dbdata_callout_cache *cache_record;
70
71 cache_record = dbfn_read_with_length(dbm_file, key, &length);
72
73 if (cache_record == NULL)
74   {
75   HDEBUG(D_verify) debug_printf("callout cache: no %s record found for %s\n", type, key);
76   return NULL;
77   }
78
79 /* We treat a record as "negative" if its result field is not positive, or if
80 it is a domain record and the postmaster field is negative. */
81
82 negative = cache_record->result != ccache_accept ||
83   (type[0] == 'd' && cache_record->postmaster_result == ccache_reject);
84 expire = negative? negative_expire : positive_expire;
85 now = time(NULL);
86
87 if (now - cache_record->time_stamp > expire)
88   {
89   HDEBUG(D_verify) debug_printf("callout cache: %s record expired for %s\n", type, key);
90   return NULL;
91   }
92
93 /* If this is a non-reject domain record, check for the obsolete format version
94 that doesn't have the postmaster and random timestamps, by looking at the
95 length. If so, copy it to a new-style block, replicating the record's
96 timestamp. Then check the additional timestamps. (There's no point wasting
97 effort if connections are rejected.) */
98
99 if (type[0] == 'd' && cache_record->result != ccache_reject)
100   {
101   if (length == sizeof(dbdata_callout_cache_obs))
102     {
103     dbdata_callout_cache *new = store_get(sizeof(dbdata_callout_cache));
104     memcpy(new, cache_record, length);
105     new->postmaster_stamp = new->random_stamp = new->time_stamp;
106     cache_record = new;
107     }
108
109   if (now - cache_record->postmaster_stamp > expire)
110     cache_record->postmaster_result = ccache_unknown;
111
112   if (now - cache_record->random_stamp > expire)
113     cache_record->random_result = ccache_unknown;
114   }
115
116 HDEBUG(D_verify) debug_printf("callout cache: found %s record for %s\n", type, key);
117 return cache_record;
118 }
119
120
121
122 /*************************************************
123 *      Do callout verification for an address    *
124 *************************************************/
125
126 /* This function is called from verify_address() when the address has routed to
127 a host list, and a callout has been requested. Callouts are expensive; that is
128 why a cache is used to improve the efficiency.
129
130 Arguments:
131   addr              the address that's been routed
132   host_list         the list of hosts to try
133   tf                the transport feedback block
134
135   ifstring          "interface" option from transport, or NULL
136   portstring        "port" option from transport, or NULL
137   protocolstring    "protocol" option from transport, or NULL
138   callout           the per-command callout timeout
139   callout_overall   the overall callout timeout (if < 0 use 4*callout)
140   callout_connect   the callout connection timeout (if < 0 use callout)
141   options           the verification options - these bits are used:
142                       vopt_is_recipient => this is a recipient address
143                       vopt_callout_no_cache => don't use callout cache
144                       vopt_callout_fullpm => if postmaster check, do full one
145                       vopt_callout_random => do the "random" thing
146                       vopt_callout_recipsender => use real sender for recipient
147                       vopt_callout_recippmaster => use postmaster for recipient
148   se_mailfrom         MAIL FROM address for sender verify; NULL => ""
149   pm_mailfrom         if non-NULL, do the postmaster check with this sender
150
151 Returns:            OK/FAIL/DEFER
152 */
153
154 static int
155 do_callout(address_item *addr, host_item *host_list, transport_feedback *tf,
156   int callout, int callout_overall, int callout_connect, int options,
157   uschar *se_mailfrom, uschar *pm_mailfrom)
158 {
159 int yield = OK;
160 int old_domain_cache_result = ccache_accept;
161 BOOL done = FALSE;
162 uschar *address_key;
163 uschar *from_address;
164 uschar *random_local_part = NULL;
165 const uschar *save_deliver_domain = deliver_domain;
166 uschar **failure_ptr = options & vopt_is_recipient
167   ? &recipient_verify_failure : &sender_verify_failure;
168 open_db dbblock;
169 open_db *dbm_file = NULL;
170 dbdata_callout_cache new_domain_record;
171 dbdata_callout_cache_address new_address_record;
172 host_item *host;
173 time_t callout_start_time;
174
175 new_domain_record.result = ccache_unknown;
176 new_domain_record.postmaster_result = ccache_unknown;
177 new_domain_record.random_result = ccache_unknown;
178
179 memset(&new_address_record, 0, sizeof(new_address_record));
180
181 /* For a recipient callout, the key used for the address cache record must
182 include the sender address if we are using the real sender in the callout,
183 because that may influence the result of the callout. */
184
185 address_key = addr->address;
186 from_address = US"";
187
188 if (options & vopt_is_recipient)
189   {
190   if (options & vopt_callout_recipsender)
191     {
192     address_key = string_sprintf("%s/<%s>", addr->address, sender_address);
193     from_address = sender_address;
194     if (cutthrough.delivery) options |= vopt_callout_no_cache;
195     }
196   else if (options & vopt_callout_recippmaster)
197     {
198     address_key = string_sprintf("%s/<postmaster@%s>", addr->address,
199       qualify_domain_sender);
200     from_address = string_sprintf("postmaster@%s", qualify_domain_sender);
201     }
202   }
203
204 /* For a sender callout, we must adjust the key if the mailfrom address is not
205 empty. */
206
207 else
208   {
209   from_address = (se_mailfrom == NULL)? US"" : se_mailfrom;
210   if (from_address[0] != 0)
211     address_key = string_sprintf("%s/<%s>", addr->address, from_address);
212   }
213
214 /* Open the callout cache database, it it exists, for reading only at this
215 stage, unless caching has been disabled. */
216
217 if (options & vopt_callout_no_cache)
218   {
219   HDEBUG(D_verify) debug_printf("callout cache: disabled by no_cache\n");
220   }
221 else if ((dbm_file = dbfn_open(US"callout", O_RDWR, &dbblock, FALSE)) == NULL)
222   {
223   HDEBUG(D_verify) debug_printf("callout cache: not available\n");
224   }
225
226 /* If a cache database is available see if we can avoid the need to do an
227 actual callout by making use of previously-obtained data. */
228
229 if (dbm_file)
230   {
231   dbdata_callout_cache_address *cache_address_record;
232   dbdata_callout_cache *cache_record = get_callout_cache_record(dbm_file,
233     addr->domain, US"domain",
234     callout_cache_domain_positive_expire,
235     callout_cache_domain_negative_expire);
236
237   /* If an unexpired cache record was found for this domain, see if the callout
238   process can be short-circuited. */
239
240   if (cache_record)
241     {
242     /* In most cases, if an early command (up to and including MAIL FROM:<>)
243     was rejected, there is no point carrying on. The callout fails. However, if
244     we are doing a recipient verification with use_sender or use_postmaster
245     set, a previous failure of MAIL FROM:<> doesn't count, because this time we
246     will be using a non-empty sender. We have to remember this situation so as
247     not to disturb the cached domain value if this whole verification succeeds
248     (we don't want it turning into "accept"). */
249
250     old_domain_cache_result = cache_record->result;
251
252     if (cache_record->result == ccache_reject ||
253          (*from_address == 0 && cache_record->result == ccache_reject_mfnull))
254       {
255       setflag(addr, af_verify_nsfail);
256       HDEBUG(D_verify)
257         debug_printf("callout cache: domain gave initial rejection, or "
258           "does not accept HELO or MAIL FROM:<>\n");
259       setflag(addr, af_verify_nsfail);
260       addr->user_message = US"(result of an earlier callout reused).";
261       yield = FAIL;
262       *failure_ptr = US"mail";
263       goto END_CALLOUT;
264       }
265
266     /* If a previous check on a "random" local part was accepted, we assume
267     that the server does not do any checking on local parts. There is therefore
268     no point in doing the callout, because it will always be successful. If a
269     random check previously failed, arrange not to do it again, but preserve
270     the data in the new record. If a random check is required but hasn't been
271     done, skip the remaining cache processing. */
272
273     if (options & vopt_callout_random) switch(cache_record->random_result)
274       {
275       case ccache_accept:
276         HDEBUG(D_verify)
277           debug_printf("callout cache: domain accepts random addresses\n");
278         goto END_CALLOUT;     /* Default yield is OK */
279
280       case ccache_reject:
281         HDEBUG(D_verify)
282           debug_printf("callout cache: domain rejects random addresses\n");
283         options &= ~vopt_callout_random;
284         new_domain_record.random_result = ccache_reject;
285         new_domain_record.random_stamp = cache_record->random_stamp;
286         break;
287
288       default:
289         HDEBUG(D_verify)
290           debug_printf("callout cache: need to check random address handling "
291             "(not cached or cache expired)\n");
292         goto END_CACHE;
293       }
294
295     /* If a postmaster check is requested, but there was a previous failure,
296     there is again no point in carrying on. If a postmaster check is required,
297     but has not been done before, we are going to have to do a callout, so skip
298     remaining cache processing. */
299
300     if (pm_mailfrom)
301       {
302       if (cache_record->postmaster_result == ccache_reject)
303         {
304         setflag(addr, af_verify_pmfail);
305         HDEBUG(D_verify)
306           debug_printf("callout cache: domain does not accept "
307             "RCPT TO:<postmaster@domain>\n");
308         yield = FAIL;
309         *failure_ptr = US"postmaster";
310         setflag(addr, af_verify_pmfail);
311         addr->user_message = US"(result of earlier verification reused).";
312         goto END_CALLOUT;
313         }
314       if (cache_record->postmaster_result == ccache_unknown)
315         {
316         HDEBUG(D_verify)
317           debug_printf("callout cache: need to check RCPT "
318             "TO:<postmaster@domain> (not cached or cache expired)\n");
319         goto END_CACHE;
320         }
321
322       /* If cache says OK, set pm_mailfrom NULL to prevent a redundant
323       postmaster check if the address itself has to be checked. Also ensure
324       that the value in the cache record is preserved (with its old timestamp).
325       */
326
327       HDEBUG(D_verify) debug_printf("callout cache: domain accepts RCPT "
328         "TO:<postmaster@domain>\n");
329       pm_mailfrom = NULL;
330       new_domain_record.postmaster_result = ccache_accept;
331       new_domain_record.postmaster_stamp = cache_record->postmaster_stamp;
332       }
333     }
334
335   /* We can't give a result based on information about the domain. See if there
336   is an unexpired cache record for this specific address (combined with the
337   sender address if we are doing a recipient callout with a non-empty sender).
338   */
339
340   cache_address_record = (dbdata_callout_cache_address *)
341     get_callout_cache_record(dbm_file,
342       address_key, US"address",
343       callout_cache_positive_expire,
344       callout_cache_negative_expire);
345
346   if (cache_address_record)
347     {
348     if (cache_address_record->result == ccache_accept)
349       {
350       HDEBUG(D_verify)
351         debug_printf("callout cache: address record is positive\n");
352       }
353     else
354       {
355       HDEBUG(D_verify)
356         debug_printf("callout cache: address record is negative\n");
357       addr->user_message = US"Previous (cached) callout verification failure";
358       *failure_ptr = US"recipient";
359       yield = FAIL;
360       }
361     goto END_CALLOUT;
362     }
363
364   /* Close the cache database while we actually do the callout for real. */
365
366   END_CACHE:
367   dbfn_close(dbm_file);
368   dbm_file = NULL;
369   }
370
371 if (!addr->transport)
372   {
373   HDEBUG(D_verify) debug_printf("cannot callout via null transport\n");
374   }
375 else if (Ustrcmp(addr->transport->driver_name, "smtp") != 0)
376   log_write(0, LOG_MAIN|LOG_PANIC|LOG_CONFIG_FOR, "callout transport '%s': %s is non-smtp",
377     addr->transport->name, addr->transport->driver_name);
378 else
379   {
380   smtp_transport_options_block *ob =
381     (smtp_transport_options_block *)addr->transport->options_block;
382
383   /* The information wasn't available in the cache, so we have to do a real
384   callout and save the result in the cache for next time, unless no_cache is set,
385   or unless we have a previously cached negative random result. If we are to test
386   with a random local part, ensure that such a local part is available. If not,
387   log the fact, but carry on without randomising. */
388
389   if (options & vopt_callout_random && callout_random_local_part != NULL)
390     if (!(random_local_part = expand_string(callout_random_local_part)))
391       log_write(0, LOG_MAIN|LOG_PANIC, "failed to expand "
392         "callout_random_local_part: %s", expand_string_message);
393
394   /* Default the connect and overall callout timeouts if not set, and record the
395   time we are starting so that we can enforce it. */
396
397   if (callout_overall < 0) callout_overall = 4 * callout;
398   if (callout_connect < 0) callout_connect = callout;
399   callout_start_time = time(NULL);
400
401   /* Before doing a real callout, if this is an SMTP connection, flush the SMTP
402   output because a callout might take some time. When PIPELINING is active and
403   there are many recipients, the total time for doing lots of callouts can add up
404   and cause the client to time out. So in this case we forgo the PIPELINING
405   optimization. */
406
407   if (smtp_out && !disable_callout_flush) mac_smtp_fflush();
408
409 /* cutthrough-multi: if a nonfirst rcpt has the same routing as the first,
410 and we are holding a cutthrough conn open, we can just append the rcpt to
411 that conn for verification purposes (and later delivery also).  Simplest
412 coding means skipping this whole loop and doing the append separately.
413
414 We will need to remember it has been appended so that rcpt-acl tail code
415 can do it there for the non-rcpt-verify case.  For this we keep an addresscount.
416 */
417
418   /* Can we re-use an open cutthrough connection? */
419   if (  cutthrough.fd >= 0
420      && (options & (vopt_callout_recipsender | vopt_callout_recippmaster))
421         == vopt_callout_recipsender
422      && !random_local_part
423      && !pm_mailfrom
424      )
425     {
426     if (addr->transport == cutthrough.addr.transport)
427       for (host = host_list; host; host = host->next)
428         if (Ustrcmp(host->address, cutthrough.host.address) == 0)
429           {
430           int host_af;
431           uschar *interface = NULL;  /* Outgoing interface to use; NULL => any */
432           int port = 25;
433
434           deliver_host = host->name;
435           deliver_host_address = host->address;
436           deliver_host_port = host->port;
437           deliver_domain = addr->domain;
438           transport_name = addr->transport->name;
439
440           host_af = (Ustrchr(host->address, ':') == NULL)? AF_INET:AF_INET6;
441
442           if (!smtp_get_interface(tf->interface, host_af, addr, &interface,
443                   US"callout") ||
444               !smtp_get_port(tf->port, addr, &port, US"callout"))
445             log_write(0, LOG_MAIN|LOG_PANIC, "<%s>: %s", addr->address,
446               addr->message);
447
448           if (  (  interface == cutthrough.interface
449                 || (  interface
450                    && cutthrough.interface
451                    && Ustrcmp(interface, cutthrough.interface) == 0
452                 )  )
453              && port == cutthrough.host.port
454              )
455             {
456             uschar * resp = NULL;
457
458             /* Match!  Send the RCPT TO, append the addr, set done */
459             done =
460               smtp_write_command(&ctblock, FALSE, "RCPT TO:<%.1000s>\r\n",
461                 transport_rcpt_address(addr,
462                   (addr->transport == NULL)? FALSE :
463                    addr->transport->rcpt_include_affixes)) >= 0 &&
464               cutthrough_response('2', &resp, CUTTHROUGH_DATA_TIMEOUT) == '2';
465
466             /* This would go horribly wrong if a callout fail was ignored by ACL.
467             We punt by abandoning cutthrough on a reject, like the
468             first-rcpt does. */
469
470             if (done)
471               {
472               address_item * na = store_get(sizeof(address_item));
473               *na = cutthrough.addr;
474               cutthrough.addr = *addr;
475               cutthrough.addr.host_used = &cutthrough.host;
476               cutthrough.addr.next = na;
477
478               cutthrough.nrcpt++;
479               }
480             else
481               {
482               cancel_cutthrough_connection("recipient rejected");
483               if (!resp || errno == ETIMEDOUT)
484                 {
485                 HDEBUG(D_verify) debug_printf("SMTP timeout\n");
486                 }
487               else if (errno == 0)
488                 {
489                 if (*resp == 0)
490                   Ustrcpy(resp, US"connection dropped");
491
492                 addr->message =
493                   string_sprintf("response to \"%s\" from %s [%s] was: %s",
494                     big_buffer, host->name, host->address,
495                     string_printing(resp));
496
497                 addr->user_message =
498                   string_sprintf("Callout verification failed:\n%s", resp);
499
500                 /* Hard rejection ends the process */
501
502                 if (resp[0] == '5')   /* Address rejected */
503                   {
504                   yield = FAIL;
505                   done = TRUE;
506                   }
507                 }
508               }
509             }
510           break;        /* host_list */
511           }
512     if (!done)
513       cancel_cutthrough_connection("incompatible connection");
514     }
515
516   /* Now make connections to the hosts and do real callouts. The list of hosts
517   is passed in as an argument. */
518
519   for (host = host_list; host && !done; host = host->next)
520     {
521     int host_af;
522     int port = 25;
523     uschar *interface = NULL;  /* Outgoing interface to use; NULL => any */
524     smtp_context sx;
525     uschar responsebuffer[4096];
526
527     clearflag(addr, af_verify_pmfail);  /* postmaster callout flag */
528     clearflag(addr, af_verify_nsfail);  /* null sender callout flag */
529
530     /* Skip this host if we don't have an IP address for it. */
531
532     if (!host->address)
533       {
534       DEBUG(D_verify) debug_printf("no IP address for host name %s: skipping\n",
535         host->name);
536       continue;
537       }
538
539     /* Check the overall callout timeout */
540
541     if (time(NULL) - callout_start_time >= callout_overall)
542       {
543       HDEBUG(D_verify) debug_printf("overall timeout for callout exceeded\n");
544       break;
545       }
546
547     /* Set IPv4 or IPv6 */
548
549     host_af = Ustrchr(host->address, ':') == NULL ? AF_INET : AF_INET6;
550
551     /* Expand and interpret the interface and port strings. The latter will not
552     be used if there is a host-specific port (e.g. from a manualroute router).
553     This has to be delayed till now, because they may expand differently for
554     different hosts. If there's a failure, log it, but carry on with the
555     defaults. */
556
557     deliver_host = host->name;
558     deliver_host_address = host->address;
559     deliver_host_port = host->port;
560     deliver_domain = addr->domain;
561     transport_name = addr->transport->name;
562
563     if (  !smtp_get_interface(tf->interface, host_af, addr, &interface,
564             US"callout")
565        || !smtp_get_port(tf->port, addr, &port, US"callout")
566        )
567       log_write(0, LOG_MAIN|LOG_PANIC, "<%s>: %s", addr->address,
568         addr->message);
569
570     sx.addrlist = addr;
571     sx.host = host;
572     sx.host_af = host_af,
573     sx.port = port;
574     sx.interface = interface;
575     sx.helo_data = tf->helo_data;
576     sx.tblock = addr->transport;
577
578 tls_retry_connection:
579     /* Set the address state so that errors are recorded in it */
580
581     addr->transport_return = PENDING_DEFER;
582     ob->connect_timeout = callout_connect;
583     ob->command_timeout = callout;
584
585     /* Get the channel set up ready for a message (MAIL FROM being the next
586     SMTP command to send.  If we tried TLS but it failed, try again without
587     if permitted */
588
589     if (  (yield = smtp_setup_conn(&sx, FALSE, TRUE)) == DEFER
590        && addr->basic_errno == ERRNO_TLSFAILURE
591        && ob->tls_tempfail_tryclear
592        && verify_check_given_host(&ob->hosts_require_tls, host) != OK
593        )
594       {
595       log_write(0, LOG_MAIN, "TLS session failure:"
596         " callout unencrypted to %s [%s] (not in hosts_require_tls)",
597         host->name, host->address);
598       yield = smtp_setup_conn(&sx, TRUE, TRUE);
599       }
600     if (yield != OK)
601       {
602       if (addr->message) addr->message = string_sprintf("%s [%s] %s",
603                                       host->name, host->address, addr->message);
604       errno = addr->basic_errno;
605       transport_name = NULL;
606       deliver_host = deliver_host_address = NULL;
607       deliver_domain = save_deliver_domain;
608
609       /* Failure to accept HELO is cached; this blocks the whole domain for all
610       senders. I/O errors and defer responses are not cached. */
611
612       if (yield == FAIL && (errno == 0 || errno == ERRNO_SMTPCLOSED))
613         {
614         setflag(addr, af_verify_nsfail);
615         new_domain_record.result = ccache_reject;
616         done = TRUE;
617         }
618       else
619         done = FALSE;
620       goto no_conn;
621       }
622
623     /* If we needed to authenticate, smtp_setup_conn() did that.  Copy
624     the AUTH info for logging */
625
626     addr->authenticator = client_authenticator;
627     addr->auth_id = client_authenticated_id;
628
629     /* Build a mail-AUTH string (re-using responsebuffer for convenience */
630
631     done =
632          !smtp_mail_auth_str(responsebuffer, sizeof(responsebuffer), addr, ob)
633       && (
634           (addr->auth_sndr = client_authenticated_sender),
635
636     /* Send the MAIL command */
637
638           (smtp_write_command(&sx.outblock, FALSE,
639 #ifdef SUPPORT_I18N
640             addr->prop.utf8_msg && !addr->prop.utf8_downcvt
641             ? "MAIL FROM:<%s>%s%s SMTPUTF8\r\n"
642             :
643 #endif
644               "MAIL FROM:<%s>%s%s\r\n",
645             from_address,
646             responsebuffer,
647             options & vopt_is_recipient && sx.peer_offered & PEER_OFFERED_SIZE
648             ? string_sprintf(" SIZE=%d", message_size + ob->size_addition)
649             : US""
650
651             ) >= 0)
652          )
653
654       && smtp_read_response(&sx.inblock, responsebuffer, sizeof(responsebuffer),
655           '2', callout);
656
657     deliver_host = deliver_host_address = NULL;
658     deliver_domain = save_deliver_domain;
659
660     /* If the host does not accept MAIL FROM:<>, arrange to cache this
661     information, but again, don't record anything for an I/O error or a defer. Do
662     not cache rejections of MAIL when a non-empty sender has been used, because
663     that blocks the whole domain for all senders. */
664
665     if (!done)
666       {
667       *failure_ptr = US"mail";     /* At or before MAIL */
668       if (errno == 0 && responsebuffer[0] == '5')
669         {
670         setflag(addr, af_verify_nsfail);
671         if (from_address[0] == 0)
672           new_domain_record.result = ccache_reject_mfnull;
673         }
674       }
675
676     /* Otherwise, proceed to check a "random" address (if required), then the
677     given address, and the postmaster address (if required). Between each check,
678     issue RSET, because some servers accept only one recipient after MAIL
679     FROM:<>.
680
681     Before doing this, set the result in the domain cache record to "accept",
682     unless its previous value was ccache_reject_mfnull. In that case, the domain
683     rejects MAIL FROM:<> and we want to continue to remember that. When that is
684     the case, we have got here only in the case of a recipient verification with
685     a non-null sender. */
686
687     else
688       {
689       const uschar * rcpt_domain = addr->domain;
690
691 #ifdef SUPPORT_I18N
692       uschar * errstr = NULL;
693       if (  testflag(addr, af_utf8_downcvt)
694          && (rcpt_domain = string_domain_utf8_to_alabel(rcpt_domain,
695                                     &errstr), errstr)
696          )
697         {
698         addr->message = errstr;
699         errno = ERRNO_EXPANDFAIL;
700         setflag(addr, af_verify_nsfail);
701         done = FALSE;
702         rcpt_domain = US"";  /*XXX errorhandling! */
703         }
704 #endif
705
706       new_domain_record.result =
707         (old_domain_cache_result == ccache_reject_mfnull)?
708           ccache_reject_mfnull: ccache_accept;
709
710       /* Do the random local part check first */
711
712       if (random_local_part != NULL)
713         {
714         uschar randombuffer[1024];
715         BOOL random_ok =
716           smtp_write_command(&sx.outblock, FALSE,
717             "RCPT TO:<%.1000s@%.1000s>\r\n", random_local_part,
718             rcpt_domain) >= 0 &&
719           smtp_read_response(&sx.inblock, randombuffer,
720             sizeof(randombuffer), '2', callout);
721
722         /* Remember when we last did a random test */
723
724         new_domain_record.random_stamp = time(NULL);
725
726         /* If accepted, we aren't going to do any further tests below. */
727
728         if (random_ok)
729           new_domain_record.random_result = ccache_accept;
730
731         /* Otherwise, cache a real negative response, and get back to the right
732         state to send RCPT. Unless there's some problem such as a dropped
733         connection, we expect to succeed, because the commands succeeded above.
734         However, some servers drop the connection after responding to  an
735         invalid recipient, so on (any) error we drop and remake the connection.
736         */
737
738         else if (errno == 0)
739           {
740           /* This would be ok for 1st rcpt a cutthrough, but no way to
741           handle a subsequent.  So refuse to support any */
742           cancel_cutthrough_connection("random-recipient");
743
744           if (randombuffer[0] == '5')
745             new_domain_record.random_result = ccache_reject;
746
747           done =
748             smtp_write_command(&sx.outblock, FALSE, "RSET\r\n") >= 0 &&
749             smtp_read_response(&sx.inblock, responsebuffer, sizeof(responsebuffer),
750               '2', callout) &&
751
752             smtp_write_command(&sx.outblock, FALSE,
753 #ifdef SUPPORT_I18N
754               addr->prop.utf8_msg && !addr->prop.utf8_downcvt
755               ? "MAIL FROM:<%s> SMTPUTF8\r\n"
756               :
757 #endif
758                 "MAIL FROM:<%s>\r\n",
759               from_address) >= 0 &&
760             smtp_read_response(&sx.inblock, responsebuffer, sizeof(responsebuffer),
761               '2', callout);
762
763           if (!done)
764             {
765             HDEBUG(D_acl|D_v)
766               debug_printf("problem after random/rset/mfrom; reopen conn\n");
767             random_local_part = NULL;
768 #ifdef SUPPORT_TLS
769             tls_close(FALSE, TRUE);
770 #endif
771             HDEBUG(D_transport|D_acl|D_v) debug_printf("  SMTP(close)>>\n");
772             (void)close(sx.inblock.sock);
773 #ifndef DISABLE_EVENT
774             (void) event_raise(addr->transport->event_action,
775                               US"tcp:close", NULL);
776 #endif
777             goto tls_retry_connection;
778             }
779           }
780         else done = FALSE;    /* Some timeout/connection problem */
781         }                     /* Random check */
782
783       /* If the host is accepting all local parts, as determined by the "random"
784       check, we don't need to waste time doing any further checking. */
785
786       if (new_domain_record.random_result != ccache_accept && done)
787         {
788         /* Get the rcpt_include_affixes flag from the transport if there is one,
789         but assume FALSE if there is not. */
790
791         uschar * rcpt = transport_rcpt_address(addr,
792               addr->transport ? addr->transport->rcpt_include_affixes : FALSE);
793
794 #ifdef SUPPORT_I18N
795         /*XXX should the conversion be moved into transport_rcpt_address() ? */
796         if (  testflag(addr, af_utf8_downcvt)
797            && !(rcpt = string_address_utf8_to_alabel(rcpt, NULL))
798            )
799           {
800           errno = ERRNO_EXPANDFAIL;
801           *failure_ptr = US"recipient";
802           done = FALSE;
803           }
804         else
805 #endif
806
807         done =
808           smtp_write_command(&sx.outblock, FALSE, "RCPT TO:<%.1000s>\r\n",
809             rcpt) >= 0 &&
810           smtp_read_response(&sx.inblock, responsebuffer, sizeof(responsebuffer),
811             '2', callout);
812
813         if (done)
814           new_address_record.result = ccache_accept;
815         else if (errno == 0 && responsebuffer[0] == '5')
816           {
817           *failure_ptr = US"recipient";
818           new_address_record.result = ccache_reject;
819           }
820
821         /* Do postmaster check if requested; if a full check is required, we
822         check for RCPT TO:<postmaster> (no domain) in accordance with RFC 821. */
823
824         if (done && pm_mailfrom)
825           {
826           /* Could possibly shift before main verify, just above, and be ok
827           for cutthrough.  But no way to handle a subsequent rcpt, so just
828           refuse any */
829         cancel_cutthrough_connection("postmaster verify");
830         HDEBUG(D_acl|D_v) debug_printf("Cutthrough cancelled by presence of postmaster verify\n");
831
832           done =
833             smtp_write_command(&sx.outblock, FALSE, "RSET\r\n") >= 0 &&
834             smtp_read_response(&sx.inblock, responsebuffer,
835               sizeof(responsebuffer), '2', callout) &&
836
837             smtp_write_command(&sx.outblock, FALSE,
838               "MAIL FROM:<%s>\r\n", pm_mailfrom) >= 0 &&
839             smtp_read_response(&sx.inblock, responsebuffer,
840               sizeof(responsebuffer), '2', callout) &&
841
842             /* First try using the current domain */
843
844             ((
845             smtp_write_command(&sx.outblock, FALSE,
846               "RCPT TO:<postmaster@%.1000s>\r\n", rcpt_domain) >= 0 &&
847             smtp_read_response(&sx.inblock, responsebuffer,
848               sizeof(responsebuffer), '2', callout)
849             )
850
851             ||
852
853             /* If that doesn't work, and a full check is requested,
854             try without the domain. */
855
856             (
857             (options & vopt_callout_fullpm) != 0 &&
858             smtp_write_command(&sx.outblock, FALSE,
859               "RCPT TO:<postmaster>\r\n") >= 0 &&
860             smtp_read_response(&sx.inblock, responsebuffer,
861               sizeof(responsebuffer), '2', callout)
862             ));
863
864           /* Sort out the cache record */
865
866           new_domain_record.postmaster_stamp = time(NULL);
867
868           if (done)
869             new_domain_record.postmaster_result = ccache_accept;
870           else if (errno == 0 && responsebuffer[0] == '5')
871             {
872             *failure_ptr = US"postmaster";
873             setflag(addr, af_verify_pmfail);
874             new_domain_record.postmaster_result = ccache_reject;
875             }
876           }
877         }           /* Random not accepted */
878       }             /* MAIL FROM: accepted */
879
880     /* For any failure of the main check, other than a negative response, we just
881     close the connection and carry on. We can identify a negative response by the
882     fact that errno is zero. For I/O errors it will be non-zero
883
884     Set up different error texts for logging and for sending back to the caller
885     as an SMTP response. Log in all cases, using a one-line format. For sender
886     callouts, give a full response to the caller, but for recipient callouts,
887     don't give the IP address because this may be an internal host whose identity
888     is not to be widely broadcast. */
889
890 no_conn:
891     if (!done) switch(errno)
892       {
893       case ETIMEDOUT:
894         HDEBUG(D_verify) debug_printf("SMTP timeout\n");
895         sx.send_quit = FALSE;
896         break;
897
898 #ifdef SUPPORT_I18N
899       case ERRNO_UTF8_FWD:
900         {
901         extern int acl_where;   /* src/acl.c */
902         errno = 0;
903         addr->message = string_sprintf(
904             "response to \"EHLO\" from %s [%s] did not include SMTPUTF8",
905             host->name, host->address);
906         addr->user_message = acl_where == ACL_WHERE_RCPT
907           ? US"533 no support for internationalised mailbox name"
908           : US"550 mailbox unavailable";
909         yield = FAIL;
910         done = TRUE;
911         }
912         break;
913 #endif
914       case ECONNREFUSED:
915         sx.send_quit = FALSE;
916         break;
917
918       case 0:
919         if (*responsebuffer == 0) Ustrcpy(responsebuffer, US"connection dropped");
920
921         addr->message =
922           string_sprintf("response to \"%s\" from %s [%s] was: %s",
923             big_buffer, host->name, host->address,
924             string_printing(responsebuffer));
925
926         addr->user_message = options & vopt_is_recipient
927           ? string_sprintf("Callout verification failed:\n%s", responsebuffer)
928           : string_sprintf("Called:   %s\nSent:     %s\nResponse: %s",
929             host->address, big_buffer, responsebuffer);
930
931         /* Hard rejection ends the process */
932
933         if (responsebuffer[0] == '5')   /* Address rejected */
934           {
935           yield = FAIL;
936           done = TRUE;
937           }
938         break;
939       }
940
941     /* End the SMTP conversation and close the connection. */
942
943     /* Cutthrough - on a successful connect and recipient-verify with
944     use-sender and we are 1st rcpt and have no cutthrough conn so far
945     here is where we want to leave the conn open */
946     if (  cutthrough.delivery
947        && rcpt_count == 1
948        && done
949        && yield == OK
950        &&    (options & (vopt_callout_recipsender|vopt_callout_recippmaster|vopt_success_on_redirect))
951            == vopt_callout_recipsender
952        && !random_local_part
953        && !pm_mailfrom
954        && cutthrough.fd < 0
955        && !sx.lmtp
956        )
957       {
958       HDEBUG(D_acl|D_v) debug_printf("holding verify callout open for cutthrough delivery\n");
959
960       cutthrough.fd = sx.outblock.sock; /* We assume no buffer in use in the outblock */
961       cutthrough.nrcpt = 1;
962       cutthrough.interface = interface;
963       cutthrough.host = *host;
964       cutthrough.addr = *addr;          /* Save the address_item for later logging */
965       cutthrough.addr.next =      NULL;
966       cutthrough.addr.host_used = &cutthrough.host;
967       if (addr->parent)
968         *(cutthrough.addr.parent = store_get(sizeof(address_item))) =
969           *addr->parent;
970       ctblock.buffer = ctbuffer;
971       ctblock.buffersize = sizeof(ctbuffer);
972       ctblock.ptr = ctbuffer;
973       /* ctblock.cmd_count = 0; ctblock.authenticating = FALSE; */
974       ctblock.sock = cutthrough.fd;
975       }
976     else
977       {
978       /* Ensure no cutthrough on multiple address verifies */
979       if (options & vopt_callout_recipsender)
980         cancel_cutthrough_connection("not usable for cutthrough");
981       if (sx.send_quit)
982         {
983         (void) smtp_write_command(&sx.outblock, FALSE, "QUIT\r\n");
984
985         /* Wait a short time for response, and discard it */
986         smtp_read_response(&sx.inblock, responsebuffer, sizeof(responsebuffer),
987           '2', 1);
988         }
989
990       if (sx.inblock.sock >= 0)
991         {
992 #ifdef SUPPORT_TLS
993         tls_close(FALSE, TRUE);
994 #endif
995         HDEBUG(D_transport|D_acl|D_v) debug_printf("  SMTP(close)>>\n");
996         (void)close(sx.inblock.sock);
997         sx.inblock.sock = sx.outblock.sock = -1;
998 #ifndef DISABLE_EVENT
999         (void) event_raise(addr->transport->event_action, US"tcp:close", NULL);
1000 #endif
1001         }
1002       }
1003
1004     }    /* Loop through all hosts, while !done */
1005   }
1006
1007 /* If we get here with done == TRUE, a successful callout happened, and yield
1008 will be set OK or FAIL according to the response to the RCPT command.
1009 Otherwise, we looped through the hosts but couldn't complete the business.
1010 However, there may be domain-specific information to cache in both cases.
1011
1012 The value of the result field in the new_domain record is ccache_unknown if
1013 there was an error before or with MAIL FROM:, and errno was not zero,
1014 implying some kind of I/O error. We don't want to write the cache in that case.
1015 Otherwise the value is ccache_accept, ccache_reject, or ccache_reject_mfnull. */
1016
1017 if (  !(options & vopt_callout_no_cache)
1018    && new_domain_record.result != ccache_unknown)
1019   {
1020   if ((dbm_file = dbfn_open(US"callout", O_RDWR|O_CREAT, &dbblock, FALSE))
1021        == NULL)
1022     {
1023     HDEBUG(D_verify) debug_printf("callout cache: not available\n");
1024     }
1025   else
1026     {
1027     (void)dbfn_write(dbm_file, addr->domain, &new_domain_record,
1028       (int)sizeof(dbdata_callout_cache));
1029     HDEBUG(D_verify) debug_printf("wrote callout cache domain record for %s:\n"
1030       "  result=%d postmaster=%d random=%d\n",
1031       addr->domain,
1032       new_domain_record.result,
1033       new_domain_record.postmaster_result,
1034       new_domain_record.random_result);
1035     }
1036   }
1037
1038 /* If a definite result was obtained for the callout, cache it unless caching
1039 is disabled. */
1040
1041 if (done)
1042   {
1043   if (  !(options & vopt_callout_no_cache)
1044      && new_address_record.result != ccache_unknown)
1045     {
1046     if (!dbm_file)
1047       dbm_file = dbfn_open(US"callout", O_RDWR|O_CREAT, &dbblock, FALSE);
1048     if (!dbm_file)
1049       {
1050       HDEBUG(D_verify) debug_printf("no callout cache available\n");
1051       }
1052     else
1053       {
1054       (void)dbfn_write(dbm_file, address_key, &new_address_record,
1055         (int)sizeof(dbdata_callout_cache_address));
1056       HDEBUG(D_verify) debug_printf("wrote %s callout cache address record for %s\n",
1057         new_address_record.result == ccache_accept ? "positive" : "negative",
1058         address_key);
1059       }
1060     }
1061   }    /* done */
1062
1063 /* Failure to connect to any host, or any response other than 2xx or 5xx is a
1064 temporary error. If there was only one host, and a response was received, leave
1065 it alone if supplying details. Otherwise, give a generic response. */
1066
1067 else   /* !done */
1068   {
1069   uschar * dullmsg = string_sprintf("Could not complete %s verify callout",
1070     options & vopt_is_recipient ? "recipient" : "sender");
1071   yield = DEFER;
1072
1073   addr->message = host_list->next || !addr->message
1074     ? dullmsg : string_sprintf("%s: %s", dullmsg, addr->message);
1075
1076   addr->user_message = smtp_return_error_details
1077     ? string_sprintf("%s for <%s>.\n"
1078       "The mail server(s) for the domain may be temporarily unreachable, or\n"
1079       "they may be permanently unreachable from this server. In the latter case,\n%s",
1080       dullmsg, addr->address,
1081       options & vopt_is_recipient
1082         ? "the address will never be accepted."
1083         : "you need to change the address or create an MX record for its domain\n"
1084           "if it is supposed to be generally accessible from the Internet.\n"
1085           "Talk to your mail administrator for details.")
1086     : dullmsg;
1087
1088   /* Force a specific error code */
1089
1090   addr->basic_errno = ERRNO_CALLOUTDEFER;
1091   }
1092
1093 /* Come here from within the cache-reading code on fast-track exit. */
1094
1095 END_CALLOUT:
1096 if (dbm_file) dbfn_close(dbm_file);
1097 tls_modify_variables(&tls_in);
1098 return yield;
1099 }
1100
1101
1102
1103 /* Called after recipient-acl to get a cutthrough connection open when
1104    one was requested and a recipient-verify wasn't subsequently done.
1105 */
1106 int
1107 open_cutthrough_connection( address_item * addr )
1108 {
1109 address_item addr2;
1110 int rc;
1111
1112 /* Use a recipient-verify-callout to set up the cutthrough connection. */
1113 /* We must use a copy of the address for verification, because it might
1114 get rewritten. */
1115
1116 addr2 = *addr;
1117 HDEBUG(D_acl) debug_printf("----------- %s cutthrough setup ------------\n",
1118   rcpt_count > 1 ? "more" : "start");
1119 rc = verify_address(&addr2, NULL,
1120         vopt_is_recipient | vopt_callout_recipsender | vopt_callout_no_cache,
1121         CUTTHROUGH_CMD_TIMEOUT, -1, -1,
1122         NULL, NULL, NULL);
1123 addr->message = addr2.message;
1124 addr->user_message = addr2.user_message;
1125 HDEBUG(D_acl) debug_printf("----------- end cutthrough setup ------------\n");
1126 return rc;
1127 }
1128
1129
1130
1131 /* Send given number of bytes from the buffer */
1132 static BOOL
1133 cutthrough_send(int n)
1134 {
1135 if(cutthrough.fd < 0)
1136   return TRUE;
1137
1138 if(
1139 #ifdef SUPPORT_TLS
1140    (tls_out.active == cutthrough.fd) ? tls_write(FALSE, ctblock.buffer, n) :
1141 #endif
1142    send(cutthrough.fd, ctblock.buffer, n, 0) > 0
1143   )
1144 {
1145   transport_count += n;
1146   ctblock.ptr= ctblock.buffer;
1147   return TRUE;
1148 }
1149
1150 HDEBUG(D_transport|D_acl) debug_printf("cutthrough_send failed: %s\n", strerror(errno));
1151 return FALSE;
1152 }
1153
1154
1155
1156 static BOOL
1157 _cutthrough_puts(uschar * cp, int n)
1158 {
1159 while(n--)
1160  {
1161  if(ctblock.ptr >= ctblock.buffer+ctblock.buffersize)
1162    if(!cutthrough_send(ctblock.buffersize))
1163      return FALSE;
1164
1165  *ctblock.ptr++ = *cp++;
1166  }
1167 return TRUE;
1168 }
1169
1170 /* Buffered output of counted data block.   Return boolean success */
1171 BOOL
1172 cutthrough_puts(uschar * cp, int n)
1173 {
1174 if (cutthrough.fd < 0)       return TRUE;
1175 if (_cutthrough_puts(cp, n)) return TRUE;
1176 cancel_cutthrough_connection("transmit failed");
1177 return FALSE;
1178 }
1179
1180
1181 static BOOL
1182 _cutthrough_flush_send(void)
1183 {
1184 int n= ctblock.ptr-ctblock.buffer;
1185
1186 if(n>0)
1187   if(!cutthrough_send(n))
1188     return FALSE;
1189 return TRUE;
1190 }
1191
1192
1193 /* Send out any bufferred output.  Return boolean success. */
1194 BOOL
1195 cutthrough_flush_send(void)
1196 {
1197 if (_cutthrough_flush_send()) return TRUE;
1198 cancel_cutthrough_connection("transmit failed");
1199 return FALSE;
1200 }
1201
1202
1203 BOOL
1204 cutthrough_put_nl(void)
1205 {
1206 return cutthrough_puts(US"\r\n", 2);
1207 }
1208
1209
1210 /* Get and check response from cutthrough target */
1211 static uschar
1212 cutthrough_response(char expect, uschar ** copy, int timeout)
1213 {
1214 smtp_inblock inblock;
1215 uschar inbuffer[4096];
1216 uschar responsebuffer[4096];
1217
1218 inblock.buffer = inbuffer;
1219 inblock.buffersize = sizeof(inbuffer);
1220 inblock.ptr = inbuffer;
1221 inblock.ptrend = inbuffer;
1222 inblock.sock = cutthrough.fd;
1223 /* this relies on (inblock.sock == tls_out.active) */
1224 if(!smtp_read_response(&inblock, responsebuffer, sizeof(responsebuffer), expect, timeout))
1225   cancel_cutthrough_connection("target timeout on read");
1226
1227 if(copy != NULL)
1228   {
1229   uschar * cp;
1230   *copy = cp = string_copy(responsebuffer);
1231   /* Trim the trailing end of line */
1232   cp += Ustrlen(responsebuffer);
1233   if(cp > *copy  &&  cp[-1] == '\n') *--cp = '\0';
1234   if(cp > *copy  &&  cp[-1] == '\r') *--cp = '\0';
1235   }
1236
1237 return responsebuffer[0];
1238 }
1239
1240
1241 /* Negotiate dataphase with the cutthrough target, returning success boolean */
1242 BOOL
1243 cutthrough_predata(void)
1244 {
1245 if(cutthrough.fd < 0)
1246   return FALSE;
1247
1248 HDEBUG(D_transport|D_acl|D_v) debug_printf("  SMTP>> DATA\n");
1249 cutthrough_puts(US"DATA\r\n", 6);
1250 cutthrough_flush_send();
1251
1252 /* Assume nothing buffered.  If it was it gets ignored. */
1253 return cutthrough_response('3', NULL, CUTTHROUGH_DATA_TIMEOUT) == '3';
1254 }
1255
1256
1257 /* fd and tctx args only to match write_chunk() */
1258 static BOOL
1259 cutthrough_write_chunk(int fd, transport_ctx * tctx, uschar * s, int len)
1260 {
1261 uschar * s2;
1262 while(s && (s2 = Ustrchr(s, '\n')))
1263  {
1264  if(!cutthrough_puts(s, s2-s) || !cutthrough_put_nl())
1265   return FALSE;
1266  s = s2+1;
1267  }
1268 return TRUE;
1269 }
1270
1271
1272 /* Buffered send of headers.  Return success boolean. */
1273 /* Expands newlines to wire format (CR,NL).           */
1274 /* Also sends header-terminating blank line.          */
1275 BOOL
1276 cutthrough_headers_send(void)
1277 {
1278 transport_ctx tctx;
1279
1280 if(cutthrough.fd < 0)
1281   return FALSE;
1282
1283 /* We share a routine with the mainline transport to handle header add/remove/rewrites,
1284    but having a separate buffered-output function (for now)
1285 */
1286 HDEBUG(D_acl) debug_printf("----------- start cutthrough headers send -----------\n");
1287
1288 tctx.tblock = cutthrough.addr.transport;
1289 tctx.addr = &cutthrough.addr;
1290 tctx.check_string = US".";
1291 tctx.escape_string = US"..";
1292 tctx.options = topt_use_crlf;
1293
1294 if (!transport_headers_send(cutthrough.fd, &tctx, &cutthrough_write_chunk))
1295   return FALSE;
1296
1297 HDEBUG(D_acl) debug_printf("----------- done cutthrough headers send ------------\n");
1298 return TRUE;
1299 }
1300
1301
1302 static void
1303 close_cutthrough_connection(const char * why)
1304 {
1305 if(cutthrough.fd >= 0)
1306   {
1307   /* We could be sending this after a bunch of data, but that is ok as
1308      the only way to cancel the transfer in dataphase is to drop the tcp
1309      conn before the final dot.
1310   */
1311   ctblock.ptr = ctbuffer;
1312   HDEBUG(D_transport|D_acl|D_v) debug_printf("  SMTP>> QUIT\n");
1313   _cutthrough_puts(US"QUIT\r\n", 6);    /* avoid recursion */
1314   _cutthrough_flush_send();
1315
1316   /* Wait a short time for response, and discard it */
1317   cutthrough_response('2', NULL, 1);
1318
1319   #ifdef SUPPORT_TLS
1320   tls_close(FALSE, TRUE);
1321   #endif
1322   HDEBUG(D_transport|D_acl|D_v) debug_printf("  SMTP(close)>>\n");
1323   (void)close(cutthrough.fd);
1324   cutthrough.fd = -1;
1325   HDEBUG(D_acl) debug_printf("----------- cutthrough shutdown (%s) ------------\n", why);
1326   }
1327 ctblock.ptr = ctbuffer;
1328 }
1329
1330 void
1331 cancel_cutthrough_connection(const char * why)
1332 {
1333 close_cutthrough_connection(why);
1334 cutthrough.delivery = FALSE;
1335 }
1336
1337
1338
1339
1340 /* Have senders final-dot.  Send one to cutthrough target, and grab the response.
1341    Log an OK response as a transmission.
1342    Close the connection.
1343    Return smtp response-class digit.
1344 */
1345 uschar *
1346 cutthrough_finaldot(void)
1347 {
1348 uschar res;
1349 address_item * addr;
1350 HDEBUG(D_transport|D_acl|D_v) debug_printf("  SMTP>> .\n");
1351
1352 /* Assume data finshed with new-line */
1353 if(  !cutthrough_puts(US".", 1)
1354   || !cutthrough_put_nl()
1355   || !cutthrough_flush_send()
1356   )
1357   return cutthrough.addr.message;
1358
1359 res = cutthrough_response('2', &cutthrough.addr.message, CUTTHROUGH_DATA_TIMEOUT);
1360 for (addr = &cutthrough.addr; addr; addr = addr->next)
1361   {
1362   addr->message = cutthrough.addr.message;
1363   switch(res)
1364     {
1365     case '2':
1366       delivery_log(LOG_MAIN, addr, (int)'>', NULL);
1367       close_cutthrough_connection("delivered");
1368       break;
1369
1370     case '4':
1371       delivery_log(LOG_MAIN, addr, 0,
1372         US"tmp-reject from cutthrough after DATA:");
1373       break;
1374
1375     case '5':
1376       delivery_log(LOG_MAIN|LOG_REJECT, addr, 0,
1377         US"rejected after DATA:");
1378       break;
1379
1380     default:
1381       break;
1382     }
1383   }
1384 return cutthrough.addr.message;
1385 }
1386
1387
1388
1389 /*************************************************
1390 *           Copy error to toplevel address       *
1391 *************************************************/
1392
1393 /* This function is used when a verify fails or defers, to ensure that the
1394 failure or defer information is in the original toplevel address. This applies
1395 when an address is redirected to a single new address, and the failure or
1396 deferral happens to the child address.
1397
1398 Arguments:
1399   vaddr       the verify address item
1400   addr        the final address item
1401   yield       FAIL or DEFER
1402
1403 Returns:      the value of YIELD
1404 */
1405
1406 static int
1407 copy_error(address_item *vaddr, address_item *addr, int yield)
1408 {
1409 if (addr != vaddr)
1410   {
1411   vaddr->message = addr->message;
1412   vaddr->user_message = addr->user_message;
1413   vaddr->basic_errno = addr->basic_errno;
1414   vaddr->more_errno = addr->more_errno;
1415   vaddr->prop.address_data = addr->prop.address_data;
1416   copyflag(vaddr, addr, af_pass_message);
1417   }
1418 return yield;
1419 }
1420
1421
1422
1423
1424 /**************************************************
1425 * printf that automatically handles TLS if needed *
1426 ***************************************************/
1427
1428 /* This function is used by verify_address() as a substitute for all fprintf()
1429 calls; a direct fprintf() will not produce output in a TLS SMTP session, such
1430 as a response to an EXPN command.  smtp_in.c makes smtp_printf available but
1431 that assumes that we always use the smtp_out FILE* when not using TLS or the
1432 ssl buffer when we are.  Instead we take a FILE* parameter and check to see if
1433 that is smtp_out; if so, smtp_printf() with TLS support, otherwise regular
1434 fprintf().
1435
1436 Arguments:
1437   f           the candidate FILE* to write to
1438   format      format string
1439   ...         optional arguments
1440
1441 Returns:
1442               nothing
1443 */
1444
1445 static void PRINTF_FUNCTION(2,3)
1446 respond_printf(FILE *f, const char *format, ...)
1447 {
1448 va_list ap;
1449
1450 va_start(ap, format);
1451 if (smtp_out && (f == smtp_out))
1452   smtp_vprintf(format, ap);
1453 else
1454   vfprintf(f, format, ap);
1455 va_end(ap);
1456 }
1457
1458
1459
1460 /*************************************************
1461 *            Verify an email address             *
1462 *************************************************/
1463
1464 /* This function is used both for verification (-bv and at other times) and
1465 address testing (-bt), which is indicated by address_test_mode being set.
1466
1467 Arguments:
1468   vaddr            contains the address to verify; the next field in this block
1469                      must be NULL
1470   f                if not NULL, write the result to this file
1471   options          various option bits:
1472                      vopt_fake_sender => this sender verify is not for the real
1473                        sender (it was verify=sender=xxxx or an address from a
1474                        header line) - rewriting must not change sender_address
1475                      vopt_is_recipient => this is a recipient address, otherwise
1476                        it's a sender address - this affects qualification and
1477                        rewriting and messages from callouts
1478                      vopt_qualify => qualify an unqualified address; else error
1479                      vopt_expn => called from SMTP EXPN command
1480                      vopt_success_on_redirect => when a new address is generated
1481                        the verification instantly succeeds
1482
1483                      These ones are used by do_callout() -- the options variable
1484                        is passed to it.
1485
1486                      vopt_callout_fullpm => if postmaster check, do full one
1487                      vopt_callout_no_cache => don't use callout cache
1488                      vopt_callout_random => do the "random" thing
1489                      vopt_callout_recipsender => use real sender for recipient
1490                      vopt_callout_recippmaster => use postmaster for recipient
1491
1492   callout          if > 0, specifies that callout is required, and gives timeout
1493                      for individual commands
1494   callout_overall  if > 0, gives overall timeout for the callout function;
1495                    if < 0, a default is used (see do_callout())
1496   callout_connect  the connection timeout for callouts
1497   se_mailfrom      when callout is requested to verify a sender, use this
1498                      in MAIL FROM; NULL => ""
1499   pm_mailfrom      when callout is requested, if non-NULL, do the postmaster
1500                      thing and use this as the sender address (may be "")
1501
1502   routed           if not NULL, set TRUE if routing succeeded, so we can
1503                      distinguish between routing failed and callout failed
1504
1505 Returns:           OK      address verified
1506                    FAIL    address failed to verify
1507                    DEFER   can't tell at present
1508 */
1509
1510 int
1511 verify_address(address_item *vaddr, FILE *f, int options, int callout,
1512   int callout_overall, int callout_connect, uschar *se_mailfrom,
1513   uschar *pm_mailfrom, BOOL *routed)
1514 {
1515 BOOL allok = TRUE;
1516 BOOL full_info = (f == NULL)? FALSE : (debug_selector != 0);
1517 BOOL expn         = (options & vopt_expn) != 0;
1518 BOOL success_on_redirect = (options & vopt_success_on_redirect) != 0;
1519 int i;
1520 int yield = OK;
1521 int verify_type = expn? v_expn :
1522      address_test_mode? v_none :
1523           options & vopt_is_recipient? v_recipient : v_sender;
1524 address_item *addr_list;
1525 address_item *addr_new = NULL;
1526 address_item *addr_remote = NULL;
1527 address_item *addr_local = NULL;
1528 address_item *addr_succeed = NULL;
1529 uschar **failure_ptr = options & vopt_is_recipient
1530   ? &recipient_verify_failure : &sender_verify_failure;
1531 uschar *ko_prefix, *cr;
1532 uschar *address = vaddr->address;
1533 uschar *save_sender;
1534 uschar null_sender[] = { 0 };             /* Ensure writeable memory */
1535
1536 /* Clear, just in case */
1537
1538 *failure_ptr = NULL;
1539
1540 /* Set up a prefix and suffix for error message which allow us to use the same
1541 output statements both in EXPN mode (where an SMTP response is needed) and when
1542 debugging with an output file. */
1543
1544 if (expn)
1545   {
1546   ko_prefix = US"553 ";
1547   cr = US"\r";
1548   }
1549 else ko_prefix = cr = US"";
1550
1551 /* Add qualify domain if permitted; otherwise an unqualified address fails. */
1552
1553 if (parse_find_at(address) == NULL)
1554   {
1555   if ((options & vopt_qualify) == 0)
1556     {
1557     if (f != NULL)
1558       respond_printf(f, "%sA domain is required for \"%s\"%s\n",
1559         ko_prefix, address, cr);
1560     *failure_ptr = US"qualify";
1561     return FAIL;
1562     }
1563   address = rewrite_address_qualify(address, options & vopt_is_recipient);
1564   }
1565
1566 DEBUG(D_verify)
1567   {
1568   debug_printf(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>\n");
1569   debug_printf("%s %s\n", address_test_mode? "Testing" : "Verifying", address);
1570   }
1571
1572 /* Rewrite and report on it. Clear the domain and local part caches - these
1573 may have been set by domains and local part tests during an ACL. */
1574
1575 if (global_rewrite_rules != NULL)
1576   {
1577   uschar *old = address;
1578   address = rewrite_address(address, options & vopt_is_recipient, FALSE,
1579     global_rewrite_rules, rewrite_existflags);
1580   if (address != old)
1581     {
1582     for (i = 0; i < (MAX_NAMED_LIST * 2)/32; i++) vaddr->localpart_cache[i] = 0;
1583     for (i = 0; i < (MAX_NAMED_LIST * 2)/32; i++) vaddr->domain_cache[i] = 0;
1584     if (f != NULL && !expn) fprintf(f, "Address rewritten as: %s\n", address);
1585     }
1586   }
1587
1588 /* If this is the real sender address, we must update sender_address at
1589 this point, because it may be referred to in the routers. */
1590
1591 if ((options & (vopt_fake_sender|vopt_is_recipient)) == 0)
1592   sender_address = address;
1593
1594 /* If the address was rewritten to <> no verification can be done, and we have
1595 to return OK. This rewriting is permitted only for sender addresses; for other
1596 addresses, such rewriting fails. */
1597
1598 if (address[0] == 0) return OK;
1599
1600 /* Flip the legacy TLS-related variables over to the outbound set in case
1601 they're used in the context of a transport used by verification. Reset them
1602 at exit from this routine (so no returns allowed from here on). */
1603
1604 tls_modify_variables(&tls_out);
1605
1606 /* Save a copy of the sender address for re-instating if we change it to <>
1607 while verifying a sender address (a nice bit of self-reference there). */
1608
1609 save_sender = sender_address;
1610
1611 /* Observability variable for router/transport use */
1612
1613 verify_mode = options & vopt_is_recipient ? US"R" : US"S";
1614
1615 /* Update the address structure with the possibly qualified and rewritten
1616 address. Set it up as the starting address on the chain of new addresses. */
1617
1618 vaddr->address = address;
1619 addr_new = vaddr;
1620
1621 /* We need a loop, because an address can generate new addresses. We must also
1622 cope with generated pipes and files at the top level. (See also the code and
1623 comment in deliver.c.) However, it is usually the case that the router for
1624 user's .forward files has its verify flag turned off.
1625
1626 If an address generates more than one child, the loop is used only when
1627 full_info is set, and this can only be set locally. Remote enquiries just get
1628 information about the top level address, not anything that it generated. */
1629
1630 while (addr_new)
1631   {
1632   int rc;
1633   address_item *addr = addr_new;
1634
1635   addr_new = addr->next;
1636   addr->next = NULL;
1637
1638   DEBUG(D_verify)
1639     {
1640     debug_printf(">>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>\n");
1641     debug_printf("Considering %s\n", addr->address);
1642     }
1643
1644   /* Handle generated pipe, file or reply addresses. We don't get these
1645   when handling EXPN, as it does only one level of expansion. */
1646
1647   if (testflag(addr, af_pfr))
1648     {
1649     allok = FALSE;
1650     if (f != NULL)
1651       {
1652       BOOL allow;
1653
1654       if (addr->address[0] == '>')
1655         {
1656         allow = testflag(addr, af_allow_reply);
1657         fprintf(f, "%s -> mail %s", addr->parent->address, addr->address + 1);
1658         }
1659       else
1660         {
1661         allow = (addr->address[0] == '|')?
1662           testflag(addr, af_allow_pipe) : testflag(addr, af_allow_file);
1663         fprintf(f, "%s -> %s", addr->parent->address, addr->address);
1664         }
1665
1666       if (addr->basic_errno == ERRNO_BADTRANSPORT)
1667         fprintf(f, "\n*** Error in setting up pipe, file, or autoreply:\n"
1668           "%s\n", addr->message);
1669       else if (allow)
1670         fprintf(f, "\n  transport = %s\n", addr->transport->name);
1671       else
1672         fprintf(f, " *** forbidden ***\n");
1673       }
1674     continue;
1675     }
1676
1677   /* Just in case some router parameter refers to it. */
1678
1679   return_path = addr->prop.errors_address
1680     ? addr->prop.errors_address : sender_address;
1681
1682   /* Split the address into domain and local part, handling the %-hack if
1683   necessary, and then route it. While routing a sender address, set
1684   $sender_address to <> because that is what it will be if we were trying to
1685   send a bounce to the sender. */
1686
1687   if (routed) *routed = FALSE;
1688   if ((rc = deliver_split_address(addr)) == OK)
1689     {
1690     if (!(options & vopt_is_recipient)) sender_address = null_sender;
1691     rc = route_address(addr, &addr_local, &addr_remote, &addr_new,
1692       &addr_succeed, verify_type);
1693     sender_address = save_sender;     /* Put back the real sender */
1694     }
1695
1696   /* If routing an address succeeded, set the flag that remembers, for use when
1697   an ACL cached a sender verify (in case a callout fails). Then if routing set
1698   up a list of hosts or the transport has a host list, and the callout option
1699   is set, and we aren't in a host checking run, do the callout verification,
1700   and set another flag that notes that a callout happened. */
1701
1702   if (rc == OK)
1703     {
1704     if (routed) *routed = TRUE;
1705     if (callout > 0)
1706       {
1707       transport_instance * tp;
1708       host_item * host_list = addr->host_list;
1709
1710       /* Make up some data for use in the case where there is no remote
1711       transport. */
1712
1713       transport_feedback tf = {
1714         NULL,                       /* interface (=> any) */
1715         US"smtp",                   /* port */
1716         US"smtp",                   /* protocol */
1717         NULL,                       /* hosts */
1718         US"$smtp_active_hostname",  /* helo_data */
1719         FALSE,                      /* hosts_override */
1720         FALSE,                      /* hosts_randomize */
1721         FALSE,                      /* gethostbyname */
1722         TRUE,                       /* qualify_single */
1723         FALSE                       /* search_parents */
1724         };
1725
1726       /* If verification yielded a remote transport, we want to use that
1727       transport's options, so as to mimic what would happen if we were really
1728       sending a message to this address. */
1729
1730       if ((tp = addr->transport) && !tp->info->local)
1731         {
1732         (void)(tp->setup)(tp, addr, &tf, 0, 0, NULL);
1733
1734         /* If the transport has hosts and the router does not, or if the
1735         transport is configured to override the router's hosts, we must build a
1736         host list of the transport's hosts, and find the IP addresses */
1737
1738         if (tf.hosts && (!host_list || tf.hosts_override))
1739           {
1740           uschar *s;
1741           const uschar *save_deliver_domain = deliver_domain;
1742           uschar *save_deliver_localpart = deliver_localpart;
1743
1744           host_list = NULL;    /* Ignore the router's hosts */
1745
1746           deliver_domain = addr->domain;
1747           deliver_localpart = addr->local_part;
1748           s = expand_string(tf.hosts);
1749           deliver_domain = save_deliver_domain;
1750           deliver_localpart = save_deliver_localpart;
1751
1752           if (!s)
1753             {
1754             log_write(0, LOG_MAIN|LOG_PANIC, "failed to expand list of hosts "
1755               "\"%s\" in %s transport for callout: %s", tf.hosts,
1756               tp->name, expand_string_message);
1757             }
1758           else
1759             {
1760             int flags;
1761             host_item *host, *nexthost;
1762             host_build_hostlist(&host_list, s, tf.hosts_randomize);
1763
1764             /* Just ignore failures to find a host address. If we don't manage
1765             to find any addresses, the callout will defer. Note that more than
1766             one address may be found for a single host, which will result in
1767             additional host items being inserted into the chain. Hence we must
1768             save the next host first. */
1769
1770             flags = HOST_FIND_BY_A;
1771             if (tf.qualify_single) flags |= HOST_FIND_QUALIFY_SINGLE;
1772             if (tf.search_parents) flags |= HOST_FIND_SEARCH_PARENTS;
1773
1774             for (host = host_list; host; host = nexthost)
1775               {
1776               nexthost = host->next;
1777               if (tf.gethostbyname ||
1778                   string_is_ip_address(host->name, NULL) != 0)
1779                 (void)host_find_byname(host, NULL, flags, NULL, TRUE);
1780               else
1781                 {
1782                 dnssec_domains * dnssec_domains = NULL;
1783                 if (Ustrcmp(tp->driver_name, "smtp") == 0)
1784                   {
1785                   smtp_transport_options_block * ob =
1786                       (smtp_transport_options_block *) tp->options_block;
1787                   dnssec_domains = &ob->dnssec;
1788                   }
1789
1790                 (void)host_find_bydns(host, NULL, flags, NULL, NULL, NULL,
1791                   dnssec_domains, NULL, NULL);
1792                 }
1793               }
1794             }
1795           }
1796         }
1797
1798       /* Can only do a callout if we have at least one host! If the callout
1799       fails, it will have set ${sender,recipient}_verify_failure. */
1800
1801       if (host_list)
1802         {
1803         HDEBUG(D_verify) debug_printf("Attempting full verification using callout\n");
1804         if (host_checking && !host_checking_callout)
1805           {
1806           HDEBUG(D_verify)
1807             debug_printf("... callout omitted by default when host testing\n"
1808               "(Use -bhc if you want the callouts to happen.)\n");
1809           }
1810         else
1811           {
1812 #ifdef SUPPORT_TLS
1813           deliver_set_expansions(addr);
1814 #endif
1815           rc = do_callout(addr, host_list, &tf, callout, callout_overall,
1816             callout_connect, options, se_mailfrom, pm_mailfrom);
1817           }
1818         }
1819       else
1820         {
1821         HDEBUG(D_verify) debug_printf("Cannot do callout: neither router nor "
1822           "transport provided a host list\n");
1823         }
1824       }
1825     }
1826
1827   /* Otherwise, any failure is a routing failure */
1828
1829   else *failure_ptr = US"route";
1830
1831   /* A router may return REROUTED if it has set up a child address as a result
1832   of a change of domain name (typically from widening). In this case we always
1833   want to continue to verify the new child. */
1834
1835   if (rc == REROUTED) continue;
1836
1837   /* Handle hard failures */
1838
1839   if (rc == FAIL)
1840     {
1841     allok = FALSE;
1842     if (f)
1843       {
1844       address_item *p = addr->parent;
1845
1846       respond_printf(f, "%s%s %s", ko_prefix,
1847         full_info ? addr->address : address,
1848         address_test_mode ? "is undeliverable" : "failed to verify");
1849       if (!expn && admin_user)
1850         {
1851         if (addr->basic_errno > 0)
1852           respond_printf(f, ": %s", strerror(addr->basic_errno));
1853         if (addr->message)
1854           respond_printf(f, ": %s", addr->message);
1855         }
1856
1857       /* Show parents iff doing full info */
1858
1859       if (full_info) while (p)
1860         {
1861         respond_printf(f, "%s\n    <-- %s", cr, p->address);
1862         p = p->parent;
1863         }
1864       respond_printf(f, "%s\n", cr);
1865       }
1866     cancel_cutthrough_connection("routing hard fail");
1867
1868     if (!full_info)
1869       {
1870       yield = copy_error(vaddr, addr, FAIL);
1871       goto out;
1872       }
1873     yield = FAIL;
1874     }
1875
1876   /* Soft failure */
1877
1878   else if (rc == DEFER)
1879     {
1880     allok = FALSE;
1881     if (f)
1882       {
1883       address_item *p = addr->parent;
1884       respond_printf(f, "%s%s cannot be resolved at this time", ko_prefix,
1885         full_info? addr->address : address);
1886       if (!expn && admin_user)
1887         {
1888         if (addr->basic_errno > 0)
1889           respond_printf(f, ": %s", strerror(addr->basic_errno));
1890         if (addr->message)
1891           respond_printf(f, ": %s", addr->message);
1892         else if (addr->basic_errno <= 0)
1893           respond_printf(f, ": unknown error");
1894         }
1895
1896       /* Show parents iff doing full info */
1897
1898       if (full_info) while (p)
1899         {
1900         respond_printf(f, "%s\n    <-- %s", cr, p->address);
1901         p = p->parent;
1902         }
1903       respond_printf(f, "%s\n", cr);
1904       }
1905     cancel_cutthrough_connection("routing soft fail");
1906
1907     if (!full_info)
1908       {
1909       yield = copy_error(vaddr, addr, DEFER);
1910       goto out;
1911       }
1912     if (yield == OK) yield = DEFER;
1913     }
1914
1915   /* If we are handling EXPN, we do not want to continue to route beyond
1916   the top level (whose address is in "address"). */
1917
1918   else if (expn)
1919     {
1920     uschar *ok_prefix = US"250-";
1921
1922     if (!addr_new)
1923       if (!addr_local && !addr_remote)
1924         respond_printf(f, "250 mail to <%s> is discarded\r\n", address);
1925       else
1926         respond_printf(f, "250 <%s>\r\n", address);
1927
1928     else do
1929       {
1930       address_item *addr2 = addr_new;
1931       addr_new = addr2->next;
1932       if (!addr_new) ok_prefix = US"250 ";
1933       respond_printf(f, "%s<%s>\r\n", ok_prefix, addr2->address);
1934       } while (addr_new);
1935     yield = OK;
1936     goto out;
1937     }
1938
1939   /* Successful routing other than EXPN. */
1940
1941   else
1942     {
1943     /* Handle successful routing when short info wanted. Otherwise continue for
1944     other (generated) addresses. Short info is the operational case. Full info
1945     can be requested only when debug_selector != 0 and a file is supplied.
1946
1947     There is a conflict between the use of aliasing as an alternate email
1948     address, and as a sort of mailing list. If an alias turns the incoming
1949     address into just one address (e.g. J.Caesar->jc44) you may well want to
1950     carry on verifying the generated address to ensure it is valid when
1951     checking incoming mail. If aliasing generates multiple addresses, you
1952     probably don't want to do this. Exim therefore treats the generation of
1953     just a single new address as a special case, and continues on to verify the
1954     generated address. */
1955
1956     if (  !full_info                    /* Stop if short info wanted AND */
1957        && (  (  !addr_new               /* No new address OR */
1958              || addr_new->next          /* More than one new address OR */
1959              || testflag(addr_new, af_pfr)      /* New address is pfr */
1960              )
1961           ||                            /* OR */
1962              (  addr_new                /* At least one new address AND */
1963              && success_on_redirect     /* success_on_redirect is set */
1964           )  )
1965        )
1966       {
1967       if (f) fprintf(f, "%s %s\n",
1968         address, address_test_mode ? "is deliverable" : "verified");
1969
1970       /* If we have carried on to verify a child address, we want the value
1971       of $address_data to be that of the child */
1972
1973       vaddr->prop.address_data = addr->prop.address_data;
1974
1975       /* If stopped because more than one new address, cannot cutthrough */
1976
1977       if (addr_new && addr_new->next)
1978         cancel_cutthrough_connection("multiple addresses from routing");
1979
1980       yield = OK;
1981       goto out;
1982       }
1983     }
1984   }     /* Loop for generated addresses */
1985
1986 /* Display the full results of the successful routing, including any generated
1987 addresses. Control gets here only when full_info is set, which requires f not
1988 to be NULL, and this occurs only when a top-level verify is called with the
1989 debugging switch on.
1990
1991 If there are no local and no remote addresses, and there were no pipes, files,
1992 or autoreplies, and there were no errors or deferments, the message is to be
1993 discarded, usually because of the use of :blackhole: in an alias file. */
1994
1995 if (allok && !addr_local && !addr_remote)
1996   {
1997   fprintf(f, "mail to %s is discarded\n", address);
1998   goto out;
1999   }
2000
2001 for (addr_list = addr_local, i = 0; i < 2; addr_list = addr_remote, i++)
2002   while (addr_list)
2003     {
2004     address_item *addr = addr_list;
2005     address_item *p = addr->parent;
2006     transport_instance * tp = addr->transport;
2007
2008     addr_list = addr->next;
2009
2010     fprintf(f, "%s", CS addr->address);
2011 #ifdef EXPERIMENTAL_SRS
2012     if(addr->prop.srs_sender)
2013       fprintf(f, "    [srs = %s]", addr->prop.srs_sender);
2014 #endif
2015
2016     /* If the address is a duplicate, show something about it. */
2017
2018     if (!testflag(addr, af_pfr))
2019       {
2020       tree_node *tnode;
2021       if ((tnode = tree_search(tree_duplicates, addr->unique)))
2022         fprintf(f, "   [duplicate, would not be delivered]");
2023       else tree_add_duplicate(addr->unique, addr);
2024       }
2025
2026     /* Now show its parents */
2027
2028     for (p = addr->parent; p; p = p->parent)
2029       fprintf(f, "\n    <-- %s", p->address);
2030     fprintf(f, "\n  ");
2031
2032     /* Show router, and transport */
2033
2034     fprintf(f, "router = %s, transport = %s\n",
2035       addr->router->name, tp ? tp->name : US"unset");
2036
2037     /* Show any hosts that are set up by a router unless the transport
2038     is going to override them; fiddle a bit to get a nice format. */
2039
2040     if (addr->host_list && tp && !tp->overrides_hosts)
2041       {
2042       host_item *h;
2043       int maxlen = 0;
2044       int maxaddlen = 0;
2045       for (h = addr->host_list; h; h = h->next)
2046         {                               /* get max lengths of host names, addrs */
2047         int len = Ustrlen(h->name);
2048         if (len > maxlen) maxlen = len;
2049         len = h->address ? Ustrlen(h->address) : 7;
2050         if (len > maxaddlen) maxaddlen = len;
2051         }
2052       for (h = addr->host_list; h; h = h->next)
2053         {
2054         fprintf(f, "  host %-*s ", maxlen, h->name);
2055
2056         if (h->address)
2057           fprintf(f, "[%s%-*c", h->address, maxaddlen+1 - Ustrlen(h->address), ']');
2058         else if (tp->info->local)
2059           fprintf(f, " %-*s ", maxaddlen, "");  /* Omit [unknown] for local */
2060         else
2061           fprintf(f, "[%s%-*c", "unknown", maxaddlen+1 - 7, ']');
2062
2063         if (h->mx >= 0) fprintf(f, " MX=%d", h->mx);
2064         if (h->port != PORT_NONE) fprintf(f, " port=%d", h->port);
2065         if (running_in_test_harness  &&  h->dnssec == DS_YES) fputs(" AD", f);
2066         if (h->status == hstatus_unusable) fputs(" ** unusable **", f);
2067         fputc('\n', f);
2068         }
2069       }
2070     }
2071
2072 /* Yield will be DEFER or FAIL if any one address has, only for full_info (which is
2073 the -bv or -bt case). */
2074
2075 out:
2076 verify_mode = NULL;
2077 tls_modify_variables(&tls_in);
2078
2079 return yield;
2080 }
2081
2082
2083
2084
2085 /*************************************************
2086 *      Check headers for syntax errors           *
2087 *************************************************/
2088
2089 /* This function checks those header lines that contain addresses, and verifies
2090 that all the addresses therein are syntactially correct.
2091
2092 Arguments:
2093   msgptr     where to put an error message
2094
2095 Returns:     OK
2096              FAIL
2097 */
2098
2099 int
2100 verify_check_headers(uschar **msgptr)
2101 {
2102 header_line *h;
2103 uschar *colon, *s;
2104 int yield = OK;
2105
2106 for (h = header_list; h != NULL && yield == OK; h = h->next)
2107   {
2108   if (h->type != htype_from &&
2109       h->type != htype_reply_to &&
2110       h->type != htype_sender &&
2111       h->type != htype_to &&
2112       h->type != htype_cc &&
2113       h->type != htype_bcc)
2114     continue;
2115
2116   colon = Ustrchr(h->text, ':');
2117   s = colon + 1;
2118   while (isspace(*s)) s++;
2119
2120   /* Loop for multiple addresses in the header, enabling group syntax. Note
2121   that we have to reset this after the header has been scanned. */
2122
2123   parse_allow_group = TRUE;
2124
2125   while (*s != 0)
2126     {
2127     uschar *ss = parse_find_address_end(s, FALSE);
2128     uschar *recipient, *errmess;
2129     int terminator = *ss;
2130     int start, end, domain;
2131
2132     /* Temporarily terminate the string at this point, and extract the
2133     operative address within, allowing group syntax. */
2134
2135     *ss = 0;
2136     recipient = parse_extract_address(s,&errmess,&start,&end,&domain,FALSE);
2137     *ss = terminator;
2138
2139     /* Permit an unqualified address only if the message is local, or if the
2140     sending host is configured to be permitted to send them. */
2141
2142     if (recipient != NULL && domain == 0)
2143       {
2144       if (h->type == htype_from || h->type == htype_sender)
2145         {
2146         if (!allow_unqualified_sender) recipient = NULL;
2147         }
2148       else
2149         {
2150         if (!allow_unqualified_recipient) recipient = NULL;
2151         }
2152       if (recipient == NULL) errmess = US"unqualified address not permitted";
2153       }
2154
2155     /* It's an error if no address could be extracted, except for the special
2156     case of an empty address. */
2157
2158     if (recipient == NULL && Ustrcmp(errmess, "empty address") != 0)
2159       {
2160       uschar *verb = US"is";
2161       uschar *t = ss;
2162       uschar *tt = colon;
2163       int len;
2164
2165       /* Arrange not to include any white space at the end in the
2166       error message or the header name. */
2167
2168       while (t > s && isspace(t[-1])) t--;
2169       while (tt > h->text && isspace(tt[-1])) tt--;
2170
2171       /* Add the address that failed to the error message, since in a
2172       header with very many addresses it is sometimes hard to spot
2173       which one is at fault. However, limit the amount of address to
2174       quote - cases have been seen where, for example, a missing double
2175       quote in a humungous To: header creates an "address" that is longer
2176       than string_sprintf can handle. */
2177
2178       len = t - s;
2179       if (len > 1024)
2180         {
2181         len = 1024;
2182         verb = US"begins";
2183         }
2184
2185       /* deconst cast ok as we're passing a non-const to string_printing() */
2186       *msgptr = US string_printing(
2187         string_sprintf("%s: failing address in \"%.*s:\" header %s: %.*s",
2188           errmess, tt - h->text, h->text, verb, len, s));
2189
2190       yield = FAIL;
2191       break;          /* Out of address loop */
2192       }
2193
2194     /* Advance to the next address */
2195
2196     s = ss + (terminator? 1:0);
2197     while (isspace(*s)) s++;
2198     }   /* Next address */
2199
2200   parse_allow_group = FALSE;
2201   parse_found_group = FALSE;
2202   }     /* Next header unless yield has been set FALSE */
2203
2204 return yield;
2205 }
2206
2207
2208 /*************************************************
2209 *      Check header names for 8-bit characters   *
2210 *************************************************/
2211
2212 /* This function checks for invalid characters in header names. See
2213 RFC 5322, 2.2. and RFC 6532, 3.
2214
2215 Arguments:
2216   msgptr     where to put an error message
2217
2218 Returns:     OK
2219              FAIL
2220 */
2221
2222 int
2223 verify_check_header_names_ascii(uschar **msgptr)
2224 {
2225 header_line *h;
2226 uschar *colon, *s;
2227
2228 for (h = header_list; h != NULL; h = h->next)
2229   {
2230    colon = Ustrchr(h->text, ':');
2231    for(s = h->text; s < colon; s++)
2232      {
2233         if ((*s < 33) || (*s > 126))
2234         {
2235                 *msgptr = string_sprintf("Invalid character in header \"%.*s\" found",
2236                                          colon - h->text, h->text);
2237                 return FAIL;
2238         }
2239      }
2240   }
2241 return OK;
2242 }
2243
2244 /*************************************************
2245 *          Check for blind recipients            *
2246 *************************************************/
2247
2248 /* This function checks that every (envelope) recipient is mentioned in either
2249 the To: or Cc: header lines, thus detecting blind carbon copies.
2250
2251 There are two ways of scanning that could be used: either scan the header lines
2252 and tick off the recipients, or scan the recipients and check the header lines.
2253 The original proposed patch did the former, but I have chosen to do the latter,
2254 because (a) it requires no memory and (b) will use fewer resources when there
2255 are many addresses in To: and/or Cc: and only one or two envelope recipients.
2256
2257 Arguments:   none
2258 Returns:     OK    if there are no blind recipients
2259              FAIL  if there is at least one blind recipient
2260 */
2261
2262 int
2263 verify_check_notblind(void)
2264 {
2265 int i;
2266 for (i = 0; i < recipients_count; i++)
2267   {
2268   header_line *h;
2269   BOOL found = FALSE;
2270   uschar *address = recipients_list[i].address;
2271
2272   for (h = header_list; !found && h != NULL; h = h->next)
2273     {
2274     uschar *colon, *s;
2275
2276     if (h->type != htype_to && h->type != htype_cc) continue;
2277
2278     colon = Ustrchr(h->text, ':');
2279     s = colon + 1;
2280     while (isspace(*s)) s++;
2281
2282     /* Loop for multiple addresses in the header, enabling group syntax. Note
2283     that we have to reset this after the header has been scanned. */
2284
2285     parse_allow_group = TRUE;
2286
2287     while (*s != 0)
2288       {
2289       uschar *ss = parse_find_address_end(s, FALSE);
2290       uschar *recipient,*errmess;
2291       int terminator = *ss;
2292       int start, end, domain;
2293
2294       /* Temporarily terminate the string at this point, and extract the
2295       operative address within, allowing group syntax. */
2296
2297       *ss = 0;
2298       recipient = parse_extract_address(s,&errmess,&start,&end,&domain,FALSE);
2299       *ss = terminator;
2300
2301       /* If we found a valid recipient that has a domain, compare it with the
2302       envelope recipient. Local parts are compared case-sensitively, domains
2303       case-insensitively. By comparing from the start with length "domain", we
2304       include the "@" at the end, which ensures that we are comparing the whole
2305       local part of each address. */
2306
2307       if (recipient != NULL && domain != 0)
2308         {
2309         found = Ustrncmp(recipient, address, domain) == 0 &&
2310                 strcmpic(recipient + domain, address + domain) == 0;
2311         if (found) break;
2312         }
2313
2314       /* Advance to the next address */
2315
2316       s = ss + (terminator? 1:0);
2317       while (isspace(*s)) s++;
2318       }   /* Next address */
2319
2320     parse_allow_group = FALSE;
2321     parse_found_group = FALSE;
2322     }     /* Next header (if found is false) */
2323
2324   if (!found) return FAIL;
2325   }       /* Next recipient */
2326
2327 return OK;
2328 }
2329
2330
2331
2332 /*************************************************
2333 *          Find if verified sender               *
2334 *************************************************/
2335
2336 /* Usually, just a single address is verified as the sender of the message.
2337 However, Exim can be made to verify other addresses as well (often related in
2338 some way), and this is useful in some environments. There may therefore be a
2339 chain of such addresses that have previously been tested. This function finds
2340 whether a given address is on the chain.
2341
2342 Arguments:   the address to be verified
2343 Returns:     pointer to an address item, or NULL
2344 */
2345
2346 address_item *
2347 verify_checked_sender(uschar *sender)
2348 {
2349 address_item *addr;
2350 for (addr = sender_verified_list; addr != NULL; addr = addr->next)
2351   if (Ustrcmp(sender, addr->address) == 0) break;
2352 return addr;
2353 }
2354
2355
2356
2357
2358
2359 /*************************************************
2360 *             Get valid header address           *
2361 *************************************************/
2362
2363 /* Scan the originator headers of the message, looking for an address that
2364 verifies successfully. RFC 822 says:
2365
2366     o   The "Sender" field mailbox should be sent  notices  of
2367         any  problems in transport or delivery of the original
2368         messages.  If there is no  "Sender"  field,  then  the
2369         "From" field mailbox should be used.
2370
2371     o   If the "Reply-To" field exists, then the reply  should
2372         go to the addresses indicated in that field and not to
2373         the address(es) indicated in the "From" field.
2374
2375 So we check a Sender field if there is one, else a Reply_to field, else a From
2376 field. As some strange messages may have more than one of these fields,
2377 especially if they are resent- fields, check all of them if there is more than
2378 one.
2379
2380 Arguments:
2381   user_msgptr      points to where to put a user error message
2382   log_msgptr       points to where to put a log error message
2383   callout          timeout for callout check (passed to verify_address())
2384   callout_overall  overall callout timeout (ditto)
2385   callout_connect  connect callout timeout (ditto)
2386   se_mailfrom      mailfrom for verify; NULL => ""
2387   pm_mailfrom      sender for pm callout check (passed to verify_address())
2388   options          callout options (passed to verify_address())
2389   verrno           where to put the address basic_errno
2390
2391 If log_msgptr is set to something without setting user_msgptr, the caller
2392 normally uses log_msgptr for both things.
2393
2394 Returns:           result of the verification attempt: OK, FAIL, or DEFER;
2395                    FAIL is given if no appropriate headers are found
2396 */
2397
2398 int
2399 verify_check_header_address(uschar **user_msgptr, uschar **log_msgptr,
2400   int callout, int callout_overall, int callout_connect, uschar *se_mailfrom,
2401   uschar *pm_mailfrom, int options, int *verrno)
2402 {
2403 static int header_types[] = { htype_sender, htype_reply_to, htype_from };
2404 BOOL done = FALSE;
2405 int yield = FAIL;
2406 int i;
2407
2408 for (i = 0; i < 3 && !done; i++)
2409   {
2410   header_line *h;
2411   for (h = header_list; h != NULL && !done; h = h->next)
2412     {
2413     int terminator, new_ok;
2414     uschar *s, *ss, *endname;
2415
2416     if (h->type != header_types[i]) continue;
2417     s = endname = Ustrchr(h->text, ':') + 1;
2418
2419     /* Scan the addresses in the header, enabling group syntax. Note that we
2420     have to reset this after the header has been scanned. */
2421
2422     parse_allow_group = TRUE;
2423
2424     while (*s != 0)
2425       {
2426       address_item *vaddr;
2427
2428       while (isspace(*s) || *s == ',') s++;
2429       if (*s == 0) break;        /* End of header */
2430
2431       ss = parse_find_address_end(s, FALSE);
2432
2433       /* The terminator is a comma or end of header, but there may be white
2434       space preceding it (including newline for the last address). Move back
2435       past any white space so we can check against any cached envelope sender
2436       address verifications. */
2437
2438       while (isspace(ss[-1])) ss--;
2439       terminator = *ss;
2440       *ss = 0;
2441
2442       HDEBUG(D_verify) debug_printf("verifying %.*s header address %s\n",
2443         (int)(endname - h->text), h->text, s);
2444
2445       /* See if we have already verified this address as an envelope sender,
2446       and if so, use the previous answer. */
2447
2448       vaddr = verify_checked_sender(s);
2449
2450       if (vaddr != NULL &&                   /* Previously checked */
2451            (callout <= 0 ||                  /* No callout needed; OR */
2452             vaddr->special_action > 256))    /* Callout was done */
2453         {
2454         new_ok = vaddr->special_action & 255;
2455         HDEBUG(D_verify) debug_printf("previously checked as envelope sender\n");
2456         *ss = terminator;  /* Restore shortened string */
2457         }
2458
2459       /* Otherwise we run the verification now. We must restore the shortened
2460       string before running the verification, so the headers are correct, in
2461       case there is any rewriting. */
2462
2463       else
2464         {
2465         int start, end, domain;
2466         uschar *address = parse_extract_address(s, log_msgptr, &start, &end,
2467           &domain, FALSE);
2468
2469         *ss = terminator;
2470
2471         /* If we found an empty address, just carry on with the next one, but
2472         kill the message. */
2473
2474         if (address == NULL && Ustrcmp(*log_msgptr, "empty address") == 0)
2475           {
2476           *log_msgptr = NULL;
2477           s = ss;
2478           continue;
2479           }
2480
2481         /* If verification failed because of a syntax error, fail this
2482         function, and ensure that the failing address gets added to the error
2483         message. */
2484
2485         if (address == NULL)
2486           {
2487           new_ok = FAIL;
2488           while (ss > s && isspace(ss[-1])) ss--;
2489           *log_msgptr = string_sprintf("syntax error in '%.*s' header when "
2490             "scanning for sender: %s in \"%.*s\"",
2491             endname - h->text, h->text, *log_msgptr, ss - s, s);
2492           yield = FAIL;
2493           done = TRUE;
2494           break;
2495           }
2496
2497         /* Else go ahead with the sender verification. But it isn't *the*
2498         sender of the message, so set vopt_fake_sender to stop sender_address
2499         being replaced after rewriting or qualification. */
2500
2501         else
2502           {
2503           vaddr = deliver_make_addr(address, FALSE);
2504           new_ok = verify_address(vaddr, NULL, options | vopt_fake_sender,
2505             callout, callout_overall, callout_connect, se_mailfrom,
2506             pm_mailfrom, NULL);
2507           }
2508         }
2509
2510       /* We now have the result, either newly found, or cached. If we are
2511       giving out error details, set a specific user error. This means that the
2512       last of these will be returned to the user if all three fail. We do not
2513       set a log message - the generic one below will be used. */
2514
2515       if (new_ok != OK)
2516         {
2517         *verrno = vaddr->basic_errno;
2518         if (smtp_return_error_details)
2519           {
2520           *user_msgptr = string_sprintf("Rejected after DATA: "
2521             "could not verify \"%.*s\" header address\n%s: %s",
2522             endname - h->text, h->text, vaddr->address, vaddr->message);
2523           }
2524         }
2525
2526       /* Success or defer */
2527
2528       if (new_ok == OK)
2529         {
2530         yield = OK;
2531         done = TRUE;
2532         break;
2533         }
2534
2535       if (new_ok == DEFER) yield = DEFER;
2536
2537       /* Move on to any more addresses in the header */
2538
2539       s = ss;
2540       }     /* Next address */
2541
2542     parse_allow_group = FALSE;
2543     parse_found_group = FALSE;
2544     }       /* Next header, unless done */
2545   }         /* Next header type unless done */
2546
2547 if (yield == FAIL && *log_msgptr == NULL)
2548   *log_msgptr = US"there is no valid sender in any header line";
2549
2550 if (yield == DEFER && *log_msgptr == NULL)
2551   *log_msgptr = US"all attempts to verify a sender in a header line deferred";
2552
2553 return yield;
2554 }
2555
2556
2557
2558
2559 /*************************************************
2560 *            Get RFC 1413 identification         *
2561 *************************************************/
2562
2563 /* Attempt to get an id from the sending machine via the RFC 1413 protocol. If
2564 the timeout is set to zero, then the query is not done. There may also be lists
2565 of hosts and nets which are exempt. To guard against malefactors sending
2566 non-printing characters which could, for example, disrupt a message's headers,
2567 make sure the string consists of printing characters only.
2568
2569 Argument:
2570   port    the port to connect to; usually this is IDENT_PORT (113), but when
2571           running in the test harness with -bh a different value is used.
2572
2573 Returns:  nothing
2574
2575 Side effect: any received ident value is put in sender_ident (NULL otherwise)
2576 */
2577
2578 void
2579 verify_get_ident(int port)
2580 {
2581 int sock, host_af, qlen;
2582 int received_sender_port, received_interface_port, n;
2583 uschar *p;
2584 uschar buffer[2048];
2585
2586 /* Default is no ident. Check whether we want to do an ident check for this
2587 host. */
2588
2589 sender_ident = NULL;
2590 if (rfc1413_query_timeout <= 0 || verify_check_host(&rfc1413_hosts) != OK)
2591   return;
2592
2593 DEBUG(D_ident) debug_printf("doing ident callback\n");
2594
2595 /* Set up a connection to the ident port of the remote host. Bind the local end
2596 to the incoming interface address. If the sender host address is an IPv6
2597 address, the incoming interface address will also be IPv6. */
2598
2599 host_af = Ustrchr(sender_host_address, ':') == NULL ? AF_INET : AF_INET6;
2600 if ((sock = ip_socket(SOCK_STREAM, host_af)) < 0) return;
2601
2602 if (ip_bind(sock, host_af, interface_address, 0) < 0)
2603   {
2604   DEBUG(D_ident) debug_printf("bind socket for ident failed: %s\n",
2605     strerror(errno));
2606   goto END_OFF;
2607   }
2608
2609 if (ip_connect(sock, host_af, sender_host_address, port,
2610                 rfc1413_query_timeout, TRUE) < 0)
2611   {
2612   if (errno == ETIMEDOUT && LOGGING(ident_timeout))
2613     log_write(0, LOG_MAIN, "ident connection to %s timed out",
2614       sender_host_address);
2615   else
2616     DEBUG(D_ident) debug_printf("ident connection to %s failed: %s\n",
2617       sender_host_address, strerror(errno));
2618   goto END_OFF;
2619   }
2620
2621 /* Construct and send the query. */
2622
2623 sprintf(CS buffer, "%d , %d\r\n", sender_host_port, interface_port);
2624 qlen = Ustrlen(buffer);
2625 if (send(sock, buffer, qlen, 0) < 0)
2626   {
2627   DEBUG(D_ident) debug_printf("ident send failed: %s\n", strerror(errno));
2628   goto END_OFF;
2629   }
2630
2631 /* Read a response line. We put it into the rest of the buffer, using several
2632 recv() calls if necessary. */
2633
2634 p = buffer + qlen;
2635
2636 for (;;)
2637   {
2638   uschar *pp;
2639   int count;
2640   int size = sizeof(buffer) - (p - buffer);
2641
2642   if (size <= 0) goto END_OFF;   /* Buffer filled without seeing \n. */
2643   count = ip_recv(sock, p, size, rfc1413_query_timeout);
2644   if (count <= 0) goto END_OFF;  /* Read error or EOF */
2645
2646   /* Scan what we just read, to see if we have reached the terminating \r\n. Be
2647   generous, and accept a plain \n terminator as well. The only illegal
2648   character is 0. */
2649
2650   for (pp = p; pp < p + count; pp++)
2651     {
2652     if (*pp == 0) goto END_OFF;   /* Zero octet not allowed */
2653     if (*pp == '\n')
2654       {
2655       if (pp[-1] == '\r') pp--;
2656       *pp = 0;
2657       goto GOT_DATA;             /* Break out of both loops */
2658       }
2659     }
2660
2661   /* Reached the end of the data without finding \n. Let the loop continue to
2662   read some more, if there is room. */
2663
2664   p = pp;
2665   }
2666
2667 GOT_DATA:
2668
2669 /* We have received a line of data. Check it carefully. It must start with the
2670 same two port numbers that we sent, followed by data as defined by the RFC. For
2671 example,
2672
2673   12345 , 25 : USERID : UNIX :root
2674
2675 However, the amount of white space may be different to what we sent. In the
2676 "osname" field there may be several sub-fields, comma separated. The data we
2677 actually want to save follows the third colon. Some systems put leading spaces
2678 in it - we discard those. */
2679
2680 if (sscanf(CS buffer + qlen, "%d , %d%n", &received_sender_port,
2681       &received_interface_port, &n) != 2 ||
2682     received_sender_port != sender_host_port ||
2683     received_interface_port != interface_port)
2684   goto END_OFF;
2685
2686 p = buffer + qlen + n;
2687 while(isspace(*p)) p++;
2688 if (*p++ != ':') goto END_OFF;
2689 while(isspace(*p)) p++;
2690 if (Ustrncmp(p, "USERID", 6) != 0) goto END_OFF;
2691 p += 6;
2692 while(isspace(*p)) p++;
2693 if (*p++ != ':') goto END_OFF;
2694 while (*p != 0 && *p != ':') p++;
2695 if (*p++ == 0) goto END_OFF;
2696 while(isspace(*p)) p++;
2697 if (*p == 0) goto END_OFF;
2698
2699 /* The rest of the line is the data we want. We turn it into printing
2700 characters when we save it, so that it cannot mess up the format of any logging
2701 or Received: lines into which it gets inserted. We keep a maximum of 127
2702 characters. The deconst cast is ok as we fed a nonconst to string_printing() */
2703
2704 sender_ident = US string_printing(string_copyn(p, 127));
2705 DEBUG(D_ident) debug_printf("sender_ident = %s\n", sender_ident);
2706
2707 END_OFF:
2708 (void)close(sock);
2709 return;
2710 }
2711
2712
2713
2714
2715 /*************************************************
2716 *      Match host to a single host-list item     *
2717 *************************************************/
2718
2719 /* This function compares a host (name or address) against a single item
2720 from a host list. The host name gets looked up if it is needed and is not
2721 already known. The function is called from verify_check_this_host() via
2722 match_check_list(), which is why most of its arguments are in a single block.
2723
2724 Arguments:
2725   arg            the argument block (see below)
2726   ss             the host-list item
2727   valueptr       where to pass back looked up data, or NULL
2728   error          for error message when returning ERROR
2729
2730 The block contains:
2731   host_name      (a) the host name, or
2732                  (b) NULL, implying use sender_host_name and
2733                        sender_host_aliases, looking them up if required, or
2734                  (c) the empty string, meaning that only IP address matches
2735                        are permitted
2736   host_address   the host address
2737   host_ipv4      the IPv4 address taken from an IPv6 one
2738
2739 Returns:         OK      matched
2740                  FAIL    did not match
2741                  DEFER   lookup deferred
2742                  ERROR   (a) failed to find the host name or IP address, or
2743                          (b) unknown lookup type specified, or
2744                          (c) host name encountered when only IP addresses are
2745                                being matched
2746 */
2747
2748 int
2749 check_host(void *arg, const uschar *ss, const uschar **valueptr, uschar **error)
2750 {
2751 check_host_block *cb = (check_host_block *)arg;
2752 int mlen = -1;
2753 int maskoffset;
2754 BOOL iplookup = FALSE;
2755 BOOL isquery = FALSE;
2756 BOOL isiponly = cb->host_name != NULL && cb->host_name[0] == 0;
2757 const uschar *t;
2758 uschar *semicolon;
2759 uschar **aliases;
2760
2761 /* Optimize for the special case when the pattern is "*". */
2762
2763 if (*ss == '*' && ss[1] == 0) return OK;
2764
2765 /* If the pattern is empty, it matches only in the case when there is no host -
2766 this can occur in ACL checking for SMTP input using the -bs option. In this
2767 situation, the host address is the empty string. */
2768
2769 if (cb->host_address[0] == 0) return (*ss == 0)? OK : FAIL;
2770 if (*ss == 0) return FAIL;
2771
2772 /* If the pattern is precisely "@" then match against the primary host name,
2773 provided that host name matching is permitted; if it's "@[]" match against the
2774 local host's IP addresses. */
2775
2776 if (*ss == '@')
2777   {
2778   if (ss[1] == 0)
2779     {
2780     if (isiponly) return ERROR;
2781     ss = primary_hostname;
2782     }
2783   else if (Ustrcmp(ss, "@[]") == 0)
2784     {
2785     ip_address_item *ip;
2786     for (ip = host_find_interfaces(); ip != NULL; ip = ip->next)
2787       if (Ustrcmp(ip->address, cb->host_address) == 0) return OK;
2788     return FAIL;
2789     }
2790   }
2791
2792 /* If the pattern is an IP address, optionally followed by a bitmask count, do
2793 a (possibly masked) comparison with the current IP address. */
2794
2795 if (string_is_ip_address(ss, &maskoffset) != 0)
2796   return (host_is_in_net(cb->host_address, ss, maskoffset)? OK : FAIL);
2797
2798 /* The pattern is not an IP address. A common error that people make is to omit
2799 one component of an IPv4 address, either by accident, or believing that, for
2800 example, 1.2.3/24 is the same as 1.2.3.0/24, or 1.2.3 is the same as 1.2.3.0,
2801 which it isn't. (Those applications that do accept 1.2.3 as an IP address
2802 interpret it as 1.2.0.3 because the final component becomes 16-bit - this is an
2803 ancient specification.) To aid in debugging these cases, we give a specific
2804 error if the pattern contains only digits and dots or contains a slash preceded
2805 only by digits and dots (a slash at the start indicates a file name and of
2806 course slashes may be present in lookups, but not preceded only by digits and
2807 dots). */
2808
2809 for (t = ss; isdigit(*t) || *t == '.'; t++);
2810 if (*t == 0 || (*t == '/' && t != ss))
2811   {
2812   *error = US"malformed IPv4 address or address mask";
2813   return ERROR;
2814   }
2815
2816 /* See if there is a semicolon in the pattern */
2817
2818 semicolon = Ustrchr(ss, ';');
2819
2820 /* If we are doing an IP address only match, then all lookups must be IP
2821 address lookups, even if there is no "net-". */
2822
2823 if (isiponly)
2824   {
2825   iplookup = semicolon != NULL;
2826   }
2827
2828 /* Otherwise, if the item is of the form net[n]-lookup;<file|query> then it is
2829 a lookup on a masked IP network, in textual form. We obey this code even if we
2830 have already set iplookup, so as to skip over the "net-" prefix and to set the
2831 mask length. The net- stuff really only applies to single-key lookups where the
2832 key is implicit. For query-style lookups the key is specified in the query.
2833 From release 4.30, the use of net- for query style is no longer needed, but we
2834 retain it for backward compatibility. */
2835
2836 if (Ustrncmp(ss, "net", 3) == 0 && semicolon != NULL)
2837   {
2838   mlen = 0;
2839   for (t = ss + 3; isdigit(*t); t++) mlen = mlen * 10 + *t - '0';
2840   if (mlen == 0 && t == ss+3) mlen = -1;  /* No mask supplied */
2841   iplookup = (*t++ == '-');
2842   }
2843 else t = ss;
2844
2845 /* Do the IP address lookup if that is indeed what we have */
2846
2847 if (iplookup)
2848   {
2849   int insize;
2850   int search_type;
2851   int incoming[4];
2852   void *handle;
2853   uschar *filename, *key, *result;
2854   uschar buffer[64];
2855
2856   /* Find the search type */
2857
2858   search_type = search_findtype(t, semicolon - t);
2859
2860   if (search_type < 0) log_write(0, LOG_MAIN|LOG_PANIC_DIE, "%s",
2861     search_error_message);
2862
2863   /* Adjust parameters for the type of lookup. For a query-style lookup, there
2864   is no file name, and the "key" is just the query. For query-style with a file
2865   name, we have to fish the file off the start of the query. For a single-key
2866   lookup, the key is the current IP address, masked appropriately, and
2867   reconverted to text form, with the mask appended. For IPv6 addresses, specify
2868   dot separators instead of colons, except when the lookup type is "iplsearch".
2869   */
2870
2871   if (mac_islookup(search_type, lookup_absfilequery))
2872     {
2873     filename = semicolon + 1;
2874     key = filename;
2875     while (*key != 0 && !isspace(*key)) key++;
2876     filename = string_copyn(filename, key - filename);
2877     while (isspace(*key)) key++;
2878     }
2879   else if (mac_islookup(search_type, lookup_querystyle))
2880     {
2881     filename = NULL;
2882     key = semicolon + 1;
2883     }
2884   else   /* Single-key style */
2885     {
2886     int sep = (Ustrcmp(lookup_list[search_type]->name, "iplsearch") == 0)?
2887       ':' : '.';
2888     insize = host_aton(cb->host_address, incoming);
2889     host_mask(insize, incoming, mlen);
2890     (void)host_nmtoa(insize, incoming, mlen, buffer, sep);
2891     key = buffer;
2892     filename = semicolon + 1;
2893     }
2894
2895   /* Now do the actual lookup; note that there is no search_close() because
2896   of the caching arrangements. */
2897
2898   if (!(handle = search_open(filename, search_type, 0, NULL, NULL)))
2899     log_write(0, LOG_MAIN|LOG_PANIC_DIE, "%s", search_error_message);
2900
2901   result = search_find(handle, filename, key, -1, NULL, 0, 0, NULL);
2902   if (valueptr != NULL) *valueptr = result;
2903   return (result != NULL)? OK : search_find_defer? DEFER: FAIL;
2904   }
2905
2906 /* The pattern is not an IP address or network reference of any kind. That is,
2907 it is a host name pattern. If this is an IP only match, there's an error in the
2908 host list. */
2909
2910 if (isiponly)
2911   {
2912   *error = US"cannot match host name in match_ip list";
2913   return ERROR;
2914   }
2915
2916 /* Check the characters of the pattern to see if they comprise only letters,
2917 digits, full stops, and hyphens (the constituents of domain names). Allow
2918 underscores, as they are all too commonly found. Sigh. Also, if
2919 allow_utf8_domains is set, allow top-bit characters. */
2920
2921 for (t = ss; *t != 0; t++)
2922   if (!isalnum(*t) && *t != '.' && *t != '-' && *t != '_' &&
2923       (!allow_utf8_domains || *t < 128)) break;
2924
2925 /* If the pattern is a complete domain name, with no fancy characters, look up
2926 its IP address and match against that. Note that a multi-homed host will add
2927 items to the chain. */
2928
2929 if (*t == 0)
2930   {
2931   int rc;
2932   host_item h;
2933   h.next = NULL;
2934   h.name = ss;
2935   h.address = NULL;
2936   h.mx = MX_NONE;
2937
2938   /* Using byname rather than bydns here means we cannot determine dnssec
2939   status.  On the other hand it is unclear how that could be either
2940   propagated up or enforced. */
2941
2942   rc = host_find_byname(&h, NULL, HOST_FIND_QUALIFY_SINGLE, NULL, FALSE);
2943   if (rc == HOST_FOUND || rc == HOST_FOUND_LOCAL)
2944     {
2945     host_item *hh;
2946     for (hh = &h; hh != NULL; hh = hh->next)
2947       {
2948       if (host_is_in_net(hh->address, cb->host_address, 0)) return OK;
2949       }
2950     return FAIL;
2951     }
2952   if (rc == HOST_FIND_AGAIN) return DEFER;
2953   *error = string_sprintf("failed to find IP address for %s", ss);
2954   return ERROR;
2955   }
2956
2957 /* Almost all subsequent comparisons require the host name, and can be done
2958 using the general string matching function. When this function is called for
2959 outgoing hosts, the name is always given explicitly. If it is NULL, it means we
2960 must use sender_host_name and its aliases, looking them up if necessary. */
2961
2962 if (cb->host_name != NULL)   /* Explicit host name given */
2963   return match_check_string(cb->host_name, ss, -1, TRUE, TRUE, TRUE,
2964     valueptr);
2965
2966 /* Host name not given; in principle we need the sender host name and its
2967 aliases. However, for query-style lookups, we do not need the name if the
2968 query does not contain $sender_host_name. From release 4.23, a reference to
2969 $sender_host_name causes it to be looked up, so we don't need to do the lookup
2970 on spec. */
2971
2972 if ((semicolon = Ustrchr(ss, ';')) != NULL)
2973   {
2974   const uschar *affix;
2975   int partial, affixlen, starflags, id;
2976
2977   *semicolon = 0;
2978   id = search_findtype_partial(ss, &partial, &affix, &affixlen, &starflags);
2979   *semicolon=';';
2980
2981   if (id < 0)                           /* Unknown lookup type */
2982     {
2983     log_write(0, LOG_MAIN|LOG_PANIC, "%s in host list item \"%s\"",
2984       search_error_message, ss);
2985     return DEFER;
2986     }
2987   isquery = mac_islookup(id, lookup_querystyle|lookup_absfilequery);
2988   }
2989
2990 if (isquery)
2991   {
2992   switch(match_check_string(US"", ss, -1, TRUE, TRUE, TRUE, valueptr))
2993     {
2994     case OK:    return OK;
2995     case DEFER: return DEFER;
2996     default:    return FAIL;
2997     }
2998   }
2999
3000 /* Not a query-style lookup; must ensure the host name is present, and then we
3001 do a check on the name and all its aliases. */
3002
3003 if (sender_host_name == NULL)
3004   {
3005   HDEBUG(D_host_lookup)
3006     debug_printf("sender host name required, to match against %s\n", ss);
3007   if (host_lookup_failed || host_name_lookup() != OK)
3008     {
3009     *error = string_sprintf("failed to find host name for %s",
3010       sender_host_address);;
3011     return ERROR;
3012     }
3013   host_build_sender_fullhost();
3014   }
3015
3016 /* Match on the sender host name, using the general matching function */
3017
3018 switch(match_check_string(sender_host_name, ss, -1, TRUE, TRUE, TRUE,
3019        valueptr))
3020   {
3021   case OK:    return OK;
3022   case DEFER: return DEFER;
3023   }
3024
3025 /* If there are aliases, try matching on them. */
3026
3027 aliases = sender_host_aliases;
3028 while (*aliases != NULL)
3029   {
3030   switch(match_check_string(*aliases++, ss, -1, TRUE, TRUE, TRUE, valueptr))
3031     {
3032     case OK:    return OK;
3033     case DEFER: return DEFER;
3034     }
3035   }
3036 return FAIL;
3037 }
3038
3039
3040
3041
3042 /*************************************************
3043 *    Check a specific host matches a host list   *
3044 *************************************************/
3045
3046 /* This function is passed a host list containing items in a number of
3047 different formats and the identity of a host. Its job is to determine whether
3048 the given host is in the set of hosts defined by the list. The host name is
3049 passed as a pointer so that it can be looked up if needed and not already
3050 known. This is commonly the case when called from verify_check_host() to check
3051 an incoming connection. When called from elsewhere the host name should usually
3052 be set.
3053
3054 This function is now just a front end to match_check_list(), which runs common
3055 code for scanning a list. We pass it the check_host() function to perform a
3056 single test.
3057
3058 Arguments:
3059   listptr              pointer to the host list
3060   cache_bits           pointer to cache for named lists, or NULL
3061   host_name            the host name or NULL, implying use sender_host_name and
3062                          sender_host_aliases, looking them up if required
3063   host_address         the IP address
3064   valueptr             if not NULL, data from a lookup is passed back here
3065
3066 Returns:    OK    if the host is in the defined set
3067             FAIL  if the host is not in the defined set,
3068             DEFER if a data lookup deferred (not a host lookup)
3069
3070 If the host name was needed in order to make a comparison, and could not be
3071 determined from the IP address, the result is FAIL unless the item
3072 "+allow_unknown" was met earlier in the list, in which case OK is returned. */
3073
3074 int
3075 verify_check_this_host(const uschar **listptr, unsigned int *cache_bits,
3076   const uschar *host_name, const uschar *host_address, const uschar **valueptr)
3077 {
3078 int rc;
3079 unsigned int *local_cache_bits = cache_bits;
3080 const uschar *save_host_address = deliver_host_address;
3081 check_host_block cb;
3082 cb.host_name = host_name;
3083 cb.host_address = host_address;
3084
3085 if (valueptr != NULL) *valueptr = NULL;
3086
3087 /* If the host address starts off ::ffff: it is an IPv6 address in
3088 IPv4-compatible mode. Find the IPv4 part for checking against IPv4
3089 addresses. */
3090
3091 cb.host_ipv4 = (Ustrncmp(host_address, "::ffff:", 7) == 0)?
3092   host_address + 7 : host_address;
3093
3094 /* During the running of the check, put the IP address into $host_address. In
3095 the case of calls from the smtp transport, it will already be there. However,
3096 in other calls (e.g. when testing ignore_target_hosts), it won't. Just to be on
3097 the safe side, any existing setting is preserved, though as I write this
3098 (November 2004) I can't see any cases where it is actually needed. */
3099
3100 deliver_host_address = host_address;
3101 rc = match_check_list(
3102        listptr,                                /* the list */
3103        0,                                      /* separator character */
3104        &hostlist_anchor,                       /* anchor pointer */
3105        &local_cache_bits,                      /* cache pointer */
3106        check_host,                             /* function for testing */
3107        &cb,                                    /* argument for function */
3108        MCL_HOST,                               /* type of check */
3109        (host_address == sender_host_address)?
3110          US"host" : host_address,              /* text for debugging */
3111        valueptr);                              /* where to pass back data */
3112 deliver_host_address = save_host_address;
3113 return rc;
3114 }
3115
3116
3117
3118
3119 /*************************************************
3120 *      Check the given host item matches a list  *
3121 *************************************************/
3122 int
3123 verify_check_given_host(uschar **listptr, host_item *host)
3124 {
3125 return verify_check_this_host(CUSS listptr, NULL, host->name, host->address, NULL);
3126 }
3127
3128 /*************************************************
3129 *      Check the remote host matches a list      *
3130 *************************************************/
3131
3132 /* This is a front end to verify_check_this_host(), created because checking
3133 the remote host is a common occurrence. With luck, a good compiler will spot
3134 the tail recursion and optimize it. If there's no host address, this is
3135 command-line SMTP input - check against an empty string for the address.
3136
3137 Arguments:
3138   listptr              pointer to the host list
3139
3140 Returns:               the yield of verify_check_this_host(),
3141                        i.e. OK, FAIL, or DEFER
3142 */
3143
3144 int
3145 verify_check_host(uschar **listptr)
3146 {
3147 return verify_check_this_host(CUSS listptr, sender_host_cache, NULL,
3148   (sender_host_address == NULL)? US"" : sender_host_address, NULL);
3149 }
3150
3151
3152
3153
3154
3155 /*************************************************
3156 *              Invert an IP address              *
3157 *************************************************/
3158
3159 /* Originally just used for DNS xBL lists, now also used for the
3160 reverse_ip expansion operator.
3161
3162 Arguments:
3163   buffer         where to put the answer
3164   address        the address to invert
3165 */
3166
3167 void
3168 invert_address(uschar *buffer, uschar *address)
3169 {
3170 int bin[4];
3171 uschar *bptr = buffer;
3172
3173 /* If this is an IPv4 address mapped into IPv6 format, adjust the pointer
3174 to the IPv4 part only. */
3175
3176 if (Ustrncmp(address, "::ffff:", 7) == 0) address += 7;
3177
3178 /* Handle IPv4 address: when HAVE_IPV6 is false, the result of host_aton() is
3179 always 1. */
3180
3181 if (host_aton(address, bin) == 1)
3182   {
3183   int i;
3184   int x = bin[0];
3185   for (i = 0; i < 4; i++)
3186     {
3187     sprintf(CS bptr, "%d.", x & 255);
3188     while (*bptr) bptr++;
3189     x >>= 8;
3190     }
3191   }
3192
3193 /* Handle IPv6 address. Actually, as far as I know, there are no IPv6 addresses
3194 in any DNS black lists, and the format in which they will be looked up is
3195 unknown. This is just a guess. */
3196
3197 #if HAVE_IPV6
3198 else
3199   {
3200   int i, j;
3201   for (j = 3; j >= 0; j--)
3202     {
3203     int x = bin[j];
3204     for (i = 0; i < 8; i++)
3205       {
3206       sprintf(CS bptr, "%x.", x & 15);
3207       while (*bptr) bptr++;
3208       x >>= 4;
3209       }
3210     }
3211   }
3212 #endif
3213
3214 /* Remove trailing period -- this is needed so that both arbitrary
3215 dnsbl keydomains and inverted addresses may be combined with the
3216 same format string, "%s.%s" */
3217
3218 *(--bptr) = 0;
3219 }
3220
3221
3222
3223 /*************************************************
3224 *          Perform a single dnsbl lookup         *
3225 *************************************************/
3226
3227 /* This function is called from verify_check_dnsbl() below. It is also called
3228 recursively from within itself when domain and domain_txt are different
3229 pointers, in order to get the TXT record from the alternate domain.
3230
3231 Arguments:
3232   domain         the outer dnsbl domain
3233   domain_txt     alternate domain to lookup TXT record on success; when the
3234                    same domain is to be used, domain_txt == domain (that is,
3235                    the pointers must be identical, not just the text)
3236   keydomain      the current keydomain (for debug message)
3237   prepend        subdomain to lookup (like keydomain, but
3238                    reversed if IP address)
3239   iplist         the list of matching IP addresses, or NULL for "any"
3240   bitmask        true if bitmask matching is wanted
3241   match_type     condition for 'succeed' result
3242                    0 => Any RR in iplist     (=)
3243                    1 => No RR in iplist      (!=)
3244                    2 => All RRs in iplist    (==)
3245                    3 => Some RRs not in iplist (!==)
3246                    the two bits are defined as MT_NOT and MT_ALL
3247   defer_return   what to return for a defer
3248
3249 Returns:         OK if lookup succeeded
3250                  FAIL if not
3251 */
3252
3253 static int
3254 one_check_dnsbl(uschar *domain, uschar *domain_txt, uschar *keydomain,
3255   uschar *prepend, uschar *iplist, BOOL bitmask, int match_type,
3256   int defer_return)
3257 {
3258 dns_answer dnsa;
3259 dns_scan dnss;
3260 tree_node *t;
3261 dnsbl_cache_block *cb;
3262 int old_pool = store_pool;
3263 uschar query[256];         /* DNS domain max length */
3264
3265 /* Construct the specific query domainname */
3266
3267 if (!string_format(query, sizeof(query), "%s.%s", prepend, domain))
3268   {
3269   log_write(0, LOG_MAIN|LOG_PANIC, "dnslist query is too long "
3270     "(ignored): %s...", query);
3271   return FAIL;
3272   }
3273
3274 /* Look for this query in the cache. */
3275
3276 if (  (t = tree_search(dnsbl_cache, query))
3277    && (cb = t->data.ptr)->expiry > time(NULL)
3278    )
3279
3280 /* Previous lookup was cached */
3281
3282   {
3283   HDEBUG(D_dnsbl) debug_printf("using result of previous DNS lookup\n");
3284   }
3285
3286 /* If not cached from a previous lookup, we must do a DNS lookup, and
3287 cache the result in permanent memory. */
3288
3289 else
3290   {
3291   uint ttl = 3600;
3292
3293   store_pool = POOL_PERM;
3294
3295   if (t)
3296     {
3297     HDEBUG(D_dnsbl) debug_printf("cached data found but past valid time; ");
3298     }
3299
3300   else
3301     {   /* Set up a tree entry to cache the lookup */
3302     t = store_get(sizeof(tree_node) + Ustrlen(query));
3303     Ustrcpy(t->name, query);
3304     t->data.ptr = cb = store_get(sizeof(dnsbl_cache_block));
3305     (void)tree_insertnode(&dnsbl_cache, t);
3306     }
3307
3308   /* Do the DNS lookup . */
3309
3310   HDEBUG(D_dnsbl) debug_printf("new DNS lookup for %s\n", query);
3311   cb->rc = dns_basic_lookup(&dnsa, query, T_A);
3312   cb->text_set = FALSE;
3313   cb->text = NULL;
3314   cb->rhs = NULL;
3315
3316   /* If the lookup succeeded, cache the RHS address. The code allows for
3317   more than one address - this was for complete generality and the possible
3318   use of A6 records. However, A6 records have been reduced to experimental
3319   status (August 2001) and may die out. So they may never get used at all,
3320   let alone in dnsbl records. However, leave the code here, just in case.
3321
3322   Quite apart from one A6 RR generating multiple addresses, there are DNS
3323   lists that return more than one A record, so we must handle multiple
3324   addresses generated in that way as well.
3325
3326   Mark the cache entry with the "now" plus the minimum of the address TTLs,
3327   or some suitably far-future time if none were found. */
3328
3329   if (cb->rc == DNS_SUCCEED)
3330     {
3331     dns_record *rr;
3332     dns_address **addrp = &(cb->rhs);
3333     for (rr = dns_next_rr(&dnsa, &dnss, RESET_ANSWERS);
3334          rr;
3335          rr = dns_next_rr(&dnsa, &dnss, RESET_NEXT))
3336       {
3337       if (rr->type == T_A)
3338         {
3339         dns_address *da = dns_address_from_rr(&dnsa, rr);
3340         if (da)
3341           {
3342           *addrp = da;
3343           while (da->next != NULL) da = da->next;
3344           addrp = &(da->next);
3345           if (ttl > rr->ttl) ttl = rr->ttl;
3346           }
3347         }
3348       }
3349
3350     /* If we didn't find any A records, change the return code. This can
3351     happen when there is a CNAME record but there are no A records for what
3352     it points to. */
3353
3354     if (cb->rhs == NULL) cb->rc = DNS_NODATA;
3355     }
3356
3357   cb->expiry = time(NULL)+ttl;
3358   store_pool = old_pool;
3359   }
3360
3361 /* We now have the result of the DNS lookup, either newly done, or cached
3362 from a previous call. If the lookup succeeded, check against the address
3363 list if there is one. This may be a positive equality list (introduced by
3364 "="), a negative equality list (introduced by "!="), a positive bitmask
3365 list (introduced by "&"), or a negative bitmask list (introduced by "!&").*/
3366
3367 if (cb->rc == DNS_SUCCEED)
3368   {
3369   dns_address *da = NULL;
3370   uschar *addlist = cb->rhs->address;
3371
3372   /* For A and AAAA records, there may be multiple addresses from multiple
3373   records. For A6 records (currently not expected to be used) there may be
3374   multiple addresses from a single record. */
3375
3376   for (da = cb->rhs->next; da != NULL; da = da->next)
3377     addlist = string_sprintf("%s, %s", addlist, da->address);
3378
3379   HDEBUG(D_dnsbl) debug_printf("DNS lookup for %s succeeded (yielding %s)\n",
3380     query, addlist);
3381
3382   /* Address list check; this can be either for equality, or via a bitmask.
3383   In the latter case, all the bits must match. */
3384
3385   if (iplist != NULL)
3386     {
3387     for (da = cb->rhs; da != NULL; da = da->next)
3388       {
3389       int ipsep = ',';
3390       uschar ip[46];
3391       const uschar *ptr = iplist;
3392       uschar *res;
3393
3394       /* Handle exact matching */
3395
3396       if (!bitmask)
3397         {
3398         while ((res = string_nextinlist(&ptr, &ipsep, ip, sizeof(ip))) != NULL)
3399           {
3400           if (Ustrcmp(CS da->address, ip) == 0) break;
3401           }
3402         }
3403
3404       /* Handle bitmask matching */
3405
3406       else
3407         {
3408         int address[4];
3409         int mask = 0;
3410
3411         /* At present, all known DNS blocking lists use A records, with
3412         IPv4 addresses on the RHS encoding the information they return. I
3413         wonder if this will linger on as the last vestige of IPv4 when IPv6
3414         is ubiquitous? Anyway, for now we use paranoia code to completely
3415         ignore IPv6 addresses. The default mask is 0, which always matches.
3416         We change this only for IPv4 addresses in the list. */
3417
3418         if (host_aton(da->address, address) == 1) mask = address[0];
3419
3420         /* Scan the returned addresses, skipping any that are IPv6 */
3421
3422         while ((res = string_nextinlist(&ptr, &ipsep, ip, sizeof(ip))) != NULL)
3423           {
3424           if (host_aton(ip, address) != 1) continue;
3425           if ((address[0] & mask) == address[0]) break;
3426           }
3427         }
3428
3429       /* If either
3430
3431          (a) An IP address in an any ('=') list matched, or
3432          (b) No IP address in an all ('==') list matched
3433
3434       then we're done searching. */
3435
3436       if (((match_type & MT_ALL) != 0) == (res == NULL)) break;
3437       }
3438
3439     /* If da == NULL, either
3440
3441        (a) No IP address in an any ('=') list matched, or
3442        (b) An IP address in an all ('==') list didn't match
3443
3444     so behave as if the DNSBL lookup had not succeeded, i.e. the host is not on
3445     the list. */
3446
3447     if ((match_type == MT_NOT || match_type == MT_ALL) != (da == NULL))
3448       {
3449       HDEBUG(D_dnsbl)
3450         {
3451         uschar *res = NULL;
3452         switch(match_type)
3453           {
3454           case 0:
3455           res = US"was no match";
3456           break;
3457           case MT_NOT:
3458           res = US"was an exclude match";
3459           break;
3460           case MT_ALL:
3461           res = US"was an IP address that did not match";
3462           break;
3463           case MT_NOT|MT_ALL:
3464           res = US"were no IP addresses that did not match";
3465           break;
3466           }
3467         debug_printf("=> but we are not accepting this block class because\n");
3468         debug_printf("=> there %s for %s%c%s\n",
3469           res,
3470           ((match_type & MT_ALL) == 0)? "" : "=",
3471           bitmask? '&' : '=', iplist);
3472         }
3473       return FAIL;
3474       }
3475     }
3476
3477   /* Either there was no IP list, or the record matched, implying that the
3478   domain is on the list. We now want to find a corresponding TXT record. If an
3479   alternate domain is specified for the TXT record, call this function
3480   recursively to look that up; this has the side effect of re-checking that
3481   there is indeed an A record at the alternate domain. */
3482
3483   if (domain_txt != domain)
3484     return one_check_dnsbl(domain_txt, domain_txt, keydomain, prepend, NULL,
3485       FALSE, match_type, defer_return);
3486
3487   /* If there is no alternate domain, look up a TXT record in the main domain
3488   if it has not previously been cached. */
3489
3490   if (!cb->text_set)
3491     {
3492     cb->text_set = TRUE;
3493     if (dns_basic_lookup(&dnsa, query, T_TXT) == DNS_SUCCEED)
3494       {
3495       dns_record *rr;
3496       for (rr = dns_next_rr(&dnsa, &dnss, RESET_ANSWERS);
3497            rr != NULL;
3498            rr = dns_next_rr(&dnsa, &dnss, RESET_NEXT))
3499         if (rr->type == T_TXT) break;
3500       if (rr != NULL)
3501         {
3502         int len = (rr->data)[0];
3503         if (len > 511) len = 127;
3504         store_pool = POOL_PERM;
3505         cb->text = string_sprintf("%.*s", len, (const uschar *)(rr->data+1));
3506         store_pool = old_pool;
3507         }
3508       }
3509     }
3510
3511   dnslist_value = addlist;
3512   dnslist_text = cb->text;
3513   return OK;
3514   }
3515
3516 /* There was a problem with the DNS lookup */
3517
3518 if (cb->rc != DNS_NOMATCH && cb->rc != DNS_NODATA)
3519   {
3520   log_write(L_dnslist_defer, LOG_MAIN,
3521     "DNS list lookup defer (probably timeout) for %s: %s", query,
3522     (defer_return == OK)?   US"assumed in list" :
3523     (defer_return == FAIL)? US"assumed not in list" :
3524                             US"returned DEFER");
3525   return defer_return;
3526   }
3527
3528 /* No entry was found in the DNS; continue for next domain */
3529
3530 HDEBUG(D_dnsbl)
3531   {
3532   debug_printf("DNS lookup for %s failed\n", query);
3533   debug_printf("=> that means %s is not listed at %s\n",
3534      keydomain, domain);
3535   }
3536
3537 return FAIL;
3538 }
3539
3540
3541
3542
3543 /*************************************************
3544 *        Check host against DNS black lists      *
3545 *************************************************/
3546
3547 /* This function runs checks against a list of DNS black lists, until one
3548 matches. Each item on the list can be of the form
3549
3550   domain=ip-address/key
3551
3552 The domain is the right-most domain that is used for the query, for example,
3553 blackholes.mail-abuse.org. If the IP address is present, there is a match only
3554 if the DNS lookup returns a matching IP address. Several addresses may be
3555 given, comma-separated, for example: x.y.z=127.0.0.1,127.0.0.2.
3556
3557 If no key is given, what is looked up in the domain is the inverted IP address
3558 of the current client host. If a key is given, it is used to construct the
3559 domain for the lookup. For example:
3560
3561   dsn.rfc-ignorant.org/$sender_address_domain
3562
3563 After finding a match in the DNS, the domain is placed in $dnslist_domain, and
3564 then we check for a TXT record for an error message, and if found, save its
3565 value in $dnslist_text. We also cache everything in a tree, to optimize
3566 multiple lookups.
3567
3568 The TXT record is normally looked up in the same domain as the A record, but
3569 when many lists are combined in a single DNS domain, this will not be a very
3570 specific message. It is possible to specify a different domain for looking up
3571 TXT records; this is given before the main domain, comma-separated. For
3572 example:
3573
3574   dnslists = http.dnsbl.sorbs.net,dnsbl.sorbs.net=127.0.0.2 : \
3575              socks.dnsbl.sorbs.net,dnsbl.sorbs.net=127.0.0.3
3576
3577 The caching ensures that only one lookup in dnsbl.sorbs.net is done.
3578
3579 Note: an address for testing RBL is 192.203.178.39
3580 Note: an address for testing DUL is 192.203.178.4
3581 Note: a domain for testing RFCI is example.tld.dsn.rfc-ignorant.org
3582
3583 Arguments:
3584   where        the acl type
3585   listptr      the domain/address/data list
3586   log_msgptr   log message on error
3587
3588 Returns:    OK      successful lookup (i.e. the address is on the list), or
3589                       lookup deferred after +include_unknown
3590             FAIL    name not found, or no data found for the given type, or
3591                       lookup deferred after +exclude_unknown (default)
3592             DEFER   lookup failure, if +defer_unknown was set
3593 */
3594
3595 int
3596 verify_check_dnsbl(int where, const uschar ** listptr, uschar ** log_msgptr)
3597 {
3598 int sep = 0;
3599 int defer_return = FAIL;
3600 const uschar *list = *listptr;
3601 uschar *domain;
3602 uschar *s;
3603 uschar buffer[1024];
3604 uschar revadd[128];        /* Long enough for IPv6 address */
3605
3606 /* Indicate that the inverted IP address is not yet set up */
3607
3608 revadd[0] = 0;
3609
3610 /* In case this is the first time the DNS resolver is being used. */
3611
3612 dns_init(FALSE, FALSE, FALSE);  /*XXX dnssec? */
3613
3614 /* Loop through all the domains supplied, until something matches */
3615
3616 while ((domain = string_nextinlist(&list, &sep, buffer, sizeof(buffer))) != NULL)
3617   {
3618   int rc;
3619   BOOL bitmask = FALSE;
3620   int match_type = 0;
3621   uschar *domain_txt;
3622   uschar *comma;
3623   uschar *iplist;
3624   uschar *key;
3625
3626   HDEBUG(D_dnsbl) debug_printf("DNS list check: %s\n", domain);
3627
3628   /* Deal with special values that change the behaviour on defer */
3629
3630   if (domain[0] == '+')
3631     {
3632     if      (strcmpic(domain, US"+include_unknown") == 0) defer_return = OK;
3633     else if (strcmpic(domain, US"+exclude_unknown") == 0) defer_return = FAIL;
3634     else if (strcmpic(domain, US"+defer_unknown") == 0)   defer_return = DEFER;
3635     else
3636       log_write(0, LOG_MAIN|LOG_PANIC, "unknown item in dnslist (ignored): %s",
3637         domain);
3638     continue;
3639     }
3640
3641   /* See if there's explicit data to be looked up */
3642
3643   if ((key = Ustrchr(domain, '/'))) *key++ = 0;
3644
3645   /* See if there's a list of addresses supplied after the domain name. This is
3646   introduced by an = or a & character; if preceded by = we require all matches
3647   and if preceded by ! we invert the result. */
3648
3649   if (!(iplist = Ustrchr(domain, '=')))
3650     {
3651     bitmask = TRUE;
3652     iplist = Ustrchr(domain, '&');
3653     }
3654
3655   if (iplist)                                  /* Found either = or & */
3656     {
3657     if (iplist > domain && iplist[-1] == '!')  /* Handle preceding ! */
3658       {
3659       match_type |= MT_NOT;
3660       iplist[-1] = 0;
3661       }
3662
3663     *iplist++ = 0;                             /* Terminate domain, move on */
3664
3665     /* If we found = (bitmask == FALSE), check for == or =& */
3666
3667     if (!bitmask && (*iplist == '=' || *iplist == '&'))
3668       {
3669       bitmask = *iplist++ == '&';
3670       match_type |= MT_ALL;
3671       }
3672     }
3673
3674
3675   /* If there is a comma in the domain, it indicates that a second domain for
3676   looking up TXT records is provided, before the main domain. Otherwise we must
3677   set domain_txt == domain. */
3678
3679   domain_txt = domain;
3680   comma = Ustrchr(domain, ',');
3681   if (comma != NULL)
3682     {
3683     *comma++ = 0;
3684     domain = comma;
3685     }
3686
3687   /* Check that what we have left is a sensible domain name. There is no reason
3688   why these domains should in fact use the same syntax as hosts and email
3689   domains, but in practice they seem to. However, there is little point in
3690   actually causing an error here, because that would no doubt hold up incoming
3691   mail. Instead, I'll just log it. */
3692
3693   for (s = domain; *s != 0; s++)
3694     {
3695     if (!isalnum(*s) && *s != '-' && *s != '.' && *s != '_')
3696       {
3697       log_write(0, LOG_MAIN, "dnslists domain \"%s\" contains "
3698         "strange characters - is this right?", domain);
3699       break;
3700       }
3701     }
3702
3703   /* Check the alternate domain if present */
3704
3705   if (domain_txt != domain) for (s = domain_txt; *s != 0; s++)
3706     {
3707     if (!isalnum(*s) && *s != '-' && *s != '.' && *s != '_')
3708       {
3709       log_write(0, LOG_MAIN, "dnslists domain \"%s\" contains "
3710         "strange characters - is this right?", domain_txt);
3711       break;
3712       }
3713     }
3714
3715   /* If there is no key string, construct the query by adding the domain name
3716   onto the inverted host address, and perform a single DNS lookup. */
3717
3718   if (key == NULL)
3719     {
3720     if (where == ACL_WHERE_NOTSMTP_START || where == ACL_WHERE_NOTSMTP)
3721       {
3722       *log_msgptr = string_sprintf
3723         ("cannot test auto-keyed dnslists condition in %s ACL",
3724           acl_wherenames[where]);
3725       return ERROR;
3726       }
3727     if (sender_host_address == NULL) return FAIL;    /* can never match */
3728     if (revadd[0] == 0) invert_address(revadd, sender_host_address);
3729     rc = one_check_dnsbl(domain, domain_txt, sender_host_address, revadd,
3730       iplist, bitmask, match_type, defer_return);
3731     if (rc == OK)
3732       {
3733       dnslist_domain = string_copy(domain_txt);
3734       dnslist_matched = string_copy(sender_host_address);
3735       HDEBUG(D_dnsbl) debug_printf("=> that means %s is listed at %s\n",
3736         sender_host_address, dnslist_domain);
3737       }
3738     if (rc != FAIL) return rc;     /* OK or DEFER */
3739     }
3740
3741   /* If there is a key string, it can be a list of domains or IP addresses to
3742   be concatenated with the main domain. */
3743
3744   else
3745     {
3746     int keysep = 0;
3747     BOOL defer = FALSE;
3748     uschar *keydomain;
3749     uschar keybuffer[256];
3750     uschar keyrevadd[128];
3751
3752     while ((keydomain = string_nextinlist(CUSS &key, &keysep, keybuffer,
3753             sizeof(keybuffer))) != NULL)
3754       {
3755       uschar *prepend = keydomain;
3756
3757       if (string_is_ip_address(keydomain, NULL) != 0)
3758         {
3759         invert_address(keyrevadd, keydomain);
3760         prepend = keyrevadd;
3761         }
3762
3763       rc = one_check_dnsbl(domain, domain_txt, keydomain, prepend, iplist,
3764         bitmask, match_type, defer_return);
3765
3766       if (rc == OK)
3767         {
3768         dnslist_domain = string_copy(domain_txt);
3769         dnslist_matched = string_copy(keydomain);
3770         HDEBUG(D_dnsbl) debug_printf("=> that means %s is listed at %s\n",
3771           keydomain, dnslist_domain);
3772         return OK;
3773         }
3774
3775       /* If the lookup deferred, remember this fact. We keep trying the rest
3776       of the list to see if we get a useful result, and if we don't, we return
3777       DEFER at the end. */
3778
3779       if (rc == DEFER) defer = TRUE;
3780       }    /* continue with next keystring domain/address */
3781
3782     if (defer) return DEFER;
3783     }
3784   }        /* continue with next dnsdb outer domain */
3785
3786 return FAIL;
3787 }
3788
3789 /* vi: aw ai sw=2
3790 */
3791 /* End of verify.c */