Withdraw A6 DNS record support
[exim.git] / src / src / host.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) University of Cambridge 1995 - 2012 */
6 /* See the file NOTICE for conditions of use and distribution. */
7
8 /* Functions for finding hosts, either by gethostbyname(), gethostbyaddr(), or
9 directly via the DNS. When IPv6 is supported, getipnodebyname() and
10 getipnodebyaddr() may be used instead of gethostbyname() and gethostbyaddr(),
11 if the newer functions are available. This module also contains various other
12 functions concerned with hosts and addresses, and a random number function,
13 used for randomizing hosts with equal MXs but available for use in other parts
14 of Exim. */
15
16
17 #include "exim.h"
18
19
20 /* Static variable for preserving the list of interface addresses in case it is
21 used more than once. */
22
23 static ip_address_item *local_interface_data = NULL;
24
25
26 #ifdef USE_INET_NTOA_FIX
27 /*************************************************
28 *         Replacement for broken inet_ntoa()     *
29 *************************************************/
30
31 /* On IRIX systems, gcc uses a different structure passing convention to the
32 native libraries. This causes inet_ntoa() to always yield 0.0.0.0 or
33 255.255.255.255. To get round this, we provide a private version of the
34 function here. It is used only if USE_INET_NTOA_FIX is set, which should happen
35 only when gcc is in use on an IRIX system. Code send to me by J.T. Breitner,
36 with these comments:
37
38   code by Stuart Levy
39   as seen in comp.sys.sgi.admin
40
41 August 2005: Apparently this is also needed for AIX systems; USE_INET_NTOA_FIX
42 should now be set for them as well.
43
44 Arguments:  sa  an in_addr structure
45 Returns:        pointer to static text string
46 */
47
48 char *
49 inet_ntoa(struct in_addr sa)
50 {
51 static uschar addr[20];
52 sprintf(addr, "%d.%d.%d.%d",
53         (US &sa.s_addr)[0],
54         (US &sa.s_addr)[1],
55         (US &sa.s_addr)[2],
56         (US &sa.s_addr)[3]);
57   return addr;
58 }
59 #endif
60
61
62
63 /*************************************************
64 *              Random number generator           *
65 *************************************************/
66
67 /* This is a simple pseudo-random number generator. It does not have to be
68 very good for the uses to which it is put. When running the regression tests,
69 start with a fixed seed.
70
71 If you need better, see vaguely_random_number() which is potentially stronger,
72 if a crypto library is available, but might end up just calling this instead.
73
74 Arguments:
75   limit:    one more than the largest number required
76
77 Returns:    a pseudo-random number in the range 0 to limit-1
78 */
79
80 int
81 random_number(int limit)
82 {
83 if (limit < 1)
84   return 0;
85 if (random_seed == 0)
86   {
87   if (running_in_test_harness) random_seed = 42; else
88     {
89     int p = (int)getpid();
90     random_seed = (int)time(NULL) ^ ((p << 16) | p);
91     }
92   }
93 random_seed = 1103515245 * random_seed + 12345;
94 return (unsigned int)(random_seed >> 16) % limit;
95 }
96
97
98
99 /*************************************************
100 *       Replace gethostbyname() when testing     *
101 *************************************************/
102
103 /* This function is called instead of gethostbyname(), gethostbyname2(), or
104 getipnodebyname() when running in the test harness. It recognizes the name
105 "manyhome.test.ex" and generates a humungous number of IP addresses. It also
106 recognizes an unqualified "localhost" and forces it to the appropriate loopback
107 address. IP addresses are treated as literals. For other names, it uses the DNS
108 to find the host name. In the test harness, this means it will access only the
109 fake DNS resolver.
110
111 Arguments:
112   name          the host name or a textual IP address
113   af            AF_INET or AF_INET6
114   error_num     where to put an error code:
115                 HOST_NOT_FOUND/TRY_AGAIN/NO_RECOVERY/NO_DATA
116
117 Returns:        a hostent structure or NULL for an error
118 */
119
120 static struct hostent *
121 host_fake_gethostbyname(const uschar *name, int af, int *error_num)
122 {
123 #if HAVE_IPV6
124 int alen = (af == AF_INET)? sizeof(struct in_addr):sizeof(struct in6_addr);
125 #else
126 int alen = sizeof(struct in_addr);
127 #endif
128
129 int ipa;
130 const uschar *lname = name;
131 uschar *adds;
132 uschar **alist;
133 struct hostent *yield;
134 dns_answer dnsa;
135 dns_scan dnss;
136 dns_record *rr;
137
138 DEBUG(D_host_lookup)
139   debug_printf("using host_fake_gethostbyname for %s (%s)\n", name,
140     (af == AF_INET)? "IPv4" : "IPv6");
141
142 /* Handle the name that needs a vast number of IP addresses */
143
144 if (Ustrcmp(name, "manyhome.test.ex") == 0 && af == AF_INET)
145   {
146   int i, j;
147   yield = store_get(sizeof(struct hostent));
148   alist = store_get(2049 * sizeof(char *));
149   adds  = store_get(2048 * alen);
150   yield->h_name = CS name;
151   yield->h_aliases = NULL;
152   yield->h_addrtype = af;
153   yield->h_length = alen;
154   yield->h_addr_list = CSS alist;
155   for (i = 104; i <= 111; i++)
156     {
157     for (j = 0; j <= 255; j++)
158       {
159       *alist++ = adds;
160       *adds++ = 10;
161       *adds++ = 250;
162       *adds++ = i;
163       *adds++ = j;
164       }
165     }
166   *alist = NULL;
167   return yield;
168   }
169
170 /* Handle unqualified "localhost" */
171
172 if (Ustrcmp(name, "localhost") == 0)
173   lname = (af == AF_INET)? US"127.0.0.1" : US"::1";
174
175 /* Handle a literal IP address */
176
177 ipa = string_is_ip_address(lname, NULL);
178 if (ipa != 0)
179   {
180   if ((ipa == 4 && af == AF_INET) ||
181       (ipa == 6 && af == AF_INET6))
182     {
183     int i, n;
184     int x[4];
185     yield = store_get(sizeof(struct hostent));
186     alist = store_get(2 * sizeof(char *));
187     adds  = store_get(alen);
188     yield->h_name = CS name;
189     yield->h_aliases = NULL;
190     yield->h_addrtype = af;
191     yield->h_length = alen;
192     yield->h_addr_list = CSS alist;
193     *alist++ = adds;
194     n = host_aton(lname, x);
195     for (i = 0; i < n; i++)
196       {
197       int y = x[i];
198       *adds++ = (y >> 24) & 255;
199       *adds++ = (y >> 16) & 255;
200       *adds++ = (y >> 8) & 255;
201       *adds++ = y & 255;
202       }
203     *alist = NULL;
204     }
205
206   /* Wrong kind of literal address */
207
208   else
209     {
210     *error_num = HOST_NOT_FOUND;
211     return NULL;
212     }
213   }
214
215 /* Handle a host name */
216
217 else
218   {
219   int type = (af == AF_INET)? T_A:T_AAAA;
220   int rc = dns_lookup(&dnsa, lname, type, NULL);
221   int count = 0;
222
223   lookup_dnssec_authenticated = NULL;
224
225   switch(rc)
226     {
227     case DNS_SUCCEED: break;
228     case DNS_NOMATCH: *error_num = HOST_NOT_FOUND; return NULL;
229     case DNS_NODATA:  *error_num = NO_DATA; return NULL;
230     case DNS_AGAIN:   *error_num = TRY_AGAIN; return NULL;
231     default:
232     case DNS_FAIL:    *error_num = NO_RECOVERY; return NULL;
233     }
234
235   for (rr = dns_next_rr(&dnsa, &dnss, RESET_ANSWERS);
236        rr != NULL;
237        rr = dns_next_rr(&dnsa, &dnss, RESET_NEXT))
238     {
239     if (rr->type == type) count++;
240     }
241
242   yield = store_get(sizeof(struct hostent));
243   alist = store_get((count + 1) * sizeof(char **));
244   adds  = store_get(count *alen);
245
246   yield->h_name = CS name;
247   yield->h_aliases = NULL;
248   yield->h_addrtype = af;
249   yield->h_length = alen;
250   yield->h_addr_list = CSS alist;
251
252   for (rr = dns_next_rr(&dnsa, &dnss, RESET_ANSWERS);
253        rr != NULL;
254        rr = dns_next_rr(&dnsa, &dnss, RESET_NEXT))
255     {
256     int i, n;
257     int x[4];
258     dns_address *da;
259     if (rr->type != type) continue;
260     da = dns_address_from_rr(&dnsa, rr);
261     *alist++ = adds;
262     n = host_aton(da->address, x);
263     for (i = 0; i < n; i++)
264       {
265       int y = x[i];
266       *adds++ = (y >> 24) & 255;
267       *adds++ = (y >> 16) & 255;
268       *adds++ = (y >> 8) & 255;
269       *adds++ = y & 255;
270       }
271     }
272   *alist = NULL;
273   }
274
275 return yield;
276 }
277
278
279
280 /*************************************************
281 *       Build chain of host items from list      *
282 *************************************************/
283
284 /* This function builds a chain of host items from a textual list of host
285 names. It does not do any lookups. If randomize is true, the chain is build in
286 a randomized order. There may be multiple groups of independently randomized
287 hosts; they are delimited by a host name consisting of just "+".
288
289 Arguments:
290   anchor      anchor for the chain
291   list        text list
292   randomize   TRUE for randomizing
293
294 Returns:      nothing
295 */
296
297 void
298 host_build_hostlist(host_item **anchor, const uschar *list, BOOL randomize)
299 {
300 int sep = 0;
301 int fake_mx = MX_NONE;          /* This value is actually -1 */
302 uschar *name;
303
304 if (list == NULL) return;
305 if (randomize) fake_mx--;       /* Start at -2 for randomizing */
306
307 *anchor = NULL;
308
309 while ((name = string_nextinlist(&list, &sep, NULL, 0)) != NULL)
310   {
311   host_item *h;
312
313   if (name[0] == '+' && name[1] == 0)   /* "+" delimits a randomized group */
314     {                                   /* ignore if not randomizing */
315     if (randomize) fake_mx--;
316     continue;
317     }
318
319   h = store_get(sizeof(host_item));
320   h->name = name;
321   h->address = NULL;
322   h->port = PORT_NONE;
323   h->mx = fake_mx;
324   h->sort_key = randomize? (-fake_mx)*1000 + random_number(1000) : 0;
325   h->status = hstatus_unknown;
326   h->why = hwhy_unknown;
327   h->last_try = 0;
328
329   if (*anchor == NULL)
330     {
331     h->next = NULL;
332     *anchor = h;
333     }
334   else
335     {
336     host_item *hh = *anchor;
337     if (h->sort_key < hh->sort_key)
338       {
339       h->next = hh;
340       *anchor = h;
341       }
342     else
343       {
344       while (hh->next != NULL && h->sort_key >= (hh->next)->sort_key)
345         hh = hh->next;
346       h->next = hh->next;
347       hh->next = h;
348       }
349     }
350   }
351 }
352
353
354
355
356
357 /*************************************************
358 *        Extract port from address string        *
359 *************************************************/
360
361 /* In the spool file, and in the -oMa and -oMi options, a host plus port is
362 given as an IP address followed by a dot and a port number. This function
363 decodes this.
364
365 An alternative format for the -oMa and -oMi options is [ip address]:port which
366 is what Exim 4 uses for output, because it seems to becoming commonly used,
367 whereas the dot form confuses some programs/people. So we recognize that form
368 too.
369
370 Argument:
371   address    points to the string; if there is a port, the '.' in the string
372              is overwritten with zero to terminate the address; if the string
373              is in the [xxx]:ppp format, the address is shifted left and the
374              brackets are removed
375
376 Returns:     0 if there is no port, else the port number. If there's a syntax
377              error, leave the incoming address alone, and return 0.
378 */
379
380 int
381 host_address_extract_port(uschar *address)
382 {
383 int port = 0;
384 uschar *endptr;
385
386 /* Handle the "bracketed with colon on the end" format */
387
388 if (*address == '[')
389   {
390   uschar *rb = address + 1;
391   while (*rb != 0 && *rb != ']') rb++;
392   if (*rb++ == 0) return 0;        /* Missing ]; leave invalid address */
393   if (*rb == ':')
394     {
395     port = Ustrtol(rb + 1, &endptr, 10);
396     if (*endptr != 0) return 0;    /* Invalid port; leave invalid address */
397     }
398   else if (*rb != 0) return 0;     /* Bad syntax; leave invalid address */
399   memmove(address, address + 1, rb - address - 2);
400   rb[-2] = 0;
401   }
402
403 /* Handle the "dot on the end" format */
404
405 else
406   {
407   int skip = -3;                   /* Skip 3 dots in IPv4 addresses */
408   address--;
409   while (*(++address) != 0)
410     {
411     int ch = *address;
412     if (ch == ':') skip = 0;       /* Skip 0 dots in IPv6 addresses */
413       else if (ch == '.' && skip++ >= 0) break;
414     }
415   if (*address == 0) return 0;
416   port = Ustrtol(address + 1, &endptr, 10);
417   if (*endptr != 0) return 0;      /* Invalid port; leave invalid address */
418   *address = 0;
419   }
420
421 return port;
422 }
423
424
425 /*************************************************
426 *         Get port from a host item's name       *
427 *************************************************/
428
429 /* This function is called when finding the IP address for a host that is in a
430 list of hosts explicitly configured, such as in the manualroute router, or in a
431 fallback hosts list. We see if there is a port specification at the end of the
432 host name, and if so, remove it. A minimum length of 3 is required for the
433 original name; nothing shorter is recognized as having a port.
434
435 We test for a name ending with a sequence of digits; if preceded by colon we
436 have a port if the character before the colon is ] and the name starts with [
437 or if there are no other colons in the name (i.e. it's not an IPv6 address).
438
439 Arguments:  pointer to the host item
440 Returns:    a port number or PORT_NONE
441 */
442
443 int
444 host_item_get_port(host_item *h)
445 {
446 const uschar *p;
447 int port, x;
448 int len = Ustrlen(h->name);
449
450 if (len < 3 || (p = h->name + len - 1, !isdigit(*p))) return PORT_NONE;
451
452 /* Extract potential port number */
453
454 port = *p-- - '0';
455 x = 10;
456
457 while (p > h->name + 1 && isdigit(*p))
458   {
459   port += (*p-- - '0') * x;
460   x *= 10;
461   }
462
463 /* The smallest value of p at this point is h->name + 1. */
464
465 if (*p != ':') return PORT_NONE;
466
467 if (p[-1] == ']' && h->name[0] == '[')
468   h->name = string_copyn(h->name + 1, p - h->name - 2);
469 else if (Ustrchr(h->name, ':') == p)
470   h->name = string_copyn(h->name, p - h->name);
471 else return PORT_NONE;
472
473 DEBUG(D_route|D_host_lookup) debug_printf("host=%s port=%d\n", h->name, port);
474 return port;
475 }
476
477
478
479 #ifndef STAND_ALONE    /* Omit when standalone testing */
480
481 /*************************************************
482 *     Build sender_fullhost and sender_rcvhost   *
483 *************************************************/
484
485 /* This function is called when sender_host_name and/or sender_helo_name
486 have been set. Or might have been set - for a local message read off the spool
487 they won't be. In that case, do nothing. Otherwise, set up the fullhost string
488 as follows:
489
490 (a) No sender_host_name or sender_helo_name: "[ip address]"
491 (b) Just sender_host_name: "host_name [ip address]"
492 (c) Just sender_helo_name: "(helo_name) [ip address]" unless helo is IP
493             in which case: "[ip address}"
494 (d) The two are identical: "host_name [ip address]" includes helo = IP
495 (e) The two are different: "host_name (helo_name) [ip address]"
496
497 If log_incoming_port is set, the sending host's port number is added to the IP
498 address.
499
500 This function also builds sender_rcvhost for use in Received: lines, whose
501 syntax is a bit different. This value also includes the RFC 1413 identity.
502 There wouldn't be two different variables if I had got all this right in the
503 first place.
504
505 Because this data may survive over more than one incoming SMTP message, it has
506 to be in permanent store.
507
508 Arguments:  none
509 Returns:    nothing
510 */
511
512 void
513 host_build_sender_fullhost(void)
514 {
515 BOOL show_helo = TRUE;
516 uschar *address;
517 int len;
518 int old_pool = store_pool;
519
520 if (sender_host_address == NULL) return;
521
522 store_pool = POOL_PERM;
523
524 /* Set up address, with or without the port. After discussion, it seems that
525 the only format that doesn't cause trouble is [aaaa]:pppp. However, we can't
526 use this directly as the first item for Received: because it ain't an RFC 2822
527 domain. Sigh. */
528
529 address = string_sprintf("[%s]:%d", sender_host_address, sender_host_port);
530 if ((log_extra_selector & LX_incoming_port) == 0 || sender_host_port <= 0)
531   *(Ustrrchr(address, ':')) = 0;
532
533 /* If there's no EHLO/HELO data, we can't show it. */
534
535 if (sender_helo_name == NULL) show_helo = FALSE;
536
537 /* If HELO/EHLO was followed by an IP literal, it's messy because of two
538 features of IPv6. Firstly, there's the "IPv6:" prefix (Exim is liberal and
539 doesn't require this, for historical reasons). Secondly, IPv6 addresses may not
540 be given in canonical form, so we have to canonicize them before comparing. As
541 it happens, the code works for both IPv4 and IPv6. */
542
543 else if (sender_helo_name[0] == '[' &&
544          sender_helo_name[(len=Ustrlen(sender_helo_name))-1] == ']')
545   {
546   int offset = 1;
547   uschar *helo_ip;
548
549   if (strncmpic(sender_helo_name + 1, US"IPv6:", 5) == 0) offset += 5;
550   if (strncmpic(sender_helo_name + 1, US"IPv4:", 5) == 0) offset += 5;
551
552   helo_ip = string_copyn(sender_helo_name + offset, len - offset - 1);
553
554   if (string_is_ip_address(helo_ip, NULL) != 0)
555     {
556     int x[4], y[4];
557     int sizex, sizey;
558     uschar ipx[48], ipy[48];    /* large enough for full IPv6 */
559
560     sizex = host_aton(helo_ip, x);
561     sizey = host_aton(sender_host_address, y);
562
563     (void)host_nmtoa(sizex, x, -1, ipx, ':');
564     (void)host_nmtoa(sizey, y, -1, ipy, ':');
565
566     if (strcmpic(ipx, ipy) == 0) show_helo = FALSE;
567     }
568   }
569
570 /* Host name is not verified */
571
572 if (sender_host_name == NULL)
573   {
574   uschar *portptr = Ustrstr(address, "]:");
575   int size = 0;
576   int ptr = 0;
577   int adlen;    /* Sun compiler doesn't like ++ in initializers */
578
579   adlen = (portptr == NULL)? Ustrlen(address) : (++portptr - address);
580   sender_fullhost = (sender_helo_name == NULL)? address :
581     string_sprintf("(%s) %s", sender_helo_name, address);
582
583   sender_rcvhost = string_cat(NULL, &size, &ptr, address, adlen);
584
585   if (sender_ident != NULL || show_helo || portptr != NULL)
586     {
587     int firstptr;
588     sender_rcvhost = string_cat(sender_rcvhost, &size, &ptr, US" (", 2);
589     firstptr = ptr;
590
591     if (portptr != NULL)
592       sender_rcvhost = string_append(sender_rcvhost, &size, &ptr, 2, US"port=",
593         portptr + 1);
594
595     if (show_helo)
596       sender_rcvhost = string_append(sender_rcvhost, &size, &ptr, 2,
597         (firstptr == ptr)? US"helo=" : US" helo=", sender_helo_name);
598
599     if (sender_ident != NULL)
600       sender_rcvhost = string_append(sender_rcvhost, &size, &ptr, 2,
601         (firstptr == ptr)? US"ident=" : US" ident=", sender_ident);
602
603     sender_rcvhost = string_cat(sender_rcvhost, &size, &ptr, US")", 1);
604     }
605
606   sender_rcvhost[ptr] = 0;   /* string_cat() always leaves room */
607
608   /* Release store, because string_cat allocated a minimum of 100 bytes that
609   are rarely completely used. */
610
611   store_reset(sender_rcvhost + ptr + 1);
612   }
613
614 /* Host name is known and verified. Unless we've already found that the HELO
615 data matches the IP address, compare it with the name. */
616
617 else
618   {
619   if (show_helo && strcmpic(sender_host_name, sender_helo_name) == 0)
620     show_helo = FALSE;
621
622   if (show_helo)
623     {
624     sender_fullhost = string_sprintf("%s (%s) %s", sender_host_name,
625       sender_helo_name, address);
626     sender_rcvhost = (sender_ident == NULL)?
627       string_sprintf("%s (%s helo=%s)", sender_host_name,
628         address, sender_helo_name) :
629       string_sprintf("%s\n\t(%s helo=%s ident=%s)", sender_host_name,
630         address, sender_helo_name, sender_ident);
631     }
632   else
633     {
634     sender_fullhost = string_sprintf("%s %s", sender_host_name, address);
635     sender_rcvhost = (sender_ident == NULL)?
636       string_sprintf("%s (%s)", sender_host_name, address) :
637       string_sprintf("%s (%s ident=%s)", sender_host_name, address,
638         sender_ident);
639     }
640   }
641
642 store_pool = old_pool;
643
644 DEBUG(D_host_lookup) debug_printf("sender_fullhost = %s\n", sender_fullhost);
645 DEBUG(D_host_lookup) debug_printf("sender_rcvhost = %s\n", sender_rcvhost);
646 }
647
648
649
650 /*************************************************
651 *          Build host+ident message              *
652 *************************************************/
653
654 /* Used when logging rejections and various ACL and SMTP incidents. The text
655 return depends on whether sender_fullhost and sender_ident are set or not:
656
657   no ident, no host   => U=unknown
658   no ident, host set  => H=sender_fullhost
659   ident set, no host  => U=ident
660   ident set, host set => H=sender_fullhost U=ident
661
662 Arguments:
663   useflag   TRUE if first item to be flagged (H= or U=); if there are two
664               items, the second is always flagged
665
666 Returns:    pointer to a string in big_buffer
667 */
668
669 uschar *
670 host_and_ident(BOOL useflag)
671 {
672 if (sender_fullhost == NULL)
673   {
674   (void)string_format(big_buffer, big_buffer_size, "%s%s", useflag? "U=" : "",
675      (sender_ident == NULL)? US"unknown" : sender_ident);
676   }
677 else
678   {
679   uschar *flag = useflag? US"H=" : US"";
680   uschar *iface = US"";
681   if ((log_extra_selector & LX_incoming_interface) != 0 &&
682        interface_address != NULL)
683     iface = string_sprintf(" I=[%s]:%d", interface_address, interface_port);
684   if (sender_ident == NULL)
685     (void)string_format(big_buffer, big_buffer_size, "%s%s%s",
686       flag, sender_fullhost, iface);
687   else
688     (void)string_format(big_buffer, big_buffer_size, "%s%s%s U=%s",
689       flag, sender_fullhost, iface, sender_ident);
690   }
691 return big_buffer;
692 }
693
694 #endif   /* STAND_ALONE */
695
696
697
698
699 /*************************************************
700 *         Build list of local interfaces         *
701 *************************************************/
702
703 /* This function interprets the contents of the local_interfaces or
704 extra_local_interfaces options, and creates an ip_address_item block for each
705 item on the list. There is no special interpretation of any IP addresses; in
706 particular, 0.0.0.0 and ::0 are returned without modification. If any address
707 includes a port, it is set in the block. Otherwise the port value is set to
708 zero.
709
710 Arguments:
711   list        the list
712   name        the name of the option being expanded
713
714 Returns:      a chain of ip_address_items, each containing to a textual
715               version of an IP address, and a port number (host order) or
716               zero if no port was given with the address
717 */
718
719 ip_address_item *
720 host_build_ifacelist(const uschar *list, uschar *name)
721 {
722 int sep = 0;
723 uschar *s;
724 uschar buffer[64];
725 ip_address_item *yield = NULL;
726 ip_address_item *last = NULL;
727 ip_address_item *next;
728
729 while ((s = string_nextinlist(&list, &sep, buffer, sizeof(buffer))) != NULL)
730   {
731   int ipv;
732   int port = host_address_extract_port(s);            /* Leaves just the IP address */
733   if ((ipv = string_is_ip_address(s, NULL)) == 0)
734     log_write(0, LOG_MAIN|LOG_PANIC_DIE, "Malformed IP address \"%s\" in %s",
735       s, name);
736
737   /* Skip IPv6 addresses if IPv6 is disabled. */
738
739   if (disable_ipv6 && ipv == 6) continue;
740
741   /* This use of strcpy() is OK because we have checked that s is a valid IP
742   address above. The field in the ip_address_item is large enough to hold an
743   IPv6 address. */
744
745   next = store_get(sizeof(ip_address_item));
746   next->next = NULL;
747   Ustrcpy(next->address, s);
748   next->port = port;
749   next->v6_include_v4 = FALSE;
750
751   if (yield == NULL) yield = last = next; else
752     {
753     last->next = next;
754     last = next;
755     }
756   }
757
758 return yield;
759 }
760
761
762
763
764
765 /*************************************************
766 *         Find addresses on local interfaces     *
767 *************************************************/
768
769 /* This function finds the addresses of local IP interfaces. These are used
770 when testing for routing to the local host. As the function may be called more
771 than once, the list is preserved in permanent store, pointed to by a static
772 variable, to save doing the work more than once per process.
773
774 The generic list of interfaces is obtained by calling host_build_ifacelist()
775 for local_interfaces and extra_local_interfaces. This list scanned to remove
776 duplicates (which may exist with different ports - not relevant here). If
777 either of the wildcard IP addresses (0.0.0.0 and ::0) are encountered, they are
778 replaced by the appropriate (IPv4 or IPv6) list of actual local interfaces,
779 obtained from os_find_running_interfaces().
780
781 Arguments:    none
782 Returns:      a chain of ip_address_items, each containing to a textual
783               version of an IP address; the port numbers are not relevant
784 */
785
786
787 /* First, a local subfunction to add an interface to a list in permanent store,
788 but only if there isn't a previous copy of that address on the list. */
789
790 static ip_address_item *
791 add_unique_interface(ip_address_item *list, ip_address_item *ipa)
792 {
793 ip_address_item *ipa2;
794 for (ipa2 = list; ipa2 != NULL; ipa2 = ipa2->next)
795   if (Ustrcmp(ipa2->address, ipa->address) == 0) return list;
796 ipa2 = store_get_perm(sizeof(ip_address_item));
797 *ipa2 = *ipa;
798 ipa2->next = list;
799 return ipa2;
800 }
801
802
803 /* This is the globally visible function */
804
805 ip_address_item *
806 host_find_interfaces(void)
807 {
808 ip_address_item *running_interfaces = NULL;
809
810 if (local_interface_data == NULL)
811   {
812   void *reset_item = store_get(0);
813   ip_address_item *dlist = host_build_ifacelist(CUS local_interfaces,
814     US"local_interfaces");
815   ip_address_item *xlist = host_build_ifacelist(CUS extra_local_interfaces,
816     US"extra_local_interfaces");
817   ip_address_item *ipa;
818
819   if (dlist == NULL) dlist = xlist; else
820     {
821     for (ipa = dlist; ipa->next != NULL; ipa = ipa->next);
822     ipa->next = xlist;
823     }
824
825   for (ipa = dlist; ipa != NULL; ipa = ipa->next)
826     {
827     if (Ustrcmp(ipa->address, "0.0.0.0") == 0 ||
828         Ustrcmp(ipa->address, "::0") == 0)
829       {
830       ip_address_item *ipa2;
831       BOOL ipv6 = ipa->address[0] == ':';
832       if (running_interfaces == NULL)
833         running_interfaces = os_find_running_interfaces();
834       for (ipa2 = running_interfaces; ipa2 != NULL; ipa2 = ipa2->next)
835         {
836         if ((Ustrchr(ipa2->address, ':') != NULL) == ipv6)
837           local_interface_data = add_unique_interface(local_interface_data,
838           ipa2);
839         }
840       }
841     else
842       {
843       local_interface_data = add_unique_interface(local_interface_data, ipa);
844       DEBUG(D_interface)
845         {
846         debug_printf("Configured local interface: address=%s", ipa->address);
847         if (ipa->port != 0) debug_printf(" port=%d", ipa->port);
848         debug_printf("\n");
849         }
850       }
851     }
852   store_reset(reset_item);
853   }
854
855 return local_interface_data;
856 }
857
858
859
860
861
862 /*************************************************
863 *        Convert network IP address to text      *
864 *************************************************/
865
866 /* Given an IPv4 or IPv6 address in binary, convert it to a text
867 string and return the result in a piece of new store. The address can
868 either be given directly, or passed over in a sockaddr structure. Note
869 that this isn't the converse of host_aton() because of byte ordering
870 differences. See host_nmtoa() below.
871
872 Arguments:
873   type       if < 0 then arg points to a sockaddr, else
874              either AF_INET or AF_INET6
875   arg        points to a sockaddr if type is < 0, or
876              points to an IPv4 address (32 bits), or
877              points to an IPv6 address (128 bits),
878              in both cases, in network byte order
879   buffer     if NULL, the result is returned in gotten store;
880              else points to a buffer to hold the answer
881   portptr    points to where to put the port number, if non NULL; only
882              used when type < 0
883
884 Returns:     pointer to character string
885 */
886
887 uschar *
888 host_ntoa(int type, const void *arg, uschar *buffer, int *portptr)
889 {
890 uschar *yield;
891
892 /* The new world. It is annoying that we have to fish out the address from
893 different places in the block, depending on what kind of address it is. It
894 is also a pain that inet_ntop() returns a const uschar *, whereas the IPv4
895 function inet_ntoa() returns just uschar *, and some picky compilers insist
896 on warning if one assigns a const uschar * to a uschar *. Hence the casts. */
897
898 #if HAVE_IPV6
899 uschar addr_buffer[46];
900 if (type < 0)
901   {
902   int family = ((struct sockaddr *)arg)->sa_family;
903   if (family == AF_INET6)
904     {
905     struct sockaddr_in6 *sk = (struct sockaddr_in6 *)arg;
906     yield = (uschar *)inet_ntop(family, &(sk->sin6_addr), CS addr_buffer,
907       sizeof(addr_buffer));
908     if (portptr != NULL) *portptr = ntohs(sk->sin6_port);
909     }
910   else
911     {
912     struct sockaddr_in *sk = (struct sockaddr_in *)arg;
913     yield = (uschar *)inet_ntop(family, &(sk->sin_addr), CS addr_buffer,
914       sizeof(addr_buffer));
915     if (portptr != NULL) *portptr = ntohs(sk->sin_port);
916     }
917   }
918 else
919   {
920   yield = (uschar *)inet_ntop(type, arg, CS addr_buffer, sizeof(addr_buffer));
921   }
922
923 /* If the result is a mapped IPv4 address, show it in V4 format. */
924
925 if (Ustrncmp(yield, "::ffff:", 7) == 0) yield += 7;
926
927 #else  /* HAVE_IPV6 */
928
929 /* The old world */
930
931 if (type < 0)
932   {
933   yield = US inet_ntoa(((struct sockaddr_in *)arg)->sin_addr);
934   if (portptr != NULL) *portptr = ntohs(((struct sockaddr_in *)arg)->sin_port);
935   }
936 else
937   yield = US inet_ntoa(*((struct in_addr *)arg));
938 #endif
939
940 /* If there is no buffer, put the string into some new store. */
941
942 if (buffer == NULL) return string_copy(yield);
943
944 /* Callers of this function with a non-NULL buffer must ensure that it is
945 large enough to hold an IPv6 address, namely, at least 46 bytes. That's what
946 makes this use of strcpy() OK. */
947
948 Ustrcpy(buffer, yield);
949 return buffer;
950 }
951
952
953
954
955 /*************************************************
956 *         Convert address text to binary         *
957 *************************************************/
958
959 /* Given the textual form of an IP address, convert it to binary in an
960 array of ints. IPv4 addresses occupy one int; IPv6 addresses occupy 4 ints.
961 The result has the first byte in the most significant byte of the first int. In
962 other words, the result is not in network byte order, but in host byte order.
963 As a result, this is not the converse of host_ntoa(), which expects network
964 byte order. See host_nmtoa() below.
965
966 Arguments:
967   address    points to the textual address, checked for syntax
968   bin        points to an array of 4 ints
969
970 Returns:     the number of ints used
971 */
972
973 int
974 host_aton(const uschar *address, int *bin)
975 {
976 int x[4];
977 int v4offset = 0;
978
979 /* Handle IPv6 address, which may end with an IPv4 address. It may also end
980 with a "scope", introduced by a percent sign. This code is NOT enclosed in #if
981 HAVE_IPV6 in order that IPv6 addresses are recognized even if IPv6 is not
982 supported. */
983
984 if (Ustrchr(address, ':') != NULL)
985   {
986   const uschar *p = address;
987   const uschar *component[8];
988   BOOL ipv4_ends = FALSE;
989   int ci = 0;
990   int nulloffset = 0;
991   int v6count = 8;
992   int i;
993
994   /* If the address starts with a colon, it will start with two colons.
995   Just lose the first one, which will leave a null first component. */
996
997   if (*p == ':') p++;
998
999   /* Split the address into components separated by colons. The input address
1000   is supposed to be checked for syntax. There was a case where this was
1001   overlooked; to guard against that happening again, check here and crash if
1002   there are too many components. */
1003
1004   while (*p != 0 && *p != '%')
1005     {
1006     int len = Ustrcspn(p, ":%");
1007     if (len == 0) nulloffset = ci;
1008     if (ci > 7) log_write(0, LOG_MAIN|LOG_PANIC_DIE,
1009       "Internal error: invalid IPv6 address \"%s\" passed to host_aton()",
1010       address);
1011     component[ci++] = p;
1012     p += len;
1013     if (*p == ':') p++;
1014     }
1015
1016   /* If the final component contains a dot, it is a trailing v4 address.
1017   As the syntax is known to be checked, just set up for a trailing
1018   v4 address and restrict the v6 part to 6 components. */
1019
1020   if (Ustrchr(component[ci-1], '.') != NULL)
1021     {
1022     address = component[--ci];
1023     ipv4_ends = TRUE;
1024     v4offset = 3;
1025     v6count = 6;
1026     }
1027
1028   /* If there are fewer than 6 or 8 components, we have to insert some
1029   more empty ones in the middle. */
1030
1031   if (ci < v6count)
1032     {
1033     int insert_count = v6count - ci;
1034     for (i = v6count-1; i > nulloffset + insert_count; i--)
1035       component[i] = component[i - insert_count];
1036     while (i > nulloffset) component[i--] = US"";
1037     }
1038
1039   /* Now turn the components into binary in pairs and bung them
1040   into the vector of ints. */
1041
1042   for (i = 0; i < v6count; i += 2)
1043     bin[i/2] = (Ustrtol(component[i], NULL, 16) << 16) +
1044       Ustrtol(component[i+1], NULL, 16);
1045
1046   /* If there was no terminating v4 component, we are done. */
1047
1048   if (!ipv4_ends) return 4;
1049   }
1050
1051 /* Handle IPv4 address */
1052
1053 (void)sscanf(CS address, "%d.%d.%d.%d", x, x+1, x+2, x+3);
1054 bin[v4offset] = (x[0] << 24) + (x[1] << 16) + (x[2] << 8) + x[3];
1055 return v4offset+1;
1056 }
1057
1058
1059 /*************************************************
1060 *           Apply mask to an IP address          *
1061 *************************************************/
1062
1063 /* Mask an address held in 1 or 4 ints, with the ms bit in the ms bit of the
1064 first int, etc.
1065
1066 Arguments:
1067   count        the number of ints
1068   binary       points to the ints to be masked
1069   mask         the count of ms bits to leave, or -1 if no masking
1070
1071 Returns:       nothing
1072 */
1073
1074 void
1075 host_mask(int count, int *binary, int mask)
1076 {
1077 int i;
1078 if (mask < 0) mask = 99999;
1079 for (i = 0; i < count; i++)
1080   {
1081   int wordmask;
1082   if (mask == 0) wordmask = 0;
1083   else if (mask < 32)
1084     {
1085     wordmask = (-1) << (32 - mask);
1086     mask = 0;
1087     }
1088   else
1089     {
1090     wordmask = -1;
1091     mask -= 32;
1092     }
1093   binary[i] &= wordmask;
1094   }
1095 }
1096
1097
1098
1099
1100 /*************************************************
1101 *     Convert masked IP address in ints to text  *
1102 *************************************************/
1103
1104 /* We can't use host_ntoa() because it assumes the binary values are in network
1105 byte order, and these are the result of host_aton(), which puts them in ints in
1106 host byte order. Also, we really want IPv6 addresses to be in a canonical
1107 format, so we output them with no abbreviation. In a number of cases we can't
1108 use the normal colon separator in them because it terminates keys in lsearch
1109 files, so we want to use dot instead. There's an argument that specifies what
1110 to use for IPv6 addresses.
1111
1112 Arguments:
1113   count       1 or 4 (number of ints)
1114   binary      points to the ints
1115   mask        mask value; if < 0 don't add to result
1116   buffer      big enough to hold the result
1117   sep         component separator character for IPv6 addresses
1118
1119 Returns:      the number of characters placed in buffer, not counting
1120               the final nul.
1121 */
1122
1123 int
1124 host_nmtoa(int count, int *binary, int mask, uschar *buffer, int sep)
1125 {
1126 int i, j;
1127 uschar *tt = buffer;
1128
1129 if (count == 1)
1130   {
1131   j = binary[0];
1132   for (i = 24; i >= 0; i -= 8)
1133     {
1134     sprintf(CS tt, "%d.", (j >> i) & 255);
1135     while (*tt) tt++;
1136     }
1137   }
1138 else
1139   {
1140   for (i = 0; i < 4; i++)
1141     {
1142     j = binary[i];
1143     sprintf(CS tt, "%04x%c%04x%c", (j >> 16) & 0xffff, sep, j & 0xffff, sep);
1144     while (*tt) tt++;
1145     }
1146   }
1147
1148 tt--;   /* lose final separator */
1149
1150 if (mask < 0)
1151   *tt = 0;
1152 else
1153   {
1154   sprintf(CS tt, "/%d", mask);
1155   while (*tt) tt++;
1156   }
1157
1158 return tt - buffer;
1159 }
1160
1161
1162
1163 /*************************************************
1164 *        Check port for tls_on_connect           *
1165 *************************************************/
1166
1167 /* This function checks whether a given incoming port is configured for tls-
1168 on-connect. It is called from the daemon and from inetd handling. If the global
1169 option tls_on_connect is already set, all ports operate this way. Otherwise, we
1170 check the tls_on_connect_ports option for a list of ports.
1171
1172 Argument:  a port number
1173 Returns:   TRUE or FALSE
1174 */
1175
1176 BOOL
1177 host_is_tls_on_connect_port(int port)
1178 {
1179 int sep = 0;
1180 uschar buffer[32];
1181 const uschar *list = tls_in.on_connect_ports;
1182 uschar *s;
1183 uschar *end;
1184
1185 if (tls_in.on_connect) return TRUE;
1186
1187 while ((s = string_nextinlist(&list, &sep, buffer, sizeof(buffer))))
1188   if (Ustrtol(s, &end, 10) == port)
1189     return TRUE;
1190
1191 return FALSE;
1192 }
1193
1194
1195
1196 /*************************************************
1197 *        Check whether host is in a network      *
1198 *************************************************/
1199
1200 /* This function checks whether a given IP address matches a pattern that
1201 represents either a single host, or a network (using CIDR notation). The caller
1202 of this function must check the syntax of the arguments before calling it.
1203
1204 Arguments:
1205   host        string representation of the ip-address to check
1206   net         string representation of the network, with optional CIDR mask
1207   maskoffset  offset to the / that introduces the mask in the key
1208               zero if there is no mask
1209
1210 Returns:
1211   TRUE   the host is inside the network
1212   FALSE  the host is NOT inside the network
1213 */
1214
1215 BOOL
1216 host_is_in_net(const uschar *host, const uschar *net, int maskoffset)
1217 {
1218 int i;
1219 int address[4];
1220 int incoming[4];
1221 int mlen;
1222 int size = host_aton(net, address);
1223 int insize;
1224
1225 /* No mask => all bits to be checked */
1226
1227 if (maskoffset == 0) mlen = 99999;    /* Big number */
1228   else mlen = Uatoi(net + maskoffset + 1);
1229
1230 /* Convert the incoming address to binary. */
1231
1232 insize = host_aton(host, incoming);
1233
1234 /* Convert IPv4 addresses given in IPv6 compatible mode, which represent
1235    connections from IPv4 hosts to IPv6 hosts, that is, addresses of the form
1236    ::ffff:<v4address>, to IPv4 format. */
1237
1238 if (insize == 4 && incoming[0] == 0 && incoming[1] == 0 &&
1239     incoming[2] == 0xffff)
1240   {
1241   insize = 1;
1242   incoming[0] = incoming[3];
1243   }
1244
1245 /* No match if the sizes don't agree. */
1246
1247 if (insize != size) return FALSE;
1248
1249 /* Else do the masked comparison. */
1250
1251 for (i = 0; i < size; i++)
1252   {
1253   int mask;
1254   if (mlen == 0) mask = 0;
1255   else if (mlen < 32)
1256     {
1257     mask = (-1) << (32 - mlen);
1258     mlen = 0;
1259     }
1260   else
1261     {
1262     mask = -1;
1263     mlen -= 32;
1264     }
1265   if ((incoming[i] & mask) != (address[i] & mask)) return FALSE;
1266   }
1267
1268 return TRUE;
1269 }
1270
1271
1272
1273 /*************************************************
1274 *       Scan host list for local hosts           *
1275 *************************************************/
1276
1277 /* Scan through a chain of addresses and check whether any of them is the
1278 address of an interface on the local machine. If so, remove that address and
1279 any previous ones with the same MX value, and all subsequent ones (which will
1280 have greater or equal MX values) from the chain. Note: marking them as unusable
1281 is NOT the right thing to do because it causes the hosts not to be used for
1282 other domains, for which they may well be correct.
1283
1284 The hosts may be part of a longer chain; we only process those between the
1285 initial pointer and the "last" pointer.
1286
1287 There is also a list of "pseudo-local" host names which are checked against the
1288 host names. Any match causes that host item to be treated the same as one which
1289 matches a local IP address.
1290
1291 If the very first host is a local host, then all MX records had a precedence
1292 greater than or equal to that of the local host. Either there's a problem in
1293 the DNS, or an apparently remote name turned out to be an abbreviation for the
1294 local host. Give a specific return code, and let the caller decide what to do.
1295 Otherwise, give a success code if at least one host address has been found.
1296
1297 Arguments:
1298   host        pointer to the first host in the chain
1299   lastptr     pointer to pointer to the last host in the chain (may be updated)
1300   removed     if not NULL, set TRUE if some local addresses were removed
1301                 from the list
1302
1303 Returns:
1304   HOST_FOUND       if there is at least one host with an IP address on the chain
1305                      and an MX value less than any MX value associated with the
1306                      local host
1307   HOST_FOUND_LOCAL if a local host is among the lowest-numbered MX hosts; when
1308                      the host addresses were obtained from A records or
1309                      gethostbyname(), the MX values are set to -1.
1310   HOST_FIND_FAILED if no valid hosts with set IP addresses were found
1311 */
1312
1313 int
1314 host_scan_for_local_hosts(host_item *host, host_item **lastptr, BOOL *removed)
1315 {
1316 int yield = HOST_FIND_FAILED;
1317 host_item *last = *lastptr;
1318 host_item *prev = NULL;
1319 host_item *h;
1320
1321 if (removed != NULL) *removed = FALSE;
1322
1323 if (local_interface_data == NULL) local_interface_data = host_find_interfaces();
1324
1325 for (h = host; h != last->next; h = h->next)
1326   {
1327   #ifndef STAND_ALONE
1328   if (hosts_treat_as_local != NULL)
1329     {
1330     int rc;
1331     const uschar *save = deliver_domain;
1332     deliver_domain = h->name;   /* set $domain */
1333     rc = match_isinlist(string_copylc(h->name), CUSS &hosts_treat_as_local, 0,
1334       &domainlist_anchor, NULL, MCL_DOMAIN, TRUE, NULL);
1335     deliver_domain = save;
1336     if (rc == OK) goto FOUND_LOCAL;
1337     }
1338   #endif
1339
1340   /* It seems that on many operating systems, 0.0.0.0 is treated as a synonym
1341   for 127.0.0.1 and refers to the local host. We therefore force it always to
1342   be treated as local. */
1343
1344   if (h->address != NULL)
1345     {
1346     ip_address_item *ip;
1347     if (Ustrcmp(h->address, "0.0.0.0") == 0) goto FOUND_LOCAL;
1348     for (ip = local_interface_data; ip != NULL; ip = ip->next)
1349       if (Ustrcmp(h->address, ip->address) == 0) goto FOUND_LOCAL;
1350     yield = HOST_FOUND;  /* At least one remote address has been found */
1351     }
1352
1353   /* Update prev to point to the last host item before any that have
1354   the same MX value as the one we have just considered. */
1355
1356   if (h->next == NULL || h->next->mx != h->mx) prev = h;
1357   }
1358
1359 return yield;  /* No local hosts found: return HOST_FOUND or HOST_FIND_FAILED */
1360
1361 /* A host whose IP address matches a local IP address, or whose name matches
1362 something in hosts_treat_as_local has been found. */
1363
1364 FOUND_LOCAL:
1365
1366 if (prev == NULL)
1367   {
1368   HDEBUG(D_host_lookup) debug_printf((h->mx >= 0)?
1369     "local host has lowest MX\n" :
1370     "local host found for non-MX address\n");
1371   return HOST_FOUND_LOCAL;
1372   }
1373
1374 HDEBUG(D_host_lookup)
1375   {
1376   debug_printf("local host in host list - removed hosts:\n");
1377   for (h = prev->next; h != last->next; h = h->next)
1378     debug_printf("  %s %s %d\n", h->name, h->address, h->mx);
1379   }
1380
1381 if (removed != NULL) *removed = TRUE;
1382 prev->next = last->next;
1383 *lastptr = prev;
1384 return yield;
1385 }
1386
1387
1388
1389
1390 /*************************************************
1391 *        Remove duplicate IPs in host list       *
1392 *************************************************/
1393
1394 /* You would think that administrators could set up their DNS records so that
1395 one ended up with a list of unique IP addresses after looking up A or MX
1396 records, but apparently duplication is common. So we scan such lists and
1397 remove the later duplicates. Note that we may get lists in which some host
1398 addresses are not set.
1399
1400 Arguments:
1401   host        pointer to the first host in the chain
1402   lastptr     pointer to pointer to the last host in the chain (may be updated)
1403
1404 Returns:      nothing
1405 */
1406
1407 static void
1408 host_remove_duplicates(host_item *host, host_item **lastptr)
1409 {
1410 while (host != *lastptr)
1411   {
1412   if (host->address != NULL)
1413     {
1414     host_item *h = host;
1415     while (h != *lastptr)
1416       {
1417       if (h->next->address != NULL &&
1418           Ustrcmp(h->next->address, host->address) == 0)
1419         {
1420         DEBUG(D_host_lookup) debug_printf("duplicate IP address %s (MX=%d) "
1421           "removed\n", host->address, h->next->mx);
1422         if (h->next == *lastptr) *lastptr = h;
1423         h->next = h->next->next;
1424         }
1425       else h = h->next;
1426       }
1427     }
1428   /* If the last item was removed, host may have become == *lastptr */
1429   if (host != *lastptr) host = host->next;
1430   }
1431 }
1432
1433
1434
1435
1436 /*************************************************
1437 *    Find sender host name by gethostbyaddr()    *
1438 *************************************************/
1439
1440 /* This used to be the only way it was done, but it turns out that not all
1441 systems give aliases for calls to gethostbyaddr() - or one of the modern
1442 equivalents like getipnodebyaddr(). Fortunately, multiple PTR records are rare,
1443 but they can still exist. This function is now used only when a DNS lookup of
1444 the IP address fails, in order to give access to /etc/hosts.
1445
1446 Arguments:   none
1447 Returns:     OK, DEFER, FAIL
1448 */
1449
1450 static int
1451 host_name_lookup_byaddr(void)
1452 {
1453 int len;
1454 uschar *s, *t;
1455 struct hostent *hosts;
1456 struct in_addr addr;
1457
1458 /* Lookup on IPv6 system */
1459
1460 #if HAVE_IPV6
1461 if (Ustrchr(sender_host_address, ':') != NULL)
1462   {
1463   struct in6_addr addr6;
1464   if (inet_pton(AF_INET6, CS sender_host_address, &addr6) != 1)
1465     log_write(0, LOG_MAIN|LOG_PANIC_DIE, "unable to parse \"%s\" as an "
1466       "IPv6 address", sender_host_address);
1467   #if HAVE_GETIPNODEBYADDR
1468   hosts = getipnodebyaddr(CS &addr6, sizeof(addr6), AF_INET6, &h_errno);
1469   #else
1470   hosts = gethostbyaddr(CS &addr6, sizeof(addr6), AF_INET6);
1471   #endif
1472   }
1473 else
1474   {
1475   if (inet_pton(AF_INET, CS sender_host_address, &addr) != 1)
1476     log_write(0, LOG_MAIN|LOG_PANIC_DIE, "unable to parse \"%s\" as an "
1477       "IPv4 address", sender_host_address);
1478   #if HAVE_GETIPNODEBYADDR
1479   hosts = getipnodebyaddr(CS &addr, sizeof(addr), AF_INET, &h_errno);
1480   #else
1481   hosts = gethostbyaddr(CS &addr, sizeof(addr), AF_INET);
1482   #endif
1483   }
1484
1485 /* Do lookup on IPv4 system */
1486
1487 #else
1488 addr.s_addr = (S_ADDR_TYPE)inet_addr(CS sender_host_address);
1489 hosts = gethostbyaddr(CS(&addr), sizeof(addr), AF_INET);
1490 #endif
1491
1492 /* Failed to look up the host. */
1493
1494 if (hosts == NULL)
1495   {
1496   HDEBUG(D_host_lookup) debug_printf("IP address lookup failed: h_errno=%d\n",
1497     h_errno);
1498   return (h_errno == TRY_AGAIN || h_errno == NO_RECOVERY) ? DEFER : FAIL;
1499   }
1500
1501 /* It seems there are some records in the DNS that yield an empty name. We
1502 treat this as non-existent. In some operating systems, this is returned as an
1503 empty string; in others as a single dot. */
1504
1505 if (hosts->h_name == NULL || hosts->h_name[0] == 0 || hosts->h_name[0] == '.')
1506   {
1507   HDEBUG(D_host_lookup) debug_printf("IP address lookup yielded an empty name: "
1508     "treated as non-existent host name\n");
1509   return FAIL;
1510   }
1511
1512 /* Copy and lowercase the name, which is in static storage in many systems.
1513 Put it in permanent memory. */
1514
1515 s = (uschar *)hosts->h_name;
1516 len = Ustrlen(s) + 1;
1517 t = sender_host_name = store_get_perm(len);
1518 while (*s != 0) *t++ = tolower(*s++);
1519 *t = 0;
1520
1521 /* If the host has aliases, build a copy of the alias list */
1522
1523 if (hosts->h_aliases != NULL)
1524   {
1525   int count = 1;
1526   uschar **aliases, **ptr;
1527   for (aliases = USS hosts->h_aliases; *aliases != NULL; aliases++) count++;
1528   ptr = sender_host_aliases = store_get_perm(count * sizeof(uschar *));
1529   for (aliases = USS hosts->h_aliases; *aliases != NULL; aliases++)
1530     {
1531     uschar *s = *aliases;
1532     int len = Ustrlen(s) + 1;
1533     uschar *t = *ptr++ = store_get_perm(len);
1534     while (*s != 0) *t++ = tolower(*s++);
1535     *t = 0;
1536     }
1537   *ptr = NULL;
1538   }
1539
1540 return OK;
1541 }
1542
1543
1544
1545 /*************************************************
1546 *        Find host name for incoming call        *
1547 *************************************************/
1548
1549 /* Put the name in permanent store, pointed to by sender_host_name. We also set
1550 up a list of alias names, pointed to by sender_host_alias. The list is
1551 NULL-terminated. The incoming address is in sender_host_address, either in
1552 dotted-quad form for IPv4 or in colon-separated form for IPv6.
1553
1554 This function does a thorough check that the names it finds point back to the
1555 incoming IP address. Any that do not are discarded. Note that this is relied on
1556 by the ACL reverse_host_lookup check.
1557
1558 On some systems, get{host,ipnode}byaddr() appears to do this internally, but
1559 this it not universally true. Also, for release 4.30, this function was changed
1560 to do a direct DNS lookup first, by default[1], because it turns out that that
1561 is the only guaranteed way to find all the aliases on some systems. My
1562 experiments indicate that Solaris gethostbyaddr() gives the aliases for but
1563 Linux does not.
1564
1565 [1] The actual order is controlled by the host_lookup_order option.
1566
1567 Arguments:    none
1568 Returns:      OK on success, the answer being placed in the global variable
1569                 sender_host_name, with any aliases in a list hung off
1570                 sender_host_aliases
1571               FAIL if no host name can be found
1572               DEFER if a temporary error was encountered
1573
1574 The variable host_lookup_msg is set to an empty string on sucess, or to a
1575 reason for the failure otherwise, in a form suitable for tagging onto an error
1576 message, and also host_lookup_failed is set TRUE if the lookup failed. If there
1577 was a defer, host_lookup_deferred is set TRUE.
1578
1579 Any dynamically constructed string for host_lookup_msg must be in permanent
1580 store, because it might be used for several incoming messages on the same SMTP
1581 connection. */
1582
1583 int
1584 host_name_lookup(void)
1585 {
1586 int old_pool, rc;
1587 int sep = 0;
1588 uschar *hname, *save_hostname;
1589 uschar **aliases;
1590 uschar buffer[256];
1591 uschar *ordername;
1592 const uschar *list = host_lookup_order;
1593 dns_record *rr;
1594 dns_answer dnsa;
1595 dns_scan dnss;
1596
1597 sender_host_dnssec = host_lookup_deferred = host_lookup_failed = FALSE;
1598
1599 HDEBUG(D_host_lookup)
1600   debug_printf("looking up host name for %s\n", sender_host_address);
1601
1602 /* For testing the case when a lookup does not complete, we have a special
1603 reserved IP address. */
1604
1605 if (running_in_test_harness &&
1606     Ustrcmp(sender_host_address, "99.99.99.99") == 0)
1607   {
1608   HDEBUG(D_host_lookup)
1609     debug_printf("Test harness: host name lookup returns DEFER\n");
1610   host_lookup_deferred = TRUE;
1611   return DEFER;
1612   }
1613
1614 /* Do lookups directly in the DNS or via gethostbyaddr() (or equivalent), in
1615 the order specified by the host_lookup_order option. */
1616
1617 while ((ordername = string_nextinlist(&list, &sep, buffer, sizeof(buffer)))
1618         != NULL)
1619   {
1620   if (strcmpic(ordername, US"bydns") == 0)
1621     {
1622     dns_init(FALSE, FALSE, FALSE);    /* dnssec ctrl by dns_dnssec_ok glbl */
1623     dns_build_reverse(sender_host_address, buffer);
1624     rc = dns_lookup(&dnsa, buffer, T_PTR, NULL);
1625
1626     /* The first record we come across is used for the name; others are
1627     considered to be aliases. We have to scan twice, in order to find out the
1628     number of aliases. However, if all the names are empty, we will behave as
1629     if failure. (PTR records that yield empty names have been encountered in
1630     the DNS.) */
1631
1632     if (rc == DNS_SUCCEED)
1633       {
1634       uschar **aptr = NULL;
1635       int ssize = 264;
1636       int count = 0;
1637       int old_pool = store_pool;
1638
1639       /* Ideally we'd check DNSSEC both forward and reverse, but we use the
1640       gethost* routines for forward, so can't do that unless/until we rewrite. */
1641       sender_host_dnssec = dns_is_secure(&dnsa);
1642       DEBUG(D_dns)
1643         debug_printf("Reverse DNS security status: %s\n",
1644             sender_host_dnssec ? "DNSSEC verified (AD)" : "unverified");
1645
1646       store_pool = POOL_PERM;        /* Save names in permanent storage */
1647
1648       for (rr = dns_next_rr(&dnsa, &dnss, RESET_ANSWERS);
1649            rr != NULL;
1650            rr = dns_next_rr(&dnsa, &dnss, RESET_NEXT))
1651         {
1652         if (rr->type == T_PTR) count++;
1653         }
1654
1655       /* Get store for the list of aliases. For compatibility with
1656       gethostbyaddr, we make an empty list if there are none. */
1657
1658       aptr = sender_host_aliases = store_get(count * sizeof(uschar *));
1659
1660       /* Re-scan and extract the names */
1661
1662       for (rr = dns_next_rr(&dnsa, &dnss, RESET_ANSWERS);
1663            rr != NULL;
1664            rr = dns_next_rr(&dnsa, &dnss, RESET_NEXT))
1665         {
1666         uschar *s = NULL;
1667         if (rr->type != T_PTR) continue;
1668         s = store_get(ssize);
1669
1670         /* If an overlong response was received, the data will have been
1671         truncated and dn_expand may fail. */
1672
1673         if (dn_expand(dnsa.answer, dnsa.answer + dnsa.answerlen,
1674              (uschar *)(rr->data), (DN_EXPAND_ARG4_TYPE)(s), ssize) < 0)
1675           {
1676           log_write(0, LOG_MAIN, "host name alias list truncated for %s",
1677             sender_host_address);
1678           break;
1679           }
1680
1681         store_reset(s + Ustrlen(s) + 1);
1682         if (s[0] == 0)
1683           {
1684           HDEBUG(D_host_lookup) debug_printf("IP address lookup yielded an "
1685             "empty name: treated as non-existent host name\n");
1686           continue;
1687           }
1688         if (sender_host_name == NULL) sender_host_name = s;
1689           else *aptr++ = s;
1690         while (*s != 0) { *s = tolower(*s); s++; }
1691         }
1692
1693       *aptr = NULL;            /* End of alias list */
1694       store_pool = old_pool;   /* Reset store pool */
1695
1696       /* If we've found a names, break out of the "order" loop */
1697
1698       if (sender_host_name != NULL) break;
1699       }
1700
1701     /* If the DNS lookup deferred, we must also defer. */
1702
1703     if (rc == DNS_AGAIN)
1704       {
1705       HDEBUG(D_host_lookup)
1706         debug_printf("IP address PTR lookup gave temporary error\n");
1707       host_lookup_deferred = TRUE;
1708       return DEFER;
1709       }
1710     }
1711
1712   /* Do a lookup using gethostbyaddr() - or equivalent */
1713
1714   else if (strcmpic(ordername, US"byaddr") == 0)
1715     {
1716     HDEBUG(D_host_lookup)
1717       debug_printf("IP address lookup using gethostbyaddr()\n");
1718     rc = host_name_lookup_byaddr();
1719     if (rc == DEFER)
1720       {
1721       host_lookup_deferred = TRUE;
1722       return rc;                       /* Can't carry on */
1723       }
1724     if (rc == OK) break;               /* Found a name */
1725     }
1726   }      /* Loop for bydns/byaddr scanning */
1727
1728 /* If we have failed to find a name, return FAIL and log when required.
1729 NB host_lookup_msg must be in permanent store.  */
1730
1731 if (sender_host_name == NULL)
1732   {
1733   if (host_checking || !log_testing_mode)
1734     log_write(L_host_lookup_failed, LOG_MAIN, "no host name found for IP "
1735       "address %s", sender_host_address);
1736   host_lookup_msg = US" (failed to find host name from IP address)";
1737   host_lookup_failed = TRUE;
1738   return FAIL;
1739   }
1740
1741 HDEBUG(D_host_lookup)
1742   {
1743   uschar **aliases = sender_host_aliases;
1744   debug_printf("IP address lookup yielded \"%s\"\n", sender_host_name);
1745   while (*aliases != NULL) debug_printf("  alias \"%s\"\n", *aliases++);
1746   }
1747
1748 /* We need to verify that a forward lookup on the name we found does indeed
1749 correspond to the address. This is for security: in principle a malefactor who
1750 happened to own a reverse zone could set it to point to any names at all.
1751
1752 This code was present in versions of Exim before 3.20. At that point I took it
1753 out because I thought that gethostbyaddr() did the check anyway. It turns out
1754 that this isn't always the case, so it's coming back in at 4.01. This version
1755 is actually better, because it also checks aliases.
1756
1757 The code was made more robust at release 4.21. Prior to that, it accepted all
1758 the names if any of them had the correct IP address. Now the code checks all
1759 the names, and accepts only those that have the correct IP address. */
1760
1761 save_hostname = sender_host_name;   /* Save for error messages */
1762 aliases = sender_host_aliases;
1763 for (hname = sender_host_name; hname != NULL; hname = *aliases++)
1764   {
1765   int rc;
1766   BOOL ok = FALSE;
1767   host_item h;
1768   h.next = NULL;
1769   h.name = hname;
1770   h.mx = MX_NONE;
1771   h.address = NULL;
1772
1773   /* When called with the last argument FALSE, host_find_byname() won't return
1774   HOST_FOUND_LOCAL. If the incoming address is an IPv4 address expressed in
1775   IPv6 format, we must compare the IPv4 part to any IPv4 addresses. */
1776
1777   if ((rc = host_find_byname(&h, NULL, 0, NULL, FALSE)) == HOST_FOUND)
1778     {
1779     host_item *hh;
1780     HDEBUG(D_host_lookup) debug_printf("checking addresses for %s\n", hname);
1781     for (hh = &h; hh != NULL; hh = hh->next)
1782       {
1783       if (host_is_in_net(hh->address, sender_host_address, 0))
1784         {
1785         HDEBUG(D_host_lookup) debug_printf("  %s OK\n", hh->address);
1786         ok = TRUE;
1787         break;
1788         }
1789       else
1790         {
1791         HDEBUG(D_host_lookup) debug_printf("  %s\n", hh->address);
1792         }
1793       }
1794     if (!ok) HDEBUG(D_host_lookup)
1795       debug_printf("no IP address for %s matched %s\n", hname,
1796         sender_host_address);
1797     }
1798   else if (rc == HOST_FIND_AGAIN)
1799     {
1800     HDEBUG(D_host_lookup) debug_printf("temporary error for host name lookup\n");
1801     host_lookup_deferred = TRUE;
1802     sender_host_name = NULL;
1803     return DEFER;
1804     }
1805   else
1806     {
1807     HDEBUG(D_host_lookup) debug_printf("no IP addresses found for %s\n", hname);
1808     }
1809
1810   /* If this name is no good, and it's the sender name, set it null pro tem;
1811   if it's an alias, just remove it from the list. */
1812
1813   if (!ok)
1814     {
1815     if (hname == sender_host_name) sender_host_name = NULL; else
1816       {
1817       uschar **a;                              /* Don't amalgamate - some */
1818       a = --aliases;                           /* compilers grumble */
1819       while (*a != NULL) { *a = a[1]; a++; }
1820       }
1821     }
1822   }
1823
1824 /* If sender_host_name == NULL, it means we didn't like the name. Replace
1825 it with the first alias, if there is one. */
1826
1827 if (sender_host_name == NULL && *sender_host_aliases != NULL)
1828   sender_host_name = *sender_host_aliases++;
1829
1830 /* If we now have a main name, all is well. */
1831
1832 if (sender_host_name != NULL) return OK;
1833
1834 /* We have failed to find an address that matches. */
1835
1836 HDEBUG(D_host_lookup)
1837   debug_printf("%s does not match any IP address for %s\n",
1838     sender_host_address, save_hostname);
1839
1840 /* This message must be in permanent store */
1841
1842 old_pool = store_pool;
1843 store_pool = POOL_PERM;
1844 host_lookup_msg = string_sprintf(" (%s does not match any IP address for %s)",
1845   sender_host_address, save_hostname);
1846 store_pool = old_pool;
1847 host_lookup_failed = TRUE;
1848 return FAIL;
1849 }
1850
1851
1852
1853
1854 /*************************************************
1855 *    Find IP address(es) for host by name        *
1856 *************************************************/
1857
1858 /* The input is a host_item structure with the name filled in and the address
1859 field set to NULL. We use gethostbyname() or getipnodebyname() or
1860 gethostbyname2(), as appropriate. Of course, these functions may use the DNS,
1861 but they do not do MX processing. It appears, however, that in some systems the
1862 current setting of resolver options is used when one of these functions calls
1863 the resolver. For this reason, we call dns_init() at the start, with arguments
1864 influenced by bits in "flags", just as we do for host_find_bydns().
1865
1866 The second argument provides a host list (usually an IP list) of hosts to
1867 ignore. This makes it possible to ignore IPv6 link-local addresses or loopback
1868 addresses in unreasonable places.
1869
1870 The lookup may result in a change of name. For compatibility with the dns
1871 lookup, return this via fully_qualified_name as well as updating the host item.
1872 The lookup may also yield more than one IP address, in which case chain on
1873 subsequent host_item structures.
1874
1875 Arguments:
1876   host                   a host item with the name and MX filled in;
1877                            the address is to be filled in;
1878                            multiple IP addresses cause other host items to be
1879                              chained on.
1880   ignore_target_hosts    a list of hosts to ignore
1881   flags                  HOST_FIND_QUALIFY_SINGLE   ) passed to
1882                          HOST_FIND_SEARCH_PARENTS   )   dns_init()
1883   fully_qualified_name   if not NULL, set to point to host name for
1884                          compatibility with host_find_bydns
1885   local_host_check       TRUE if a check for the local host is wanted
1886
1887 Returns:                 HOST_FIND_FAILED  Failed to find the host or domain
1888                          HOST_FIND_AGAIN   Try again later
1889                          HOST_FOUND        Host found - data filled in
1890                          HOST_FOUND_LOCAL  Host found and is the local host
1891 */
1892
1893 int
1894 host_find_byname(host_item *host, const uschar *ignore_target_hosts, int flags,
1895   const uschar **fully_qualified_name, BOOL local_host_check)
1896 {
1897 int i, yield, times;
1898 uschar **addrlist;
1899 host_item *last = NULL;
1900 BOOL temp_error = FALSE;
1901 #if HAVE_IPV6
1902 int af;
1903 #endif
1904
1905 /* If we are in the test harness, a name ending in .test.again.dns always
1906 forces a temporary error response, unless the name is in
1907 dns_again_means_nonexist. */
1908
1909 if (running_in_test_harness)
1910   {
1911   const uschar *endname = host->name + Ustrlen(host->name);
1912   if (Ustrcmp(endname - 14, "test.again.dns") == 0) goto RETURN_AGAIN;
1913   }
1914
1915 /* Make sure DNS options are set as required. This appears to be necessary in
1916 some circumstances when the get..byname() function actually calls the DNS. */
1917
1918 dns_init((flags & HOST_FIND_QUALIFY_SINGLE) != 0,
1919          (flags & HOST_FIND_SEARCH_PARENTS) != 0,
1920          FALSE);        /*XXX dnssec? */
1921
1922 /* In an IPv6 world, unless IPv6 has been disabled, we need to scan for both
1923 kinds of address, so go round the loop twice. Note that we have ensured that
1924 AF_INET6 is defined even in an IPv4 world, which makes for slightly tidier
1925 code. However, if dns_ipv4_lookup matches the domain, we also just do IPv4
1926 lookups here (except when testing standalone). */
1927
1928 #if HAVE_IPV6
1929   #ifdef STAND_ALONE
1930   if (disable_ipv6)
1931   #else
1932   if (disable_ipv6 ||
1933     (dns_ipv4_lookup != NULL &&
1934         match_isinlist(host->name, CUSS &dns_ipv4_lookup, 0, NULL, NULL,
1935           MCL_DOMAIN, TRUE, NULL) == OK))
1936   #endif
1937
1938     { af = AF_INET; times = 1; }
1939   else
1940     { af = AF_INET6; times = 2; }
1941
1942 /* No IPv6 support */
1943
1944 #else   /* HAVE_IPV6 */
1945   times = 1;
1946 #endif  /* HAVE_IPV6 */
1947
1948 /* Initialize the flag that gets set for DNS syntax check errors, so that the
1949 interface to this function can be similar to host_find_bydns. */
1950
1951 host_find_failed_syntax = FALSE;
1952
1953 /* Loop to look up both kinds of address in an IPv6 world */
1954
1955 for (i = 1; i <= times;
1956      #if HAVE_IPV6
1957        af = AF_INET,     /* If 2 passes, IPv4 on the second */
1958      #endif
1959      i++)
1960   {
1961   BOOL ipv4_addr;
1962   int error_num = 0;
1963   struct hostent *hostdata;
1964
1965   #ifdef STAND_ALONE
1966   printf("Looking up: %s\n", host->name);
1967   #endif
1968
1969   #if HAVE_IPV6
1970   if (running_in_test_harness)
1971     hostdata = host_fake_gethostbyname(host->name, af, &error_num);
1972   else
1973     {
1974     #if HAVE_GETIPNODEBYNAME
1975     hostdata = getipnodebyname(CS host->name, af, 0, &error_num);
1976     #else
1977     hostdata = gethostbyname2(CS host->name, af);
1978     error_num = h_errno;
1979     #endif
1980     }
1981
1982   #else    /* not HAVE_IPV6 */
1983   if (running_in_test_harness)
1984     hostdata = host_fake_gethostbyname(host->name, AF_INET, &error_num);
1985   else
1986     {
1987     hostdata = gethostbyname(CS host->name);
1988     error_num = h_errno;
1989     }
1990   #endif   /* HAVE_IPV6 */
1991
1992   if (hostdata == NULL)
1993     {
1994     uschar *error;
1995     switch (error_num)
1996       {
1997       case HOST_NOT_FOUND: error = US"HOST_NOT_FOUND"; break;
1998       case TRY_AGAIN: error = US"TRY_AGAIN"; break;
1999       case NO_RECOVERY: error = US"NO_RECOVERY"; break;
2000       case NO_DATA: error = US"NO_DATA"; break;
2001       #if NO_DATA != NO_ADDRESS
2002       case NO_ADDRESS: error = US"NO_ADDRESS"; break;
2003       #endif
2004       default: error = US"?"; break;
2005       }
2006
2007     DEBUG(D_host_lookup) debug_printf("%s returned %d (%s)\n",
2008       #if HAVE_IPV6
2009         #if HAVE_GETIPNODEBYNAME
2010         (af == AF_INET6)? "getipnodebyname(af=inet6)" : "getipnodebyname(af=inet)",
2011         #else
2012         (af == AF_INET6)? "gethostbyname2(af=inet6)" : "gethostbyname2(af=inet)",
2013         #endif
2014       #else
2015       "gethostbyname",
2016       #endif
2017       error_num, error);
2018
2019     if (error_num == TRY_AGAIN || error_num == NO_RECOVERY) temp_error = TRUE;
2020     continue;
2021     }
2022   if ((hostdata->h_addr_list)[0] == NULL) continue;
2023
2024   /* Replace the name with the fully qualified one if necessary, and fill in
2025   the fully_qualified_name pointer. */
2026
2027   if (hostdata->h_name[0] != 0 &&
2028       Ustrcmp(host->name, hostdata->h_name) != 0)
2029     host->name = string_copy_dnsdomain((uschar *)hostdata->h_name);
2030   if (fully_qualified_name != NULL) *fully_qualified_name = host->name;
2031
2032   /* Get the list of addresses. IPv4 and IPv6 addresses can be distinguished
2033   by their different lengths. Scan the list, ignoring any that are to be
2034   ignored, and build a chain from the rest. */
2035
2036   ipv4_addr = hostdata->h_length == sizeof(struct in_addr);
2037
2038   for (addrlist = USS hostdata->h_addr_list; *addrlist != NULL; addrlist++)
2039     {
2040     uschar *text_address =
2041       host_ntoa(ipv4_addr? AF_INET:AF_INET6, *addrlist, NULL, NULL);
2042
2043     #ifndef STAND_ALONE
2044     if (ignore_target_hosts != NULL &&
2045         verify_check_this_host(&ignore_target_hosts, NULL, host->name,
2046           text_address, NULL) == OK)
2047       {
2048       DEBUG(D_host_lookup)
2049         debug_printf("ignored host %s [%s]\n", host->name, text_address);
2050       continue;
2051       }
2052     #endif
2053
2054     /* If this is the first address, last == NULL and we put the data in the
2055     original block. */
2056
2057     if (last == NULL)
2058       {
2059       host->address = text_address;
2060       host->port = PORT_NONE;
2061       host->status = hstatus_unknown;
2062       host->why = hwhy_unknown;
2063       host->dnssec = DS_UNK;
2064       last = host;
2065       }
2066
2067     /* Else add further host item blocks for any other addresses, keeping
2068     the order. */
2069
2070     else
2071       {
2072       host_item *next = store_get(sizeof(host_item));
2073       next->name = host->name;
2074       next->mx = host->mx;
2075       next->address = text_address;
2076       next->port = PORT_NONE;
2077       next->status = hstatus_unknown;
2078       next->why = hwhy_unknown;
2079       next->dnssec = DS_UNK;
2080       next->last_try = 0;
2081       next->next = last->next;
2082       last->next = next;
2083       last = next;
2084       }
2085     }
2086   }
2087
2088 /* If no hosts were found, the address field in the original host block will be
2089 NULL. If temp_error is set, at least one of the lookups gave a temporary error,
2090 so we pass that back. */
2091
2092 if (host->address == NULL)
2093   {
2094   uschar *msg =
2095     #ifndef STAND_ALONE
2096     (message_id[0] == 0 && smtp_in != NULL)?
2097       string_sprintf("no IP address found for host %s (during %s)", host->name,
2098           smtp_get_connection_info()) :
2099     #endif
2100     string_sprintf("no IP address found for host %s", host->name);
2101
2102   HDEBUG(D_host_lookup) debug_printf("%s\n", msg);
2103   if (temp_error) goto RETURN_AGAIN;
2104   if (host_checking || !log_testing_mode)
2105     log_write(L_host_lookup_failed, LOG_MAIN, "%s", msg);
2106   return HOST_FIND_FAILED;
2107   }
2108
2109 /* Remove any duplicate IP addresses, then check to see if this is the local
2110 host if required. */
2111
2112 host_remove_duplicates(host, &last);
2113 yield = local_host_check?
2114   host_scan_for_local_hosts(host, &last, NULL) : HOST_FOUND;
2115
2116 HDEBUG(D_host_lookup)
2117   {
2118   const host_item *h;
2119   if (fully_qualified_name != NULL)
2120     debug_printf("fully qualified name = %s\n", *fully_qualified_name);
2121   debug_printf("%s looked up these IP addresses:\n",
2122     #if HAVE_IPV6
2123       #if HAVE_GETIPNODEBYNAME
2124       "getipnodebyname"
2125       #else
2126       "gethostbyname2"
2127       #endif
2128     #else
2129     "gethostbyname"
2130     #endif
2131     );
2132   for (h = host; h != last->next; h = h->next)
2133     debug_printf("  name=%s address=%s\n", h->name,
2134       (h->address == NULL)? US"<null>" : h->address);
2135   }
2136
2137 /* Return the found status. */
2138
2139 return yield;
2140
2141 /* Handle the case when there is a temporary error. If the name matches
2142 dns_again_means_nonexist, return permanent rather than temporary failure. */
2143
2144 RETURN_AGAIN:
2145   {
2146   #ifndef STAND_ALONE
2147   int rc;
2148   const uschar *save = deliver_domain;
2149   deliver_domain = host->name;  /* set $domain */
2150   rc = match_isinlist(host->name, CUSS &dns_again_means_nonexist, 0, NULL, NULL,
2151     MCL_DOMAIN, TRUE, NULL);
2152   deliver_domain = save;
2153   if (rc == OK)
2154     {
2155     DEBUG(D_host_lookup) debug_printf("%s is in dns_again_means_nonexist: "
2156       "returning HOST_FIND_FAILED\n", host->name);
2157     return HOST_FIND_FAILED;
2158     }
2159   #endif
2160   return HOST_FIND_AGAIN;
2161   }
2162 }
2163
2164
2165
2166 /*************************************************
2167 *        Fill in a host address from the DNS     *
2168 *************************************************/
2169
2170 /* Given a host item, with its name, port and mx fields set, and its address
2171 field set to NULL, fill in its IP address from the DNS. If it is multi-homed,
2172 create additional host items for the additional addresses, copying all the
2173 other fields, and randomizing the order.
2174
2175 On IPv6 systems, A6 records are sought first (but only if support for A6 is
2176 configured - they may never become mainstream), then AAAA records are sought,
2177 and finally A records are sought as well.
2178
2179 The host name may be changed if the DNS returns a different name - e.g. fully
2180 qualified or changed via CNAME. If fully_qualified_name is not NULL, dns_lookup
2181 ensures that it points to the fully qualified name. However, this is the fully
2182 qualified version of the original name; if a CNAME is involved, the actual
2183 canonical host name may be different again, and so we get it directly from the
2184 relevant RR. Note that we do NOT change the mx field of the host item in this
2185 function as it may be called to set the addresses of hosts taken from MX
2186 records.
2187
2188 Arguments:
2189   host                  points to the host item we're filling in
2190   lastptr               points to pointer to last host item in a chain of
2191                           host items (may be updated if host is last and gets
2192                           extended because multihomed)
2193   ignore_target_hosts   list of hosts to ignore
2194   allow_ip              if TRUE, recognize an IP address and return it
2195   fully_qualified_name  if not NULL, return fully qualified name here if
2196                           the contents are different (i.e. it must be preset
2197                           to something)
2198   dnnssec_require       if TRUE check the DNS result AD bit
2199
2200 Returns:       HOST_FIND_FAILED     couldn't find A record
2201                HOST_FIND_AGAIN      try again later
2202                HOST_FOUND           found AAAA and/or A record(s)
2203                HOST_IGNORED         found, but all IPs ignored
2204 */
2205
2206 static int
2207 set_address_from_dns(host_item *host, host_item **lastptr,
2208   const uschar *ignore_target_hosts, BOOL allow_ip,
2209   const uschar **fully_qualified_name,
2210   BOOL dnssec_request, BOOL dnssec_require)
2211 {
2212 dns_record *rr;
2213 host_item *thishostlast = NULL;    /* Indicates not yet filled in anything */
2214 BOOL v6_find_again = FALSE;
2215 int i;
2216
2217 /* If allow_ip is set, a name which is an IP address returns that value
2218 as its address. This is used for MX records when allow_mx_to_ip is set, for
2219 those sites that feel they have to flaunt the RFC rules. */
2220
2221 if (allow_ip && string_is_ip_address(host->name, NULL) != 0)
2222   {
2223   #ifndef STAND_ALONE
2224   if (ignore_target_hosts != NULL &&
2225         verify_check_this_host(&ignore_target_hosts, NULL, host->name,
2226         host->name, NULL) == OK)
2227     return HOST_IGNORED;
2228   #endif
2229
2230   host->address = host->name;
2231   return HOST_FOUND;
2232   }
2233
2234 /* On an IPv6 system, unless IPv6 is disabled, go round the loop up to three
2235 times, looking for A6 and AAAA records the first two times. However, unless
2236 doing standalone testing, we force an IPv4 lookup if the domain matches
2237 dns_ipv4_lookup is set. Since A6 records look like being abandoned, support
2238 them only if explicitly configured to do so. On an IPv4 system, go round the
2239 loop once only, looking only for A records. */
2240
2241 #if HAVE_IPV6
2242   #ifndef STAND_ALONE
2243     if (disable_ipv6 || (dns_ipv4_lookup != NULL &&
2244         match_isinlist(host->name, CUSS &dns_ipv4_lookup, 0, NULL, NULL,
2245           MCL_DOMAIN, TRUE, NULL) == OK))
2246       i = 0;    /* look up A records only */
2247     else
2248   #endif        /* STAND_ALONE */
2249
2250   i = 1;        /* look up AAAA and A records */
2251
2252 /* The IPv4 world */
2253
2254 #else           /* HAVE_IPV6 */
2255   i = 0;        /* look up A records only */
2256 #endif          /* HAVE_IPV6 */
2257
2258 for (; i >= 0; i--)
2259   {
2260   static int types[] = { T_A, T_AAAA, T_A6 };
2261   int type = types[i];
2262   int randoffset = (i == 0)? 500 : 0;  /* Ensures v6 sorts before v4 */
2263   dns_answer dnsa;
2264   dns_scan dnss;
2265
2266   int rc = dns_lookup(&dnsa, host->name, type, fully_qualified_name);
2267   lookup_dnssec_authenticated = !dnssec_request ? NULL
2268     : dns_is_secure(&dnsa) ? US"yes" : US"no";
2269
2270   /* We want to return HOST_FIND_AGAIN if one of the A, A6, or AAAA lookups
2271   fails or times out, but not if another one succeeds. (In the early
2272   IPv6 days there are name servers that always fail on AAAA, but are happy
2273   to give out an A record. We want to proceed with that A record.) */
2274
2275   if (rc != DNS_SUCCEED)
2276     {
2277     if (i == 0)  /* Just tried for an A record, i.e. end of loop */
2278       {
2279       if (host->address != NULL) return HOST_FOUND;  /* A6 or AAAA was found */
2280       if (rc == DNS_AGAIN || rc == DNS_FAIL || v6_find_again)
2281         return HOST_FIND_AGAIN;
2282       return HOST_FIND_FAILED;    /* DNS_NOMATCH or DNS_NODATA */
2283       }
2284
2285     /* Tried for an A6 or AAAA record: remember if this was a temporary
2286     error, and look for the next record type. */
2287
2288     if (rc != DNS_NOMATCH && rc != DNS_NODATA) v6_find_again = TRUE;
2289     continue;
2290     }
2291
2292   if (dnssec_request)
2293     {
2294     if (dns_is_secure(&dnsa))
2295       {
2296       DEBUG(D_host_lookup) debug_printf("%s A DNSSEC\n", host->name);
2297       if (host->dnssec == DS_UNK) /* set in host_find_bydns() */
2298         host->dnssec = DS_YES;
2299       }
2300     else
2301       {
2302       if (dnssec_require)
2303         {
2304         log_write(L_host_lookup_failed, LOG_MAIN,
2305                 "dnssec fail on %s for %.256s",
2306                 i>1 ? "A6" : i>0 ? "AAAA" : "A", host->name);
2307         continue;
2308         }
2309       if (host->dnssec == DS_YES) /* set in host_find_bydns() */
2310         {
2311         DEBUG(D_host_lookup) debug_printf("%s A cancel DNSSEC\n", host->name);
2312         host->dnssec = DS_NO;
2313         lookup_dnssec_authenticated = US"no";
2314         }
2315       }
2316     }
2317
2318   /* Lookup succeeded: fill in the given host item with the first non-ignored
2319   address found; create additional items for any others. A single A6 record
2320   may generate more than one address. */
2321
2322   for (rr = dns_next_rr(&dnsa, &dnss, RESET_ANSWERS);
2323        rr != NULL;
2324        rr = dns_next_rr(&dnsa, &dnss, RESET_NEXT))
2325     {
2326     if (rr->type == type)
2327       {
2328       /* dns_address *da = dns_address_from_rr(&dnsa, rr); */
2329
2330       dns_address *da;
2331       da = dns_address_from_rr(&dnsa, rr);
2332
2333       DEBUG(D_host_lookup)
2334         {
2335         if (da == NULL)
2336           debug_printf("no addresses extracted from A6 RR for %s\n",
2337             host->name);
2338         }
2339
2340       /* This loop runs only once for A and AAAA records, but may run
2341       several times for an A6 record that generated multiple addresses. */
2342
2343       for (; da != NULL; da = da->next)
2344         {
2345         #ifndef STAND_ALONE
2346         if (ignore_target_hosts != NULL &&
2347               verify_check_this_host(&ignore_target_hosts, NULL,
2348                 host->name, da->address, NULL) == OK)
2349           {
2350           DEBUG(D_host_lookup)
2351             debug_printf("ignored host %s [%s]\n", host->name, da->address);
2352           continue;
2353           }
2354         #endif
2355
2356         /* If this is the first address, stick it in the given host block,
2357         and change the name if the returned RR has a different name. */
2358
2359         if (thishostlast == NULL)
2360           {
2361           if (strcmpic(host->name, rr->name) != 0)
2362             host->name = string_copy_dnsdomain(rr->name);
2363           host->address = da->address;
2364           host->sort_key = host->mx * 1000 + random_number(500) + randoffset;
2365           host->status = hstatus_unknown;
2366           host->why = hwhy_unknown;
2367           thishostlast = host;
2368           }
2369
2370         /* Not the first address. Check for, and ignore, duplicates. Then
2371         insert in the chain at a random point. */
2372
2373         else
2374           {
2375           int new_sort_key;
2376           host_item *next;
2377
2378           /* End of our local chain is specified by "thishostlast". */
2379
2380           for (next = host;; next = next->next)
2381             {
2382             if (Ustrcmp(CS da->address, next->address) == 0) break;
2383             if (next == thishostlast) { next = NULL; break; }
2384             }
2385           if (next != NULL) continue;  /* With loop for next address */
2386
2387           /* Not a duplicate */
2388
2389           new_sort_key = host->mx * 1000 + random_number(500) + randoffset;
2390           next = store_get(sizeof(host_item));
2391
2392           /* New address goes first: insert the new block after the first one
2393           (so as not to disturb the original pointer) but put the new address
2394           in the original block. */
2395
2396           if (new_sort_key < host->sort_key)
2397             {
2398             *next = *host;                                  /* Copies port */
2399             host->next = next;
2400             host->address = da->address;
2401             host->sort_key = new_sort_key;
2402             if (thishostlast == host) thishostlast = next;  /* Local last */
2403             if (*lastptr == host) *lastptr = next;          /* Global last */
2404             }
2405
2406           /* Otherwise scan down the addresses for this host to find the
2407           one to insert after. */
2408
2409           else
2410             {
2411             host_item *h = host;
2412             while (h != thishostlast)
2413               {
2414               if (new_sort_key < h->next->sort_key) break;
2415               h = h->next;
2416               }
2417             *next = *h;                                 /* Copies port */
2418             h->next = next;
2419             next->address = da->address;
2420             next->sort_key = new_sort_key;
2421             if (h == thishostlast) thishostlast = next; /* Local last */
2422             if (h == *lastptr) *lastptr = next;         /* Global last */
2423             }
2424           }
2425         }
2426       }
2427     }
2428   }
2429
2430 /* Control gets here only if the third lookup (the A record) succeeded.
2431 However, the address may not be filled in if it was ignored. */
2432
2433 return (host->address == NULL)? HOST_IGNORED : HOST_FOUND;
2434 }
2435
2436
2437
2438
2439 /*************************************************
2440 *    Find IP addresses and host names via DNS    *
2441 *************************************************/
2442
2443 /* The input is a host_item structure with the name field filled in and the
2444 address field set to NULL. This may be in a chain of other host items. The
2445 lookup may result in more than one IP address, in which case we must created
2446 new host blocks for the additional addresses, and insert them into the chain.
2447 The original name may not be fully qualified. Use the fully_qualified_name
2448 argument to return the official name, as returned by the resolver.
2449
2450 Arguments:
2451   host                  point to initial host item
2452   ignore_target_hosts   a list of hosts to ignore
2453   whichrrs              flags indicating which RRs to look for:
2454                           HOST_FIND_BY_SRV  => look for SRV
2455                           HOST_FIND_BY_MX   => look for MX
2456                           HOST_FIND_BY_A    => look for A or AAAA
2457                         also flags indicating how the lookup is done
2458                           HOST_FIND_QUALIFY_SINGLE   ) passed to the
2459                           HOST_FIND_SEARCH_PARENTS   )   resolver
2460   srv_service           when SRV used, the service name
2461   srv_fail_domains      DNS errors for these domains => assume nonexist
2462   mx_fail_domains       DNS errors for these domains => assume nonexist
2463   dnssec_request_domains => make dnssec request
2464   dnssec_require_domains => ditto and nonexist failures
2465   fully_qualified_name  if not NULL, return fully-qualified name
2466   removed               set TRUE if local host was removed from the list
2467
2468 Returns:                HOST_FIND_FAILED  Failed to find the host or domain;
2469                                           if there was a syntax error,
2470                                           host_find_failed_syntax is set.
2471                         HOST_FIND_AGAIN   Could not resolve at this time
2472                         HOST_FOUND        Host found
2473                         HOST_FOUND_LOCAL  The lowest MX record points to this
2474                                           machine, if MX records were found, or
2475                                           an A record that was found contains
2476                                           an address of the local host
2477 */
2478
2479 int
2480 host_find_bydns(host_item *host, const uschar *ignore_target_hosts, int whichrrs,
2481   uschar *srv_service, uschar *srv_fail_domains, uschar *mx_fail_domains,
2482   uschar *dnssec_request_domains, uschar *dnssec_require_domains,
2483   const uschar **fully_qualified_name, BOOL *removed)
2484 {
2485 host_item *h, *last;
2486 dns_record *rr;
2487 int rc = DNS_FAIL;
2488 int ind_type = 0;
2489 int yield;
2490 dns_answer dnsa;
2491 dns_scan dnss;
2492 BOOL dnssec_require = match_isinlist(host->name, CUSS &dnssec_require_domains,
2493                                     0, NULL, NULL, MCL_DOMAIN, TRUE, NULL) == OK;
2494 BOOL dnssec_request = dnssec_require
2495                     || match_isinlist(host->name, CUSS &dnssec_request_domains,
2496                                     0, NULL, NULL, MCL_DOMAIN, TRUE, NULL) == OK;
2497 dnssec_status_t dnssec;
2498
2499 /* Set the default fully qualified name to the incoming name, initialize the
2500 resolver if necessary, set up the relevant options, and initialize the flag
2501 that gets set for DNS syntax check errors. */
2502
2503 if (fully_qualified_name != NULL) *fully_qualified_name = host->name;
2504 dns_init((whichrrs & HOST_FIND_QUALIFY_SINGLE) != 0,
2505          (whichrrs & HOST_FIND_SEARCH_PARENTS) != 0,
2506          dnssec_request
2507          );
2508 host_find_failed_syntax = FALSE;
2509
2510 /* First, if requested, look for SRV records. The service name is given; we
2511 assume TCP progocol. DNS domain names are constrained to a maximum of 256
2512 characters, so the code below should be safe. */
2513
2514 if ((whichrrs & HOST_FIND_BY_SRV) != 0)
2515   {
2516   uschar buffer[300];
2517   uschar *temp_fully_qualified_name = buffer;
2518   int prefix_length;
2519
2520   (void)sprintf(CS buffer, "_%s._tcp.%n%.256s", srv_service, &prefix_length,
2521     host->name);
2522   ind_type = T_SRV;
2523
2524   /* Search for SRV records. If the fully qualified name is different to
2525   the input name, pass back the new original domain, without the prepended
2526   magic. */
2527
2528   dnssec = DS_UNK;
2529   lookup_dnssec_authenticated = NULL;
2530   rc = dns_lookup(&dnsa, buffer, ind_type, CUSS &temp_fully_qualified_name);
2531
2532   if (dnssec_request)
2533     {
2534     if (dns_is_secure(&dnsa))
2535       { dnssec = DS_YES; lookup_dnssec_authenticated = US"yes"; }
2536     else
2537       { dnssec = DS_NO; lookup_dnssec_authenticated = US"no"; }
2538     }
2539
2540   if (temp_fully_qualified_name != buffer && fully_qualified_name != NULL)
2541     *fully_qualified_name = temp_fully_qualified_name + prefix_length;
2542
2543   /* On DNS failures, we give the "try again" error unless the domain is
2544   listed as one for which we continue. */
2545
2546   if (rc == DNS_SUCCEED && dnssec_require && !dns_is_secure(&dnsa))
2547     {
2548     log_write(L_host_lookup_failed, LOG_MAIN,
2549                 "dnssec fail on SRV for %.256s", host->name);
2550     rc = DNS_FAIL;
2551     }
2552   if (rc == DNS_FAIL || rc == DNS_AGAIN)
2553     {
2554     #ifndef STAND_ALONE
2555     if (match_isinlist(host->name, CUSS &srv_fail_domains, 0, NULL, NULL,
2556         MCL_DOMAIN, TRUE, NULL) != OK)
2557     #endif
2558       { yield = HOST_FIND_AGAIN; goto out; }
2559     DEBUG(D_host_lookup) debug_printf("DNS_%s treated as DNS_NODATA "
2560       "(domain in srv_fail_domains)\n", (rc == DNS_FAIL)? "FAIL":"AGAIN");
2561     }
2562   }
2563
2564 /* If we did not find any SRV records, search the DNS for MX records, if
2565 requested to do so. If the result is DNS_NOMATCH, it means there is no such
2566 domain, and there's no point in going on to look for address records with the
2567 same domain. The result will be DNS_NODATA if the domain exists but has no MX
2568 records. On DNS failures, we give the "try again" error unless the domain is
2569 listed as one for which we continue. */
2570
2571 if (rc != DNS_SUCCEED && (whichrrs & HOST_FIND_BY_MX) != 0)
2572   {
2573   ind_type = T_MX;
2574   dnssec = DS_UNK;
2575   lookup_dnssec_authenticated = NULL;
2576   rc = dns_lookup(&dnsa, host->name, ind_type, fully_qualified_name);
2577
2578   if (dnssec_request)
2579     {
2580     if (dns_is_secure(&dnsa))
2581       { 
2582       DEBUG(D_host_lookup) debug_printf("%s MX DNSSEC\n", host->name);
2583       dnssec = DS_YES; lookup_dnssec_authenticated = US"yes";
2584       }
2585     else
2586       {
2587       dnssec = DS_NO; lookup_dnssec_authenticated = US"no";
2588       }
2589     }
2590
2591   switch (rc)
2592     {
2593     case DNS_NOMATCH:
2594       yield = HOST_FIND_FAILED; goto out;
2595
2596     case DNS_SUCCEED:
2597       if (!dnssec_require || dns_is_secure(&dnsa))
2598         break;
2599       log_write(L_host_lookup_failed, LOG_MAIN,
2600                   "dnssec fail on MX for %.256s", host->name);
2601       rc = DNS_FAIL;
2602       /*FALLTHROUGH*/
2603
2604     case DNS_FAIL:
2605     case DNS_AGAIN:
2606       #ifndef STAND_ALONE
2607       if (match_isinlist(host->name, CUSS &mx_fail_domains, 0, NULL, NULL,
2608           MCL_DOMAIN, TRUE, NULL) != OK)
2609       #endif
2610         { yield = HOST_FIND_AGAIN; goto out; }
2611       DEBUG(D_host_lookup) debug_printf("DNS_%s treated as DNS_NODATA "
2612         "(domain in mx_fail_domains)\n", (rc == DNS_FAIL)? "FAIL":"AGAIN");
2613       break;
2614     }
2615   }
2616
2617 /* If we haven't found anything yet, and we are requested to do so, try for an
2618 A or AAAA record. If we find it (or them) check to see that it isn't the local
2619 host. */
2620
2621 if (rc != DNS_SUCCEED)
2622   {
2623   if ((whichrrs & HOST_FIND_BY_A) == 0)
2624     {
2625     DEBUG(D_host_lookup) debug_printf("Address records are not being sought\n");
2626     yield = HOST_FIND_FAILED;
2627     goto out;
2628     }
2629
2630   last = host;        /* End of local chainlet */
2631   host->mx = MX_NONE;
2632   host->port = PORT_NONE;
2633   host->dnssec = DS_UNK;
2634   lookup_dnssec_authenticated = NULL;
2635   rc = set_address_from_dns(host, &last, ignore_target_hosts, FALSE,
2636     fully_qualified_name, dnssec_request, dnssec_require);
2637
2638   /* If one or more address records have been found, check that none of them
2639   are local. Since we know the host items all have their IP addresses
2640   inserted, host_scan_for_local_hosts() can only return HOST_FOUND or
2641   HOST_FOUND_LOCAL. We do not need to scan for duplicate IP addresses here,
2642   because set_address_from_dns() removes them. */
2643
2644   if (rc == HOST_FOUND)
2645     rc = host_scan_for_local_hosts(host, &last, removed);
2646   else
2647     if (rc == HOST_IGNORED) rc = HOST_FIND_FAILED;  /* No special action */
2648
2649   DEBUG(D_host_lookup)
2650     {
2651     host_item *h;
2652     if (host->address != NULL)
2653       {
2654       if (fully_qualified_name != NULL)
2655         debug_printf("fully qualified name = %s\n", *fully_qualified_name);
2656       for (h = host; h != last->next; h = h->next)
2657         debug_printf("%s %s mx=%d sort=%d %s\n", h->name,
2658           (h->address == NULL)? US"<null>" : h->address, h->mx, h->sort_key,
2659           (h->status >= hstatus_unusable)? US"*" : US"");
2660       }
2661     }
2662
2663   yield = rc;
2664   goto out;
2665   }
2666
2667 /* We have found one or more MX or SRV records. Sort them according to
2668 precedence. Put the data for the first one into the existing host block, and
2669 insert new host_item blocks into the chain for the remainder. For equal
2670 precedences one is supposed to randomize the order. To make this happen, the
2671 sorting is actually done on the MX value * 1000 + a random number. This is put
2672 into a host field called sort_key.
2673
2674 In the case of hosts with both IPv6 and IPv4 addresses, we want to choose the
2675 IPv6 address in preference. At this stage, we don't know what kind of address
2676 the host has. We choose a random number < 500; if later we find an A record
2677 first, we add 500 to the random number. Then for any other address records, we
2678 use random numbers in the range 0-499 for AAAA records and 500-999 for A
2679 records.
2680
2681 At this point we remove any duplicates that point to the same host, retaining
2682 only the one with the lowest precedence. We cannot yet check for precedence
2683 greater than that of the local host, because that test cannot be properly done
2684 until the addresses have been found - an MX record may point to a name for this
2685 host which is not the primary hostname. */
2686
2687 last = NULL;    /* Indicates that not even the first item is filled yet */
2688
2689 for (rr = dns_next_rr(&dnsa, &dnss, RESET_ANSWERS);
2690      rr != NULL;
2691      rr = dns_next_rr(&dnsa, &dnss, RESET_NEXT))
2692   {
2693   int precedence;
2694   int weight = 0;        /* For SRV records */
2695   int port = PORT_NONE;
2696   uschar *s;             /* MUST be unsigned for GETSHORT */
2697   uschar data[256];
2698
2699   if (rr->type != ind_type) continue;
2700   s = rr->data;
2701   GETSHORT(precedence, s);      /* Pointer s is advanced */
2702
2703   /* For MX records, we use a random "weight" which causes multiple records of
2704   the same precedence to sort randomly. */
2705
2706   if (ind_type == T_MX)
2707     weight = random_number(500);
2708
2709   /* SRV records are specified with a port and a weight. The weight is used
2710   in a special algorithm. However, to start with, we just use it to order the
2711   records of equal priority (precedence). */
2712
2713   else
2714     {
2715     GETSHORT(weight, s);
2716     GETSHORT(port, s);
2717     }
2718
2719   /* Get the name of the host pointed to. */
2720
2721   (void)dn_expand(dnsa.answer, dnsa.answer + dnsa.answerlen, s,
2722     (DN_EXPAND_ARG4_TYPE)data, sizeof(data));
2723
2724   /* Check that we haven't already got this host on the chain; if we have,
2725   keep only the lower precedence. This situation shouldn't occur, but you
2726   never know what junk might get into the DNS (and this case has been seen on
2727   more than one occasion). */
2728
2729   if (last != NULL)       /* This is not the first record */
2730     {
2731     host_item *prev = NULL;
2732
2733     for (h = host; h != last->next; prev = h, h = h->next)
2734       {
2735       if (strcmpic(h->name, data) == 0)
2736         {
2737         DEBUG(D_host_lookup)
2738           debug_printf("discarded duplicate host %s (MX=%d)\n", data,
2739             (precedence > h->mx)? precedence : h->mx);
2740         if (precedence >= h->mx) goto NEXT_MX_RR; /* Skip greater precedence */
2741         if (h == host)                            /* Override first item */
2742           {
2743           h->mx = precedence;
2744           host->sort_key = precedence * 1000 + weight;
2745           goto NEXT_MX_RR;
2746           }
2747
2748         /* Unwanted host item is not the first in the chain, so we can get
2749         get rid of it by cutting it out. */
2750
2751         prev->next = h->next;
2752         if (h == last) last = prev;
2753         break;
2754         }
2755       }
2756     }
2757
2758   /* If this is the first MX or SRV record, put the data into the existing host
2759   block. Otherwise, add a new block in the correct place; if it has to be
2760   before the first block, copy the first block's data to a new second block. */
2761
2762   if (last == NULL)
2763     {
2764     host->name = string_copy_dnsdomain(data);
2765     host->address = NULL;
2766     host->port = port;
2767     host->mx = precedence;
2768     host->sort_key = precedence * 1000 + weight;
2769     host->status = hstatus_unknown;
2770     host->why = hwhy_unknown;
2771     host->dnssec = dnssec;
2772     last = host;
2773     }
2774
2775   /* Make a new host item and seek the correct insertion place */
2776
2777   else
2778     {
2779     int sort_key = precedence * 1000 + weight;
2780     host_item *next = store_get(sizeof(host_item));
2781     next->name = string_copy_dnsdomain(data);
2782     next->address = NULL;
2783     next->port = port;
2784     next->mx = precedence;
2785     next->sort_key = sort_key;
2786     next->status = hstatus_unknown;
2787     next->why = hwhy_unknown;
2788     next->dnssec = dnssec;
2789     next->last_try = 0;
2790
2791     /* Handle the case when we have to insert before the first item. */
2792
2793     if (sort_key < host->sort_key)
2794       {
2795       host_item htemp;
2796       htemp = *host;
2797       *host = *next;
2798       *next = htemp;
2799       host->next = next;
2800       if (last == host) last = next;
2801       }
2802
2803     /* Else scan down the items we have inserted as part of this exercise;
2804     don't go further. */
2805
2806     else
2807       {
2808       for (h = host; h != last; h = h->next)
2809         {
2810         if (sort_key < h->next->sort_key)
2811           {
2812           next->next = h->next;
2813           h->next = next;
2814           break;
2815           }
2816         }
2817
2818       /* Join on after the last host item that's part of this
2819       processing if we haven't stopped sooner. */
2820
2821       if (h == last)
2822         {
2823         next->next = last->next;
2824         last->next = next;
2825         last = next;
2826         }
2827       }
2828     }
2829
2830   NEXT_MX_RR: continue;
2831   }
2832
2833 /* If the list of hosts was obtained from SRV records, there are two things to
2834 do. First, if there is only one host, and it's name is ".", it means there is
2835 no SMTP service at this domain. Otherwise, we have to sort the hosts of equal
2836 priority according to their weights, using an algorithm that is defined in RFC
2837 2782. The hosts are currently sorted by priority and weight. For each priority
2838 group we have to pick off one host and put it first, and then repeat for any
2839 remaining in the same priority group. */
2840
2841 if (ind_type == T_SRV)
2842   {
2843   host_item **pptr;
2844
2845   if (host == last && host->name[0] == 0)
2846     {
2847     DEBUG(D_host_lookup) debug_printf("the single SRV record is \".\"\n");
2848     yield = HOST_FIND_FAILED;
2849     goto out;
2850     }
2851
2852   DEBUG(D_host_lookup)
2853     {
2854     debug_printf("original ordering of hosts from SRV records:\n");
2855     for (h = host; h != last->next; h = h->next)
2856       debug_printf("  %s P=%d W=%d\n", h->name, h->mx, h->sort_key % 1000);
2857     }
2858
2859   for (pptr = &host, h = host; h != last; pptr = &(h->next), h = h->next)
2860     {
2861     int sum = 0;
2862     host_item *hh;
2863
2864     /* Find the last following host that has the same precedence. At the same
2865     time, compute the sum of the weights and the running totals. These can be
2866     stored in the sort_key field. */
2867
2868     for (hh = h; hh != last; hh = hh->next)
2869       {
2870       int weight = hh->sort_key % 1000;   /* was precedence * 1000 + weight */
2871       sum += weight;
2872       hh->sort_key = sum;
2873       if (hh->mx != hh->next->mx) break;
2874       }
2875
2876     /* If there's more than one host at this precedence (priority), we need to
2877     pick one to go first. */
2878
2879     if (hh != h)
2880       {
2881       host_item *hhh;
2882       host_item **ppptr;
2883       int randomizer = random_number(sum + 1);
2884
2885       for (ppptr = pptr, hhh = h;
2886            hhh != hh;
2887            ppptr = &(hhh->next), hhh = hhh->next)
2888         {
2889         if (hhh->sort_key >= randomizer) break;
2890         }
2891
2892       /* hhh now points to the host that should go first; ppptr points to the
2893       place that points to it. Unfortunately, if the start of the minilist is
2894       the start of the entire list, we can't just swap the items over, because
2895       we must not change the value of host, since it is passed in from outside.
2896       One day, this could perhaps be changed.
2897
2898       The special case is fudged by putting the new item *second* in the chain,
2899       and then transferring the data between the first and second items. We
2900       can't just swap the first and the chosen item, because that would mean
2901       that an item with zero weight might no longer be first. */
2902
2903       if (hhh != h)
2904         {
2905         *ppptr = hhh->next;          /* Cuts it out of the chain */
2906
2907         if (h == host)
2908           {
2909           host_item temp = *h;
2910           *h = *hhh;
2911           *hhh = temp;
2912           hhh->next = temp.next;
2913           h->next = hhh;
2914           }
2915
2916         else
2917           {
2918           hhh->next = h;               /* The rest of the chain follows it */
2919           *pptr = hhh;                 /* It takes the place of h */
2920           h = hhh;                     /* It's now the start of this minilist */
2921           }
2922         }
2923       }
2924
2925     /* A host has been chosen to be first at this priority and h now points
2926     to this host. There may be others at the same priority, or others at a
2927     different priority. Before we leave this host, we need to put back a sort
2928     key of the traditional MX kind, in case this host is multihomed, because
2929     the sort key is used for ordering the multiple IP addresses. We do not need
2930     to ensure that these new sort keys actually reflect the order of the hosts,
2931     however. */
2932
2933     h->sort_key = h->mx * 1000 + random_number(500);
2934     }   /* Move on to the next host */
2935   }
2936
2937 /* Now we have to find IP addresses for all the hosts. We have ensured above
2938 that the names in all the host items are unique. Before release 4.61 we used to
2939 process records from the additional section in the DNS packet that returned the
2940 MX or SRV records. However, a DNS name server is free to drop any resource
2941 records from the additional section. In theory, this has always been a
2942 potential problem, but it is exacerbated by the advent of IPv6. If a host had
2943 several IPv4 addresses and some were not in the additional section, at least
2944 Exim would try the others. However, if a host had both IPv4 and IPv6 addresses
2945 and all the IPv4 (say) addresses were absent, Exim would try only for a IPv6
2946 connection, and never try an IPv4 address. When there was only IPv4
2947 connectivity, this was a disaster that did in practice occur.
2948
2949 So, from release 4.61 onwards, we always search for A and AAAA records
2950 explicitly. The names shouldn't point to CNAMES, but we use the general lookup
2951 function that handles them, just in case. If any lookup gives a soft error,
2952 change the default yield.
2953
2954 For these DNS lookups, we must disable qualify_single and search_parents;
2955 otherwise invalid host names obtained from MX or SRV records can cause trouble
2956 if they happen to match something local. */
2957
2958 yield = HOST_FIND_FAILED;    /* Default yield */
2959 dns_init(FALSE, FALSE,       /* Disable qualify_single and search_parents */
2960          dnssec_request || dnssec_require);
2961
2962 for (h = host; h != last->next; h = h->next)
2963   {
2964   if (h->address != NULL) continue;  /* Inserted by a multihomed host */
2965   rc = set_address_from_dns(h, &last, ignore_target_hosts, allow_mx_to_ip,
2966     NULL, dnssec_request, dnssec_require);
2967   if (rc != HOST_FOUND)
2968     {
2969     h->status = hstatus_unusable;
2970     if (rc == HOST_FIND_AGAIN)
2971       {
2972       yield = rc;
2973       h->why = hwhy_deferred;
2974       }
2975     else
2976       h->why = (rc == HOST_IGNORED)? hwhy_ignored : hwhy_failed;
2977     }
2978   }
2979
2980 /* Scan the list for any hosts that are marked unusable because they have
2981 been explicitly ignored, and remove them from the list, as if they did not
2982 exist. If we end up with just a single, ignored host, flatten its fields as if
2983 nothing was found. */
2984
2985 if (ignore_target_hosts != NULL)
2986   {
2987   host_item *prev = NULL;
2988   for (h = host; h != last->next; h = h->next)
2989     {
2990     REDO:
2991     if (h->why != hwhy_ignored)        /* Non ignored host, just continue */
2992       prev = h;
2993     else if (prev == NULL)             /* First host is ignored */
2994       {
2995       if (h != last)                   /* First is not last */
2996         {
2997         if (h->next == last) last = h; /* Overwrite it with next */
2998         *h = *(h->next);               /* and reprocess it. */
2999         goto REDO;                     /* C should have redo, like Perl */
3000         }
3001       }
3002     else                               /* Ignored host is not first - */
3003       {                                /*   cut it out */
3004       prev->next = h->next;
3005       if (h == last) last = prev;
3006       }
3007     }
3008
3009   if (host->why == hwhy_ignored) host->address = NULL;
3010   }
3011
3012 /* There is still one complication in the case of IPv6. Although the code above
3013 arranges that IPv6 addresses take precedence over IPv4 addresses for multihomed
3014 hosts, it doesn't do this for addresses that apply to different hosts with the
3015 same MX precedence, because the sorting on MX precedence happens first. So we
3016 have to make another pass to check for this case. We ensure that, within a
3017 single MX preference value, IPv6 addresses come first. This can separate the
3018 addresses of a multihomed host, but that should not matter. */
3019
3020 #if HAVE_IPV6
3021 if (h != last && !disable_ipv6)
3022   {
3023   for (h = host; h != last; h = h->next)
3024     {
3025     host_item temp;
3026     host_item *next = h->next;
3027     if (h->mx != next->mx ||                   /* If next is different MX */
3028         h->address == NULL ||                  /* OR this one is unset */
3029         Ustrchr(h->address, ':') != NULL ||    /* OR this one is IPv6 */
3030         (next->address != NULL &&
3031          Ustrchr(next->address, ':') == NULL)) /* OR next is IPv4 */
3032       continue;                                /* move on to next */
3033     temp = *h;                                 /* otherwise, swap */
3034     temp.next = next->next;
3035     *h = *next;
3036     h->next = next;
3037     *next = temp;
3038     }
3039   }
3040 #endif
3041
3042 /* Remove any duplicate IP addresses and then scan the list of hosts for any
3043 whose IP addresses are on the local host. If any are found, all hosts with the
3044 same or higher MX values are removed. However, if the local host has the lowest
3045 numbered MX, then HOST_FOUND_LOCAL is returned. Otherwise, if at least one host
3046 with an IP address is on the list, HOST_FOUND is returned. Otherwise,
3047 HOST_FIND_FAILED is returned, but in this case do not update the yield, as it
3048 might have been set to HOST_FIND_AGAIN just above here. If not, it will already
3049 be HOST_FIND_FAILED. */
3050
3051 host_remove_duplicates(host, &last);
3052 rc = host_scan_for_local_hosts(host, &last, removed);
3053 if (rc != HOST_FIND_FAILED) yield = rc;
3054
3055 DEBUG(D_host_lookup)
3056   {
3057   if (fully_qualified_name != NULL)
3058     debug_printf("fully qualified name = %s\n", *fully_qualified_name);
3059   debug_printf("host_find_bydns yield = %s (%d); returned hosts:\n",
3060     (yield == HOST_FOUND)? "HOST_FOUND" :
3061     (yield == HOST_FOUND_LOCAL)? "HOST_FOUND_LOCAL" :
3062     (yield == HOST_FIND_AGAIN)? "HOST_FIND_AGAIN" :
3063     (yield == HOST_FIND_FAILED)? "HOST_FIND_FAILED" : "?",
3064     yield);
3065   for (h = host; h != last->next; h = h->next)
3066     {
3067     debug_printf("  %s %s MX=%d %s", h->name,
3068       !h->address ? US"<null>" : h->address, h->mx,
3069       h->dnssec == DS_YES ? US"DNSSEC " : US"");
3070     if (h->port != PORT_NONE) debug_printf("port=%d ", h->port);
3071     if (h->status >= hstatus_unusable) debug_printf("*");
3072     debug_printf("\n");
3073     }
3074   }
3075
3076 out:
3077
3078 dns_init(FALSE, FALSE, FALSE);  /* clear the dnssec bit for getaddrbyname */
3079 return yield;
3080 }
3081
3082
3083
3084
3085 /*************************************************
3086 **************************************************
3087 *             Stand-alone test program           *
3088 **************************************************
3089 *************************************************/
3090
3091 #ifdef STAND_ALONE
3092
3093 int main(int argc, char **cargv)
3094 {
3095 host_item h;
3096 int whichrrs = HOST_FIND_BY_MX | HOST_FIND_BY_A;
3097 BOOL byname = FALSE;
3098 BOOL qualify_single = TRUE;
3099 BOOL search_parents = FALSE;
3100 BOOL request_dnssec = FALSE;
3101 BOOL require_dnssec = FALSE;
3102 uschar **argv = USS cargv;
3103 uschar buffer[256];
3104
3105 disable_ipv6 = FALSE;
3106 primary_hostname = US"";
3107 store_pool = POOL_MAIN;
3108 debug_selector = D_host_lookup|D_interface;
3109 debug_file = stdout;
3110 debug_fd = fileno(debug_file);
3111
3112 printf("Exim stand-alone host functions test\n");
3113
3114 host_find_interfaces();
3115 debug_selector = D_host_lookup | D_dns;
3116
3117 if (argc > 1) primary_hostname = argv[1];
3118
3119 /* So that debug level changes can be done first */
3120
3121 dns_init(qualify_single, search_parents, FALSE);
3122
3123 printf("Testing host lookup\n");
3124 printf("> ");
3125 while (Ufgets(buffer, 256, stdin) != NULL)
3126   {
3127   int rc;
3128   int len = Ustrlen(buffer);
3129   uschar *fully_qualified_name;
3130
3131   while (len > 0 && isspace(buffer[len-1])) len--;
3132   buffer[len] = 0;
3133
3134   if (Ustrcmp(buffer, "q") == 0) break;
3135
3136   if (Ustrcmp(buffer, "byname") == 0) byname = TRUE;
3137   else if (Ustrcmp(buffer, "no_byname") == 0) byname = FALSE;
3138   else if (Ustrcmp(buffer, "a_only") == 0) whichrrs = HOST_FIND_BY_A;
3139   else if (Ustrcmp(buffer, "mx_only") == 0) whichrrs = HOST_FIND_BY_MX;
3140   else if (Ustrcmp(buffer, "srv_only") == 0) whichrrs = HOST_FIND_BY_SRV;
3141   else if (Ustrcmp(buffer, "srv+a") == 0)
3142     whichrrs = HOST_FIND_BY_SRV | HOST_FIND_BY_A;
3143   else if (Ustrcmp(buffer, "srv+mx") == 0)
3144     whichrrs = HOST_FIND_BY_SRV | HOST_FIND_BY_MX;
3145   else if (Ustrcmp(buffer, "srv+mx+a") == 0)
3146     whichrrs = HOST_FIND_BY_SRV | HOST_FIND_BY_MX | HOST_FIND_BY_A;
3147   else if (Ustrcmp(buffer, "qualify_single")    == 0) qualify_single = TRUE;
3148   else if (Ustrcmp(buffer, "no_qualify_single") == 0) qualify_single = FALSE;
3149   else if (Ustrcmp(buffer, "search_parents")    == 0) search_parents = TRUE;
3150   else if (Ustrcmp(buffer, "no_search_parents") == 0) search_parents = FALSE;
3151   else if (Ustrcmp(buffer, "request_dnssec")    == 0) request_dnssec = TRUE;
3152   else if (Ustrcmp(buffer, "no_request_dnssec") == 0) request_dnssec = FALSE;
3153   else if (Ustrcmp(buffer, "require_dnssec")    == 0) require_dnssec = TRUE;
3154   else if (Ustrcmp(buffer, "no_reqiret_dnssec") == 0) require_dnssec = FALSE;
3155   else if (Ustrcmp(buffer, "test_harness") == 0)
3156     running_in_test_harness = !running_in_test_harness;
3157   else if (Ustrcmp(buffer, "ipv6") == 0) disable_ipv6 = !disable_ipv6;
3158   else if (Ustrcmp(buffer, "res_debug") == 0)
3159     {
3160     _res.options ^= RES_DEBUG;
3161     }
3162   else if (Ustrncmp(buffer, "retrans", 7) == 0)
3163     {
3164     (void)sscanf(CS(buffer+8), "%d", &dns_retrans);
3165     _res.retrans = dns_retrans;
3166     }
3167   else if (Ustrncmp(buffer, "retry", 5) == 0)
3168     {
3169     (void)sscanf(CS(buffer+6), "%d", &dns_retry);
3170     _res.retry = dns_retry;
3171     }
3172   else
3173     {
3174     int flags = whichrrs;
3175
3176     h.name = buffer;
3177     h.next = NULL;
3178     h.mx = MX_NONE;
3179     h.port = PORT_NONE;
3180     h.status = hstatus_unknown;
3181     h.why = hwhy_unknown;
3182     h.address = NULL;
3183
3184     if (qualify_single) flags |= HOST_FIND_QUALIFY_SINGLE;
3185     if (search_parents) flags |= HOST_FIND_SEARCH_PARENTS;
3186
3187     rc = byname
3188       ? host_find_byname(&h, NULL, flags, &fully_qualified_name, TRUE)
3189       : host_find_bydns(&h, NULL, flags, US"smtp", NULL, NULL,
3190                         request_dnssec ? &h.name : NULL,
3191                         require_dnssec ? &h.name : NULL,
3192                         &fully_qualified_name, NULL);
3193
3194     if (rc == HOST_FIND_FAILED) printf("Failed\n");
3195       else if (rc == HOST_FIND_AGAIN) printf("Again\n");
3196         else if (rc == HOST_FOUND_LOCAL) printf("Local\n");
3197     }
3198
3199   printf("\n> ");
3200   }
3201
3202 printf("Testing host_aton\n");
3203 printf("> ");
3204 while (Ufgets(buffer, 256, stdin) != NULL)
3205   {
3206   int i;
3207   int x[4];
3208   int len = Ustrlen(buffer);
3209
3210   while (len > 0 && isspace(buffer[len-1])) len--;
3211   buffer[len] = 0;
3212
3213   if (Ustrcmp(buffer, "q") == 0) break;
3214
3215   len = host_aton(buffer, x);
3216   printf("length = %d ", len);
3217   for (i = 0; i < len; i++)
3218     {
3219     printf("%04x ", (x[i] >> 16) & 0xffff);
3220     printf("%04x ", x[i] & 0xffff);
3221     }
3222   printf("\n> ");
3223   }
3224
3225 printf("\n");
3226
3227 printf("Testing host_name_lookup\n");
3228 printf("> ");
3229 while (Ufgets(buffer, 256, stdin) != NULL)
3230   {
3231   int len = Ustrlen(buffer);
3232   while (len > 0 && isspace(buffer[len-1])) len--;
3233   buffer[len] = 0;
3234   if (Ustrcmp(buffer, "q") == 0) break;
3235   sender_host_address = buffer;
3236   sender_host_name = NULL;
3237   sender_host_aliases = NULL;
3238   host_lookup_msg = US"";
3239   host_lookup_failed = FALSE;
3240   if (host_name_lookup() == FAIL)  /* Debug causes printing */
3241     printf("Lookup failed:%s\n", host_lookup_msg);
3242   printf("\n> ");
3243   }
3244
3245 printf("\n");
3246
3247 return 0;
3248 }
3249 #endif  /* STAND_ALONE */
3250
3251 /* vi: aw ai sw=2
3252 */
3253 /* End of host.c */