Increase buffer size used for DNS responses. Bug 2329
[exim.git] / src / src / dns.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) University of Cambridge 1995 - 2018 */
6 /* See the file NOTICE for conditions of use and distribution. */
7
8 /* Functions for interfacing with the DNS. */
9
10 #include "exim.h"
11
12
13
14 /*************************************************
15 *               Fake DNS resolver                *
16 *************************************************/
17
18 /* This function is called instead of res_search() when Exim is running in its
19 test harness. It recognizes some special domain names, and uses them to force
20 failure and retry responses (optionally with a delay). Otherwise, it calls an
21 external utility that mocks-up a nameserver, if it can find the utility.
22 If not, it passes its arguments on to res_search(). The fake nameserver may
23 also return a code specifying that the name should be passed on.
24
25 Background: the original test suite required a real nameserver to carry the
26 test zones, whereas the new test suite has the fake server for portability. This
27 code supports both.
28
29 Arguments:
30   domain      the domain name
31   type        the DNS record type
32   answerptr   where to put the answer
33   size        size of the answer area
34
35 Returns:      length of returned data, or -1 on error (h_errno set)
36 */
37
38 static int
39 fakens_search(const uschar *domain, int type, uschar *answerptr, int size)
40 {
41 int len = Ustrlen(domain);
42 int asize = size;                  /* Locally modified */
43 uschar name[256];
44 uschar utilname[256];
45 uschar *aptr = answerptr;          /* Locally modified */
46 struct stat statbuf;
47
48 /* Remove terminating dot. */
49
50 if (domain[len - 1] == '.') len--;
51 Ustrncpy(name, domain, len);
52 name[len] = 0;
53
54 /* Look for the fakens utility, and if it exists, call it. */
55
56 (void)string_format(utilname, sizeof(utilname), "%s/bin/fakens",
57   config_main_directory);
58
59 if (stat(CS utilname, &statbuf) >= 0)
60   {
61   pid_t pid;
62   int infd, outfd, rc;
63   uschar *argv[5];
64
65   DEBUG(D_dns) debug_printf("DNS lookup of %s (%s) using fakens\n", name, dns_text_type(type));
66
67   argv[0] = utilname;
68   argv[1] = config_main_directory;
69   argv[2] = name;
70   argv[3] = dns_text_type(type);
71   argv[4] = NULL;
72
73   pid = child_open(argv, NULL, 0000, &infd, &outfd, FALSE);
74   if (pid < 0)
75     log_write(0, LOG_MAIN|LOG_PANIC_DIE, "failed to run fakens: %s",
76       strerror(errno));
77
78   len = 0;
79   rc = -1;
80   while (asize > 0 && (rc = read(outfd, aptr, asize)) > 0)
81     {
82     len += rc;
83     aptr += rc;       /* Don't modify the actual arguments, because they */
84     asize -= rc;      /* may need to be passed on to res_search(). */
85     }
86
87   /* If we ran out of output buffer before exhausting the return,
88   carry on reading and counting it. */
89
90   if (asize == 0)
91     while ((rc = read(outfd, name, sizeof(name))) > 0)
92       len += rc;
93
94   if (rc < 0)
95     log_write(0, LOG_MAIN|LOG_PANIC_DIE, "read from fakens failed: %s",
96       strerror(errno));
97
98   switch(child_close(pid, 0))
99     {
100     case 0: return len;
101     case 1: h_errno = HOST_NOT_FOUND; return -1;
102     case 2: h_errno = TRY_AGAIN; return -1;
103     default:
104     case 3: h_errno = NO_RECOVERY; return -1;
105     case 4: h_errno = NO_DATA; return -1;
106     case 5: /* Pass on to res_search() */
107     DEBUG(D_dns) debug_printf("fakens returned PASS_ON\n");
108     }
109   }
110 else
111   {
112   DEBUG(D_dns) debug_printf("fakens (%s) not found\n", utilname);
113   }
114
115 /* fakens utility not found, or it returned "pass on" */
116
117 DEBUG(D_dns) debug_printf("passing %s on to res_search()\n", domain);
118
119 return res_search(CS domain, C_IN, type, answerptr, size);
120 }
121
122
123
124 /*************************************************
125 *        Initialize and configure resolver       *
126 *************************************************/
127
128 /* Initialize the resolver and the storage for holding DNS answers if this is
129 the first time we have been here, and set the resolver options.
130
131 Arguments:
132   qualify_single    TRUE to set the RES_DEFNAMES option
133   search_parents    TRUE to set the RES_DNSRCH option
134   use_dnssec        TRUE to set the RES_USE_DNSSEC option
135
136 Returns:            nothing
137 */
138
139 void
140 dns_init(BOOL qualify_single, BOOL search_parents, BOOL use_dnssec)
141 {
142 res_state resp = os_get_dns_resolver_res();
143
144 if ((resp->options & RES_INIT) == 0)
145   {
146   DEBUG(D_resolver) resp->options |= RES_DEBUG;     /* For Cygwin */
147   os_put_dns_resolver_res(resp);
148   res_init();
149   DEBUG(D_resolver) resp->options |= RES_DEBUG;
150   os_put_dns_resolver_res(resp);
151   }
152
153 resp->options &= ~(RES_DNSRCH | RES_DEFNAMES);
154 resp->options |= (qualify_single? RES_DEFNAMES : 0) |
155                 (search_parents? RES_DNSRCH : 0);
156 if (dns_retrans > 0) resp->retrans = dns_retrans;
157 if (dns_retry > 0) resp->retry = dns_retry;
158
159 #ifdef RES_USE_EDNS0
160 if (dns_use_edns0 >= 0)
161   {
162   if (dns_use_edns0)
163     resp->options |= RES_USE_EDNS0;
164   else
165     resp->options &= ~RES_USE_EDNS0;
166   DEBUG(D_resolver)
167     debug_printf("Coerced resolver EDNS0 support %s.\n",
168         dns_use_edns0 ? "on" : "off");
169   }
170 #else
171 if (dns_use_edns0 >= 0)
172   DEBUG(D_resolver)
173     debug_printf("Unable to %sset EDNS0 without resolver support.\n",
174         dns_use_edns0 ? "" : "un");
175 #endif
176
177 #ifndef DISABLE_DNSSEC
178 # ifdef RES_USE_DNSSEC
179 #  ifndef RES_USE_EDNS0
180 #   error Have RES_USE_DNSSEC but not RES_USE_EDNS0?  Something hinky ...
181 #  endif
182 if (use_dnssec)
183   resp->options |= RES_USE_DNSSEC;
184 if (dns_dnssec_ok >= 0)
185   {
186   if (dns_use_edns0 == 0 && dns_dnssec_ok != 0)
187     {
188     DEBUG(D_resolver)
189       debug_printf("CONFLICT: dns_use_edns0 forced false, dns_dnssec_ok forced true, ignoring latter!\n");
190     }
191   else
192     {
193     if (dns_dnssec_ok)
194       resp->options |= RES_USE_DNSSEC;
195     else
196       resp->options &= ~RES_USE_DNSSEC;
197     DEBUG(D_resolver) debug_printf("Coerced resolver DNSSEC support %s.\n",
198         dns_dnssec_ok ? "on" : "off");
199     }
200   }
201 # else
202 if (dns_dnssec_ok >= 0)
203   DEBUG(D_resolver)
204     debug_printf("Unable to %sset DNSSEC without resolver support.\n",
205         dns_dnssec_ok ? "" : "un");
206 if (use_dnssec)
207   DEBUG(D_resolver)
208     debug_printf("Unable to set DNSSEC without resolver support.\n");
209 # endif
210 #endif /* DISABLE_DNSSEC */
211
212 os_put_dns_resolver_res(resp);
213 }
214
215
216
217 /*************************************************
218 *       Build key name for PTR records           *
219 *************************************************/
220
221 /* This function inverts an IP address and adds the relevant domain, to produce
222 a name that can be used to look up PTR records.
223
224 Arguments:
225   string     the IP address as a string
226   buffer     a suitable buffer, long enough to hold the result
227
228 Returns:     nothing
229 */
230
231 void
232 dns_build_reverse(const uschar *string, uschar *buffer)
233 {
234 const uschar *p = string + Ustrlen(string);
235 uschar *pp = buffer;
236
237 /* Handle IPv4 address */
238
239 #if HAVE_IPV6
240 if (Ustrchr(string, ':') == NULL)
241 #endif
242   {
243   int i;
244   for (i = 0; i < 4; i++)
245     {
246     const uschar *ppp = p;
247     while (ppp > string && ppp[-1] != '.') ppp--;
248     Ustrncpy(pp, ppp, p - ppp);
249     pp += p - ppp;
250     *pp++ = '.';
251     p = ppp - 1;
252     }
253   Ustrcpy(pp, "in-addr.arpa");
254   }
255
256 /* Handle IPv6 address; convert to binary so as to fill out any
257 abbreviation in the textual form. */
258
259 #if HAVE_IPV6
260 else
261   {
262   int i;
263   int v6[4];
264   (void)host_aton(string, v6);
265
266   /* The original specification for IPv6 reverse lookup was to invert each
267   nibble, and look in the ip6.int domain. The domain was subsequently
268   changed to ip6.arpa. */
269
270   for (i = 3; i >= 0; i--)
271     {
272     int j;
273     for (j = 0; j < 32; j += 4)
274       pp += sprintf(CS pp, "%x.", (v6[i] >> j) & 15);
275     }
276   Ustrcpy(pp, "ip6.arpa.");
277
278   /* Another way of doing IPv6 reverse lookups was proposed in conjunction
279   with A6 records. However, it fell out of favour when they did. The
280   alternative was to construct a binary key, and look in ip6.arpa. I tried
281   to make this code do that, but I could not make it work on Solaris 8. The
282   resolver seems to lose the initial backslash somehow. However, now that
283   this style of reverse lookup has been dropped, it doesn't matter. These
284   lines are left here purely for historical interest. */
285
286   /**************************************************
287   Ustrcpy(pp, "\\[x");
288   pp += 3;
289
290   for (i = 0; i < 4; i++)
291     {
292     sprintf(pp, "%08X", v6[i]);
293     pp += 8;
294     }
295   Ustrcpy(pp, "].ip6.arpa.");
296   **************************************************/
297
298   }
299 #endif
300 }
301
302
303
304
305 /* Increment the aptr in dnss, checking against dnsa length.
306 Return: TRUE for a bad result
307 */
308 static BOOL
309 dnss_inc_aptr(const dns_answer * dnsa, dns_scan * dnss, unsigned delta)
310 {
311 return (dnss->aptr += delta) >= dnsa->answer + dnsa->answerlen;
312 }
313
314 /*************************************************
315 *       Get next DNS record from answer block    *
316 *************************************************/
317
318 /* Call this with reset == RESET_ANSWERS to scan the answer block, reset ==
319 RESET_AUTHORITY to scan the authority records, reset == RESET_ADDITIONAL to
320 scan the additional records, and reset == RESET_NEXT to get the next record.
321 The result is in static storage which must be copied if it is to be preserved.
322
323 Arguments:
324   dnsa      pointer to dns answer block
325   dnss      pointer to dns scan block
326   reset     option specifying what portion to scan, as described above
327
328 Returns:    next dns record, or NULL when no more
329 */
330
331 dns_record *
332 dns_next_rr(const dns_answer *dnsa, dns_scan *dnss, int reset)
333 {
334 const HEADER * h = (const HEADER *)dnsa->answer;
335 int namelen;
336
337 char * trace = NULL;
338 #ifdef rr_trace
339 # define TRACE DEBUG(D_dns)
340 #else
341 trace = trace;
342 # define TRACE if (FALSE)
343 #endif
344
345 /* Reset the saved data when requested to, and skip to the first required RR */
346
347 if (reset != RESET_NEXT)
348   {
349   dnss->rrcount = ntohs(h->qdcount);
350   TRACE debug_printf("%s: reset (Q rrcount %d)\n", __FUNCTION__, dnss->rrcount);
351   dnss->aptr = dnsa->answer + sizeof(HEADER);
352
353   /* Skip over questions; failure to expand the name just gives up */
354
355   while (dnss->rrcount-- > 0)
356     {
357     TRACE trace = "Q-namelen";
358     namelen = dn_expand(dnsa->answer, dnsa->answer + dnsa->answerlen,
359       dnss->aptr, (DN_EXPAND_ARG4_TYPE) &dnss->srr.name, DNS_MAXNAME);
360     if (namelen < 0) goto null_return;
361     /* skip name & type & class */
362     TRACE trace = "Q-skip";
363     if (dnss_inc_aptr(dnsa, dnss, namelen+4)) goto null_return;
364     }
365
366   /* Get the number of answer records. */
367
368   dnss->rrcount = ntohs(h->ancount);
369   TRACE debug_printf("%s: reset (A rrcount %d)\n", __FUNCTION__, dnss->rrcount);
370
371   /* Skip over answers if we want to look at the authority section. Also skip
372   the NS records (i.e. authority section) if wanting to look at the additional
373   records. */
374
375   if (reset == RESET_ADDITIONAL)
376     {
377     TRACE debug_printf("%s: additional\n", __FUNCTION__);
378     dnss->rrcount += ntohs(h->nscount);
379     TRACE debug_printf("%s: reset (NS rrcount %d)\n", __FUNCTION__, dnss->rrcount);
380     }
381
382   if (reset == RESET_AUTHORITY || reset == RESET_ADDITIONAL)
383     {
384     TRACE if (reset == RESET_AUTHORITY)
385       debug_printf("%s: authority\n", __FUNCTION__);
386     while (dnss->rrcount-- > 0)
387       {
388       TRACE trace = "A-namelen";
389       namelen = dn_expand(dnsa->answer, dnsa->answer + dnsa->answerlen,
390         dnss->aptr, (DN_EXPAND_ARG4_TYPE) &dnss->srr.name, DNS_MAXNAME);
391       if (namelen < 0) goto null_return;
392       /* skip name, type, class & TTL */
393       TRACE trace = "A-hdr";
394       if (dnss_inc_aptr(dnsa, dnss, namelen+8)) goto null_return;
395       GETSHORT(dnss->srr.size, dnss->aptr); /* size of data portion */
396       /* skip over it */
397       TRACE trace = "A-skip";
398       if (dnss_inc_aptr(dnsa, dnss, dnss->srr.size)) goto null_return;
399       }
400     dnss->rrcount = reset == RESET_AUTHORITY
401       ? ntohs(h->nscount) : ntohs(h->arcount);
402     TRACE debug_printf("%s: reset (%s rrcount %d)\n", __FUNCTION__,
403       reset == RESET_AUTHORITY ? "NS" : "AR", dnss->rrcount);
404     }
405   TRACE debug_printf("%s: %d RRs to read\n", __FUNCTION__, dnss->rrcount);
406   }
407 else
408   TRACE debug_printf("%s: next (%d left)\n", __FUNCTION__, dnss->rrcount);
409
410 /* The variable dnss->aptr is now pointing at the next RR, and dnss->rrcount
411 contains the number of RR records left. */
412
413 if (dnss->rrcount-- <= 0) return NULL;
414
415 /* If expanding the RR domain name fails, behave as if no more records
416 (something safe). */
417
418 TRACE trace = "R-namelen";
419 namelen = dn_expand(dnsa->answer, dnsa->answer + dnsa->answerlen, dnss->aptr,
420   (DN_EXPAND_ARG4_TYPE) &dnss->srr.name, DNS_MAXNAME);
421 if (namelen < 0) goto null_return;
422
423 /* Move the pointer past the name and fill in the rest of the data structure
424 from the following bytes. */
425
426 TRACE trace = "R-name";
427 if (dnss_inc_aptr(dnsa, dnss, namelen)) goto null_return;
428
429 GETSHORT(dnss->srr.type, dnss->aptr);           /* Record type */
430 TRACE trace = "R-class";
431 if (dnss_inc_aptr(dnsa, dnss, 2)) goto null_return;     /* Don't want class */
432 GETLONG(dnss->srr.ttl, dnss->aptr);             /* TTL */
433 GETSHORT(dnss->srr.size, dnss->aptr);           /* Size of data portion */
434 dnss->srr.data = dnss->aptr;                    /* The record's data follows */
435
436 /* Unchecked increment ok here since no further access on this iteration;
437 will be checked on next at "R-name". */
438
439 dnss->aptr += dnss->srr.size;                   /* Advance to next RR */
440
441 /* Return a pointer to the dns_record structure within the dns_answer. This is
442 for convenience so that the scans can use nice-looking for loops. */
443
444 return &dnss->srr;
445
446 null_return:
447   TRACE debug_printf("%s: terminate (%d RRs left). Last op: %s; errno %d %s\n",
448     __FUNCTION__, dnss->rrcount, trace, errno, strerror(errno));
449   dnss->rrcount = 0;
450   return NULL;
451 }
452
453
454 /* Extract the AUTHORITY information from the answer. If the answer isn't
455 authoritative (AA not set), we do not extract anything.
456
457 The AUTHORITY section contains NS records if the name in question was found,
458 it contains a SOA record otherwise. (This is just from experience and some
459 tests, is there some spec?)
460
461 Scan the whole AUTHORITY section, since it may contain other records
462 (e.g. NSEC3) too.
463
464 Return: name for the authority, in an allocated string, or NULL if none found */
465
466 static const uschar *
467 dns_extract_auth_name(const dns_answer * dnsa)  /* FIXME: const dns_answer */
468 {
469 dns_scan dnss;
470 dns_record * rr;
471 const HEADER * h = (const HEADER *) dnsa->answer;
472
473 if (h->nscount && h->aa)
474   for (rr = dns_next_rr(dnsa, &dnss, RESET_AUTHORITY);
475        rr; rr = dns_next_rr(dnsa, &dnss, RESET_NEXT))
476     if (rr->type == (h->ancount ? T_NS : T_SOA))
477       return string_copy(rr->name);
478 return NULL;
479 }
480
481
482
483
484 /*************************************************
485 *    Return whether AD bit set in DNS result     *
486 *************************************************/
487
488 /* We do not perform DNSSEC work ourselves; if the administrator has installed
489 a verifying resolver which sets AD as appropriate, though, we'll use that.
490 (AD = Authentic Data, AA = Authoritative Answer)
491
492 Argument:   pointer to dns answer block
493 Returns:    bool indicating presence of AD bit
494 */
495
496 BOOL
497 dns_is_secure(const dns_answer * dnsa)
498 {
499 #ifdef DISABLE_DNSSEC
500 DEBUG(D_dns)
501   debug_printf("DNSSEC support disabled at build-time; dns_is_secure() false\n");
502 return FALSE;
503 #else
504 const HEADER * h = (const HEADER *) dnsa->answer;
505 const uschar * auth_name;
506 const uschar * trusted;
507
508 if (h->ad) return TRUE;
509
510 /* If the resolver we ask is authoritative for the domain in question, it
511 * may not set the AD but the AA bit. If we explicitly trust
512 * the resolver for that domain (via a domainlist in dns_trust_aa),
513 * we return TRUE to indicate a secure answer.
514 */
515
516 if (  !h->aa
517    || !dns_trust_aa
518    || !(trusted = expand_string(dns_trust_aa))
519    || !*trusted
520    || !(auth_name = dns_extract_auth_name(dnsa))
521    || OK != match_isinlist(auth_name, &trusted, 0, NULL, NULL,
522                             MCL_DOMAIN, TRUE, NULL)
523    )
524   return FALSE;
525
526 DEBUG(D_dns) debug_printf("DNS faked the AD bit "
527   "(got AA and matched with dns_trust_aa (%s in %s))\n",
528   auth_name, dns_trust_aa);
529
530 return TRUE;
531 #endif
532 }
533
534 static void
535 dns_set_insecure(dns_answer * dnsa)
536 {
537 #ifndef DISABLE_DNSSEC
538 HEADER * h = (HEADER *)dnsa->answer;
539 h->aa = h->ad = 0;
540 #endif
541 }
542
543 /************************************************
544  *      Check whether the AA bit is set         *
545  *      We need this to warn if we requested AD *
546  *      from an authoritative server            *
547  ************************************************/
548
549 BOOL
550 dns_is_aa(const dns_answer *dnsa)
551 {
552 #ifdef DISABLE_DNSSEC
553 return FALSE;
554 #else
555 return ((const HEADER*)dnsa->answer)->aa;
556 #endif
557 }
558
559
560
561 /*************************************************
562 *            Turn DNS type into text             *
563 *************************************************/
564
565 /* Turn the coded record type into a string for printing. All those that Exim
566 uses should be included here.
567
568 Argument:   record type
569 Returns:    pointer to string
570 */
571
572 uschar *
573 dns_text_type(int t)
574 {
575 switch(t)
576   {
577   case T_A:     return US"A";
578   case T_MX:    return US"MX";
579   case T_AAAA:  return US"AAAA";
580   case T_A6:    return US"A6";
581   case T_TXT:   return US"TXT";
582   case T_SPF:   return US"SPF";
583   case T_PTR:   return US"PTR";
584   case T_SOA:   return US"SOA";
585   case T_SRV:   return US"SRV";
586   case T_NS:    return US"NS";
587   case T_CNAME: return US"CNAME";
588   case T_TLSA:  return US"TLSA";
589   default:      return US"?";
590   }
591 }
592
593
594
595 /*************************************************
596 *        Cache a failed DNS lookup result        *
597 *************************************************/
598
599 static void
600 dns_fail_tag(uschar * buf, const uschar * name, int dns_type)
601 {
602 res_state resp = os_get_dns_resolver_res();
603 sprintf(CS buf, "%.255s-%s-%lx", name, dns_text_type(dns_type),
604   (unsigned long) resp->options);
605 }
606
607
608 /* We cache failed lookup results so as not to experience timeouts many
609 times for the same domain. We need to retain the resolver options because they
610 may change. For successful lookups, we rely on resolver and/or name server
611 caching.
612
613 Arguments:
614   name       the domain name
615   type       the lookup type
616   rc         the return code
617
618 Returns:     the return code
619 */
620
621 static int
622 dns_return(const uschar * name, int type, int rc)
623 {
624 tree_node *node = store_get_perm(sizeof(tree_node) + 290);
625 dns_fail_tag(node->name, name, type);
626 node->data.val = rc;
627 (void)tree_insertnode(&tree_dns_fails, node);
628 return rc;
629 }
630
631 /*************************************************
632 *              Do basic DNS lookup               *
633 *************************************************/
634
635 /* Call the resolver to look up the given domain name, using the given type,
636 and check the result. The error code TRY_AGAIN is documented as meaning "non-
637 Authoritative Host not found, or SERVERFAIL". Sometimes there are badly set
638 up nameservers that produce this error continually, so there is the option of
639 providing a list of domains for which this is treated as a non-existent
640 host.
641
642 The dns_answer structure is pretty big; enough to hold a max-sized DNS message
643 - so best allocated from fast-release memory.  As of writing, all our callers
644 use a stack-auto variable.
645
646 Arguments:
647   dnsa      pointer to dns_answer structure
648   name      name to look up
649   type      type of DNS record required (T_A, T_MX, etc)
650
651 Returns:    DNS_SUCCEED   successful lookup
652             DNS_NOMATCH   name not found (NXDOMAIN)
653                           or name contains illegal characters (if checking)
654                           or name is an IP address (for IP address lookup)
655             DNS_NODATA    domain exists, but no data for this type (NODATA)
656             DNS_AGAIN     soft failure, try again later
657             DNS_FAIL      DNS failure
658 */
659
660 int
661 dns_basic_lookup(dns_answer *dnsa, const uschar *name, int type)
662 {
663 #ifndef STAND_ALONE
664 int rc = -1;
665 const uschar *save_domain;
666 #endif
667
668 tree_node *previous;
669 uschar node_name[290];
670
671 /* DNS lookup failures of any kind are cached in a tree. This is mainly so that
672 a timeout on one domain doesn't happen time and time again for messages that
673 have many addresses in the same domain. We rely on the resolver and name server
674 caching for successful lookups. */
675
676 dns_fail_tag(node_name, name, type);
677 if ((previous = tree_search(tree_dns_fails, node_name)))
678   {
679   DEBUG(D_dns) debug_printf("DNS lookup of %.255s-%s: using cached value %s\n",
680     name, dns_text_type(type),
681       previous->data.val == DNS_NOMATCH ? "DNS_NOMATCH" :
682       previous->data.val == DNS_NODATA ? "DNS_NODATA" :
683       previous->data.val == DNS_AGAIN ? "DNS_AGAIN" :
684       previous->data.val == DNS_FAIL ? "DNS_FAIL" : "??");
685   return previous->data.val;
686   }
687
688 #ifdef SUPPORT_I18N
689 /* Convert all names to a-label form before doing lookup */
690   {
691   uschar * alabel;
692   uschar * errstr = NULL;
693   DEBUG(D_dns) if (string_is_utf8(name))
694     debug_printf("convert utf8 '%s' to alabel for for lookup\n", name);
695   if ((alabel = string_domain_utf8_to_alabel(name, &errstr)), errstr)
696     {
697     DEBUG(D_dns)
698       debug_printf("DNS name '%s' utf8 conversion to alabel failed: %s\n", name,
699         errstr);
700     f.host_find_failed_syntax = TRUE;
701     return DNS_NOMATCH;
702     }
703   name = alabel;
704   }
705 #endif
706
707 /* If configured, check the hygiene of the name passed to lookup. Otherwise,
708 although DNS lookups may give REFUSED at the lower level, some resolvers
709 turn this into TRY_AGAIN, which is silly. Give a NOMATCH return, since such
710 domains cannot be in the DNS. The check is now done by a regular expression;
711 give it space for substring storage to save it having to get its own if the
712 regex has substrings that are used - the default uses a conditional.
713
714 This test is omitted for PTR records. These occur only in calls from the dnsdb
715 lookup, which constructs the names itself, so they should be OK. Besides,
716 bitstring labels don't conform to normal name syntax. (But the aren't used any
717 more.)
718
719 For SRV records, we omit the initial _smtp._tcp. components at the start. */
720
721 #ifndef STAND_ALONE   /* Omit this for stand-alone tests */
722
723 if (check_dns_names_pattern[0] != 0 && type != T_PTR && type != T_TXT)
724   {
725   const uschar *checkname = name;
726   int ovector[3*(EXPAND_MAXN+1)];
727
728   dns_pattern_init();
729
730   /* For an SRV lookup, skip over the first two components (the service and
731   protocol names, which both start with an underscore). */
732
733   if (type == T_SRV || type == T_TLSA)
734     {
735     while (*checkname++ != '.');
736     while (*checkname++ != '.');
737     }
738
739   if (pcre_exec(regex_check_dns_names, NULL, CCS checkname, Ustrlen(checkname),
740       0, PCRE_EOPT, ovector, nelem(ovector)) < 0)
741     {
742     DEBUG(D_dns)
743       debug_printf("DNS name syntax check failed: %s (%s)\n", name,
744         dns_text_type(type));
745     f.host_find_failed_syntax = TRUE;
746     return DNS_NOMATCH;
747     }
748   }
749
750 #endif /* STAND_ALONE */
751
752 /* Call the resolver; for an overlong response, res_search() will return the
753 number of bytes the message would need, so we need to check for this case. The
754 effect is to truncate overlong data.
755
756 On some systems, res_search() will recognize "A-for-A" queries and return
757 the IP address instead of returning -1 with h_error=HOST_NOT_FOUND. Some
758 nameservers are also believed to do this. It is, of course, contrary to the
759 specification of the DNS, so we lock it out. */
760
761 if ((type == T_A || type == T_AAAA) && string_is_ip_address(name, NULL) != 0)
762   return DNS_NOMATCH;
763
764 /* If we are running in the test harness, instead of calling the normal resolver
765 (res_search), we call fakens_search(), which recognizes certain special
766 domains, and interfaces to a fake nameserver for certain special zones. */
767
768 dnsa->answerlen = f.running_in_test_harness
769   ? fakens_search(name, type, dnsa->answer, sizeof(dnsa->answer))
770   : res_search(CCS name, C_IN, type, dnsa->answer, sizeof(dnsa->answer));
771
772 if (dnsa->answerlen > (int) sizeof(dnsa->answer))
773   {
774   DEBUG(D_dns) debug_printf("DNS lookup of %s (%s) resulted in overlong packet"
775     " (size %d), truncating to %u.\n",
776     name, dns_text_type(type), dnsa->answerlen, (unsigned int) sizeof(dnsa->answer));
777   dnsa->answerlen = sizeof(dnsa->answer);
778   }
779
780 if (dnsa->answerlen < 0) switch (h_errno)
781   {
782   case HOST_NOT_FOUND:
783     DEBUG(D_dns) debug_printf("DNS lookup of %s (%s) gave HOST_NOT_FOUND\n"
784       "returning DNS_NOMATCH\n", name, dns_text_type(type));
785     return dns_return(name, type, DNS_NOMATCH);
786
787   case TRY_AGAIN:
788     DEBUG(D_dns) debug_printf("DNS lookup of %s (%s) gave TRY_AGAIN\n",
789       name, dns_text_type(type));
790
791     /* Cut this out for various test programs */
792 #ifndef STAND_ALONE
793     save_domain = deliver_domain;
794     deliver_domain = string_copy(name);  /* set $domain */
795     rc = match_isinlist(name, (const uschar **)&dns_again_means_nonexist, 0, NULL, NULL,
796       MCL_DOMAIN, TRUE, NULL);
797     deliver_domain = save_domain;
798     if (rc != OK)
799       {
800       DEBUG(D_dns) debug_printf("returning DNS_AGAIN\n");
801       return dns_return(name, type, DNS_AGAIN);
802       }
803     DEBUG(D_dns) debug_printf("%s is in dns_again_means_nonexist: returning "
804       "DNS_NOMATCH\n", name);
805     return dns_return(name, type, DNS_NOMATCH);
806
807 #else   /* For stand-alone tests */
808     return dns_return(name, type, DNS_AGAIN);
809 #endif
810
811   case NO_RECOVERY:
812     DEBUG(D_dns) debug_printf("DNS lookup of %s (%s) gave NO_RECOVERY\n"
813       "returning DNS_FAIL\n", name, dns_text_type(type));
814     return dns_return(name, type, DNS_FAIL);
815
816   case NO_DATA:
817     DEBUG(D_dns) debug_printf("DNS lookup of %s (%s) gave NO_DATA\n"
818       "returning DNS_NODATA\n", name, dns_text_type(type));
819     return dns_return(name, type, DNS_NODATA);
820
821   default:
822     DEBUG(D_dns) debug_printf("DNS lookup of %s (%s) gave unknown DNS error %d\n"
823       "returning DNS_FAIL\n", name, dns_text_type(type), h_errno);
824     return dns_return(name, type, DNS_FAIL);
825   }
826
827 DEBUG(D_dns) debug_printf("DNS lookup of %s (%s) succeeded\n",
828   name, dns_text_type(type));
829
830 return DNS_SUCCEED;
831 }
832
833
834
835
836 /************************************************
837 *        Do a DNS lookup and handle CNAMES      *
838 ************************************************/
839
840 /* Look up the given domain name, using the given type. Follow CNAMEs if
841 necessary, but only so many times. There aren't supposed to be CNAME chains in
842 the DNS, but you are supposed to cope with them if you find them.
843 By default, follow one CNAME since a resolver has been seen, faced with
844 an MX request and a CNAME (to an A) but no MX present, returning the CNAME.
845
846 The assumption is made that if the resolver gives back records of the
847 requested type *and* a CNAME, we don't need to make another call to look up
848 the CNAME. I can't see how it could return only some of the right records. If
849 it's done a CNAME lookup in the past, it will have all of them; if not, it
850 won't return any.
851
852 If fully_qualified_name is not NULL, set it to point to the full name
853 returned by the resolver, if this is different to what it is given, unless
854 the returned name starts with "*" as some nameservers seem to be returning
855 wildcards in this form.  In international mode "different" means "alabel
856 forms are different".
857
858 Arguments:
859   dnsa                  pointer to dns_answer structure
860   name                  domain name to look up
861   type                  DNS record type (T_A, T_MX, etc)
862   fully_qualified_name  if not NULL, return the returned name here if its
863                           contents are different (i.e. it must be preset)
864
865 Returns:                DNS_SUCCEED   successful lookup
866                         DNS_NOMATCH   name not found
867                         DNS_NODATA    no data found
868                         DNS_AGAIN     soft failure, try again later
869                         DNS_FAIL      DNS failure
870 */
871
872 int
873 dns_lookup(dns_answer *dnsa, const uschar *name, int type,
874   const uschar **fully_qualified_name)
875 {
876 int i;
877 const uschar *orig_name = name;
878 BOOL secure_so_far = TRUE;
879
880 /* By default, assume the resolver follows CNAME chains (and returns NODATA for
881 an unterminated one). If it also does that for a CNAME loop, fine; if it returns
882 a CNAME (maybe the last?) whine about it.  However, retain the coding for dumb
883 resolvers hiding behind a config variable. Loop to follow CNAME chains so far,
884 but no further...  The testsuite tests the latter case, mostly assuming that the
885 former will work. */
886
887 for (i = 0; i <= dns_cname_loops; i++)
888   {
889   uschar * data;
890   dns_record *rr, cname_rr, type_rr;
891   dns_scan dnss;
892   int rc;
893
894   /* DNS lookup failures get passed straight back. */
895
896   if ((rc = dns_basic_lookup(dnsa, name, type)) != DNS_SUCCEED)
897     return rc;
898
899   /* We should have either records of the required type, or a CNAME record,
900   or both. We need to know whether both exist for getting the fully qualified
901   name, but avoid scanning more than necessary. Note that we must copy the
902   contents of any rr blocks returned by dns_next_rr() as they use the same
903   area in the dnsa block. */
904
905   cname_rr.data = type_rr.data = NULL;
906   for (rr = dns_next_rr(dnsa, &dnss, RESET_ANSWERS);
907        rr; rr = dns_next_rr(dnsa, &dnss, RESET_NEXT))
908     if (rr->type == type)
909       {
910       if (type_rr.data == NULL) type_rr = *rr;
911       if (cname_rr.data != NULL) break;
912       }
913     else if (rr->type == T_CNAME)
914       cname_rr = *rr;
915
916   /* For the first time round this loop, if a CNAME was found, take the fully
917   qualified name from it; otherwise from the first data record, if present. */
918
919   if (i == 0 && fully_qualified_name)
920     {
921     uschar * rr_name = cname_rr.data
922       ? cname_rr.name : type_rr.data ? type_rr.name : NULL;
923     if (  rr_name
924        && Ustrcmp(rr_name, *fully_qualified_name) != 0
925        && rr_name[0] != '*'
926 #ifdef SUPPORT_I18N
927        && (  !string_is_utf8(*fully_qualified_name)
928           || Ustrcmp(rr_name,
929                string_domain_utf8_to_alabel(*fully_qualified_name, NULL)) != 0
930           )
931 #endif
932        )
933         *fully_qualified_name = string_copy_dnsdomain(rr_name);
934     }
935
936   /* If any data records of the correct type were found, we are done. */
937
938   if (type_rr.data)
939     {
940     if (!secure_so_far) /* mark insecure if any element of CNAME chain was */
941       dns_set_insecure(dnsa);
942     return DNS_SUCCEED;
943     }
944
945   /* If there are no data records, we need to re-scan the DNS using the
946   domain given in the CNAME record, which should exist (otherwise we should
947   have had a failure from dns_lookup). However code against the possibility of
948   its not existing. */
949
950   if (!cname_rr.data)
951     return DNS_FAIL;
952
953   data = store_get(256);
954   if (dn_expand(dnsa->answer, dnsa->answer + dnsa->answerlen,
955       cname_rr.data, (DN_EXPAND_ARG4_TYPE)data, 256) < 0)
956     return DNS_FAIL;
957   name = data;
958
959   if (!dns_is_secure(dnsa))
960     secure_so_far = FALSE;
961
962   DEBUG(D_dns) debug_printf("CNAME found: change to %s\n", name);
963   }       /* Loop back to do another lookup */
964
965 /*Control reaches here after 10 times round the CNAME loop. Something isn't
966 right... */
967
968 log_write(0, LOG_MAIN, "CNAME loop for %s encountered", orig_name);
969 return DNS_FAIL;
970 }
971
972
973
974
975
976
977 /************************************************
978 *    Do a DNS lookup and handle virtual types   *
979 ************************************************/
980
981 /* This function handles some invented "lookup types" that synthesize features
982 not available in the basic types. The special types all have negative values.
983 Positive type values are passed straight on to dns_lookup().
984
985 Arguments:
986   dnsa                  pointer to dns_answer structure
987   name                  domain name to look up
988   type                  DNS record type (T_A, T_MX, etc or a "special")
989   fully_qualified_name  if not NULL, return the returned name here if its
990                           contents are different (i.e. it must be preset)
991
992 Returns:                DNS_SUCCEED   successful lookup
993                         DNS_NOMATCH   name not found
994                         DNS_NODATA    no data found
995                         DNS_AGAIN     soft failure, try again later
996                         DNS_FAIL      DNS failure
997 */
998
999 int
1000 dns_special_lookup(dns_answer *dnsa, const uschar *name, int type,
1001   const uschar **fully_qualified_name)
1002 {
1003 switch (type)
1004   {
1005   /* The "mx hosts only" type doesn't require any special action here */
1006   case T_MXH:
1007     return dns_lookup(dnsa, name, T_MX, fully_qualified_name);
1008
1009   /* Find nameservers for the domain or the nearest enclosing zone, excluding
1010   the root servers. */
1011   case T_ZNS:
1012     type = T_NS;
1013     /* FALLTHROUGH */
1014   case T_SOA:
1015     {
1016     const uschar *d = name;
1017     while (d != 0)
1018       {
1019       int rc = dns_lookup(dnsa, d, type, fully_qualified_name);
1020       if (rc != DNS_NOMATCH && rc != DNS_NODATA) return rc;
1021       while (*d != 0 && *d != '.') d++;
1022       if (*d++ == 0) break;
1023       }
1024     return DNS_NOMATCH;
1025     }
1026
1027   /* Try to look up the Client SMTP Authorization SRV record for the name. If
1028   there isn't one, search from the top downwards for a CSA record in a parent
1029   domain, which might be making assertions about subdomains. If we find a record
1030   we set fully_qualified_name to whichever lookup succeeded, so that the caller
1031   can tell whether to look at the explicit authorization field or the subdomain
1032   assertion field. */
1033   case T_CSA:
1034     {
1035     uschar *srvname, *namesuff, *tld;
1036     int priority, weight, port;
1037     int limit, rc, i;
1038     BOOL ipv6;
1039     dns_record *rr;
1040     dns_scan dnss;
1041
1042     DEBUG(D_dns) debug_printf("CSA lookup of %s\n", name);
1043
1044     srvname = string_sprintf("_client._smtp.%s", name);
1045     rc = dns_lookup(dnsa, srvname, T_SRV, NULL);
1046     if (rc == DNS_SUCCEED || rc == DNS_AGAIN)
1047       {
1048       if (rc == DNS_SUCCEED) *fully_qualified_name = string_copy(name);
1049       return rc;
1050       }
1051
1052     /* Search for CSA subdomain assertion SRV records from the top downwards,
1053     starting with the 2nd level domain. This order maximizes cache-friendliness.
1054     We skip the top level domains to avoid loading their nameservers and because
1055     we know they'll never have CSA SRV records. */
1056
1057     namesuff = Ustrrchr(name, '.');
1058     if (namesuff == NULL) return DNS_NOMATCH;
1059     tld = namesuff + 1;
1060     ipv6 = FALSE;
1061     limit = dns_csa_search_limit;
1062
1063     /* Use more appropriate search parameters if we are in the reverse DNS. */
1064
1065     if (strcmpic(namesuff, US".arpa") == 0)
1066       if (namesuff - 8 > name && strcmpic(namesuff - 8, US".in-addr.arpa") == 0)
1067         {
1068         namesuff -= 8;
1069         tld = namesuff + 1;
1070         limit = 3;
1071         }
1072       else if (namesuff - 4 > name && strcmpic(namesuff - 4, US".ip6.arpa") == 0)
1073         {
1074         namesuff -= 4;
1075         tld = namesuff + 1;
1076         ipv6 = TRUE;
1077         limit = 3;
1078         }
1079
1080     DEBUG(D_dns) debug_printf("CSA TLD %s\n", tld);
1081
1082     /* Do not perform the search if the top level or 2nd level domains do not
1083     exist. This is quite common, and when it occurs all the search queries would
1084     go to the root or TLD name servers, which is not friendly. So we check the
1085     AUTHORITY section; if it contains the root's SOA record or the TLD's SOA then
1086     the TLD or the 2LD (respectively) doesn't exist and we can skip the search.
1087     If the TLD and the 2LD exist but the explicit CSA record lookup failed, then
1088     the AUTHORITY SOA will be the 2LD's or a subdomain thereof. */
1089
1090     if (rc == DNS_NOMATCH)
1091       {
1092       /* This is really gross. The successful return value from res_search() is
1093       the packet length, which is stored in dnsa->answerlen. If we get a
1094       negative DNS reply then res_search() returns -1, which causes the bounds
1095       checks for name decompression to fail when it is treated as a packet
1096       length, which in turn causes the authority search to fail. The correct
1097       packet length has been lost inside libresolv, so we have to guess a
1098       replacement value. (The only way to fix this properly would be to
1099       re-implement res_search() and res_query() so that they don't muddle their
1100       success and packet length return values.) For added safety we only reset
1101       the packet length if the packet header looks plausible. */
1102
1103       const HEADER * h = (const HEADER *)dnsa->answer;
1104       if (h->qr == 1 && h->opcode == QUERY && h->tc == 0
1105           && (h->rcode == NOERROR || h->rcode == NXDOMAIN)
1106           && ntohs(h->qdcount) == 1 && ntohs(h->ancount) == 0
1107           && ntohs(h->nscount) >= 1)
1108             dnsa->answerlen = sizeof(dnsa->answer);
1109
1110       for (rr = dns_next_rr(dnsa, &dnss, RESET_AUTHORITY);
1111            rr; rr = dns_next_rr(dnsa, &dnss, RESET_NEXT)
1112           )
1113         if (rr->type != T_SOA) continue;
1114         else if (strcmpic(rr->name, US"") == 0 ||
1115                  strcmpic(rr->name, tld) == 0) return DNS_NOMATCH;
1116         else break;
1117       }
1118
1119     for (i = 0; i < limit; i++)
1120       {
1121       if (ipv6)
1122         {
1123         /* Scan through the IPv6 reverse DNS in chunks of 16 bits worth of IP
1124         address, i.e. 4 hex chars and 4 dots, i.e. 8 chars. */
1125         namesuff -= 8;
1126         if (namesuff <= name) return DNS_NOMATCH;
1127         }
1128       else
1129         /* Find the start of the preceding domain name label. */
1130         do
1131           if (--namesuff <= name) return DNS_NOMATCH;
1132         while (*namesuff != '.');
1133
1134       DEBUG(D_dns) debug_printf("CSA parent search at %s\n", namesuff + 1);
1135
1136       srvname = string_sprintf("_client._smtp.%s", namesuff + 1);
1137       rc = dns_lookup(dnsa, srvname, T_SRV, NULL);
1138       if (rc == DNS_AGAIN) return rc;
1139       if (rc != DNS_SUCCEED) continue;
1140
1141       /* Check that the SRV record we have found is worth returning. We don't
1142       just return the first one we find, because some lower level SRV record
1143       might make stricter assertions than its parent domain. */
1144
1145       for (rr = dns_next_rr(dnsa, &dnss, RESET_ANSWERS);
1146            rr; rr = dns_next_rr(dnsa, &dnss, RESET_NEXT)) if (rr->type == T_SRV)
1147         {
1148         const uschar * p = rr->data;
1149
1150         /* Extract the numerical SRV fields (p is incremented) */
1151         GETSHORT(priority, p);
1152         GETSHORT(weight, p);    weight = weight; /* compiler quietening */
1153         GETSHORT(port, p);
1154
1155         /* Check the CSA version number */
1156         if (priority != 1) continue;
1157
1158         /* If it's making an interesting assertion, return this response. */
1159         if (port & 1)
1160           {
1161           *fully_qualified_name = namesuff + 1;
1162           return DNS_SUCCEED;
1163           }
1164         }
1165       }
1166     return DNS_NOMATCH;
1167     }
1168
1169   default:
1170     if (type >= 0)
1171       return dns_lookup(dnsa, name, type, fully_qualified_name);
1172   }
1173
1174 /* Control should never reach here */
1175
1176 return DNS_FAIL;
1177 }
1178
1179
1180
1181
1182
1183 /*************************************************
1184 *          Get address(es) from DNS record       *
1185 *************************************************/
1186
1187 /* The record type is either T_A for an IPv4 address or T_AAAA for an IPv6 address.
1188
1189 Argument:
1190   dnsa       the DNS answer block
1191   rr         the RR
1192
1193 Returns:     pointer to a chain of dns_address items; NULL when the dnsa was overrun
1194 */
1195
1196 dns_address *
1197 dns_address_from_rr(dns_answer *dnsa, dns_record *rr)
1198 {
1199 dns_address * yield = NULL;
1200 uschar * dnsa_lim = dnsa->answer + dnsa->answerlen;
1201
1202 if (rr->type == T_A)
1203   {
1204   uschar *p = US rr->data;
1205   if (p + 4 <= dnsa_lim)
1206     {
1207     yield = store_get(sizeof(dns_address) + 20);
1208     (void)sprintf(CS yield->address, "%d.%d.%d.%d", p[0], p[1], p[2], p[3]);
1209     yield->next = NULL;
1210     }
1211   }
1212
1213 #if HAVE_IPV6
1214
1215 else
1216   {
1217   if (rr->data + 16 <= dnsa_lim)
1218     {
1219     struct in6_addr in6;
1220     int i;
1221     for (i = 0; i < 16; i++) in6.s6_addr[i] = rr->data[i];
1222     yield = store_get(sizeof(dns_address) + 50);
1223     inet_ntop(AF_INET6, &in6, CS yield->address, 50);
1224     yield->next = NULL;
1225     }
1226   }
1227 #endif  /* HAVE_IPV6 */
1228
1229 return yield;
1230 }
1231
1232
1233
1234 void
1235 dns_pattern_init(void)
1236 {
1237 if (check_dns_names_pattern[0] != 0 && !regex_check_dns_names)
1238   regex_check_dns_names =
1239     regex_must_compile(check_dns_names_pattern, FALSE, TRUE);
1240 }
1241
1242 /* vi: aw ai sw=2
1243 */
1244 /* End of dns.c */