Expansions: A tls option on ${readsocket }. Bug 2282
[exim.git] / src / src / ip.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) University of Cambridge 1995 - 2018 */
6 /* See the file NOTICE for conditions of use and distribution. */
7
8 /* Functions for doing things with sockets. With the advent of IPv6 this has
9 got messier, so that it's worth pulling out the code into separate functions
10 that other parts of Exim can call, especially as there are now several
11 different places in the code where sockets are used. */
12
13
14 #include "exim.h"
15
16
17 /*************************************************
18 *             Create a socket                    *
19 *************************************************/
20
21 /* Socket creation happens in a number of places so it's packaged here for
22 convenience.
23
24 Arguments:
25   type       SOCK_DGRAM or SOCK_STREAM
26   af         AF_INET or AF_INET6
27
28 Returns:     socket number or -1 on failure
29 */
30
31 int
32 ip_socket(int type, int af)
33 {
34 int sock = socket(af, type, 0);
35 if (sock < 0)
36   log_write(0, LOG_MAIN, "IPv%c socket creation failed: %s",
37     (af == AF_INET6)? '6':'4', strerror(errno));
38 return sock;
39 }
40
41
42
43
44 #if HAVE_IPV6
45 /*************************************************
46 *      Convert printing address to numeric       *
47 *************************************************/
48
49 /* This function converts the textual form of an IP address into a numeric form
50 in an appropriate structure in an IPv6 environment. The getaddrinfo() function
51 can (apparently) handle more complicated addresses (e.g. those containing
52 scopes) than inet_pton() in some environments. We use hints to tell it that the
53 input must be a numeric address.
54
55 However, apparently some operating systems (or libraries) don't support
56 getaddrinfo(), so there is a build-time option to revert to inet_pton() (which
57 does not support scopes).
58
59 Arguments:
60   address     textual form of the address
61   addr        where to copy back the answer
62
63 Returns:      nothing - failure provokes a panic-die
64 */
65
66 static void
67 ip_addrinfo(const uschar *address, struct sockaddr_in6 *saddr)
68 {
69 #ifdef IPV6_USE_INET_PTON
70
71   if (inet_pton(AF_INET6, CCS address, &saddr->sin6_addr) != 1)
72     log_write(0, LOG_MAIN|LOG_PANIC_DIE, "unable to parse \"%s\" as an "
73       "IP address", address);
74   saddr->sin6_family = AF_INET6;
75
76 #else
77
78   int rc;
79   struct addrinfo hints, *res;
80   memset(&hints, 0, sizeof(hints));
81   hints.ai_family = AF_INET6;
82   hints.ai_socktype = SOCK_STREAM;
83   hints.ai_flags = AI_NUMERICHOST;
84   if ((rc = getaddrinfo(CCS address, NULL, &hints, &res)) != 0 || res == NULL)
85     log_write(0, LOG_MAIN|LOG_PANIC_DIE, "unable to parse \"%s\" as an "
86       "IP address: %s", address,
87       (rc == 0)? "NULL result returned" : gai_strerror(rc));
88   memcpy(saddr, res->ai_addr, res->ai_addrlen);
89   freeaddrinfo(res);
90
91 #endif
92 }
93 #endif  /* HAVE_IPV6 */
94
95
96 /*************************************************
97 *         Bind socket to interface and port      *
98 *************************************************/
99
100 int
101 ip_addr(void * sin_, int af, const uschar * address, int port)
102 {
103 union sockaddr_46 * sin = sin_;
104 memset(sin, 0, sizeof(*sin));
105
106 /* Setup code when using an IPv6 socket. The wildcard address is ":", to
107 ensure an IPv6 socket is used. */
108
109 #if HAVE_IPV6
110 if (af == AF_INET6)
111   {
112   if (address[0] == ':' && address[1] == 0)
113     {
114     sin->v6.sin6_family = AF_INET6;
115     sin->v6.sin6_addr = in6addr_any;
116     }
117   else
118     ip_addrinfo(address, &sin->v6);  /* Panic-dies on error */
119   sin->v6.sin6_port = htons(port);
120   return sizeof(sin->v6);
121   }
122 else
123 #else     /* HAVE_IPv6 */
124 af = af;  /* Avoid compiler warning */
125 #endif    /* HAVE_IPV6 */
126
127 /* Setup code when using IPv4 socket. The wildcard address is "". */
128
129   {
130   sin->v4.sin_family = AF_INET;
131   sin->v4.sin_port = htons(port);
132   sin->v4.sin_addr.s_addr = address[0] == 0
133     ? (S_ADDR_TYPE)INADDR_ANY
134     : (S_ADDR_TYPE)inet_addr(CS address);
135   return sizeof(sin->v4);
136   }
137 }
138
139
140
141 /* This function binds a socket to a local interface address and port. For a
142 wildcard IPv6 bind, the address is ":".
143
144 Arguments:
145   sock           the socket
146   af             AF_INET or AF_INET6 - the socket type
147   address        the IP address, in text form
148   port           the IP port (host order)
149
150 Returns:         the result of bind()
151 */
152
153 int
154 ip_bind(int sock, int af, uschar *address, int port)
155 {
156 union sockaddr_46 sin;
157 int s_len = ip_addr(&sin, af, address, port);
158 return bind(sock, (struct sockaddr *)&sin, s_len);
159 }
160
161
162
163 /*************************************************
164 *************************************************/
165
166 #ifdef EXIM_TFO_PROBE
167 void
168 tfo_probe(void)
169 {
170 # ifdef TCP_FASTOPEN
171 int sock, backlog = 5;
172
173 if (  (sock = socket(SOCK_STREAM, AF_INET, 0)) < 0
174    && setsockopt(sock, IPPROTO_TCP, TCP_FASTOPEN, &backlog, sizeof(backlog))
175    )
176   tcp_fastopen_ok = TRUE;
177 close(sock);
178 # endif
179 }
180 #endif
181
182
183 /*************************************************
184 *        Connect socket to remote host           *
185 *************************************************/
186
187 /* This function connects a socket to a remote address and port. The socket may
188 or may not have previously been bound to a local interface. The socket is not
189 closed, even in cases of error. It is expected that the calling function, which
190 created the socket, will be the one that closes it.
191
192 Arguments:
193   sock        the socket
194   af          AF_INET6 or AF_INET for the socket type
195   address     the remote address, in text form
196   port        the remote port
197   timeout     a timeout (zero for indefinite timeout)
198   fastopen_blob    non-null iff TCP_FASTOPEN can be used; may indicate early-data to
199                 be sent in SYN segment
200
201 Returns:      0 on success; -1 on failure, with errno set
202 */
203
204 int
205 ip_connect(int sock, int af, const uschar *address, int port, int timeout,
206   const blob * fastopen_blob)
207 {
208 struct sockaddr_in s_in4;
209 struct sockaddr *s_ptr;
210 int s_len, rc, save_errno;
211
212 /* For an IPv6 address, use an IPv6 sockaddr structure. */
213
214 #if HAVE_IPV6
215 struct sockaddr_in6 s_in6;
216 if (af == AF_INET6)
217   {
218   memset(&s_in6, 0, sizeof(s_in6));
219   ip_addrinfo(address, &s_in6);   /* Panic-dies on error */
220   s_in6.sin6_port = htons(port);
221   s_ptr = (struct sockaddr *)&s_in6;
222   s_len = sizeof(s_in6);
223   }
224 else
225 #else     /* HAVE_IPV6 */
226 af = af;  /* Avoid compiler warning */
227 #endif    /* HAVE_IPV6 */
228
229 /* For an IPv4 address, use an IPv4 sockaddr structure, even on a system with
230 IPv6 support. */
231
232   {
233   memset(&s_in4, 0, sizeof(s_in4));
234   s_in4.sin_family = AF_INET;
235   s_in4.sin_port = htons(port);
236   s_in4.sin_addr.s_addr = (S_ADDR_TYPE)inet_addr(CCS address);
237   s_ptr = (struct sockaddr *)&s_in4;
238   s_len = sizeof(s_in4);
239   }
240
241 /* If no connection timeout is set, just call connect() without setting a
242 timer, thereby allowing the inbuilt OS timeout to operate. */
243
244 callout_address = string_sprintf("[%s]:%d", address, port);
245 sigalrm_seen = FALSE;
246 if (timeout > 0) alarm(timeout);
247
248 #if defined(TCP_FASTOPEN) && defined(MSG_FASTOPEN)
249 /* TCP Fast Open, if the system has a cookie from a previous call to
250 this peer, can send data in the SYN packet.  The peer can send data
251 before it gets our ACK of its SYN,ACK - the latter is useful for
252 the SMTP banner.  Other (than SMTP) cases of TCP connections can
253 possibly use the data-on-syn, so support that too.  */
254
255 if (fastopen_blob && tcp_fastopen_ok)
256   {
257   if ((rc = sendto(sock, fastopen_blob->data, fastopen_blob->len,
258                     MSG_FASTOPEN | MSG_DONTWAIT, s_ptr, s_len)) >= 0)
259         /* seen for with-data, experimental TFO option, with-cookie case */
260         /* seen for with-data, proper TFO opt, with-cookie case */
261     {
262     DEBUG(D_transport|D_v)
263       debug_printf("non-TFO mode connection attempt to %s, %lu data\n",
264         address, (unsigned long)fastopen_blob->len);
265     /*XXX also seen on successful TFO, sigh */
266     tcp_out_fastopen = fastopen_blob->len > 0 ?  2 : 1;
267     }
268   else if (errno == EINPROGRESS)        /* expected if we had no cookie for peer */
269         /* seen for no-data, proper TFO option, both cookie-request and with-cookie cases */
270         /*  apparently no visibility of the diffference at this point */
271         /* seen for with-data, proper TFO opt, cookie-req */
272         /*   with netwk delay, post-conn tcp_info sees unacked 1 for R, 2 for C; code in smtp_out.c */
273         /* ? older Experimental TFO option behaviour ? */
274     {                                   /* queue unsent data */
275     DEBUG(D_transport|D_v) debug_printf("TFO mode sendto, %s data: EINPROGRESS\n",
276       fastopen_blob->len > 0 ? "with"  : "no");
277     if (!fastopen_blob->data)
278       {
279       tcp_out_fastopen = 1;             /* we tried; unknown if useful yet */
280       rc = 0;
281       }
282     else
283       rc = send(sock, fastopen_blob->data, fastopen_blob->len, 0);
284     }
285   else if(errno == EOPNOTSUPP)
286     {
287     DEBUG(D_transport)
288       debug_printf("Tried TCP Fast Open but apparently not enabled by sysctl\n");
289     goto legacy_connect;
290     }
291   }
292 else
293 #endif
294   {
295 legacy_connect:
296   DEBUG(D_transport|D_v) if (fastopen_blob)
297     debug_printf("non-TFO mode connection attempt to %s, %lu data\n",
298       address, (unsigned long)fastopen_blob->len);
299   if ((rc = connect(sock, s_ptr, s_len)) >= 0)
300     if (  fastopen_blob && fastopen_blob->data && fastopen_blob->len
301        && send(sock, fastopen_blob->data, fastopen_blob->len, 0) < 0)
302         rc = -1;
303   }
304
305 save_errno = errno;
306 alarm(0);
307
308 /* There is a testing facility for simulating a connection timeout, as I
309 can't think of any other way of doing this. It converts a connection refused
310 into a timeout if the timeout is set to 999999. */
311
312 if (running_in_test_harness  && save_errno == ECONNREFUSED && timeout == 999999)
313   {
314   rc = -1;
315   save_errno = EINTR;
316   sigalrm_seen = TRUE;
317   }
318
319 /* Success */
320
321 if (rc >= 0)
322   return 0;
323
324 /* A failure whose error code is "Interrupted system call" is in fact
325 an externally applied timeout if the signal handler has been run. */
326
327 errno = save_errno == EINTR && sigalrm_seen ? ETIMEDOUT : save_errno;
328 return -1;
329 }
330
331
332
333 /*************************************************
334 *    Create connected socket to remote host      *
335 *************************************************/
336
337 /* Create a socket and connect to host (name or number, ipv6 ok)
338    at one of port-range.
339
340 Arguments:
341   type          SOCK_DGRAM or SOCK_STREAM
342   af            AF_INET6 or AF_INET for the socket type
343   hostname      host name, or ip address (as text)
344   portlo,porthi the remote port range
345   timeout       a timeout
346   connhost      if not NULL, host_item to be filled in with connection details
347   errstr        pointer for allocated string on error
348   fastopen_blob with SOCK_STREAM, if non-null, request TCP Fast Open.
349                 Additionally, optional early-data to send
350
351 Return:
352   socket fd, or -1 on failure (having allocated an error string)
353 */
354 int
355 ip_connectedsocket(int type, const uschar * hostname, int portlo, int porthi,
356       int timeout, host_item * connhost, uschar ** errstr, const blob * fastopen_blob)
357 {
358 int namelen, port;
359 host_item shost;
360 host_item *h;
361 int af = 0, fd, fd4 = -1, fd6 = -1;
362
363 shost.next = NULL;
364 shost.address = NULL;
365 shost.port = portlo;
366 shost.mx = -1;
367
368 namelen = Ustrlen(hostname);
369
370 /* Anything enclosed in [] must be an IP address. */
371
372 if (hostname[0] == '[' &&
373     hostname[namelen - 1] == ']')
374   {
375   uschar * host = string_copyn(hostname+1, namelen-2);
376   if (string_is_ip_address(host, NULL) == 0)
377     {
378     *errstr = string_sprintf("malformed IP address \"%s\"", hostname);
379     return -1;
380     }
381   shost.name = shost.address = host;
382   }
383
384 /* Otherwise check for an unadorned IP address */
385
386 else if (string_is_ip_address(hostname, NULL) != 0)
387   shost.name = shost.address = string_copyn(hostname, namelen);
388
389 /* Otherwise lookup IP address(es) from the name */
390
391 else
392   {
393   shost.name = string_copyn(hostname, namelen);
394   if (host_find_byname(&shost, NULL, HOST_FIND_QUALIFY_SINGLE,
395       NULL, FALSE) != HOST_FOUND)
396     {
397     *errstr = string_sprintf("no IP address found for host %s", shost.name);
398     return -1;
399     }
400   }
401
402 /* Try to connect to the server - test each IP till one works */
403
404 for (h = &shost; h; h = h->next)
405   {
406   fd = Ustrchr(h->address, ':') != 0
407     ? fd6 < 0 ? (fd6 = ip_socket(type, af = AF_INET6)) : fd6
408     : fd4 < 0 ? (fd4 = ip_socket(type, af = AF_INET )) : fd4;
409
410   if (fd < 0)
411     {
412     *errstr = string_sprintf("failed to create socket: %s", strerror(errno));
413     goto bad;
414     }
415
416   for(port = portlo; port <= porthi; port++)
417     if (ip_connect(fd, af, h->address, port, timeout, fastopen_blob) == 0)
418       {
419       if (fd != fd6) close(fd6);
420       if (fd != fd4) close(fd4);
421       if (connhost)
422         {
423         h->port = port;
424         *connhost = *h;
425         connhost->next = NULL;
426         }
427       return fd;
428       }
429   }
430
431 *errstr = string_sprintf("failed to connect to any address for %s: %s",
432   hostname, strerror(errno));
433
434 bad:
435   close(fd4); close(fd6); return -1;
436 }
437
438
439 /*XXX TFO? */
440 int
441 ip_tcpsocket(const uschar * hostport, uschar ** errstr, int tmo)
442 {
443 int scan;
444 uschar hostname[256];
445 unsigned int portlow, porthigh;
446
447 /* extract host and port part */
448 scan = sscanf(CS hostport, "%255s %u-%u", hostname, &portlow, &porthigh);
449 if (scan != 3)
450   {
451   if (scan != 2)
452     {
453     *errstr = string_sprintf("invalid socket '%s'", hostport);
454     return -1;
455     }
456   porthigh = portlow;
457   }
458
459 return ip_connectedsocket(SOCK_STREAM, hostname, portlow, porthigh,
460                           tmo, NULL, errstr, NULL);
461 }
462
463 int
464 ip_unixsocket(const uschar * path, uschar ** errstr)
465 {
466 int sock;
467 struct sockaddr_un server;
468
469 if ((sock = socket(AF_UNIX, SOCK_STREAM, 0)) < 0)
470   {
471   *errstr = US"can't open UNIX socket.";
472   return -1;
473   }
474
475 callout_address = string_copy(path);
476 server.sun_family = AF_UNIX;
477 Ustrncpy(server.sun_path, path, sizeof(server.sun_path)-1);
478 server.sun_path[sizeof(server.sun_path)-1] = '\0';
479 if (connect(sock, (struct sockaddr *) &server, sizeof(server)) < 0)
480   {
481   int err = errno;
482   (void)close(sock);
483   *errstr = string_sprintf("unable to connect to UNIX socket (%s): %s",
484                 path, strerror(err));
485   return -1;
486   }
487 return sock;
488 }
489
490 int
491 ip_streamsocket(const uschar * spec, uschar ** errstr, int tmo)
492 {
493 return *spec == '/'
494   ? ip_unixsocket(spec, errstr) : ip_tcpsocket(spec, errstr, tmo);
495 }
496
497 /*************************************************
498 *         Set keepalive on a socket              *
499 *************************************************/
500
501 /* Can be called for both incoming and outgoing sockets.
502
503 Arguments:
504   sock       the socket
505   address    the remote host address, for failure logging
506   torf       true for outgoing connection, false for incoming
507
508 Returns:     nothing
509 */
510
511 void
512 ip_keepalive(int sock, const uschar *address, BOOL torf)
513 {
514 int fodder = 1;
515 if (setsockopt(sock, SOL_SOCKET, SO_KEEPALIVE,
516     US (&fodder), sizeof(fodder)) != 0)
517   log_write(0, LOG_MAIN, "setsockopt(SO_KEEPALIVE) on connection %s %s "
518     "failed: %s", torf? "to":"from", address, strerror(errno));
519 }
520
521
522
523 /*************************************************
524 *         Receive from a socket with timeout     *
525 *************************************************/
526
527 /*
528 Arguments:
529   fd          the file descriptor
530   timeout     the timeout, seconds
531 Returns:      TRUE => ready for i/o
532               FALSE => timed out, or other error
533 */
534 BOOL
535 fd_ready(int fd, int timeout)
536 {
537 fd_set select_inset;
538 time_t start_recv = time(NULL);
539 int time_left = timeout;
540 int rc;
541
542 if (time_left <= 0)
543   {
544   errno = ETIMEDOUT;
545   return FALSE;
546   }
547 /* Wait until the socket is ready */
548
549 do
550   {
551   struct timeval tv = { .tv_sec = time_left, .tv_usec = 0 };
552   FD_ZERO (&select_inset);
553   FD_SET (fd, &select_inset);
554
555   /*DEBUG(D_transport) debug_printf("waiting for data on fd\n");*/
556   rc = select(fd + 1, (SELECT_ARG2_TYPE *)&select_inset, NULL, NULL, &tv);
557
558   /* If some interrupt arrived, just retry. We presume this to be rare,
559   but it can happen (e.g. the SIGUSR1 signal sent by exiwhat causes
560   select() to exit).
561
562   Aug 2004: Somebody set up a cron job that ran exiwhat every 2 minutes, making
563   the interrupt not at all rare. Since the timeout is typically more than 2
564   minutes, the effect was to block the timeout completely. To prevent this
565   happening again, we do an explicit time test and adjust the timeout
566   accordingly */
567
568   if (rc < 0 && errno == EINTR)
569     {
570     DEBUG(D_transport) debug_printf("EINTR while waiting for socket data\n");
571
572     /* Watch out, 'continue' jumps to the condition, not to the loops top */
573     time_left = timeout - (time(NULL) - start_recv);
574     if (time_left > 0) continue;
575     }
576
577   if (rc <= 0)
578     {
579     errno = ETIMEDOUT;
580     return FALSE;
581     }
582
583   /* Checking the FD_ISSET is not enough, if we're interrupted, the
584   select_inset may still contain the 'input'. */
585   }
586 while (rc < 0 || !FD_ISSET(fd, &select_inset));
587 return TRUE;
588 }
589
590 /* The timeout is implemented using select(), and we loop to cover select()
591 getting interrupted, and the possibility of select() returning with a positive
592 result but no ready descriptor. Is this in fact possible?
593
594 Arguments:
595   cctx        the connection context (socket fd, possibly TLS context)
596   buffer      to read into
597   bufsize     the buffer size
598   timeout     the timeout
599
600 Returns:      > 0 => that much data read
601               <= 0 on error or EOF; errno set - zero for EOF
602 */
603
604 int
605 ip_recv(client_conn_ctx * cctx, uschar * buffer, int buffsize, int timeout)
606 {
607 int rc;
608
609 if (!fd_ready(cctx->sock, timeout))
610   return -1;
611
612 /* The socket is ready, read from it (via TLS if it's active). On EOF (i.e.
613 close down of the connection), set errno to zero; otherwise leave it alone. */
614
615 #ifdef SUPPORT_TLS
616 if (cctx->tls_ctx)                                      /* client TLS */
617   rc = tls_read(cctx->tls_ctx, buffer, buffsize);
618 else if (tls_in.active.sock == cctx->sock)              /* server TLS */
619   rc = tls_read(NULL, buffer, buffsize);
620 else
621 #endif
622   rc = recv(cctx->sock, buffer, buffsize, 0);
623
624 if (rc > 0) return rc;
625 if (rc == 0) errno = 0;
626 return -1;
627 }
628
629
630
631
632 /*************************************************
633 *    Lookup address family of potential socket   *
634 *************************************************/
635
636 /* Given a file-descriptor, check to see if it's a socket and, if so,
637 return the address family; detects IPv4 vs IPv6.  If not a socket then
638 return -1.
639
640 The value 0 is typically AF_UNSPEC, which should not be seen on a connected
641 fd.  If the return is -1, the errno will be from getsockname(); probably
642 ENOTSOCK or ECONNRESET.
643
644 Arguments:     socket-or-not fd
645 Returns:       address family or -1
646 */
647
648 int
649 ip_get_address_family(int fd)
650 {
651 struct sockaddr_storage ss;
652 socklen_t sslen = sizeof(ss);
653
654 if (getsockname(fd, (struct sockaddr *) &ss, &sslen) < 0)
655   return -1;
656
657 return (int) ss.ss_family;
658 }
659
660
661
662
663 /*************************************************
664 *       Lookup DSCP settings for a socket        *
665 *************************************************/
666
667 struct dscp_name_tableentry {
668   const uschar *name;
669   int value;
670 };
671 /* Keep both of these tables sorted! */
672 static struct dscp_name_tableentry dscp_table[] = {
673 #ifdef IPTOS_DSCP_AF11
674     { CUS"af11", IPTOS_DSCP_AF11 },
675     { CUS"af12", IPTOS_DSCP_AF12 },
676     { CUS"af13", IPTOS_DSCP_AF13 },
677     { CUS"af21", IPTOS_DSCP_AF21 },
678     { CUS"af22", IPTOS_DSCP_AF22 },
679     { CUS"af23", IPTOS_DSCP_AF23 },
680     { CUS"af31", IPTOS_DSCP_AF31 },
681     { CUS"af32", IPTOS_DSCP_AF32 },
682     { CUS"af33", IPTOS_DSCP_AF33 },
683     { CUS"af41", IPTOS_DSCP_AF41 },
684     { CUS"af42", IPTOS_DSCP_AF42 },
685     { CUS"af43", IPTOS_DSCP_AF43 },
686     { CUS"ef", IPTOS_DSCP_EF },
687 #endif
688 #ifdef IPTOS_LOWCOST
689     { CUS"lowcost", IPTOS_LOWCOST },
690 #endif
691     { CUS"lowdelay", IPTOS_LOWDELAY },
692 #ifdef IPTOS_MINCOST
693     { CUS"mincost", IPTOS_MINCOST },
694 #endif
695     { CUS"reliability", IPTOS_RELIABILITY },
696     { CUS"throughput", IPTOS_THROUGHPUT }
697 };
698 static int dscp_table_size =
699   sizeof(dscp_table) / sizeof(struct dscp_name_tableentry);
700
701 /* DSCP values change by protocol family, and so do the options used for
702 setsockopt(); this utility does all the lookups.  It takes an unexpanded
703 option string, expands it, strips off affix whitespace, then checks if it's
704 a number.  If all of what's left is a number, then that's how the option will
705 be parsed and success/failure is a range check.  If it's not all a number,
706 then it must be a supported keyword.
707
708 Arguments:
709   dscp_name   a string, so far unvalidated
710   af          address_family in use
711   level       setsockopt level to use
712   optname     setsockopt name to use
713   dscp_value  value for dscp_name
714
715 Returns: TRUE if okay to setsockopt(), else FALSE
716
717 *level and *optname may be set even if FALSE is returned
718 */
719
720 BOOL
721 dscp_lookup(const uschar *dscp_name, int af,
722     int *level, int *optname, int *dscp_value)
723 {
724 uschar *dscp_lookup, *p;
725 int first, last;
726 long rawlong;
727
728 if (af == AF_INET)
729   {
730   *level = IPPROTO_IP;
731   *optname = IP_TOS;
732   }
733 #if HAVE_IPV6 && defined(IPV6_TCLASS)
734 else if (af == AF_INET6)
735   {
736   *level = IPPROTO_IPV6;
737   *optname = IPV6_TCLASS;
738   }
739 #endif
740 else
741   {
742   DEBUG(D_transport)
743     debug_printf("Unhandled address family %d in dscp_lookup()\n", af);
744   return FALSE;
745   }
746 if (!dscp_name)
747   {
748   DEBUG(D_transport)
749     debug_printf("[empty DSCP]\n");
750   return FALSE;
751   }
752 dscp_lookup = expand_string(US dscp_name);
753 if (dscp_lookup == NULL || *dscp_lookup == '\0')
754   return FALSE;
755
756 p = dscp_lookup + Ustrlen(dscp_lookup) - 1;
757 while (isspace(*p)) *p-- = '\0';
758 while (isspace(*dscp_lookup) && dscp_lookup < p) dscp_lookup++;
759 if (*dscp_lookup == '\0')
760   return FALSE;
761
762 rawlong = Ustrtol(dscp_lookup, &p, 0);
763 if (p != dscp_lookup && *p == '\0')
764   {
765   /* We have six bits available, which will end up shifted to fit in 0xFC mask.
766   RFC 2597 defines the values unshifted. */
767   if (rawlong < 0 || rawlong > 0x3F)
768     {
769     DEBUG(D_transport)
770       debug_printf("DSCP value %ld out of range, ignored.\n", rawlong);
771     return FALSE;
772     }
773   *dscp_value = rawlong << 2;
774   return TRUE;
775   }
776
777 first = 0;
778 last = dscp_table_size;
779 while (last > first)
780   {
781   int middle = (first + last)/2;
782   int c = Ustrcmp(dscp_lookup, dscp_table[middle].name);
783   if (c == 0)
784     {
785     *dscp_value = dscp_table[middle].value;
786     return TRUE;
787     }
788   else if (c > 0)
789     first = middle + 1;
790   else
791     last = middle;
792   }
793 return FALSE;
794 }
795
796 void
797 dscp_list_to_stream(FILE *stream)
798 {
799 int i;
800 for (i=0; i < dscp_table_size; ++i)
801   fprintf(stream, "%s\n", dscp_table[i].name);
802 }
803
804
805 /* End of ip.c */
806 /* vi: aw ai sw=2
807 */