CVE-2020-28009: Integer overflow in get_stdinput()
[exim.git] / src / src / string.c
1 /*************************************************
2 *     Exim - an Internet mail transport agent    *
3 *************************************************/
4
5 /* Copyright (c) University of Cambridge 1995 - 2018 */
6 /* Copyright (c) The Exim Maintainers 2020 */
7 /* See the file NOTICE for conditions of use and distribution. */
8
9 /* Miscellaneous string-handling functions. Some are not required for
10 utilities and tests, and are cut out by the COMPILE_UTILITY macro. */
11
12
13 #include "exim.h"
14 #include <assert.h>
15
16
17 #ifndef COMPILE_UTILITY
18 /*************************************************
19 *            Test for IP address                 *
20 *************************************************/
21
22 /* This used just to be a regular expression, but with IPv6 things are a bit
23 more complicated. If the address contains a colon, it is assumed to be a v6
24 address (assuming HAVE_IPV6 is set). If a mask is permitted and one is present,
25 and maskptr is not NULL, its offset is placed there.
26
27 Arguments:
28   s         a string
29   maskptr   NULL if no mask is permitted to follow
30             otherwise, points to an int where the offset of '/' is placed
31             if there is no / followed by trailing digits, *maskptr is set 0
32
33 Returns:    0 if the string is not a textual representation of an IP address
34             4 if it is an IPv4 address
35             6 if it is an IPv6 address
36 */
37
38 int
39 string_is_ip_address(const uschar *s, int *maskptr)
40 {
41 int yield = 4;
42
43 /* If an optional mask is permitted, check for it. If found, pass back the
44 offset. */
45
46 if (maskptr)
47   {
48   const uschar *ss = s + Ustrlen(s);
49   *maskptr = 0;
50   if (s != ss && isdigit(*(--ss)))
51     {
52     while (ss > s && isdigit(ss[-1])) ss--;
53     if (ss > s && *(--ss) == '/') *maskptr = ss - s;
54     }
55   }
56
57 /* A colon anywhere in the string => IPv6 address */
58
59 if (Ustrchr(s, ':') != NULL)
60   {
61   BOOL had_double_colon = FALSE;
62   BOOL v4end = FALSE;
63
64   yield = 6;
65
66   /* An IPv6 address must start with hex digit or double colon. A single
67   colon is invalid. */
68
69   if (*s == ':' && *(++s) != ':') return 0;
70
71   /* Now read up to 8 components consisting of up to 4 hex digits each. There
72   may be one and only one appearance of double colon, which implies any number
73   of binary zero bits. The number of preceding components is held in count. */
74
75   for (int count = 0; count < 8; count++)
76     {
77     /* If the end of the string is reached before reading 8 components, the
78     address is valid provided a double colon has been read. This also applies
79     if we hit the / that introduces a mask or the % that introduces the
80     interface specifier (scope id) of a link-local address. */
81
82     if (*s == 0 || *s == '%' || *s == '/') return had_double_colon ? yield : 0;
83
84     /* If a component starts with an additional colon, we have hit a double
85     colon. This is permitted to appear once only, and counts as at least
86     one component. The final component may be of this form. */
87
88     if (*s == ':')
89       {
90       if (had_double_colon) return 0;
91       had_double_colon = TRUE;
92       s++;
93       continue;
94       }
95
96     /* If the remainder of the string contains a dot but no colons, we
97     can expect a trailing IPv4 address. This is valid if either there has
98     been no double-colon and this is the 7th component (with the IPv4 address
99     being the 7th & 8th components), OR if there has been a double-colon
100     and fewer than 6 components. */
101
102     if (Ustrchr(s, ':') == NULL && Ustrchr(s, '.') != NULL)
103       {
104       if ((!had_double_colon && count != 6) ||
105           (had_double_colon && count > 6)) return 0;
106       v4end = TRUE;
107       yield = 6;
108       break;
109       }
110
111     /* Check for at least one and not more than 4 hex digits for this
112     component. */
113
114     if (!isxdigit(*s++)) return 0;
115     if (isxdigit(*s) && isxdigit(*(++s)) && isxdigit(*(++s))) s++;
116
117     /* If the component is terminated by colon and there is more to
118     follow, skip over the colon. If there is no more to follow the address is
119     invalid. */
120
121     if (*s == ':' && *(++s) == 0) return 0;
122     }
123
124   /* If about to handle a trailing IPv4 address, drop through. Otherwise
125   all is well if we are at the end of the string or at the mask or at a percent
126   sign, which introduces the interface specifier (scope id) of a link local
127   address. */
128
129   if (!v4end)
130     return (*s == 0 || *s == '%' ||
131            (*s == '/' && maskptr != NULL && *maskptr != 0))? yield : 0;
132   }
133
134 /* Test for IPv4 address, which may be the tail-end of an IPv6 address. */
135
136 for (int i = 0; i < 4; i++)
137   {
138   long n;
139   uschar * end;
140
141   if (i != 0 && *s++ != '.') return 0;
142   n = strtol(CCS s, CSS &end, 10);
143   if (n > 255 || n < 0 || end <= s || end > s+3) return 0;
144   s = end;
145   }
146
147 return !*s || (*s == '/' && maskptr && *maskptr != 0) ? yield : 0;
148 }
149 #endif  /* COMPILE_UTILITY */
150
151
152 /*************************************************
153 *              Format message size               *
154 *************************************************/
155
156 /* Convert a message size in bytes to printing form, rounding
157 according to the magnitude of the number. A value of zero causes
158 a string of spaces to be returned.
159
160 Arguments:
161   size        the message size in bytes
162   buffer      where to put the answer
163
164 Returns:      pointer to the buffer
165               a string of exactly 5 characters is normally returned
166 */
167
168 uschar *
169 string_format_size(int size, uschar *buffer)
170 {
171 if (size == 0) Ustrcpy(buffer, US"     ");
172 else if (size < 1024) sprintf(CS buffer, "%5d", size);
173 else if (size < 10*1024)
174   sprintf(CS buffer, "%4.1fK", (double)size / 1024.0);
175 else if (size < 1024*1024)
176   sprintf(CS buffer, "%4dK", (size + 512)/1024);
177 else if (size < 10*1024*1024)
178   sprintf(CS buffer, "%4.1fM", (double)size / (1024.0 * 1024.0));
179 else
180   sprintf(CS buffer, "%4dM", (size + 512 * 1024)/(1024*1024));
181 return buffer;
182 }
183
184
185
186 #ifndef COMPILE_UTILITY
187 /*************************************************
188 *       Convert a number to base 62 format       *
189 *************************************************/
190
191 /* Convert a long integer into an ASCII base 62 string. For Cygwin the value of
192 BASE_62 is actually 36. Always return exactly 6 characters plus zero, in a
193 static area.
194
195 Argument: a long integer
196 Returns:  pointer to base 62 string
197 */
198
199 uschar *
200 string_base62(unsigned long int value)
201 {
202 static uschar yield[7];
203 uschar *p = yield + sizeof(yield) - 1;
204 *p = 0;
205 while (p > yield)
206   {
207   *(--p) = base62_chars[value % BASE_62];
208   value /= BASE_62;
209   }
210 return yield;
211 }
212 #endif  /* COMPILE_UTILITY */
213
214
215
216 /*************************************************
217 *          Interpret escape sequence             *
218 *************************************************/
219
220 /* This function is called from several places where escape sequences are to be
221 interpreted in strings.
222
223 Arguments:
224   pp       points a pointer to the initiating "\" in the string;
225            the pointer gets updated to point to the final character
226            If the backslash is the last character in the string, it
227            is not interpreted.
228 Returns:   the value of the character escape
229 */
230
231 int
232 string_interpret_escape(const uschar **pp)
233 {
234 #ifdef COMPILE_UTILITY
235 const uschar *hex_digits= CUS"0123456789abcdef";
236 #endif
237 int ch;
238 const uschar *p = *pp;
239 ch = *(++p);
240 if (ch == '\0') return **pp;
241 if (isdigit(ch) && ch != '8' && ch != '9')
242   {
243   ch -= '0';
244   if (isdigit(p[1]) && p[1] != '8' && p[1] != '9')
245     {
246     ch = ch * 8 + *(++p) - '0';
247     if (isdigit(p[1]) && p[1] != '8' && p[1] != '9')
248       ch = ch * 8 + *(++p) - '0';
249     }
250   }
251 else switch(ch)
252   {
253   case 'b':  ch = '\b'; break;
254   case 'f':  ch = '\f'; break;
255   case 'n':  ch = '\n'; break;
256   case 'r':  ch = '\r'; break;
257   case 't':  ch = '\t'; break;
258   case 'v':  ch = '\v'; break;
259   case 'x':
260   ch = 0;
261   if (isxdigit(p[1]))
262     {
263     ch = ch * 16 +
264       Ustrchr(hex_digits, tolower(*(++p))) - hex_digits;
265     if (isxdigit(p[1])) ch = ch * 16 +
266       Ustrchr(hex_digits, tolower(*(++p))) - hex_digits;
267     }
268   break;
269   }
270 *pp = p;
271 return ch;
272 }
273
274
275
276 #ifndef COMPILE_UTILITY
277 /*************************************************
278 *          Ensure string is printable            *
279 *************************************************/
280
281 /* This function is called for critical strings. It checks for any
282 non-printing characters, and if any are found, it makes a new copy
283 of the string with suitable escape sequences. It is most often called by the
284 macro string_printing(), which sets flags to 0.
285
286 Arguments:
287   s             the input string
288   flags         Bit 0: convert tabs.  Bit 1: convert spaces.
289
290 Returns:        string with non-printers encoded as printing sequences
291 */
292
293 const uschar *
294 string_printing2(const uschar *s, int flags)
295 {
296 int nonprintcount = 0;
297 int length = 0;
298 const uschar *t = s;
299 uschar *ss, *tt;
300
301 while (*t != 0)
302   {
303   int c = *t++;
304   if (  !mac_isprint(c)
305      || flags & SP_TAB && c == '\t'
306      || flags & SP_SPACE && c == ' '
307      ) nonprintcount++;
308   length++;
309   }
310
311 if (nonprintcount == 0) return s;
312
313 /* Get a new block of store guaranteed big enough to hold the
314 expanded string. */
315
316 tt = ss = store_get(length + nonprintcount * 3 + 1, is_tainted(s));
317
318 /* Copy everything, escaping non printers. */
319
320 for (t = s; *t; )
321   {
322   int c = *t;
323   if (  mac_isprint(c)
324      && (!(flags & SP_TAB) || c != '\t')
325      && (!(flags & SP_SPACE) || c != ' ')
326      )
327     *tt++ = *t++;
328   else
329     {
330     *tt++ = '\\';
331     switch (*t)
332       {
333       case '\n': *tt++ = 'n'; break;
334       case '\r': *tt++ = 'r'; break;
335       case '\b': *tt++ = 'b'; break;
336       case '\v': *tt++ = 'v'; break;
337       case '\f': *tt++ = 'f'; break;
338       case '\t': *tt++ = 't'; break;
339       default: sprintf(CS tt, "%03o", *t); tt += 3; break;
340       }
341     t++;
342     }
343   }
344 *tt = 0;
345 return ss;
346 }
347 #endif  /* COMPILE_UTILITY */
348
349 /*************************************************
350 *        Undo printing escapes in string         *
351 *************************************************/
352
353 /* This function is the reverse of string_printing2.  It searches for
354 backslash characters and if any are found, it makes a new copy of the
355 string with escape sequences parsed.  Otherwise it returns the original
356 string.
357
358 Arguments:
359   s             the input string
360
361 Returns:        string with printing escapes parsed back
362 */
363
364 uschar *
365 string_unprinting(uschar *s)
366 {
367 uschar *p, *q, *r, *ss;
368 int len, off;
369
370 p = Ustrchr(s, '\\');
371 if (!p) return s;
372
373 len = Ustrlen(s) + 1;
374 ss = store_get(len, is_tainted(s));
375
376 q = ss;
377 off = p - s;
378 if (off)
379   {
380   memcpy(q, s, off);
381   q += off;
382   }
383
384 while (*p)
385   {
386   if (*p == '\\')
387     {
388     *q++ = string_interpret_escape((const uschar **)&p);
389     p++;
390     }
391   else
392     {
393     r = Ustrchr(p, '\\');
394     if (!r)
395       {
396       off = Ustrlen(p);
397       memcpy(q, p, off);
398       p += off;
399       q += off;
400       break;
401       }
402     else
403       {
404       off = r - p;
405       memcpy(q, p, off);
406       q += off;
407       p = r;
408       }
409     }
410   }
411 *q = '\0';
412
413 return ss;
414 }
415
416
417
418
419 #if (defined(HAVE_LOCAL_SCAN) || defined(EXPAND_DLFUNC)) \
420         && !defined(MACRO_PREDEF) && !defined(COMPILE_UTILITY)
421 /*************************************************
422 *            Copy and save string                *
423 *************************************************/
424
425 /*
426 Argument: string to copy
427 Returns:  copy of string in new store with the same taint status
428 */
429
430 uschar *
431 string_copy_function(const uschar *s)
432 {
433 return string_copy_taint(s, is_tainted(s));
434 }
435
436 /* This function assumes that memcpy() is faster than strcpy().
437 As above, but explicitly specifying the result taint status
438 */
439
440 uschar *
441 string_copy_taint_function(const uschar * s, BOOL tainted)
442 {
443 int len = Ustrlen(s) + 1;
444 uschar *ss = store_get(len, tainted);
445 memcpy(ss, s, len);
446 return ss;
447 }
448
449
450
451 /*************************************************
452 *       Copy and save string, given length       *
453 *************************************************/
454
455 /* It is assumed the data contains no zeros. A zero is added
456 onto the end.
457
458 Arguments:
459   s         string to copy
460   n         number of characters
461
462 Returns:    copy of string in new store
463 */
464
465 uschar *
466 string_copyn_function(const uschar *s, int n)
467 {
468 uschar *ss = store_get(n + 1, is_tainted(s));
469 Ustrncpy(ss, s, n);
470 ss[n] = 0;
471 return ss;
472 }
473 #endif
474
475
476 /*************************************************
477 *     Copy and save string in malloc'd store     *
478 *************************************************/
479
480 /* This function assumes that memcpy() is faster than strcpy().
481
482 Argument: string to copy
483 Returns:  copy of string in new store
484 */
485
486 uschar *
487 string_copy_malloc(const uschar *s)
488 {
489 int len = Ustrlen(s) + 1;
490 uschar *ss = store_malloc(len);
491 memcpy(ss, s, len);
492 return ss;
493 }
494
495
496
497 /*************************************************
498 *    Copy string if long, inserting newlines     *
499 *************************************************/
500
501 /* If the given string is longer than 75 characters, it is copied, and within
502 the copy, certain space characters are converted into newlines.
503
504 Argument:  pointer to the string
505 Returns:   pointer to the possibly altered string
506 */
507
508 uschar *
509 string_split_message(uschar *msg)
510 {
511 uschar *s, *ss;
512
513 if (msg == NULL || Ustrlen(msg) <= 75) return msg;
514 s = ss = msg = string_copy(msg);
515
516 for (;;)
517   {
518   int i = 0;
519   while (i < 75 && *ss != 0 && *ss != '\n') ss++, i++;
520   if (*ss == 0) break;
521   if (*ss == '\n')
522     s = ++ss;
523   else
524     {
525     uschar *t = ss + 1;
526     uschar *tt = NULL;
527     while (--t > s + 35)
528       {
529       if (*t == ' ')
530         {
531         if (t[-1] == ':') { tt = t; break; }
532         if (tt == NULL) tt = t;
533         }
534       }
535
536     if (tt == NULL)          /* Can't split behind - try ahead */
537       {
538       t = ss + 1;
539       while (*t != 0)
540         {
541         if (*t == ' ' || *t == '\n')
542           { tt = t; break; }
543         t++;
544         }
545       }
546
547     if (tt == NULL) break;   /* Can't find anywhere to split */
548     *tt = '\n';
549     s = ss = tt+1;
550     }
551   }
552
553 return msg;
554 }
555
556
557
558 /*************************************************
559 *   Copy returned DNS domain name, de-escaping   *
560 *************************************************/
561
562 /* If a domain name contains top-bit characters, some resolvers return
563 the fully qualified name with those characters turned into escapes. The
564 convention is a backslash followed by _decimal_ digits. We convert these
565 back into the original binary values. This will be relevant when
566 allow_utf8_domains is set true and UTF-8 characters are used in domain
567 names. Backslash can also be used to escape other characters, though we
568 shouldn't come across them in domain names.
569
570 Argument:   the domain name string
571 Returns:    copy of string in new store, de-escaped
572 */
573
574 uschar *
575 string_copy_dnsdomain(uschar *s)
576 {
577 uschar *yield;
578 uschar *ss = yield = store_get(Ustrlen(s) + 1, is_tainted(s));
579
580 while (*s != 0)
581   {
582   if (*s != '\\')
583     *ss++ = *s++;
584   else if (isdigit(s[1]))
585     {
586     *ss++ = (s[1] - '0')*100 + (s[2] - '0')*10 + s[3] - '0';
587     s += 4;
588     }
589   else if (*(++s) != 0)
590     *ss++ = *s++;
591   }
592
593 *ss = 0;
594 return yield;
595 }
596
597
598 #ifndef COMPILE_UTILITY
599 /*************************************************
600 *     Copy space-terminated or quoted string     *
601 *************************************************/
602
603 /* This function copies from a string until its end, or until whitespace is
604 encountered, unless the string begins with a double quote, in which case the
605 terminating quote is sought, and escaping within the string is done. The length
606 of a de-quoted string can be no longer than the original, since escaping always
607 turns n characters into 1 character.
608
609 Argument:  pointer to the pointer to the first character, which gets updated
610 Returns:   the new string
611 */
612
613 uschar *
614 string_dequote(const uschar **sptr)
615 {
616 const uschar *s = *sptr;
617 uschar *t, *yield;
618
619 /* First find the end of the string */
620
621 if (*s != '\"')
622   while (*s != 0 && !isspace(*s)) s++;
623 else
624   {
625   s++;
626   while (*s && *s != '\"')
627     {
628     if (*s == '\\') (void)string_interpret_escape(&s);
629     s++;
630     }
631   if (*s) s++;
632   }
633
634 /* Get enough store to copy into */
635
636 t = yield = store_get(s - *sptr + 1, is_tainted(*sptr));
637 s = *sptr;
638
639 /* Do the copy */
640
641 if (*s != '\"')
642   while (*s != 0 && !isspace(*s)) *t++ = *s++;
643 else
644   {
645   s++;
646   while (*s != 0 && *s != '\"')
647     {
648     *t++ = *s == '\\' ? string_interpret_escape(&s) : *s;
649     s++;
650     }
651   if (*s) s++;
652   }
653
654 /* Update the pointer and return the terminated copy */
655
656 *sptr = s;
657 *t = 0;
658 return yield;
659 }
660 #endif  /* COMPILE_UTILITY */
661
662
663
664 /*************************************************
665 *          Format a string and save it           *
666 *************************************************/
667
668 /* The formatting is done by string_vformat, which checks the length of
669 everything.  Taint is taken from the worst of the arguments.
670
671 Arguments:
672   format    a printf() format - deliberately char * rather than uschar *
673               because it will most usually be a literal string
674   ...       arguments for format
675
676 Returns:    pointer to fresh piece of store containing sprintf'ed string
677 */
678
679 uschar *
680 string_sprintf_trc(const char *format, const uschar * func, unsigned line, ...)
681 {
682 #ifdef COMPILE_UTILITY
683 uschar buffer[STRING_SPRINTF_BUFFER_SIZE];
684 gstring gs = { .size = STRING_SPRINTF_BUFFER_SIZE, .ptr = 0, .s = buffer };
685 gstring * g = &gs;
686 unsigned flags = 0;
687 #else
688 gstring * g = NULL;
689 unsigned flags = SVFMT_REBUFFER|SVFMT_EXTEND;
690 #endif
691
692 va_list ap;
693 va_start(ap, line);
694 g = string_vformat_trc(g, func, line, STRING_SPRINTF_BUFFER_SIZE,
695         flags, format, ap);
696 va_end(ap);
697
698 if (!g)
699   log_write(0, LOG_MAIN|LOG_PANIC_DIE,
700     "string_sprintf expansion was longer than %d; format string was (%s)\n"
701     " called from %s %d\n",
702     STRING_SPRINTF_BUFFER_SIZE, format, func, line);
703
704 #ifdef COMPILE_UTILITY
705 return string_copyn(g->s, g->ptr);
706 #else
707 gstring_release_unused(g);
708 return string_from_gstring(g);
709 #endif
710 }
711
712
713
714 /*************************************************
715 *         Case-independent strncmp() function    *
716 *************************************************/
717
718 /*
719 Arguments:
720   s         first string
721   t         second string
722   n         number of characters to compare
723
724 Returns:    < 0, = 0, or > 0, according to the comparison
725 */
726
727 int
728 strncmpic(const uschar *s, const uschar *t, int n)
729 {
730 while (n--)
731   {
732   int c = tolower(*s++) - tolower(*t++);
733   if (c) return c;
734   }
735 return 0;
736 }
737
738
739 /*************************************************
740 *         Case-independent strcmp() function     *
741 *************************************************/
742
743 /*
744 Arguments:
745   s         first string
746   t         second string
747
748 Returns:    < 0, = 0, or > 0, according to the comparison
749 */
750
751 int
752 strcmpic(const uschar *s, const uschar *t)
753 {
754 while (*s != 0)
755   {
756   int c = tolower(*s++) - tolower(*t++);
757   if (c != 0) return c;
758   }
759 return *t;
760 }
761
762
763 /*************************************************
764 *         Case-independent strstr() function     *
765 *************************************************/
766
767 /* The third argument specifies whether whitespace is required
768 to follow the matched string.
769
770 Arguments:
771   s              string to search
772   t              substring to search for
773   space_follows  if TRUE, match only if whitespace follows
774
775 Returns:         pointer to substring in string, or NULL if not found
776 */
777
778 uschar *
779 strstric(uschar *s, uschar *t, BOOL space_follows)
780 {
781 uschar *p = t;
782 uschar *yield = NULL;
783 int cl = tolower(*p);
784 int cu = toupper(*p);
785
786 while (*s)
787   {
788   if (*s == cl || *s == cu)
789     {
790     if (yield == NULL) yield = s;
791     if (*(++p) == 0)
792       {
793       if (!space_follows || s[1] == ' ' || s[1] == '\n' ) return yield;
794       yield = NULL;
795       p = t;
796       }
797     cl = tolower(*p);
798     cu = toupper(*p);
799     s++;
800     }
801   else if (yield != NULL)
802     {
803     yield = NULL;
804     p = t;
805     cl = tolower(*p);
806     cu = toupper(*p);
807     }
808   else s++;
809   }
810 return NULL;
811 }
812
813
814
815 #ifdef COMPILE_UTILITY
816 /* Dummy version for this function; it should never be called */
817 static void
818 gstring_grow(gstring * g, int count)
819 {
820 assert(FALSE);
821 }
822 #endif
823
824
825
826 #ifndef COMPILE_UTILITY
827 /*************************************************
828 *       Get next string from separated list      *
829 *************************************************/
830
831 /* Leading and trailing space is removed from each item. The separator in the
832 list is controlled by the int pointed to by the separator argument as follows:
833
834   If the value is > 0 it is used as the separator. This is typically used for
835   sublists such as slash-separated options. The value is always a printing
836   character.
837
838     (If the value is actually > UCHAR_MAX there is only one item in the list.
839     This is used for some cases when called via functions that sometimes
840     plough through lists, and sometimes are given single items.)
841
842   If the value is <= 0, the string is inspected for a leading <x, where x is an
843   ispunct() or an iscntrl() character. If found, x is used as the separator. If
844   not found:
845
846       (a) if separator == 0, ':' is used
847       (b) if separator <0, -separator is used
848
849   In all cases the value of the separator that is used is written back to the
850   int so that it is used on subsequent calls as we progress through the list.
851
852 A literal ispunct() separator can be represented in an item by doubling, but
853 there is no way to include an iscntrl() separator as part of the data.
854
855 Arguments:
856   listptr    points to a pointer to the current start of the list; the
857              pointer gets updated to point after the end of the next item
858   separator  a pointer to the separator character in an int (see above)
859   buffer     where to put a copy of the next string in the list; or
860                NULL if the next string is returned in new memory
861   buflen     when buffer is not NULL, the size of buffer; otherwise ignored
862
863 Returns:     pointer to buffer, containing the next substring,
864              or NULL if no more substrings
865 */
866
867 uschar *
868 string_nextinlist_trc(const uschar **listptr, int *separator, uschar *buffer, int buflen,
869  const uschar * func, int line)
870 {
871 int sep = *separator;
872 const uschar *s = *listptr;
873 BOOL sep_is_special;
874
875 if (!s) return NULL;
876
877 /* This allows for a fixed specified separator to be an iscntrl() character,
878 but at the time of implementation, this is never the case. However, it's best
879 to be conservative. */
880
881 while (isspace(*s) && *s != sep) s++;
882
883 /* A change of separator is permitted, so look for a leading '<' followed by an
884 allowed character. */
885
886 if (sep <= 0)
887   {
888   if (*s == '<' && (ispunct(s[1]) || iscntrl(s[1])))
889     {
890     sep = s[1];
891     if (*++s) ++s;
892     while (isspace(*s) && *s != sep) s++;
893     }
894   else
895     sep = sep ? -sep : ':';
896   *separator = sep;
897   }
898
899 /* An empty string has no list elements */
900
901 if (!*s) return NULL;
902
903 /* Note whether whether or not the separator is an iscntrl() character. */
904
905 sep_is_special = iscntrl(sep);
906
907 /* Handle the case when a buffer is provided. */
908
909 if (buffer)
910   {
911   int p = 0;
912   if (is_tainted(s) && !is_tainted(buffer))
913     die_tainted(US"string_nextinlist", func, line);
914   for (; *s; s++)
915     {
916     if (*s == sep && (*(++s) != sep || sep_is_special)) break;
917     if (p < buflen - 1) buffer[p++] = *s;
918     }
919   while (p > 0 && isspace(buffer[p-1])) p--;
920   buffer[p] = '\0';
921   }
922
923 /* Handle the case when a buffer is not provided. */
924
925 else
926   {
927   gstring * g = NULL;
928
929   /* We know that *s != 0 at this point. However, it might be pointing to a
930   separator, which could indicate an empty string, or (if an ispunct()
931   character) could be doubled to indicate a separator character as data at the
932   start of a string. Avoid getting working memory for an empty item. */
933
934   if (*s == sep)
935     {
936     s++;
937     if (*s != sep || sep_is_special)
938       {
939       *listptr = s;
940       return string_copy(US"");
941       }
942     }
943
944   /* Not an empty string; the first character is guaranteed to be a data
945   character. */
946
947   for (;;)
948     {
949     const uschar * ss;
950     for (ss = s + 1; *ss && *ss != sep; ) ss++;
951     g = string_catn(g, s, ss-s);
952     s = ss;
953     if (!*s || *++s != sep || sep_is_special) break;
954     }
955   /* while (g->ptr > 0 && isspace(g->s[g->ptr-1])) g->ptr--; */
956   while (  g->ptr > 0 && isspace(g->s[g->ptr-1])
957         && (g->ptr == 1 || g->s[g->ptr-2] != '\\') )
958     g->ptr--;
959   buffer = string_from_gstring(g);
960   gstring_release_unused(g);
961   }
962
963 /* Update the current pointer and return the new string */
964
965 *listptr = s;
966 return buffer;
967 }
968
969
970 static const uschar *
971 Ustrnchr(const uschar * s, int c, unsigned * len)
972 {
973 unsigned siz = *len;
974 while (siz)
975   {
976   if (!*s) return NULL;
977   if (*s == c)
978     {
979     *len = siz;
980     return s;
981     }
982   s++;
983   siz--;
984   }
985 return NULL;
986 }
987
988
989 /************************************************
990 *       Add element to separated list           *
991 ************************************************/
992 /* This function is used to build a list, returning an allocated null-terminated
993 growable string. The given element has any embedded separator characters
994 doubled.
995
996 Despite having the same growable-string interface as string_cat() the list is
997 always returned null-terminated.
998
999 Arguments:
1000   list  expanding-string for the list that is being built, or NULL
1001         if this is a new list that has no contents yet
1002   sep   list separator character
1003   ele   new element to be appended to the list
1004
1005 Returns:  pointer to the start of the list, changed if copied for expansion.
1006 */
1007
1008 gstring *
1009 string_append_listele(gstring * list, uschar sep, const uschar * ele)
1010 {
1011 uschar * sp;
1012
1013 if (list && list->ptr)
1014   list = string_catn(list, &sep, 1);
1015
1016 while((sp = Ustrchr(ele, sep)))
1017   {
1018   list = string_catn(list, ele, sp-ele+1);
1019   list = string_catn(list, &sep, 1);
1020   ele = sp+1;
1021   }
1022 list = string_cat(list, ele);
1023 (void) string_from_gstring(list);
1024 return list;
1025 }
1026
1027
1028 gstring *
1029 string_append_listele_n(gstring * list, uschar sep, const uschar * ele,
1030  unsigned len)
1031 {
1032 const uschar * sp;
1033
1034 if (list && list->ptr)
1035   list = string_catn(list, &sep, 1);
1036
1037 while((sp = Ustrnchr(ele, sep, &len)))
1038   {
1039   list = string_catn(list, ele, sp-ele+1);
1040   list = string_catn(list, &sep, 1);
1041   ele = sp+1;
1042   len--;
1043   }
1044 list = string_catn(list, ele, len);
1045 (void) string_from_gstring(list);
1046 return list;
1047 }
1048
1049
1050
1051 /* A slightly-bogus listmaker utility; the separator is a string so
1052 can be multiple chars - there is no checking for the element content
1053 containing any of the separator. */
1054
1055 gstring *
1056 string_append2_listele_n(gstring * list, const uschar * sepstr,
1057  const uschar * ele, unsigned len)
1058 {
1059 if (list && list->ptr)
1060   list = string_cat(list, sepstr);
1061
1062 list = string_catn(list, ele, len);
1063 (void) string_from_gstring(list);
1064 return list;
1065 }
1066
1067
1068
1069 /************************************************/
1070 /* Add more space to a growable-string.  The caller should check
1071 first if growth is required.  The gstring struct is modified on
1072 return; specifically, the string-base-pointer may have been changed.
1073
1074 Arguments:
1075   g             the growable-string
1076   count         amount needed for g->ptr to increase by
1077 */
1078
1079 static void
1080 gstring_grow(gstring * g, int count)
1081 {
1082 int p = g->ptr;
1083 int oldsize = g->size;
1084 BOOL tainted = is_tainted(g->s);
1085
1086 /* Mostly, string_cat() is used to build small strings of a few hundred
1087 characters at most. There are times, however, when the strings are very much
1088 longer (for example, a lookup that returns a vast number of alias addresses).
1089 To try to keep things reasonable, we use increments whose size depends on the
1090 existing length of the string. */
1091
1092 unsigned inc = oldsize < 4096 ? 127 : 1023;
1093
1094 if (g->ptr < 0 || g->ptr > g->size || g->size >= INT_MAX/2)
1095   log_write(0, LOG_MAIN|LOG_PANIC_DIE,
1096     "internal error in gstring_grow (ptr %d size %d)", g->ptr, g->size);
1097
1098 if (count <= 0) return;
1099
1100 if (count >= INT_MAX/2 - g->ptr)
1101   log_write(0, LOG_MAIN|LOG_PANIC_DIE,
1102     "internal error in gstring_grow (ptr %d count %d)", g->ptr, count);
1103
1104 g->size = (p + count + inc + 1) & ~inc;         /* one for a NUL */
1105
1106 /* Try to extend an existing allocation. If the result of calling
1107 store_extend() is false, either there isn't room in the current memory block,
1108 or this string is not the top item on the dynamic store stack. We then have
1109 to get a new chunk of store and copy the old string. When building large
1110 strings, it is helpful to call store_release() on the old string, to release
1111 memory blocks that have become empty. (The block will be freed if the string
1112 is at its start.) However, we can do this only if we know that the old string
1113 was the last item on the dynamic memory stack. This is the case if it matches
1114 store_last_get. */
1115
1116 if (!store_extend(g->s, tainted, oldsize, g->size))
1117   g->s = store_newblock(g->s, tainted, g->size, p);
1118 }
1119
1120
1121
1122 /*************************************************
1123 *             Add chars to string                *
1124 *************************************************/
1125 /* This function is used when building up strings of unknown length. Room is
1126 always left for a terminating zero to be added to the string that is being
1127 built. This function does not require the string that is being added to be NUL
1128 terminated, because the number of characters to add is given explicitly. It is
1129 sometimes called to extract parts of other strings.
1130
1131 Arguments:
1132   string   points to the start of the string that is being built, or NULL
1133              if this is a new string that has no contents yet
1134   s        points to characters to add
1135   count    count of characters to add; must not exceed the length of s, if s
1136              is a C string.
1137
1138 Returns:   pointer to the start of the string, changed if copied for expansion.
1139            Note that a NUL is not added, though space is left for one. This is
1140            because string_cat() is often called multiple times to build up a
1141            string - there's no point adding the NUL till the end.
1142
1143 */
1144 /* coverity[+alloc] */
1145
1146 gstring *
1147 string_catn(gstring * g, const uschar *s, int count)
1148 {
1149 int p;
1150 BOOL srctaint = is_tainted(s);
1151
1152 if (count < 0)
1153   log_write(0, LOG_MAIN|LOG_PANIC_DIE,
1154     "internal error in string_catn (count %d)", count);
1155
1156 if (!g)
1157   {
1158   unsigned inc = count < 4096 ? 127 : 1023;
1159   unsigned size = ((count + inc) &  ~inc) + 1;
1160   g = string_get_tainted(size, srctaint);
1161   }
1162 else if (srctaint && !is_tainted(g->s))
1163   gstring_rebuffer(g);
1164
1165 if (g->ptr < 0 || g->ptr > g->size)
1166   log_write(0, LOG_MAIN|LOG_PANIC_DIE,
1167     "internal error in string_catn (ptr %d size %d)", g->ptr, g->size);
1168
1169 p = g->ptr;
1170 if (count >= g->size - p)
1171   gstring_grow(g, count);
1172
1173 /* Because we always specify the exact number of characters to copy, we can
1174 use memcpy(), which is likely to be more efficient than strncopy() because the
1175 latter has to check for zero bytes. */
1176
1177 memcpy(g->s + p, s, count);
1178 g->ptr = p + count;
1179 return g;
1180 }
1181
1182
1183 gstring *
1184 string_cat(gstring *string, const uschar *s)
1185 {
1186 return string_catn(string, s, Ustrlen(s));
1187 }
1188
1189
1190
1191 /*************************************************
1192 *        Append strings to another string        *
1193 *************************************************/
1194
1195 /* This function can be used to build a string from many other strings.
1196 It calls string_cat() to do the dirty work.
1197
1198 Arguments:
1199   string   expanding-string that is being built, or NULL
1200              if this is a new string that has no contents yet
1201   count    the number of strings to append
1202   ...      "count" uschar* arguments, which must be valid zero-terminated
1203              C strings
1204
1205 Returns:   pointer to the start of the string, changed if copied for expansion.
1206            The string is not zero-terminated - see string_cat() above.
1207 */
1208
1209 __inline__ gstring *
1210 string_append(gstring *string, int count, ...)
1211 {
1212 va_list ap;
1213
1214 va_start(ap, count);
1215 while (count-- > 0)
1216   {
1217   uschar *t = va_arg(ap, uschar *);
1218   string = string_cat(string, t);
1219   }
1220 va_end(ap);
1221
1222 return string;
1223 }
1224 #endif
1225
1226
1227
1228 /*************************************************
1229 *        Format a string with length checks      *
1230 *************************************************/
1231
1232 /* This function is used to format a string with checking of the length of the
1233 output for all conversions. It protects Exim from absent-mindedness when
1234 calling functions like debug_printf and string_sprintf, and elsewhere. There
1235 are two different entry points to what is actually the same function, depending
1236 on whether the variable length list of data arguments are given explicitly or
1237 as a va_list item.
1238
1239 The formats are the usual printf() ones, with some omissions (never used) and
1240 three additions for strings: %S forces lower case, %T forces upper case, and
1241 %#s or %#S prints nothing for a NULL string. Without the # "NULL" is printed
1242 (useful in debugging). There is also the addition of %D and %M, which insert
1243 the date in the form used for datestamped log files.
1244
1245 Arguments:
1246   buffer       a buffer in which to put the formatted string
1247   buflen       the length of the buffer
1248   format       the format string - deliberately char * and not uschar *
1249   ... or ap    variable list of supplementary arguments
1250
1251 Returns:       TRUE if the result fitted in the buffer
1252 */
1253
1254 BOOL
1255 string_format_trc(uschar * buffer, int buflen,
1256   const uschar * func, unsigned line, const char * format, ...)
1257 {
1258 gstring g = { .size = buflen, .ptr = 0, .s = buffer }, *gp;
1259 va_list ap;
1260 va_start(ap, format);
1261 gp = string_vformat_trc(&g, func, line, STRING_SPRINTF_BUFFER_SIZE,
1262         0, format, ap);
1263 va_end(ap);
1264 g.s[g.ptr] = '\0';
1265 return !!gp;
1266 }
1267
1268
1269
1270
1271 /* Build or append to a growing-string, sprintf-style.
1272
1273 Arguments:
1274         g       a growable-string
1275         func    called-from function name, for debug
1276         line    called-from file line number, for debug
1277         limit   maximum string size
1278         flags   see below
1279         format  printf-like format string
1280         ap      variable-args pointer
1281
1282 Flags:
1283         SVFMT_EXTEND            buffer can be created or exteded as needed
1284         SVFMT_REBUFFER          buffer can be recopied to tainted mem as needed
1285         SVFMT_TAINT_NOCHK       do not check inputs for taint
1286
1287 If the "extend" flag is true, the string passed in can be NULL,
1288 empty, or non-empty.  Growing is subject to an overall limit given
1289 by the limit argument.
1290
1291 If the "extend" flag is false, the string passed in may not be NULL,
1292 will not be grown, and is usable in the original place after return.
1293 The return value can be NULL to signify overflow.
1294
1295 Returns the possibly-new (if copy for growth or taint-handling was needed)
1296 string, not nul-terminated.
1297 */
1298
1299 gstring *
1300 string_vformat_trc(gstring * g, const uschar * func, unsigned line,
1301   unsigned size_limit, unsigned flags, const char *format, va_list ap)
1302 {
1303 enum ltypes { L_NORMAL=1, L_SHORT=2, L_LONG=3, L_LONGLONG=4, L_LONGDOUBLE=5, L_SIZE=6 };
1304
1305 int width, precision, off, lim, need;
1306 const char * fp = format;       /* Deliberately not unsigned */
1307 BOOL dest_tainted = FALSE;
1308
1309 string_datestamp_offset = -1;   /* Datestamp not inserted */
1310 string_datestamp_length = 0;    /* Datestamp not inserted */
1311 string_datestamp_type = 0;      /* Datestamp not inserted */
1312
1313 #ifdef COMPILE_UTILITY
1314 assert(!(flags & SVFMT_EXTEND));
1315 assert(g);
1316 #else
1317
1318 /* Ensure we have a string, to save on checking later */
1319 if (!g) g = string_get(16);
1320 else if (!(flags & SVFMT_TAINT_NOCHK)) dest_tainted = is_tainted(g->s);
1321
1322 if (!(flags & SVFMT_TAINT_NOCHK) && !dest_tainted && is_tainted(format))
1323   {
1324 #ifndef MACRO_PREDEF
1325   if (!(flags & SVFMT_REBUFFER))
1326     die_tainted(US"string_vformat", func, line);
1327 #endif
1328   gstring_rebuffer(g);
1329   dest_tainted = TRUE;
1330   }
1331 #endif  /*!COMPILE_UTILITY*/
1332
1333 lim = g->size - 1;      /* leave one for a nul */
1334 off = g->ptr;           /* remember initial offset in gstring */
1335
1336 /* Scan the format and handle the insertions */
1337
1338 while (*fp)
1339   {
1340   int length = L_NORMAL;
1341   int *nptr;
1342   int slen;
1343   const char *null = "NULL";            /* ) These variables */
1344   const char *item_start, *s;           /* ) are deliberately */
1345   char newformat[16];                   /* ) not unsigned */
1346   char * gp = CS g->s + g->ptr;         /* ) */
1347
1348   /* Non-% characters just get copied verbatim */
1349
1350   if (*fp != '%')
1351     {
1352     /* Avoid string_copyn() due to COMPILE_UTILITY */
1353     if ((need = g->ptr + 1) > lim)
1354       {
1355       if (!(flags & SVFMT_EXTEND) || need > size_limit) return NULL;
1356       gstring_grow(g, 1);
1357       lim = g->size - 1;
1358       }
1359     g->s[g->ptr++] = (uschar) *fp++;
1360     continue;
1361     }
1362
1363   /* Deal with % characters. Pick off the width and precision, for checking
1364   strings, skipping over the flag and modifier characters. */
1365
1366   item_start = fp;
1367   width = precision = -1;
1368
1369   if (strchr("-+ #0", *(++fp)) != NULL)
1370     {
1371     if (*fp == '#') null = "";
1372     fp++;
1373     }
1374
1375   if (isdigit((uschar)*fp))
1376     {
1377     width = *fp++ - '0';
1378     while (isdigit((uschar)*fp)) width = width * 10 + *fp++ - '0';
1379     }
1380   else if (*fp == '*')
1381     {
1382     width = va_arg(ap, int);
1383     fp++;
1384     }
1385
1386   if (*fp == '.')
1387     if (*(++fp) == '*')
1388       {
1389       precision = va_arg(ap, int);
1390       fp++;
1391       }
1392     else
1393       for (precision = 0; isdigit((uschar)*fp); fp++)
1394         precision = precision*10 + *fp - '0';
1395
1396   /* Skip over 'h', 'L', 'l', 'll' and 'z', remembering the item length */
1397
1398   if (*fp == 'h')
1399     { fp++; length = L_SHORT; }
1400   else if (*fp == 'L')
1401     { fp++; length = L_LONGDOUBLE; }
1402   else if (*fp == 'l')
1403     if (fp[1] == 'l')
1404       { fp += 2; length = L_LONGLONG; }
1405     else
1406       { fp++; length = L_LONG; }
1407   else if (*fp == 'z')
1408     { fp++; length = L_SIZE; }
1409
1410   /* Handle each specific format type. */
1411
1412   switch (*fp++)
1413     {
1414     case 'n':
1415       nptr = va_arg(ap, int *);
1416       *nptr = g->ptr - off;
1417       break;
1418
1419     case 'd':
1420     case 'o':
1421     case 'u':
1422     case 'x':
1423     case 'X':
1424       width = length > L_LONG ? 24 : 12;
1425       if ((need = g->ptr + width) > lim)
1426         {
1427         if (!(flags & SVFMT_EXTEND) || need >= size_limit) return NULL;
1428         gstring_grow(g, width);
1429         lim = g->size - 1;
1430         gp = CS g->s + g->ptr;
1431         }
1432       strncpy(newformat, item_start, fp - item_start);
1433       newformat[fp - item_start] = 0;
1434
1435       /* Short int is promoted to int when passing through ..., so we must use
1436       int for va_arg(). */
1437
1438       switch(length)
1439         {
1440         case L_SHORT:
1441         case L_NORMAL:
1442           g->ptr += sprintf(gp, newformat, va_arg(ap, int)); break;
1443         case L_LONG:
1444           g->ptr += sprintf(gp, newformat, va_arg(ap, long int)); break;
1445         case L_LONGLONG:
1446           g->ptr += sprintf(gp, newformat, va_arg(ap, LONGLONG_T)); break;
1447         case L_SIZE:
1448           g->ptr += sprintf(gp, newformat, va_arg(ap, size_t)); break;
1449         }
1450       break;
1451
1452     case 'p':
1453       {
1454       void * ptr;
1455       if ((need = g->ptr + 24) > lim)
1456         {
1457         if (!(flags & SVFMT_EXTEND || need >= size_limit)) return NULL;
1458         gstring_grow(g, 24);
1459         lim = g->size - 1;
1460         gp = CS g->s + g->ptr;
1461         }
1462       /* sprintf() saying "(nil)" for a null pointer seems unreliable.
1463       Handle it explicitly. */
1464       if ((ptr = va_arg(ap, void *)))
1465         {
1466         strncpy(newformat, item_start, fp - item_start);
1467         newformat[fp - item_start] = 0;
1468         g->ptr += sprintf(gp, newformat, ptr);
1469         }
1470       else
1471         g->ptr += sprintf(gp, "(nil)");
1472       }
1473     break;
1474
1475     /* %f format is inherently insecure if the numbers that it may be
1476     handed are unknown (e.g. 1e300). However, in Exim, %f is used for
1477     printing load averages, and these are actually stored as integers
1478     (load average * 1000) so the size of the numbers is constrained.
1479     It is also used for formatting sending rates, where the simplicity
1480     of the format prevents overflow. */
1481
1482     case 'f':
1483     case 'e':
1484     case 'E':
1485     case 'g':
1486     case 'G':
1487       if (precision < 0) precision = 6;
1488       if ((need = g->ptr + precision + 8) > lim)
1489         {
1490         if (!(flags & SVFMT_EXTEND || need >= size_limit)) return NULL;
1491         gstring_grow(g, precision+8);
1492         lim = g->size - 1;
1493         gp = CS g->s + g->ptr;
1494         }
1495       strncpy(newformat, item_start, fp - item_start);
1496       newformat[fp-item_start] = 0;
1497       if (length == L_LONGDOUBLE)
1498         g->ptr += sprintf(gp, newformat, va_arg(ap, long double));
1499       else
1500         g->ptr += sprintf(gp, newformat, va_arg(ap, double));
1501       break;
1502
1503     /* String types */
1504
1505     case '%':
1506       if ((need = g->ptr + 1) > lim)
1507         {
1508         if (!(flags & SVFMT_EXTEND || need >= size_limit)) return NULL;
1509         gstring_grow(g, 1);
1510         lim = g->size - 1;
1511         }
1512       g->s[g->ptr++] = (uschar) '%';
1513       break;
1514
1515     case 'c':
1516       if ((need = g->ptr + 1) > lim)
1517         {
1518         if (!(flags & SVFMT_EXTEND || need >= size_limit)) return NULL;
1519         gstring_grow(g, 1);
1520         lim = g->size - 1;
1521         }
1522       g->s[g->ptr++] = (uschar) va_arg(ap, int);
1523       break;
1524
1525     case 'D':                   /* Insert daily datestamp for log file names */
1526       s = CS tod_stamp(tod_log_datestamp_daily);
1527       string_datestamp_offset = g->ptr;         /* Passed back via global */
1528       string_datestamp_length = Ustrlen(s);     /* Passed back via global */
1529       string_datestamp_type = tod_log_datestamp_daily;
1530       slen = string_datestamp_length;
1531       goto INSERT_STRING;
1532
1533     case 'M':                   /* Insert monthly datestamp for log file names */
1534       s = CS tod_stamp(tod_log_datestamp_monthly);
1535       string_datestamp_offset = g->ptr;         /* Passed back via global */
1536       string_datestamp_length = Ustrlen(s);     /* Passed back via global */
1537       string_datestamp_type = tod_log_datestamp_monthly;
1538       slen = string_datestamp_length;
1539       goto INSERT_STRING;
1540
1541     case 's':
1542     case 'S':                   /* Forces *lower* case */
1543     case 'T':                   /* Forces *upper* case */
1544       s = va_arg(ap, char *);
1545
1546       if (!s) s = null;
1547       slen = Ustrlen(s);
1548
1549       if (!(flags & SVFMT_TAINT_NOCHK) && !dest_tainted && is_tainted(s))
1550         if (flags & SVFMT_REBUFFER)
1551           {
1552           gstring_rebuffer(g);
1553           gp = CS g->s + g->ptr;
1554           dest_tainted = TRUE;
1555           }
1556 #ifndef MACRO_PREDEF
1557         else
1558           die_tainted(US"string_vformat", func, line);
1559 #endif
1560
1561     INSERT_STRING:              /* Come to from %D or %M above */
1562
1563       {
1564       BOOL truncated = FALSE;
1565
1566       /* If the width is specified, check that there is a precision
1567       set; if not, set it to the width to prevent overruns of long
1568       strings. */
1569
1570       if (width >= 0)
1571         {
1572         if (precision < 0) precision = width;
1573         }
1574
1575       /* If a width is not specified and the precision is specified, set
1576       the width to the precision, or the string length if shorted. */
1577
1578       else if (precision >= 0)
1579         width = precision < slen ? precision : slen;
1580
1581       /* If neither are specified, set them both to the string length. */
1582
1583       else
1584         width = precision = slen;
1585
1586       if ((need = g->ptr + width) >= size_limit || !(flags & SVFMT_EXTEND))
1587         {
1588         if (g->ptr == lim) return NULL;
1589         if (need > lim)
1590           {
1591           truncated = TRUE;
1592           width = precision = lim - g->ptr - 1;
1593           if (width < 0) width = 0;
1594           if (precision < 0) precision = 0;
1595           }
1596         }
1597       else if (need > lim)
1598         {
1599         gstring_grow(g, width);
1600         lim = g->size - 1;
1601         gp = CS g->s + g->ptr;
1602         }
1603
1604       g->ptr += sprintf(gp, "%*.*s", width, precision, s);
1605       if (fp[-1] == 'S')
1606         while (*gp) { *gp = tolower(*gp); gp++; }
1607       else if (fp[-1] == 'T')
1608         while (*gp) { *gp = toupper(*gp); gp++; }
1609
1610       if (truncated) return NULL;
1611       break;
1612       }
1613
1614     /* Some things are never used in Exim; also catches junk. */
1615
1616     default:
1617       strncpy(newformat, item_start, fp - item_start);
1618       newformat[fp-item_start] = 0;
1619       log_write(0, LOG_MAIN|LOG_PANIC_DIE, "string_format: unsupported type "
1620         "in \"%s\" in \"%s\"", newformat, format);
1621       break;
1622     }
1623   }
1624
1625 if (g->ptr > g->size)
1626   log_write(0, LOG_MAIN|LOG_PANIC_DIE,
1627     "string_format internal error: caller %s %d", func, line);
1628 return g;
1629 }
1630
1631
1632
1633 #ifndef COMPILE_UTILITY
1634 /*************************************************
1635 *       Generate an "open failed" message        *
1636 *************************************************/
1637
1638 /* This function creates a message after failure to open a file. It includes a
1639 string supplied as data, adds the strerror() text, and if the failure was
1640 "Permission denied", reads and includes the euid and egid.
1641
1642 Arguments:
1643   eno           the value of errno after the failure
1644   format        a text format string - deliberately not uschar *
1645   ...           arguments for the format string
1646
1647 Returns:        a message, in dynamic store
1648 */
1649
1650 uschar *
1651 string_open_failed_trc(int eno, const uschar * func, unsigned line,
1652   const char *format, ...)
1653 {
1654 va_list ap;
1655 gstring * g = string_get(1024);
1656
1657 g = string_catn(g, US"failed to open ", 15);
1658
1659 /* Use the checked formatting routine to ensure that the buffer
1660 does not overflow. It should not, since this is called only for internally
1661 specified messages. If it does, the message just gets truncated, and there
1662 doesn't seem much we can do about that. */
1663
1664 va_start(ap, format);
1665 (void) string_vformat_trc(g, func, line, STRING_SPRINTF_BUFFER_SIZE,
1666         SVFMT_REBUFFER, format, ap);
1667 string_from_gstring(g);
1668 gstring_release_unused(g);
1669 va_end(ap);
1670
1671 return eno == EACCES
1672   ? string_sprintf("%s: %s (euid=%ld egid=%ld)", g->s, strerror(eno),
1673     (long int)geteuid(), (long int)getegid())
1674   : string_sprintf("%s: %s", g->s, strerror(eno));
1675 }
1676 #endif  /* COMPILE_UTILITY */
1677
1678
1679
1680
1681
1682 #ifndef COMPILE_UTILITY
1683 /* qsort(3), currently used to sort the environment variables
1684 for -bP environment output, needs a function to compare two pointers to string
1685 pointers. Here it is. */
1686
1687 int
1688 string_compare_by_pointer(const void *a, const void *b)
1689 {
1690 return Ustrcmp(* CUSS a, * CUSS b);
1691 }
1692 #endif /* COMPILE_UTILITY */
1693
1694
1695
1696
1697 /*************************************************
1698 **************************************************
1699 *             Stand-alone test program           *
1700 **************************************************
1701 *************************************************/
1702
1703 #ifdef STAND_ALONE
1704 int main(void)
1705 {
1706 uschar buffer[256];
1707
1708 printf("Testing is_ip_address\n");
1709
1710 while (fgets(CS buffer, sizeof(buffer), stdin) != NULL)
1711   {
1712   int offset;
1713   buffer[Ustrlen(buffer) - 1] = 0;
1714   printf("%d\n", string_is_ip_address(buffer, NULL));
1715   printf("%d %d %s\n", string_is_ip_address(buffer, &offset), offset, buffer);
1716   }
1717
1718 printf("Testing string_nextinlist\n");
1719
1720 while (fgets(CS buffer, sizeof(buffer), stdin) != NULL)
1721   {
1722   uschar *list = buffer;
1723   uschar *lp1, *lp2;
1724   uschar item[256];
1725   int sep1 = 0;
1726   int sep2 = 0;
1727
1728   if (*list == '<')
1729     {
1730     sep1 = sep2 = list[1];
1731     list += 2;
1732     }
1733
1734   lp1 = lp2 = list;
1735   for (;;)
1736     {
1737     uschar *item1 = string_nextinlist(&lp1, &sep1, item, sizeof(item));
1738     uschar *item2 = string_nextinlist(&lp2, &sep2, NULL, 0);
1739
1740     if (item1 == NULL && item2 == NULL) break;
1741     if (item == NULL || item2 == NULL || Ustrcmp(item1, item2) != 0)
1742       {
1743       printf("***ERROR\nitem1=\"%s\"\nitem2=\"%s\"\n",
1744         (item1 == NULL)? "NULL" : CS item1,
1745         (item2 == NULL)? "NULL" : CS item2);
1746       break;
1747       }
1748     else printf("  \"%s\"\n", CS item1);
1749     }
1750   }
1751
1752 /* This is a horrible lash-up, but it serves its purpose. */
1753
1754 printf("Testing string_format\n");
1755
1756 while (fgets(CS buffer, sizeof(buffer), stdin) != NULL)
1757   {
1758   void *args[3];
1759   long long llargs[3];
1760   double dargs[3];
1761   int dflag = 0;
1762   int llflag = 0;
1763   int n = 0;
1764   int count;
1765   int countset = 0;
1766   uschar format[256];
1767   uschar outbuf[256];
1768   uschar *s;
1769   buffer[Ustrlen(buffer) - 1] = 0;
1770
1771   s = Ustrchr(buffer, ',');
1772   if (s == NULL) s = buffer + Ustrlen(buffer);
1773
1774   Ustrncpy(format, buffer, s - buffer);
1775   format[s-buffer] = 0;
1776
1777   if (*s == ',') s++;
1778
1779   while (*s != 0)
1780     {
1781     uschar *ss = s;
1782     s = Ustrchr(ss, ',');
1783     if (s == NULL) s = ss + Ustrlen(ss);
1784
1785     if (isdigit(*ss))
1786       {
1787       Ustrncpy(outbuf, ss, s-ss);
1788       if (Ustrchr(outbuf, '.') != NULL)
1789         {
1790         dflag = 1;
1791         dargs[n++] = Ustrtod(outbuf, NULL);
1792         }
1793       else if (Ustrstr(outbuf, "ll") != NULL)
1794         {
1795         llflag = 1;
1796         llargs[n++] = strtoull(CS outbuf, NULL, 10);
1797         }
1798       else
1799         {
1800         args[n++] = (void *)Uatoi(outbuf);
1801         }
1802       }
1803
1804     else if (Ustrcmp(ss, "*") == 0)
1805       {
1806       args[n++] = (void *)(&count);
1807       countset = 1;
1808       }
1809
1810     else
1811       {
1812       uschar *sss = malloc(s - ss + 1);
1813       Ustrncpy(sss, ss, s-ss);
1814       args[n++] = sss;
1815       }
1816
1817     if (*s == ',') s++;
1818     }
1819
1820   if (!dflag && !llflag)
1821     printf("%s\n", string_format(outbuf, sizeof(outbuf), CS format,
1822       args[0], args[1], args[2])? "True" : "False");
1823
1824   else if (dflag)
1825     printf("%s\n", string_format(outbuf, sizeof(outbuf), CS format,
1826       dargs[0], dargs[1], dargs[2])? "True" : "False");
1827
1828   else printf("%s\n", string_format(outbuf, sizeof(outbuf), CS format,
1829     llargs[0], llargs[1], llargs[2])? "True" : "False");
1830
1831   printf("%s\n", CS outbuf);
1832   if (countset) printf("count=%d\n", count);
1833   }
1834
1835 return 0;
1836 }
1837 #endif
1838
1839 /* End of string.c */