Docs: tidy for taint-check of transport process args
[exim.git] / doc / doc-txt / experimental-spec.txt
1 From time to time, experimental features may be added to Exim.
2 While a feature  is experimental, there  will be a  build-time
3 option whose name starts  "EXPERIMENTAL_" that must be  set in
4 order to include the  feature. This file contains  information
5 about experimental  features, all  of which  are unstable and
6 liable to incompatible change.
7
8
9 Brightmail AntiSpam (BMI) support
10 --------------------------------------------------------------
11
12 Brightmail  AntiSpam  is  a  commercial  package.  Please  see
13 http://www.brightmail.com    for    more    information     on
14 the product. For  the sake of  clarity, we'll refer  to it  as
15 "BMI" from now on.
16
17
18 0) BMI concept and implementation overview
19
20 In  contrast  to   how  spam-scanning  with   SpamAssassin  is
21 implemented  in  exiscan-acl,  BMI  is  more  suited  for  per
22 -recipient  scanning of  messages. However,  each messages  is
23 scanned  only  once,  but  multiple  "verdicts"  for  multiple
24 recipients can be  returned from the  BMI server. The  exiscan
25 implementation  passes  the  message to  the  BMI  server just
26 before accepting it.  It then adds  the retrieved verdicts  to
27 the messages header file in the spool. These verdicts can then
28 be  queried  in  routers,  where  operation  is  per-recipient
29 instead  of per-message.  To use  BMI, you  need to  take the
30 following steps:
31
32   1) Compile Exim with BMI support
33   2) Set up main BMI options (top section of Exim config file)
34   3) Set up ACL control statement (ACL section of the config
35      file)
36   4) Set up your routers to use BMI verdicts (routers section
37      of the config file).
38   5) (Optional) Set up per-recipient opt-in information.
39
40 These four steps are explained in more details below.
41
42 1) Adding support for BMI at compile time
43
44   To compile with BMI support,  you need to link Exim  against
45   the  Brightmail  client   SDK,  consisting   of  a   library
46   (libbmiclient_single.so)  and  a  header  file  (bmi_api.h).
47   You'll also need to explicitly set a flag in the Makefile to
48   include BMI support in the Exim binary. Both can be achieved
49   with  these lines in Local/Makefile:
50
51   EXPERIMENTAL_BRIGHTMAIL=yes
52   CFLAGS=-I/path/to/the/dir/with/the/includefile
53   EXTRALIBS_EXIM=-L/path/to/the/dir/with/the/library -lbmiclient_single
54
55   If  you use  other CFLAGS  or EXTRALIBS_EXIM  settings then
56   merge the content of these lines with them.
57
58   Note for BMI6.x users: You'll also have to add -lxml2_single
59   to the EXTRALIBS_EXIM line. Users of 5.5x do not need to  do
60   this.
61
62   You    should     also    include     the    location     of
63   libbmiclient_single.so in your dynamic linker  configuration
64   file   (usually   /etc/ld.so.conf)   and   run    "ldconfig"
65   afterwards, or  else the  produced Exim  binary will  not be
66   able to find the library file.
67
68
69 2) Setting up BMI support in the Exim main configuration
70
71   To enable BMI  support in the  main Exim configuration,  you
72   should set the path to the main BMI configuration file  with
73   the "bmi_config_file" option, like this:
74
75   bmi_config_file = /opt/brightmail/etc/brightmail.cfg
76
77   This must go into section 1 of Exim's configuration file (You
78   can  put it  right on  top). If  you omit  this option,  it
79   defaults to /opt/brightmail/etc/brightmail.cfg.
80
81   Note for BMI6.x users: This  file is in XML format  in V6.xx
82   and its  name is  /opt/brightmail/etc/bmiconfig.xml. So  BMI
83   6.x users MUST set the bmi_config_file option.
84
85
86 3) Set up ACL control statement
87
88   To  optimize performance,  it makes  sense only  to process
89   messages coming from remote, untrusted sources with the  BMI
90   server.  To set  up a  messages for  processing by  the BMI
91   server, you MUST set the "bmi_run" control statement in  any
92   ACL for an incoming message.  You will typically do this  in
93   an "accept"  block in  the "acl_check_rcpt"  ACL. You should
94   use the "accept" block(s)  that accept messages from  remote
95   servers for your own domain(s). Here is an example that uses
96   the "accept" blocks from Exim's default configuration file:
97
98
99   accept  domains       = +local_domains
100           endpass
101           verify        = recipient
102           control       = bmi_run
103
104   accept  domains       = +relay_to_domains
105           endpass
106           verify        = recipient
107           control       = bmi_run
108
109   If bmi_run  is not  set in  any ACL  during reception of the
110   message, it will NOT be passed to the BMI server.
111
112
113 4) Setting up routers to use BMI verdicts
114
115   When a message has been  run through the BMI server,  one or
116   more "verdicts" are  present. Different recipients  can have
117   different verdicts. Each  recipient is treated  individually
118   during routing, so you  can query the verdicts  by recipient
119   at  that stage.  From Exim's  view, a  verdict can  have the
120   following outcomes:
121
122   o deliver the message normally
123   o deliver the message to an alternate location
124   o do not deliver the message
125
126   To query  the verdict  for a  recipient, the  implementation
127   offers the following tools:
128
129
130   - Boolean router  preconditions. These  can be  used in  any
131     router. For a simple  implementation of BMI, these  may be
132     all  that  you  need.  The  following  preconditions   are
133     available:
134
135     o bmi_deliver_default
136
137       This  precondition  is  TRUE  if  the  verdict  for  the
138       recipient is  to deliver  the message  normally. If  the
139       message has not been  processed by the BMI  server, this
140       variable defaults to TRUE.
141
142     o bmi_deliver_alternate
143
144       This  precondition  is  TRUE  if  the  verdict  for  the
145       recipient  is to  deliver the  message to  an alternate
146       location.  You  can  get the  location  string  from the
147       $bmi_alt_location expansion variable if you need it. See
148       further below. If the message has not been processed  by
149       the BMI server, this variable defaults to FALSE.
150
151     o bmi_dont_deliver
152
153       This  precondition  is  TRUE  if  the  verdict  for  the
154       recipient  is  NOT  to   deliver  the  message  to   the
155       recipient. You will typically use this precondition in a
156       top-level blackhole router, like this:
157
158         # don't deliver messages handled by the BMI server
159         bmi_blackhole:
160           driver = redirect
161           bmi_dont_deliver
162           data = :blackhole:
163
164       This router should be on top of all others, so  messages
165       that should not be delivered do not reach other  routers
166       at all. If   the  message  has  not  been  processed  by
167       the  BMI server, this variable defaults to FALSE.
168
169
170   - A list router  precondition to query  if rules "fired"  on
171     the message for the recipient. Its name is "bmi_rule". You
172     use  it  by  passing it  a  colon-separated  list of  rule
173     numbers. You can use this condition to route messages that
174     matched specific rules. Here is an example:
175
176       # special router for BMI rule #5, #8 and #11
177       bmi_rule_redirect:
178         driver = redirect
179         bmi_rule = 5:8:11
180         data = postmaster@mydomain.com
181
182
183   - Expansion variables. Several  expansion variables are  set
184     during  routing.  You  can  use  them  in  custom   router
185     conditions,  for  example.  The  following  variables  are
186     available:
187
188     o $bmi_base64_verdict
189
190       This variable  will contain  the BASE64  encoded verdict
191       for the recipient being routed. You can use it to add  a
192       header to messages for tracking purposes, for example:
193
194       localuser:
195         driver = accept
196         check_local_user
197         headers_add = X-Brightmail-Verdict: $bmi_base64_verdict
198         transport = local_delivery
199
200       If there is no verdict available for the recipient being
201       routed, this variable contains the empty string.
202
203     o $bmi_base64_tracker_verdict
204
205       This variable  will contain  a BASE64  encoded subset of
206       the  verdict  information  concerning  the  "rules" that
207       fired  on the  message. You  can add  this string  to a
208       header, commonly named "X-Brightmail-Tracker". Example:
209
210       localuser:
211         driver = accept
212         check_local_user
213         headers_add = X-Brightmail-Tracker: $bmi_base64_tracker_verdict
214         transport = local_delivery
215
216       If there is no verdict available for the recipient being
217       routed, this variable contains the empty string.
218
219     o $bmi_alt_location
220
221       If  the  verdict  is  to  redirect  the  message  to  an
222       alternate  location,  this  variable  will  contain  the
223       alternate location string returned by the BMI server. In
224       its default configuration, this is a header-like  string
225       that can be added to the message with "headers_add".  If
226       there is  no verdict  available for  the recipient being
227       routed, or if the  message is to be  delivered normally,
228       this variable contains the empty string.
229
230     o $bmi_deliver
231
232       This is an additional integer variable that can be  used
233       to query if the message should be delivered at all.  You
234       should use router preconditions instead if possible.
235
236       $bmi_deliver is '0': the message should NOT be delivered.
237       $bmi_deliver is '1': the message should be delivered.
238
239
240   IMPORTANT NOTE: Verdict inheritance.
241   The  message  is passed  to  the BMI  server  during message
242   reception,  using the  target addresses  from the  RCPT TO:
243   commands in the SMTP transaction. If recipients get expanded
244   or re-written (for example by aliasing), the new address(es)
245   inherit the  verdict from  the original  address. This means
246   that verdicts also apply to all "child" addresses  generated
247   from top-level addresses that were sent to the BMI server.
248
249
250 5) Using per-recipient opt-in information (Optional)
251
252   The  BMI server  features multiple  scanning "profiles"  for
253   individual recipients.  These are  usually stored  in a LDAP
254   server and are  queried by the  BMI server itself.  However,
255   you can also  pass opt-in data  for each recipient  from the
256   MTA to the  BMI server. This  is particularly useful  if you
257   already look  up recipient  data in  Exim anyway  (which can
258   also be  stored in  a SQL  database or  other source).  This
259   implementation enables you  to pass opt-in  data to the  BMI
260   server  in  the  RCPT   ACL.  This  works  by   setting  the
261   'bmi_optin' modifier in  a block of  that ACL. If  should be
262   set to a list  of comma-separated strings that  identify the
263   features which the BMI server should use for that particular
264   recipient. Ideally, you  would use the  'bmi_optin' modifier
265   in the same  ACL block where  you set the  'bmi_run' control
266   flag. Here is an example that will pull opt-in data for each
267   recipient      from       a      flat       file      called
268   '/etc/exim/bmi_optin_data'.
269
270   The file format:
271
272     user1@mydomain.com: <OPTIN STRING1>:<OPTIN STRING2>
273     user2@thatdomain.com: <OPTIN STRING3>
274
275
276   The example:
277
278     accept  domains       = +relay_to_domains
279             endpass
280             verify        = recipient
281             bmi_optin     = ${lookup{$local_part@$domain}lsearch{/etc/exim/bmi_optin_data}}
282             control       = bmi_run
283
284   Of course,  you can  also use  any other  lookup method that
285   Exim supports, including LDAP, Postgres, MySQL, Oracle etc.,
286   as long as  the result is  a list of  colon-separated opt-in
287   strings.
288
289   For a list of available opt-in strings, please contact  your
290   Brightmail representative.
291
292
293
294
295 DCC Support
296 --------------------------------------------------------------
297 Distributed Checksum Clearinghouse; http://www.rhyolite.com/dcc/
298
299 *) Building exim
300
301 In order to build exim with DCC support add
302
303 EXPERIMENTAL_DCC=yes
304
305 to your Makefile. (Re-)build/install exim. exim -d should show
306 EXPERIMENTAL_DCC under "Support for".
307
308
309 *) Configuration
310
311 In the main section of exim.cf add at least
312   dccifd_address = /usr/local/dcc/var/dccifd
313 or
314   dccifd_address = <ip> <port>
315
316 In the DATA ACL you can use the new condition
317         dcc = *
318
319 After that "$dcc_header" contains the X-DCC-Header.
320
321 Return values are:
322   fail    for overall "R", "G" from dccifd
323   defer   for overall "T" from dccifd
324   accept  for overall "A", "S" from dccifd
325
326 dcc = */defer_ok works as for spamd.
327
328 The "$dcc_result" variable contains the overall result from DCC
329 answer.  There will an X-DCC: header added to the mail.
330
331 Usually you'll use
332   defer   !dcc = *
333 to greylist with DCC.
334
335 If you set, in the main section,
336   dcc_direct_add_header = true
337 then the dcc header will be added "in deep" and if the spool
338 file was already written it gets removed. This forces Exim to
339 write it again if needed.  This helps to get the DCC Header
340 through to eg. SpamAssassin.
341
342 If you want to pass even more headers in the middle of the
343 DATA stage you can set
344   $acl_m_dcc_add_header
345 to tell the DCC routines to add more information; eg, you might set
346 this to some results from ClamAV.  Be careful.  Header syntax is
347 not checked and is added "as is".
348
349 In case you've troubles with sites sending the same queue items from several
350 hosts and fail to get through greylisting you can use
351 $acl_m_dcc_override_client_ip
352
353 Setting $acl_m_dcc_override_client_ip to an IP address overrides the default
354 of $sender_host_address. eg. use the following ACL in DATA stage:
355
356   warn    set acl_m_dcc_override_client_ip = \
357     ${lookup{$sender_helo_name}nwildlsearch{/etc/mail/multipleip_sites}{$value}{}}
358           condition = ${if def:acl_m_dcc_override_client_ip}
359           log_message = dbg: acl_m_dcc_override_client_ip set to \
360                         $acl_m_dcc_override_client_ip
361
362 Then set something like
363 # cat /etc/mail/multipleip_sites
364 mout-xforward.gmx.net           82.165.159.12
365 mout.gmx.net                    212.227.15.16
366
367 Use a reasonable IP. eg. one the sending cluster actually uses.
368
369
370
371 DSN extra information
372 ---------------------
373 If compiled with EXPERIMENTAL_DSN_INFO extra information will be added
374 to DSN fail messages ("bounces"), when available.  The intent is to aid
375 tracing of specific failing messages, when presented with a "bounce"
376 complaint and needing to search logs.
377
378
379 The remote MTA IP address, with port number if nonstandard.
380 Example:
381   Remote-MTA: X-ip; [127.0.0.1]:587
382 Rationale:
383   Several addresses may correspond to the (already available)
384   dns name for the remote MTA.
385
386 The remote MTA connect-time greeting.
387 Example:
388   X-Remote-MTA-smtp-greeting: X-str; 220 the.local.host.name ESMTP Exim x.yz Tue, 2 Mar 1999 09:44:33 +0000
389 Rationale:
390   This string sometimes presents the remote MTA's idea of its
391   own name, and sometimes identifies the MTA software.
392
393 The remote MTA response to HELO or EHLO.
394 Example:
395   X-Remote-MTA-helo-response: X-str; 250-the.local.host.name Hello localhost [127.0.0.1]
396 Limitations:
397   Only the first line of a multiline response is recorded.
398 Rationale:
399   This string sometimes presents the remote MTA's view of
400   the peer IP connecting to it.
401
402 The reporting MTA detailed diagnostic.
403 Example:
404   X-Exim-Diagnostic: X-str; SMTP error from remote mail server after RCPT TO:<d3@myhost.test.ex>: 550 hard error
405 Rationale:
406   This string sometimes give extra information over the
407   existing (already available) Diagnostic-Code field.
408
409
410 Note that non-RFC-documented field names and data types are used.
411
412
413 Queuefile transport
414 -------------------
415 Queuefile is a pseudo transport which does not perform final delivery.
416 It simply copies the exim spool files out of the spool directory into
417 an external directory retaining the exim spool format.
418
419 The spool files can then be processed by external processes and then
420 requeued into exim spool directories for final delivery.
421 However, note carefully the warnings in the main documentation on
422 qpool file formats.
423
424 The motivation/inspiration for the transport is to allow external
425 processes to access email queued by exim and have access to all the
426 information which would not be available if the messages were delivered
427 to the process in the standard email formats.
428
429 The mailscanner package is one of the processes that can take advantage
430 of this transport to filter email.
431
432 The transport can be used in the same way as the other existing transports,
433 i.e by configuring a router to route mail to a transport configured with
434 the queuefile driver.
435
436 The transport only takes one option:
437
438 * directory - This is used to specify the directory messages should be
439 copied to.  Expanded.
440
441 The generic transport options (body_only, current_directory, disable_logging,
442 debug_print, delivery_date_add, envelope_to_add, event_action, group,
443 headers_add, headers_only, headers_remove, headers_rewrite, home_directory,
444 initgroups, max_parallel, message_size_limit, rcpt_include_affixes,
445 retry_use_local_part, return_path, return_path_add, shadow_condition,
446 shadow_transport, transport_filter, transport_filter_timeout, user) are
447 ignored.
448
449 Sample configuration:
450
451 (Router)
452
453 scan:
454    driver = accept
455    transport = scan
456
457 (Transport)
458
459 scan:
460   driver = queuefile
461   directory = /var/spool/baruwa-scanner/input
462
463
464 In order to build exim with Queuefile transport support add or uncomment
465
466 EXPERIMENTAL_QUEUEFILE=yes
467
468 to your Local/Makefile. (Re-)build/install exim. exim -d should show
469 Experimental_QUEUEFILE in the line "Support for:".
470
471
472 ARC support
473 -----------
474 Specification: https://tools.ietf.org/html/draft-ietf-dmarc-arc-protocol-11
475 Note that this is not an RFC yet, so may change.
476
477 [RFC 8617 was published 2019/06.  Draft 11 was 2018/01.  A review of the
478 changes has not yet been done]
479
480 ARC is intended to support the utility of SPF and DKIM in the presence of
481 intermediaries in the transmission path - forwarders and mailinglists -
482 by establishing a cryptographically-signed chain in headers.
483
484 Normally one would only bother doing ARC-signing when functioning as
485 an intermediary.  One might do verify for local destinations.
486
487 ARC uses the notion of a "ADministrative Management Domain" (ADMD).
488 Described in RFC 5598 (section 2.3), this is essentially a set of
489 mail-handling systems that mail transits that are all under the control
490 of one organisation.  A label should be chosen to identify the ADMD.
491 Messages should be ARC-verified on entry to the ADMD, and ARC-signed on exit
492 from it.
493
494
495 Building with ARC Support
496 --
497 Enable using EXPERIMENTAL_ARC=yes in your Local/Makefile.
498 You must also have DKIM present (not disabled), and you very likely
499 want to have SPF enabled.
500
501
502 Verification
503 --
504 An ACL condition is provided to perform the "verifier actions" detailed
505 in section 6 of the above specification.  It may be called from the DATA ACL
506 and succeeds if the result matches any of a given list.
507 It also records the highest ARC instance number (the chain size)
508 and verification result for later use in creating an Authentication-Results:
509 standard header.
510
511   verify = arc/<acceptable_list>   none:fail:pass
512
513   add_header = :at_start:${authresults {<admd-identifier>}}
514
515         Note that it would be wise to strip incoming messages of A-R headers
516         that claim to be from our own <admd-identifier>.
517
518 There are four new variables:
519
520   $arc_state            One of pass, fail, none
521   $arc_state_reason     (if fail, why)
522   $arc_domains          colon-sep list of ARC chain domains, in chain order.
523                         problematic elements may have empty list elements
524   $arc_oldest_pass      lowest passing instance number of chain
525
526 Example:
527   logwrite = oldest-p-ams: <${reduce {$lh_ARC-Authentication-Results:} \
528                                 {} \
529                                 {${if = {$arc_oldest_pass} \
530                                         {${extract {i}{${extract {1}{;}{$item}}}}} \
531                                         {$item} {$value}}} \
532                             }>
533
534 Receive log lines for an ARC pass will be tagged "ARC".
535
536
537 Signing
538 --
539 arc_sign = <admd-identifier> : <selector> : <privkey> [ : <options> ]
540 An option on the smtp transport, which constructs and prepends to the message
541 an ARC set of headers.  The textually-first Authentication-Results: header
542 is used as a basis (you must have added one on entry to the ADMD).
543 Expanded as a whole; if unset, empty or forced-failure then no signing is done.
544 If it is set, all of the first three elements must be non-empty.
545
546 The fourth element is optional, and if present consists of a comma-separated list
547 of options.  The options implemented are
548
549   timestamps            Add a t= tag to the generated AMS and AS headers, with the
550                         current time.
551   expire[=<val>]        Add an x= tag to the generated AMS header, with an expiry time.
552                         If the value <val> is an plain number it is used unchanged.
553                         If it starts with a '+' then the following number is added
554                         to the current time, as an offset in seconds.
555                         If a value is not given it defaults to a one month offset.
556
557 [As of writing, gmail insist that a t= tag on the AS is mandatory]
558
559 Caveats:
560  * There must be an Authentication-Results header, presumably added by an ACL
561    while receiving the message, for the same ADMD, for arc_sign to succeed.
562    This requires careful coordination between inbound and outbound logic.
563
564    Only one A-R header is taken account of.  This is a limitation versus
565    the ARC spec (which says that all A-R headers from within the ADMD must
566    be used).
567
568  * If passing a message to another system, such as a mailing-list manager
569    (MLM), between receipt and sending, be wary of manipulations to headers made
570    by the MLM.
571    + For instance, Mailman with REMOVE_DKIM_HEADERS==3 might improve
572      deliverability in a pre-ARC world, but that option also renames the
573      Authentication-Results header, which breaks signing.
574
575  * Even if you use multiple DKIM keys for different domains, the ARC concept
576    should try to stick to one ADMD, so pick a primary domain and use that for
577    AR headers and outbound signing.
578
579 Signing is not compatible with cutthrough delivery; any (before expansion)
580 value set for the option will result in cutthrough delivery not being
581 used via the transport in question.
582
583
584
585 Dovecot authenticator via inet socket
586 --------------------------------------------------------------
587 If Dovecot is configured similar to :-
588
589 service auth {
590 ...
591 #SASL
592   inet_listener {
593     name = exim
594     port = 12345
595   }
596 ...
597 }
598
599 then an Exim authenticator can be configured :-
600
601   dovecot-plain:
602     driver =            dovecot
603     public_name =       PLAIN
604     server_socket =     dovecot_server_name 12345
605     server_tls =        true
606     server_set_id =     $auth1
607
608 If the server_socket does not start with a / it is taken as a hostname (or IP);
609 and a whitespace-separated port number must be given.
610
611
612
613
614 Logging protocol unusual states
615 ---------------------------------------------------------------
616 An extra log_selector, "protocol_detail" has been added in the default build.
617 The name may change in future, hence the Experimenal status.
618
619 Currrently the only effect is to enable logging, under TLS,
620 of a TCP RST received directly after a QUIT (in server mode).
621
622 Outlook is consistently doing this; not waiting for the SMTP response
623 to its QUIT, not properly closing the TLS session and not properly closing
624 the TCP connection.  Previously this resulted is an error from SSL_write
625 being logged.
626
627
628
629 Limits ESMTP extension
630 ---------------------------------------------------------------
631 Per https://datatracker.ietf.org/doc/html/draft-freed-smtp-limits-01
632
633 If compiled with EXPERIMENTAL_ESMTP_LIMITS=yes :-
634
635 As a server, Exim will advertise, in the EHLO response, the limit for RCPT
636 commands set by the recipients_max main-section config option (if it is set),
637 and the limit for MAIL commands set by the smtp_accept_max_per_connection
638 option.
639
640 Note that as of writing, smtp_accept_max_per_connection is expanded but
641 recipients_max is not.
642
643 A new main-section option "limits_advertise_hosts" controls whether
644 the limits are advertised; the default for the option is "*".
645
646 As a client, Exim will:
647
648  - note an advertised MAILMAX; the lower of the value given and the
649  value from the transport connection_max_messages option is used.
650
651  - note an advertised RCPTMAX; the lower of the
652  value given and the value from the transport max_rcpt option is used.
653  Parallisation of transactions is not done if due to a RCPTMAX, unlike
654  max_rcpt.
655
656  - note an advertised RCPTDOMAINMAX, and behave as if the transport
657  multi_domains option was set to false.  The value advertised is ignored.
658
659 Values advertised are only noted for TLS connections and ones for which
660 the server does not advertise TLS support.
661
662
663 --------------------------------------------------------------
664 End of file
665 --------------------------------------------------------------