use thawed client config
[buildfarm-server.git] / bf-alerts.pl
1 #!/usr/bin/perl
2
3 use strict;
4
5 use Digest::SHA1  qw(sha1_hex);
6 use MIME::Base64;
7 use DBI;
8 use DBD::Pg;
9 use Data::Dumper;
10 use Mail::Send;
11 use Storable qw(thaw);
12
13 use vars qw($dbhost $dbname $dbuser $dbpass $dbport
14        $all_stat $fail_stat $change_stat $green_stat
15        $default_host
16 );
17
18 require "$ENV{BFConfDir}/BuildFarmWeb.pl";
19
20 die "no dbname" unless $dbname;
21 die "no dbuser" unless $dbuser;
22
23 # don't use configged dbuser/dbpass
24
25 $dbuser=""; $dbpass="";
26
27 my $dsn="dbi:Pg:dbname=$dbname";
28 $dsn .= ";host=$dbhost" if $dbhost;
29 $dsn .= ";port=$dbport" if $dbport;
30
31 my $db = DBI->connect($dsn,$dbuser,$dbpass);
32
33 die $DBI::errstr unless $db;
34
35 my $clear_old = $db->do(q[
36
37     DELETE FROM alerts
38     WHERE sysname IN
39       (SELECT name FROM buildsystems WHERE no_alerts)
40                            ]);
41
42
43 my $sth = $db->prepare(q[
44
45     SELECT DISTINCT ON (sysname, branch) 
46          sysname, branch, 
47          extract(epoch from snapshot at time zone 'GMT')::int as snapshot, 
48          frozen_conf as config
49     FROM build_status s join buildsystems b on (s.sysname = b.name)
50     WHERE NOT b.no_alerts and
51        snapshot > current_timestamp - interval '30 days'
52     ORDER BY sysname, branch, snapshot desc
53
54                           ]);
55
56 $sth->execute;
57
58 my @last_heard;
59
60 while (my $row = $sth->fetchrow_hashref)
61 {
62     push(@last_heard, $row);
63 }
64
65 $sth->finish;
66
67 my $sql = q[
68
69    SELECT sysname, branch, 
70             extract(epoch from first_alert) as first_alert, 
71             extract(epoch from last_notification) as last_notification
72    FROM alerts
73
74             ];
75
76 my $alerts = $db->selectall_hashref($sql,['sysname','branch']);
77
78 my @need_cleared;
79 my @need_alerts;
80
81 my $clear_sth = $db->prepare(q[
82
83   DELETE FROM alerts
84   WHERE sysname = ?
85   AND branch = ?
86                       ]);
87
88 my $update_sth = $db->prepare(q[
89
90   UPDATE alerts
91   SET last_notification = timestamp '1970-01-01' + ( interval '1 second' * $1)
92   WHERE sysname = $2
93   AND branch = $3
94                       ]);
95
96 my $insert_sth = $db->prepare(q[
97
98   INSERT INTO alerts ( sysname, branch, first_alert, last_notification )
99   VALUES ($1, $2,  
100           timestamp '1970-01-01' + ( interval '1 second' * $3),
101           timestamp '1970-01-01' + ( interval '1 second' * $4))
102                       ]);
103
104
105 my $now = time;
106 my $lts = scalar(localtime);
107 print "starting alert run: $lts\n";
108
109 foreach my $sysbranch (@last_heard)
110 {
111     my $client_conf = thaw $sysbranch->{config};
112
113     my %client_alert_settings = %{ $client_conf->{alerts} || {} };
114     my $setting = $client_alert_settings{$sysbranch->{branch}};
115     unless ($setting && $setting->{alert_after} && $setting->{alert_every})
116     {
117         # if no valid setting, clear any alert and keep going
118         if ($alerts->{$sysbranch->{sysname}}->{$sysbranch->{branch}})
119         {
120             $clear_sth->execute($sysbranch->{sysname},$sysbranch->{branch});
121             push(@need_cleared,[$sysbranch]);
122         }
123         next;
124     }
125     # ok, we have valid settings. should the alert be on?
126     my $hours_since_heard = ($now - $sysbranch->{snapshot}) / 3600;
127     # yep
128     print 
129         "have settings for $sysbranch->{sysname}:$sysbranch->{branch} ",
130         "hours since heard = $hours_since_heard, ",
131         "setting = $setting->{alert_after} / $setting->{alert_every} \n";
132
133     if ($hours_since_heard > $setting->{alert_after})
134     {
135         my $known_alert = 
136             $alerts->{$sysbranch->{sysname}}->{$sysbranch->{branch}};
137         if ($known_alert && 
138             ($now - (3600 * $setting->{alert_every})) >
139             $known_alert->{last_notification})
140         {
141             # check if it's too old - 15 days and twice initial seems plenty
142             if ($hours_since_heard > 360 && 
143                      $hours_since_heard  > 2 * $setting->{alert_after} )
144             {
145                 print "alert is too old ... giving up\n";
146                 next;
147             }
148
149             # old alert, but time to alert again
150             print "alert is on, but time to alert again\n";
151             $update_sth->execute($now,
152                                  $sysbranch->{sysname},
153                                  $sysbranch->{branch},
154                                  );
155             push(@need_alerts,[$sysbranch,$setting]);
156             print "alert updated\n";
157         }
158         elsif ( ! $known_alert )
159         {
160             # new alert
161             print "new alert needed\n";
162             $insert_sth->execute($sysbranch->{sysname},
163                                  $sysbranch->{branch},
164                                  $now,$now);
165             print "new record inserted\n";
166             push(@need_alerts,[$sysbranch,$setting]);
167         }
168     }
169     # nope, so clear the alert if it exists
170     elsif ($alerts->{$sysbranch->{sysname}}->{$sysbranch->{branch}})
171     {
172         print "clear exisiting alerts";
173         $clear_sth->execute($sysbranch->{sysname},$sysbranch->{branch});
174         push(@need_cleared,[$sysbranch,$setting]);
175     }
176     
177 }
178
179 print "start emails\n";
180
181 my $addr_sth = $db->prepare(q[
182
183   SELECT owner_email
184   FROM buildsystems
185   WHERE name = ?
186                  ]);
187
188
189 my $me = `id -un`; chomp $me;
190 my $host = `hostname`; chomp ($host);
191 $host = $default_host unless ($host =~ m/[.]/ || !defined($default_host));
192
193 my $from_addr = "PG Build Farm <$me\@$host>";
194 $from_addr =~ tr /\r\n//d;
195
196
197
198 foreach my $clearme (@need_cleared)
199 {
200     my ($sysbranch, $setting) = @$clearme;
201     my ($animal, $branch) = ($sysbranch->{sysname},$sysbranch->{branch});
202     my $text;
203     if ($setting)
204     {
205         my $hours = sprintf("%.2f",($now - $sysbranch->{snapshot}) / 3600);
206         $text = "$sysbranch->{sysname} has now reported " .
207             "on $sysbranch->{branch} $hours hours ago.";
208     }
209     else
210     {
211         $text = "$sysbranch->{sysname} has lost alarm settings on branch: " .
212             "$sysbranch->{branch}. Resetting alarm to off.";
213     }
214     my $msg = new Mail::Send;
215
216     $msg->set('From',$from_addr);
217
218     $addr_sth->execute($animal);
219
220     my $mailto = $addr_sth->fetchrow_array;
221
222     print "sending clear to $mailto\n";
223
224     # $sth->finish;
225
226     $msg->to($mailto);
227     $msg->subject("PGBuildfarm member $animal Branch $branch Alert cleared");
228     my $fh = $msg->open;
229     print $fh "\n\n$text\n"; 
230     $fh->close;
231
232     print "alert cleared $animal $branch\n";
233 }
234
235 foreach my $clearme (@need_alerts)
236 {
237     my ($sysbranch, $setting) = @$clearme;
238     my ($animal, $branch) = ($sysbranch->{sysname},$sysbranch->{branch});
239     my $hours = sprintf("%.2f",($now - $sysbranch->{snapshot}) / 3600);
240     my $text = "$sysbranch->{sysname} has not reported " .
241         "on $sysbranch->{branch} for $hours hours.";
242     my $msg = new Mail::Send;
243
244     $msg->set('From',$from_addr);
245
246     $addr_sth->execute($animal);
247
248     my ($mailto) = $addr_sth->fetchrow_array;
249
250     # $sth->finish;
251
252     print "sending alert to $mailto\n";
253
254     $msg->to($mailto);
255
256     $msg->subject("PGBuildfarm member $animal Branch $branch " .
257                   "Alert notification");
258     my $fh = $msg->open;
259     print $fh "\n\n$text\n"; 
260     $fh->close;
261
262     print "alert sent $animal $branch\n";
263 }
264
265
266 print "=================================\n";
267
268
269