]> git.sesse.net Git - wloh/blobdiff - train.pl
Move most of the train.pl logic into C++. Faster, and less crazy swappy.
[wloh] / train.pl
index 84335e15ee6b459486f51dcf170351ab3a363319..97c33d32534c0697bf451d629e7a4ded8e06e8a9 100755 (executable)
--- a/train.pl
+++ b/train.pl
@@ -42,12 +42,13 @@ WHERE deltager1.Nr > deltager2.nr AND kultur=?
 }
 
 sub output_to_file {
-       my ($games, $ids) = @_;
+       my ($locale, $games, $ids) = @_;
 
        my $tmpnam = POSIX::tmpnam();
        open DATA, ">", $tmpnam
                or die "$tmpnam: $!";
 
+       printf DATA "%s\n", $locale;
        printf DATA "%d\n", scalar keys %$ids;
        for my $id (keys %$ids) {
                printf DATA "%d\n", $id;
@@ -60,66 +61,22 @@ sub output_to_file {
        return $tmpnam;
 }
 
-sub train_model {
-       my ($filename, $locale, $ratings, $covariances, $aux_params) = @_;
-
-       open RATINGS, "$config::base_dir/bayeswf < $filename |"
-               or die "bayeswf: $!";
-       while (<RATINGS>) {
-               chomp;
-               my @x = split;
-               if ($x[0] eq 'covariance') {
-                       push @$covariances, (join("\t", @x[1..3]));
-               } elsif ($x[0] eq 'aux_param') {
-                       push @$aux_params, ($locale .  "\t" . $x[1] . "\t" . $x[2]);
-               } else {
-                       push @$ratings, ($x[2] . "\t" . $x[0] . "\t" . $x[1]);
-               }
-       }
-
-       close RATINGS;
-}
-
 my $dbh = DBI->connect($config::local_connstr, $config::local_username, $config::local_password)
        or die "connect: " . $DBI::errstr;
-$dbh->{AutoCommit} = 0;
-$dbh->{RaiseError} = 1;
-
-$dbh->do('SET client_min_messages TO WARNING');
+$dbh->{AutoCommit} = 1;
 
 my @locales = wloh_common::find_all_locales($dbh);
-
-my @ratings = ();
-my @covariances = ();
-my @aux_params = ();
+my @filenames = ();
 
 for my $locale (@locales) {
        my $last_season = find_last_season($dbh, $locale);
        my @games = ();
        my %ids = ();
        fetch_games($dbh, $locale, $last_season, \@games, \%ids);
-       my $tmpnam = output_to_file(\@games, \%ids);
-
-       train_model($tmpnam, $locale, \@ratings, \@covariances, \@aux_params);
-       unlink($tmpnam);
+       my $tmpnam = output_to_file($locale, \@games, \%ids);
+       push @filenames, $tmpnam;
 }
 
-$dbh->do('CREATE TABLE new_covariance ( player1 smallint NOT NULL, player2 smallint NOT NULL, cov float NOT NULL )');
-$dbh->do('COPY new_covariance ( player1, player2, cov ) FROM STDIN');
-$dbh->pg_putcopydata(join("\n", @covariances));
-$dbh->pg_putcopyend();
-$dbh->do('ALTER TABLE new_covariance ADD PRIMARY KEY ( player1, player2 );');
-$dbh->do('DROP TABLE IF EXISTS covariance');
-$dbh->do('ALTER TABLE new_covariance RENAME TO covariance');
-
-$dbh->do('TRUNCATE aux_params');
-$dbh->do('COPY aux_params ( kultur, id, value ) FROM STDIN');
-$dbh->pg_putcopydata(join("\n", @aux_params));
-$dbh->pg_putcopyend();
-
-$dbh->do('TRUNCATE ratings');
-$dbh->do('COPY ratings ( id, rating, rating_stddev ) FROM STDIN');
-$dbh->pg_putcopydata(join("\n", @ratings));
-$dbh->pg_putcopyend();
+$dbh->disconnect;
 
-$dbh->commit;
+system("$config::base_dir/bayeswf", @filenames);