Add a friendly header to the scenario analysis.

[wloh] / www / ratings-explained.html
diff --git a/www/ratings-explained.html b/www/ratings-explained.html

index 7a9a1b1b73bde171475d0c0dd66b6464ba8ccd1a..f48e76e54aea98150709815c690f4553ecfba0b5 100755 (executable)
--- a/www/ratings-explained.html
+++ b/www/ratings-explained.html
@@ -1,4 +1,8 @@
-<html>
+<?xml version="1.0" encoding="UTF-8" ?>
+<!DOCTYPE
+  html PUBLIC "-//W3C//DTD XHTML 1.1//EN"
+  "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="no">
    <head>
      <title>WLoH-rating</title>
      <link rel="stylesheet" href="/style" type="text/css" />
@@ -21,7 +25,7 @@
        helt vanlig tall, og det er denne vi prøver å måle ut fra resultatene vi ser.
        (Vi prøver altså eksplisitt <em>ikke</em> å dele ut «poeng» for å gjøre det bra,
        kun å estimere den ekte spillestyrken din; selv et tap kan øke ratingen din.)
-      Vi sier at hvis Anne har spillestyrke (rating) 1550 og Bjørn har 1500,
+      Vi sier at hvis Anne har spillestyrke (rating) 550 og Bjørn har 500,
        vil Anne i gjennomsnitt slå Bjørn med 50 poeng hvis de spiller.</p>
  
      <p>Imidlertid er Wordfeud er et spill der tilfeldigheter spiller en viktig rolle,
@@ -29,7 +33,7 @@
        det svinger? Her kommer <a href="http://en.wikipedia.org/wiki/Normal_distribution">normalfordelingen</a>
        inn; de fleste har nok sett kurven for den før:</p>
  
-    <p style="text-align: center;"><img src="norm1" style="width: 360px; height: 354px;"></p>
+    <p style="text-align: center;"><img src="norm1" style="width: 360px; height: 354px;" alt="Normalfordelingskurve med forventningsverdi 50" /></p>
  
      <p>Kurven her sier rett og slett at hvis Anne og Bjørn spiller, er det mest
        sannsynlige at Anne vinner med 50, siden dette er ratingforskjellen deres.
@@ -40,7 +44,7 @@
  
      <p>Ratingen din betyr altså bare noe i forhold til andre spillere, så det
        absolutte tallet er ikke så viktig i seg selv. Gjennomsnittlig spillestyrke
-      settes i utgangspunktet til 1500 poeng; dette er et helt vilkårlig tall,
+      settes i utgangspunktet til 500 poeng; dette er et helt vilkårlig tall,
        men er valgt delvis ut fra tradisjon i andre ratingsystemer. Det kunne like
        gjerne vært 0 eller 100000 (selv om det kanskje virker litt dust at
        en dårlig spiller har rating 99800 og en veldig god 100200).</p>
@@ -50,8 +54,8 @@
      <p>Målet til ratingsystemet blir altså å prøve å måle folks spillestyrke på
        en global skala, til tross for tilfeldighetene. Målet vårt blir å finne
        den kombinasjonen av ratinger som er <em>rimeligst mulig</em>, altså stemmer
-      best, med de observasjonene vi har gjort. På engelsk kalles dette
-      <em>maximum likelihool estimation</em>, eller MLE.</p>
+      best med de observasjonene vi har gjort. På engelsk kalles dette
+      <em>maximum likelihood estimation</em>, eller MLE.</p>
  
      <p>Så, hva er rimeligst vi ser at Anne har slått Bjørn med 50 poeng og ikke
        har noe annen informasjon? Her er åpenbart det mest rimelige at Anne har
@@ -73,7 +77,7 @@
        at Anne ikke bare har slått Bjørn med 50 poeng, men at hun en annen
        gang har tapt med 80 for ham:</p>
  
-    <p style="text-align: center;"><img src="norm2" style="width: 360px; height: 349px;"></p>
+    <p style="text-align: center;"><img src="norm2" style="width: 360px; height: 349px;" alt="Normalfordelingskurve med forventningsverdi ca. -18" /></p>
  
      <p>Her blir det rimeligste resultatet at Bjørn er litt bedre
        (ca. 18 poeng).</p>
@@ -103,20 +107,20 @@
        finne ekte spillestyrke til relativt nye spillere. Hvis for
        eksempel David har banket Emma, Fredrik og Gunnar med 200 poeng
        nedi sin avdeling i 8. divisjon, og man antar i utgangspunktet
-      at en gjennomsnittlig spiller er 1500 poeng, er det da rimelig
-      at David skal ha rating 1700 (som er helt mot toppen av lista)?</p>
+      at en gjennomsnittlig spiller er 500 poeng, er det da rimelig
+      at David skal ha rating 700 (som er helt mot toppen av lista)?</p>
  
      <p>De fleste vil si nei; det er ikke rimelig. Vi uttrykker dette
        med en <em>utgangsantagelse</em> (eller engelsk «prior») om 
        ratingen hos folk generelt, og igjen kommer normalfordelingen inn:</p>
  
-    <p style="text-align: center;"><img src="norm3" style="width: 372px; height: 334px;"></p>
+    <p style="text-align: center;"><img src="norm3" style="width: 372px; height: 334px;" alt="Normalfordelingskurve med forventningsverdi 500" /></p>
  
      <p>Kurven her sier rett og slett at <em>det er få av de aller beste og dårligste spillerne</em>;
-      de fleste ligger rundt 1500 noe sted. Det er rett og slett ikke veldig
-      rimelig at en spiller ligger rundt 1700 i seg selv, og inntil det finnes
+      de fleste ligger rundt 500 noe sted. Det er rett og slett ikke veldig
+      rimelig at en spiller ligger rundt 700 i seg selv, og inntil det finnes
        data som sier noe annet (i praksis et relativt stort antall kamper med
-      godt resultat) vil dette trekke spilleren nærmere 1500. I stor grad
+      godt resultat) vil dette trekke spilleren nærmere 500. I stor grad
        løser dette problemet &ndash; det er dog ingen fullstendig fiks.</p>
  
      <h2>Minorization-maximization</h2>
@@ -134,9 +138,9 @@
      <p>I stedet bruker vi en metode som på fint kalles
        <em>cyclic minorization-maximization</em> (syklisk MM, nært beslektet med EM-algoritmene
        som er i vid bruk). Den er dog ikke så fryktelig komplisert for vårt tilfelle:
-      Først antar vi alle har rating på 1500. Så tar vi Annes rating og
+      Først antar vi alle har rating på 500. Så tar vi Annes rating og
        setter henne riktig (dvs., med maksimal rimelighet) i forhold til
-      alle andre (for eksempel 50 poeng over Bjørns rating på 1500 hvis
+      alle andre (for eksempel 50 poeng over Bjørns rating på 500 hvis
        det er all informasjonen vi har). Så setter vi Bjørn riktig i forhold
        til alle andre, og så videre for alle spillere. Nå er antageligvis
        Anne plassert litt feil (siden Bjørn har flyttet på seg), så vi oppdaterer
@@ -160,7 +164,7 @@
      <p>Dette var faktisk alt. Det skal sies at det sikkert er nok å ta tak i
        som ikke er blitt dekket her &ndash; for eksempel er det ikke beskrevet
        hvordan man regner ut <em>usikkerheten</em> i de estimerte ratingene
-      (hvilket er passe komplekst, og basert på en delvis invertering av
+      (hvilket er passe komplekst, og basert på å invertere
        <a href="http://en.wikipedia.org/wiki/Hessian_matrix">Hess-matrisen</a>
        til rimelighetsfunksjonen),
        eller hvordan modellen vekter kamper eldre kamper gis mindre betydning).</p>