X-Git-Url: https://git.sesse.net/?a=blobdiff_plain;f=www%2Fratings-explained.html;h=8af260e0662f345b5ea906149ec21a645b1594c2;hb=fde909c294de9806dd6337f5acb0ed87c41557c6;hp=ace89963c81f3a8f0a3f7940e5ff2f1cb8162458;hpb=f6ebc698f5231a7c9bd62254fc3d9ee4487ff3c9;p=wloh diff --git a/www/ratings-explained.html b/www/ratings-explained.html index ace8996..8af260e 100755 --- a/www/ratings-explained.html +++ b/www/ratings-explained.html @@ -5,7 +5,7 @@ WLoH-rating - +

WLoH-rating

@@ -13,7 +13,7 @@

Dette er et hobbyprosjekt fra tredjepart, og ikke en offisiell del av Wordfeud Leage of Honour.

-

Dette er et forsøk på å forklare hvordan ratingene +

Dette er et forsøk på å forklare hvordan ratingene som brukes på denne siden regnes ut. Forklaringen er ment å være ikke-teknisk; det hjelper å ha en viss sans for matematikk, men den er med vilje skrevet uten for mange greske bokstaver og lignende.

@@ -25,7 +25,7 @@ helt vanlig tall, og det er denne vi prøver å måle ut fra resultatene vi ser. (Vi prøver altså eksplisitt ikke å dele ut «poeng» for å gjøre det bra, kun å estimere den ekte spillestyrken din; selv et tap kan øke ratingen din.) - Vi sier at hvis Anne har spillestyrke (rating) 1550 og Bjørn har 1500, + Vi sier at hvis Anne har spillestyrke (rating) 550 og Bjørn har 500, vil Anne i gjennomsnitt slå Bjørn med 50 poeng hvis de spiller.

Imidlertid er Wordfeud er et spill der tilfeldigheter spiller en viktig rolle, @@ -44,7 +44,7 @@

Ratingen din betyr altså bare noe i forhold til andre spillere, så det absolutte tallet er ikke så viktig i seg selv. Gjennomsnittlig spillestyrke - settes i utgangspunktet til 1500 poeng; dette er et helt vilkårlig tall, + settes i utgangspunktet til 500 poeng; dette er et helt vilkårlig tall, men er valgt delvis ut fra tradisjon i andre ratingsystemer. Det kunne like gjerne vært 0 eller 100000 (selv om det kanskje virker litt dust at en dårlig spiller har rating 99800 og en veldig god 100200).

@@ -107,20 +107,20 @@ finne ekte spillestyrke til relativt nye spillere. Hvis for eksempel David har banket Emma, Fredrik og Gunnar med 200 poeng nedi sin avdeling i 8. divisjon, og man antar i utgangspunktet - at en gjennomsnittlig spiller er 1500 poeng, er det da rimelig - at David skal ha rating 1700 (som er helt mot toppen av lista)?

+ at en gjennomsnittlig spiller er 500 poeng, er det da rimelig + at David skal ha rating 700 (som er helt mot toppen av lista)?

De fleste vil si nei; det er ikke rimelig. Vi uttrykker dette med en utgangsantagelse (eller engelsk «prior») om ratingen hos folk generelt, og igjen kommer normalfordelingen inn:

-

Normalfordelingskurve med forventningsverdi 1500

+

Normalfordelingskurve med forventningsverdi 500

Kurven her sier rett og slett at det er fÃ¥ av de aller beste og dÃ¥rligste spillerne; - de fleste ligger rundt 1500 noe sted. Det er rett og slett ikke veldig - rimelig at en spiller ligger rundt 1700 i seg selv, og inntil det finnes + de fleste ligger rundt 500 noe sted. Det er rett og slett ikke veldig + rimelig at en spiller ligger rundt 700 i seg selv, og inntil det finnes data som sier noe annet (i praksis et relativt stort antall kamper med - godt resultat) vil dette trekke spilleren nærmere 1500. I stor grad + godt resultat) vil dette trekke spilleren nærmere 500. I stor grad løser dette problemet – det er dog ingen fullstendig fiks.

Minorization-maximization

@@ -138,9 +138,9 @@

I stedet bruker vi en metode som på fint kalles cyclic minorization-maximization (syklisk MM, nært beslektet med EM-algoritmene som er i vid bruk). Den er dog ikke så fryktelig komplisert for vårt tilfelle: - Først antar vi alle har rating på 1500. Så tar vi Annes rating og + Først antar vi alle har rating på 500. Så tar vi Annes rating og setter henne riktig (dvs., med maksimal rimelighet) i forhold til - alle andre (for eksempel 50 poeng over Bjørns rating på 1500 hvis + alle andre (for eksempel 50 poeng over Bjørns rating på 500 hvis det er all informasjonen vi har). Så setter vi Bjørn riktig i forhold til alle andre, og så videre for alle spillere. Nå er antageligvis Anne plassert litt feil (siden Bjørn har flyttet på seg), så vi oppdaterer