Beispiel für Iteration

Beispiel für Iteration

 

Iterationsverfahren werden in der Mathematik angewandt, um Gleichungen mit mehreren Unbekannten zu lösen. Das Verfahren an sich ist ganz simpel: mit immer stärker angenäherten Werten für die Variablen werden die Berechnungen solange wiederholt [iterare (lat.) bedeutet „wiederholen“], bis die Variablen exakt oder hinreichend genau bestimmt sind.

 

Nehmen wir folgendes Beispiel an:

 

Die Bilanzen der Direktvergleiche von fünf Mannschaften seien wie folgt: (Tabelle 1)

 

Vergleich

Direktvergleiche

Ergebnis

Gewinnpunkte

A – B

6

beide gewinnen gleich oft

3:3

A – C

7

C gewinnt 2 mal öfter

2,5:4,5

A – D

1

D gewinnt

0:1

A – E

0

kein Direktvergleich

0:0

B – C

10

beide gewinnen gleich oft

5:5

B – D

13

B gewinnt 4 mal öfter

8,5:4,5

B – E

9

E gewinnt 1 mal öfter

4:5

C – D

4

beide gewinnen gleich oft

2:2

C – E

3

C gewinnt 1 mal öfter

2:1

D – E

12

D gewinnt 1 mal öfter

6,5:5,5

 

Die Gewinnpunkte der einzelnen Teams betragen demnach summiert:

 

Team A

5,5 aus 14 Spielen

Team B

20,5 aus 38 Spielen

Team C

13,5 aus 24 Spielen

Team D

14,0 aus 30 Spielen

Team E

11,5 aus 24 Spielen

 

Berechnet werden sollen die Leistungsabstände der einzelnen Teams. Um dies zu können, ist es zunächst erforderlich, jedem der fünf Teams eine Leistungszahl zuzuordnen. (Dies sind die fünf Unbekannten im Beispiel).

 

Im ctr-Rechenmodell wird die Normalverteilungsfunktion zur Skalierung verwendet. Ob nun Normalverteilung oder logistische Verteilung verwandt wird, ist zunächst völlig unbedeutend. Wichtig ist nur, dass bei der Gegenrechnung (Überprüfung) innerhalb des gleichen Systems gerechnet wird und die Zahlen der einzelnen Systeme nicht vermengt werden.

 

Im Excel-Format (dies wurde gewählt, um Ihnen die Überprüfung zu ermöglichen) ist die Formel für die Wertungsdifferenz D innerhalb der Normalverteilung =(NORMVERT(D;0;WURZEL(2)*200;1))

 

Zunächst stellen wir uns auf einen Unwissenheitsstandpunkt! Bedenken Sie dabei, dass man z.B. in Österreich den Unwissenheits- sogar in einen Unfähigkeitsstandpunkt gesteigert hat. Dann betrachten Sie mal bitte, welch hoher Lebensstandard damit dort erreicht wurde …

 

Vom Unwissenheitsstandpunkt aus weisen wir allen Teams zunächst die Wertungspunktzahl (Rating) null zu! Selbstredend wäre damit die Differenz zwischen allen Teams jeweils 0. Eine Lösung „alle ratings = 0“ wäre korrekt, wenn alle Mannschaften gleich oft gewonnen wie verloren hätten. Hammse aber nicht!

 

 

Team

Zielwert

Spiele (n)

Rating

S (Rating)

Anpassung

Näherung

A

5,5

14

0,0000

  7,00000

 (5,5-7)/14*400=

-42,8571

B

20,5

38

0,0000

19,00000

 (20,5-19)/38*400=

15,7895

C

13,5

24

0,0000

12,00000

 (13,5-12)/24*400=

25,0000

D

14,0

30

0,0000

15,00000

 (14-15)/30*400=

-13,3333

E

11,5

24

0,0000

12,00000

 (11,5-12)/24*400=

-8,3333

 

 

 

 

 

 

 

In der Spalte S (Rating)“ stehen die Gewinnpunktsummen, die sich aus den Differenzen der Ratings, wie sie in der Spalte „Rating“ stehen, ergäben. Die von den Teams tatsächlich erreichten Ergebnisse stellen nun die „Zielwerte“ dar. Ziel ist also, dass die Werte in S (Rating)“ jeweils mit den Zielwerten übereinstimmen.

 

Die Werte können nur dann übereinstimmen, wenn alle Ratingdifferenzen korrekt ermittelt sind. Es ist offensichtlich, dass die Aussage, alle Ratings hätten den Wert 0, falsch ist. Eine Annäherung an die korrekten Werte wird im Beispiel durch lineare Anpassung schrittweise erreicht. (Der Wert, der sich in der Spalte Anpassung ergibt, wird zum jeweiligen Wert aus der Spalte Rating addiert. Dies ergibt in der Summe den Wert für die Näherung. Da zu Beginn in der Spalte Rating jeweils ‚0’ steht, ist der 1.Anpassungswert identisch mit dem 1.Näherungswert, da die Anpassung jeweils zur 0 addiert wird).


Hierbei werden die Gewinnpunkte, die sich aus den unterstellten Ratings ergeben, mit dem Zielwert verglichen. Also: (Zielwert – Rechenwert), dividiert durch Anzahl der Spiele, mal Anpassungsfaktor. Die Höhe des Anpassungsfaktors ist grundsätzlich unbedeutend; ist er aber günstig gewählt, so kommt man schnell zu einem Ergebnis - im Beispiel ist er mit 400 festgelegt. Für Team A errechnet sich also ein Wert von -42,8571.

 

Die Näherungswerte werden als neue (mutmaßliche) Ratings eingesetzt. Mit ihnen wird wieder durchgerechnet, danach ersetzen die (neuen) Näherungswerte wieder die (mutmaßlichen) Ratings… usw. usf.

 

Ich hoffe, die farblichen Markierungen helfen, das Prinzip zu verstehen. Es ist deutlich erkennbar, dass die Werte in Grün sich immer mehr den Zielwerten annähern.

 

Dargestellt sind hier die vier ersten Iterationsschleifen. In der Praxis ist es völlig ausreichend, wenn bei allen Teams die Abweichung gegenüber der Differenz aus Siegen und Niederlagen bei einem Wert von unter 0,1 Prozentpunkten liegt. Dies wird hier in vier Schritten erreicht!

 

1. Iteration

 

 

 

 

 

A

5,5

14

-42,8571

5,80205

-8,6299

-51,4870

B

20,5

38

15,7895

20,20180

 3,1389

18,9284

C

13,5

24

25,0000

13,14983

 5,8362

30,8362

D

14

30

-13,3333

14,20827

-2,7770

-16,1103

E

11,5

24

-8,3333

11,63805

-2,3009

-10,6342

 

 

 

 

 

 

 

2. Iteration

 

 

 

 

 

A

5,5

14

-51,4870

5,55894

 

-53,1711

B

20,5

38

18,9284

20,43734

 

19,5880

C

13,5

24

30,8362

13,40789

 

32,3714

D

14,0

30

-16,1103

14,05260

 

-16,8116

E

11,5

24

-10,6342

11,54324

 

-11,3548

 

 

 

 

 

 

 

3. Iteration

 

 

 

 

 

A

5,5

14

-53,1711

5,50794

 

-53,3981

B

20,5

38

19,5880

20,48638

 

19,7313

C

13,5

24

32,3714

13,47252

 

32,8295

D

14,0

30

-16,8116

14,01711

 

-17,0396

E

11,5

24

-11,3548

11,51605

 

-11,6223

 

 

 

 

 

 

 

4. Iteration

 

 

 

 

 

A

5,5

14

-53,3981

5,49846

 

-53,3540

B

20,5

38

19,7313

20,49692

 

19,7638

C

13,5

24

32,8295

13,49026

 

32,9919

D

14,0

30

-17,0396

14,00721

 

-17,1357

E

11,5

24

-11,6223

11,50717

 

-11,7417

 

Ermitteln wir zuerst, ob die Grenzwerte (<0,1 Prozentpunkte) für alle Teams erreicht wurden:

Die größte Abweichung entsteht bei Team C. Durchrechnen! Bei 24 Spielen bedeutet eine errechnete Gewinnpunktzahl auf Basis der Ratingdifferenzen von 13,49026 einen (rechnerischen) Gewinnüberhang von 2,98052 (bei 24 Spielen ist der Gegenwert der Gewinnpunkte 10,50974). Tatsächlich gewann aber C 3 mal öfter als es verlor. Die Abweichung von 0,01948 -  bezogen auf die 24 Spiele - entspricht einer Differenz von 0,08 Prozentpunkten.

 

Für die anderen Mannschaften ergeben sich noch kleinere Abweichungen, was nachgerechnet werden kann.

 

Möglicherweise ist Ihnen – aufgrund der notwendigen komprimierten Darstellung – nicht ganz klar, wie z.B. der Wert 5,49846 für Team A zustande kommt. Deshalb hier – stellvertretend für alle Teams – die Kontrollrechnung für Team A:

 

Rating Team A

-53,3981

Diff.

1 Spiel

 

 

Rating Team B

19,7313

-73,1294

0,39799

6 Spiele

2,38794

Rating Team C

32,8295

-86,2276

0,38024

7 Spiele

2,66165

Rating Team D

-17,0396

-36,3585

0,44886

1 Spiele

0,44886

Rating Team E

-11,6223

-41,7758

0,44129

0 Spiele

0,00000

 

 

 

 

 

 

 

 

 

 

Summe

5,49846

 

In der Spalte „Diff.“ stehen die jeweiligen Ratingdifferenzen aus Sicht von Team A (Team A z.B. gegenüber Team B -73,…). Aus diesen Differenzen ergeben sich unter Verwendung der Formel für die Normalverteilungsfunktion (s. o.) die Werte in der Spalte „1 Spiel“. Multipliziert mit der Anzahl der Spiele ergeben sich dann die Werte in der rechten Spalte, die summiert den errechneten Gesamtwert für die Gewinnpunkte ergeben.

 

(Hinweis: bei den Tabellenwerten sind die letzten Nachkommastellen jeweils gerundet, weshalb sich bei der Summierung der gerundet dargestellten Werte minimale Differenzen ergeben können).

 

Das Iterationsbeispiel hat - hoffentlich nachvollziehbar – gezeigt, dass sich die Aussagen in der Tabelle 1 in ein objektives Punktsystem umrechnen lassen, das in sich schlüssig ist.

 

Es wäre nun also gerechtfertigt, den einzelnen Teams die (gerundeten) Ratings A -53, B +20, C +33, D -17 und E -12 zuzuordnen.

 

Nach z.B. der 20. Iterationsschleife lägen im Übrigen die gerundeten Werte immer noch auf dem gleichen Niveau. Die Näherungswerte für die 21. Iteration stehen in der rechten Spalte (sie sind - bis auf die vierte Nachkommastelle genau - identisch mit den Näherungswerten für die 20. Iteration).

 

20. Iteration

 

 

 

 

 

A

5,5

14

-53,1584

 

 

-53,1584

B

20,5

38

19,7757

 

 

19,7757

C

13,5

24

33,1416

 

 

33,1416

D

14,0

30

-17,2479

 

 

-17,2479

E

11,5

24

-11,8841

 

 

-11,8841

 

Statt den Werten -53, +20 … usw. könnte man alle Werte auch um einen gleichen Wert absenken oder anheben, ohne dass dadurch die Aussage der Ratings tangiert wäre. Also: bei Anhebung der ganzen Skala um 2500 Punkte wären demnach die Ratings A 2447, B 2520, C 2533, D 2483 und E 2488.

 

Die iterative Methode hat nun einen weiteren riesigen Vorteil. Nehmen wir an, Team A spiele nun zehnmal gegen ein Team F, gewinnt viermal und verliert sechsmal. Der Leistungsunterschied beträgt in einem solchen Fall (gerundet) 72 Ratingpunkte (rechnerisch 71,65…). Sofort kann die durchschnittliche Spielstärke von Team F errechnet werden! Rechnet man nur mit gerundeten Werten, so würde die Rating von F z.B. 2519 betragen.

 

Durch die iterative Methode können also Dreiecksvergleiche objektiv gemessen werden. Subjektive Einschätzungen oder willkürliche Festsetzungen sind nicht erforderlich. Die iterative Methode ist die Voraussetzung dafür, dass sich Ratingsysteme aus sich selbst heraus errechnen können.

 

Aber Vorsicht! Unabdingbare Voraussetzung ist die Vernetzung aller Ergebnisse!

 

Spielten nun die Teams G und H mit den gleichen Ergebnissen wie A gegen F gegeneinander, so wäre der Leistungsunterschied ebenfalls 72 Ratingpunkte. Eine Vernetzung mit den Ratings der anderen Teams ist aber nicht gegeben! Deswegen können auch keine Schlüsse gezogen werden, in welcher Relation sich die Spielstärken von G und H gegenüber denen der Teams von A bis F befinden.

 

In der Praxis kommt es zum Glück aber vor, dass alle Ergebnisse vernetzt sind. Auf der Seite „Ratings (Ranking)“  gibt es eine dunkelblaue Spalte unter dem Namen Allzeit-ø. Die Werte in der Spalte repräsentieren exakt die durchschnittlich erbrachten Leistungen (Ergebnisse) aller „Teams“ im Laufe der Fußballgeschichte.

 

Die Werte dieser Liste sind auch die Ausgangsbasis für das ctr-Rechenmodell. Dabei ist auf einige Besonderheiten hinzuweisen:

 

die Liste macht keinen Unterschied, ob es sich um Heim- oder Auswärtsspiele (oder Spiele auf neutralem Platz) handelte. Außen vor bei der Betrachtung bleibt außerdem, ob es sich um WM-Spiele, Spiele kontinentaler Endrunden (z.B. Europameisterschaft oder Spiele der Copa América), WM-Qualifikationsspiele … und, und, und … oder „nur“ um Freundschaftsspiele handelte.

 

Über weitere Besonderheiten später mehr an anderer Stelle.

Nach oben