Wertungen & Strategie

Das Schach-Ratingsystem ist kaputt Die dunkle Seite des Elo, über die niemand spricht

15. April 2026 11 Min. Lesezeit Chess Global League

Ihre Elo-Wertung wird als präzises Maß Ihrer Schachstärke beschrieben. Spieler sind besessen von jedem gewonnenen oder verlorenen Punkt. Turniere werden um Ratingklassen herum aufgebaut. Und doch sind ein 1500-Punkte-Spieler auf Chess.com und ein 1500-Punkte-FIDE-Spieler nicht annähernd gleich stark. Etwas ist kaputt — und niemand in der Schachwelt spricht ausreichend darüber.

Der Elo-Mythos

Arpad Elo war ein ungarisch-amerikanischer Physikprofessor, der sein Ratingsystem in den 1960er Jahren entwickelte, um das frühere Harkness-System des US-Schachverbands zu verbessern. Die USCF nahm es 1960 an, die FIDE 1970. Elos ursprüngliches Paper beschrieb das System als statistische Schätzung, nicht als absolute Wahrheit — ein Punkt, der in der populären Verwendung weitgehend vergessen wurde.

Das System funktioniert nach einem eleganten Prinzip: Ihre Wertung prognostiziert Ihr erwartetes Ergebnis gegen einen Gegner basierend auf dem Wertungsunterschied. Gewinnen Sie mehr als erwartet, steigt Ihre Wertung. Gewinnen Sie weniger als erwartet, sinkt sie. Einfach, transparent und — in einem geschlossenen, stabilen Spielerpool — bemerkenswert effektiv.

Das Problem ist, dass Schach im Jahr 2026 kein geschlossener, stabiler Spielerpool ist. Es ist auf Dutzende Plattformen, Zeitkontrollen, nationale Verbände und Online-Communities aufgeteilt — jede mit ihrer eigenen Ratingskala, Inflationsgeschichte und Spielerpopulation. Das Elo-System wurde dafür nie konzipiert, und die Risse sind überall sichtbar.

Wie Ratinginflation funktioniert

Ratinginflation tritt auf, wenn der Durchschnittswert in einem Pool mit der Zeit nach oben driftet, ohne eine echte Leistungssteigerung darzustellen. In einem perfekt ausbalancierten Elo-System würde jeder von einem Spieler gewonnene Punkt von einem anderen Spieler kommen — ein Nullsummen-Transfer. In der Praxis sind Schach-Rating-Pools jedoch aus mehreren Gründen keine Nullsumme.

Der größte Treiber ist die Expansion des Neuspieler-Pools. Wenn jedes Jahr Tausende neue Spieler einem Ratingsystem beitreten, bringen sie frische Punkte mit (ihre Anfangswertungen). Wenn auch nur ein Bruchteil dieser neuen Spieler stärker ist als ihre Anfangswertung vermuten lässt, pumpen sie echten Wert in den Pool, indem sie etablierte Spieler schlagen.

K-Faktor-Änderungen spielen ebenfalls eine Rolle. 2012 erhöhte die FIDE den K-Faktor von 10 auf 20 für etablierte Spieler. Dies machte Wertungen volatiler und trug zusammen mit der erweiterten Spielerbasis messbar zum Aufwärtsdrift bei. Mehrere Studien haben gezeigt, dass ein 2200-Punkte-Spieler aus den 1990ern heute wahrscheinlich etwa 2300 brauchen würde.

Wichtige Erkenntnis: Ratinginflation bedeutet nicht, dass Spieler schlechter werden — es bedeutet, dass die Zahl, die nötig ist, um als „stark" zu gelten, weiter steigt. Eine FIDE 2000 heute ist nicht dieselbe Leistung wie eine FIDE 2000 von 1985. Spieler hören das nicht gerne, aber die Daten sind in mehreren unabhängigen Analysen konsistent.

Die Online-vs-OTB-Ratinglücke

Hier ist der praktische Einfluss am stärksten spürbar. Bei Hunderttausenden von Spielervergleichen ist das Muster unverkennbar: Spieler haben online konsequent eine höhere Wertung als am Brett. Die typische Lücke bei schnellen Zeitkontrollen beträgt 200–350 Wertungspunkte.

Mehrere Faktoren erklären diese Lücke. Online-Schach wird typischerweise bei schnelleren Zeitkontrollen gespielt, und Blitz-/Rapid-Wertungen messen eine andere Fähigkeitsmischung als klassisches Schach. Online treffen Sie auf eine andere Demografie — einen globalen Pool, der von jüngeren Spielern dominiert wird, die oft unter ihrer wahren Stärke bewertet sind.

Die reale Konsequenz: Spieler, die nur online gespielt haben und bei ihrem ersten OTB-Turnier auftauchen, sind regelmäßig überrascht — und gedemütigt — davon, wie anders die Erfahrung ist. Das langsamere Tempo, die körperliche Präsenz eines Gegners, die Anforderung, Züge aufzuschreiben, das Fehlen von Computerunterstützung — all das verändert das Spiel tiefgreifend.

Plattform-Rating-Vergleich

Grobe Schätzungen basierend auf Spielerbefragungsdaten. Individuelle Variation ist sehr hoch — nur als Orientierungshilfe verwenden.

FIDE OTB Chess.com Rapid Chess.com Blitz Lichess Rapid Lichess Blitz
1000~1200–1350~1300–1450~1350–1500~1400–1600
1200~1400–1550~1500–1650~1550–1700~1600–1800
1500~1700–1850~1800–1950~1800–2000~1900–2100
1800~2000–2150~2100–2250~2100–2300~2200–2400
2000~2200–2350~2300–2450~2300–2500~2400–2600
2200~2400–2550~2500–2650~2500–2700~2600–2800

Die breiten Spannen spiegeln echte Unsicherheit wider. Spieler, die hauptsächlich Blitz online spielen und selten OTB klassisch spielen, haben die größten Lücken. Spieler, die regelmäßig OTB antreten, sehen ihre Plattformen enger zusammenrücken. Die wichtigste Variable: wie viel klassisches OTB-Schach Sie in den letzten 12 Monaten gespielt haben.

Sandbagging: Die dunkle Kunst

Sandbagging — absichtliches Verlieren von Partien, um die eigene Wertung zu senken — ist der umstrittenste Missbrauch des Elo-Systems. Es ist kein neues Problem. Nationale Schachverbände sind sich dessen seit den 1980ern bewusst. Aber der Aufstieg von Geldpreisturnieren, insbesondere solcher mit strikten Ratingklassen-Sektionen, hat es zu einem erheblichen Problem gemacht.

Der Anreiz ist offensichtlich: Ein 1750-Punkte-Spieler, der seine Wertung auf 1550 senkt, kann in der Unter-1600-Sektion teilnehmen, wo er dramatisch stärker als die meisten Mitbewerber ist. Preisgelder warten. Der Sandbagger kassiert seine Gewinne und lässt seine Wertung dann vor dem nächsten Turnier wieder auf ihr natürliches Niveau steigen.

FIDE und nationale Verbände haben Anti-Sandbagging-Bestimmungen eingeführt — Leistungsschwellen, Pflichtberichte für verdächtige Muster und in einigen Fällen direkte Ratinganpassungen. Aber das Erkennungsproblem ist schwierig: Mehrere Partien hintereinander zu verlieren ist statistisch normal. Die Absicht zu beweisen ist fast unmöglich ohne Geständnisse oder überwältigende statistische Beweise.

K-Faktor und wie er ausgenutzt wird

Der K-Faktor bestimmt, wie schnell sich Ihre Wertung pro Partie ändern kann. Höheres K = größere Schwankungen. FIDE verwendet drei Stufen: K=40 für Spieler mit weniger als 30 gewerteten Partien, K=20 für die meisten etablierten Spieler und K=10 für Spieler über 2400 mit vielen aktiven Jahren.

Die K=40-Phase ist besonders anfällig für Ausbeutung. Ein Spieler in seinen ersten 30 gewerteten Partien gewinnt oder verliert 40 Punkte aus einem einzigen Ergebnis gegen einen gleichgewerteten Gegner (im Vergleich zu 20 für einen etablierten Spieler). Erfahrene Spieler, die noch nie formal bewertet wurden — darunter einige, die ausgiebig in inoffiziellen Clubs gespielt haben — treten in diese Phase mit enormen taktischen Vorteilen ein.

Die Provisorische-Rating-Falle

Ihre erste Gruppe gewerteter Partien legt eine Ausgangsbasis fest, die erstaunlich klebrig ist. Wenn Ihre ersten 10 Partien gegen deutlich schwächere oder stärkere Gegner als Ihr wahres Niveau sind — was völlig zufällig ist, nicht Ihre Schuld — können Sie mit einer vorläufigen Wertung enden, die Ihre Stärke um 200+ Punkte falsch darstellt.

Aus einer schlechten vorläufigen Wertung herauszukommen ist langsam. Mit K=20 bringt jeder Sieg gegen einen niedriger bewerteten Spieler nur einen kleinen Gewinn. Es kann 30–50 Partien dauern, einen vorläufigen Ratingfehler zu korrigieren, während Sie konsequent gegen zu leichte oder zu starke Gegner gepaart werden.

Was Ihre Wertung wirklich aussagt

Nach all dieser Kritik lohnt es sich, klar zu sein: Ihre Wertung bedeutet etwas und ist genuil nützlich — innerhalb ihres angemessenen Rahmens. Hier ist eine ehrliche Aufschlüsselung, was Ihre Elo-Zahl misst und was nicht:

Ihre Wertung IST ein zuverlässiges Maß für… Ihre Wertung IST KEIN zuverlässiges Maß für…
Relative Stärke gegenüber Spielern im gleichen Pool Absolute Schachkompetenz unabhängig von der Plattform
Ihr erwartetes Ergebnis gegen einen bestimmten Gegner Wie Sie bei einem anderen Zeitplan abschneiden würden
Einen aktuellen Trend in Ihrer Leistung Wie sich Ihre Stärke mit Spielern vergangener Jahrzehnte vergleicht
Paarungsgerechtigkeit innerhalb eines Turniers oder einer Plattform Plattformübergreifende Vergleiche (z.B. Chess.com vs Lichess)

Gibt es ein besseres System?

Ja — und es existiert bereits. Glicko-2, entwickelt von Professor Mark Glickman von Harvard, behebt viele strukturelle Probleme des Elo. Es fügt zwei Schlüsselelemente hinzu, die dem grundlegenden Elo fehlen: eine Ratingabweichung (RD), die die Unsicherheit in Ihrer Wertung darstellt, und eine Volatilitäts-Maßzahl, die darstellt, wie konsistent Sie performen.

Lichess verwendet Glicko-2. Wenn Sie auf Lichess "1800 ± 45" sehen, ist das ±45 Ihre Ratingabweichung. Niedrigere RD bedeutet mehr Partien, mehr Gewissheit. Ein neuer Spieler könnte "1500 ± 350" anzeigen — was bedeutet, dass das System der Schätzung überhaupt nicht sicher ist. Das ist weit ehrlicher als eine bloße Elo-Zahl.

Die FIDE hat sich vor allem aus Rückwärtskompatibilitätsgründen gezögert, Glicko-2 zu übernehmen — die bestehende Wertungsdatenbank, die Jahrzehnte zurückreicht, wäre schwer zu migrieren, und Spieler haben starke emotionale Bindungen an ihre Elo-Zahlen. Aber mehrere nationale Verbände sind still zu Glicko-2 oder ähnlichen Systemen gewechselt.

Häufig gestellte Fragen

Ist mein Chess.com-Rating genau?
Ihr Chess.com-Rating spiegelt Ihre Stärke genau im Vergleich zu anderen Chess.com-Spielern bei diesem Zeitformat wider. Es ist jedoch nicht direkt mit einer FIDE-OTB-Wertung vergleichbar. Aufgrund verschiedener Spielerpools, K-Faktoren und Ratinginflation stellen die meisten Spieler fest, dass ihr Chess.com-Rapid-Rating 200–400 Punkte höher ist als ihre FIDE-Wertung wäre.
Lichess verwendet Glicko-2 statt Elo und beginnt neue Konten bei 1500 statt einer niedrigeren provisorischen Zahl. Lichess-Ratings tendieren dazu, für denselben Spieler ungefähr 200–300 Punkte höher zu sein als Chess.com-Ratings. Keines ist "korrekter" — sie messen relative Stärke in verschiedenen Communities.
Sandbagging ist das absichtliche Verlieren von Partien oder das Vermeiden von gewerteten Spielen, um Ihre Wertung künstlich niedrig zu halten, normalerweise um sich für niedrigere Ratingklassen-Sektionen in Turnieren mit Preisgeldern zu qualifizieren. Es gilt als Betrug und ist von FIDE und den meisten nationalen Verbänden ausdrücklich verboten.
Ja — Inflation ist gut dokumentiert. FIDE-Durchschnittswertungen sind im Laufe der Jahrzehnte erheblich gestiegen. Beitragende Faktoren sind die Expansion des gewerteten Spielerpools, Änderungen der K-Faktoren und die steigende Anzahl gewerteter Partien. Ein 2200-Punkte-Spieler heute ist generell nicht stärker als ein 2200-Punkte-Spieler von 1985.
Eine vorläufige Wertung ist eine frühe Schätzung, die nach einer kleinen Anzahl gewerteter Partien vergeben wird (typischerweise 20–30 für FIDE). Sie hat hohe Unsicherheit, weil sie auf begrenzten Daten basiert. Vorläufige Wertungen können dramatisch schwanken und spiegeln Ihre wahre Stärke möglicherweise nicht genau wider.
Der K-Faktor bestimmt, wie sehr sich Ihre Wertung pro Partie ändert. FIDE verwendet K=40 für neue Spieler, K=20 für die meisten aktiven Spieler und K=10 für etablierte Spieler über 2400. Ein höherer K-Faktor bedeutet größere Schwankungen pro Partie.
Glicko-2 ist ein von Mark Glickman entwickeltes Ratingsystem, das zwei Maßzahlen zur grundlegenden Elo-Zahl hinzufügt: eine Ratingabweichung (RD), die Unsicherheit darstellt, und eine Volatilitätsmaßzahl. Niedrigere RD bedeutet höheres Vertrauen in die Wertung. Lichess und die US Chess Federation verwenden Glicko-2.
Grobe Umrechnungstabellen existieren, aber die individuelle Variation ist enorm. Als sehr grobe Richtlinie stellen die meisten Spieler fest: FIDE OTB ≈ Chess.com Rapid minus 200–350 Punkte, und FIDE OTB ≈ Lichess Klassisch minus 300–400 Punkte. Keine Formel ist für Einzelfälle genau.
📊

Bauen Sie eine Wertung auf, die etwas bedeutet

Chess Global League verwendet ein faires, konsistentes Ratingsystem für alle Ligapartien. Verfolgen Sie Ihren echten Fortschritt, sehen Sie, wo Sie unter weltweiten Ligaspielern stehen, und spielen Sie gegen Gegner auf Ihrem tatsächlichen Niveau.

Kostenlos beitreten →
Zurück zum Blog