Ihre Elo-Wertung wird als präzises Maß Ihrer Schachstärke beschrieben. Spieler sind besessen von jedem gewonnenen oder verlorenen Punkt. Turniere werden um Ratingklassen herum aufgebaut. Und doch sind ein 1500-Punkte-Spieler auf Chess.com und ein 1500-Punkte-FIDE-Spieler nicht annähernd gleich stark. Etwas ist kaputt — und niemand in der Schachwelt spricht ausreichend darüber.
Der Elo-Mythos
Arpad Elo war ein ungarisch-amerikanischer Physikprofessor, der sein Ratingsystem in den 1960er Jahren entwickelte, um das frühere Harkness-System des US-Schachverbands zu verbessern. Die USCF nahm es 1960 an, die FIDE 1970. Elos ursprüngliches Paper beschrieb das System als statistische Schätzung, nicht als absolute Wahrheit — ein Punkt, der in der populären Verwendung weitgehend vergessen wurde.
Das System funktioniert nach einem eleganten Prinzip: Ihre Wertung prognostiziert Ihr erwartetes Ergebnis gegen einen Gegner basierend auf dem Wertungsunterschied. Gewinnen Sie mehr als erwartet, steigt Ihre Wertung. Gewinnen Sie weniger als erwartet, sinkt sie. Einfach, transparent und — in einem geschlossenen, stabilen Spielerpool — bemerkenswert effektiv.
Das Problem ist, dass Schach im Jahr 2026 kein geschlossener, stabiler Spielerpool ist. Es ist auf Dutzende Plattformen, Zeitkontrollen, nationale Verbände und Online-Communities aufgeteilt — jede mit ihrer eigenen Ratingskala, Inflationsgeschichte und Spielerpopulation. Das Elo-System wurde dafür nie konzipiert, und die Risse sind überall sichtbar.
Wie Ratinginflation funktioniert
Ratinginflation tritt auf, wenn der Durchschnittswert in einem Pool mit der Zeit nach oben driftet, ohne eine echte Leistungssteigerung darzustellen. In einem perfekt ausbalancierten Elo-System würde jeder von einem Spieler gewonnene Punkt von einem anderen Spieler kommen — ein Nullsummen-Transfer. In der Praxis sind Schach-Rating-Pools jedoch aus mehreren Gründen keine Nullsumme.
Der größte Treiber ist die Expansion des Neuspieler-Pools. Wenn jedes Jahr Tausende neue Spieler einem Ratingsystem beitreten, bringen sie frische Punkte mit (ihre Anfangswertungen). Wenn auch nur ein Bruchteil dieser neuen Spieler stärker ist als ihre Anfangswertung vermuten lässt, pumpen sie echten Wert in den Pool, indem sie etablierte Spieler schlagen.
K-Faktor-Änderungen spielen ebenfalls eine Rolle. 2012 erhöhte die FIDE den K-Faktor von 10 auf 20 für etablierte Spieler. Dies machte Wertungen volatiler und trug zusammen mit der erweiterten Spielerbasis messbar zum Aufwärtsdrift bei. Mehrere Studien haben gezeigt, dass ein 2200-Punkte-Spieler aus den 1990ern heute wahrscheinlich etwa 2300 brauchen würde.
Die Online-vs-OTB-Ratinglücke
Hier ist der praktische Einfluss am stärksten spürbar. Bei Hunderttausenden von Spielervergleichen ist das Muster unverkennbar: Spieler haben online konsequent eine höhere Wertung als am Brett. Die typische Lücke bei schnellen Zeitkontrollen beträgt 200–350 Wertungspunkte.
Mehrere Faktoren erklären diese Lücke. Online-Schach wird typischerweise bei schnelleren Zeitkontrollen gespielt, und Blitz-/Rapid-Wertungen messen eine andere Fähigkeitsmischung als klassisches Schach. Online treffen Sie auf eine andere Demografie — einen globalen Pool, der von jüngeren Spielern dominiert wird, die oft unter ihrer wahren Stärke bewertet sind.
Die reale Konsequenz: Spieler, die nur online gespielt haben und bei ihrem ersten OTB-Turnier auftauchen, sind regelmäßig überrascht — und gedemütigt — davon, wie anders die Erfahrung ist. Das langsamere Tempo, die körperliche Präsenz eines Gegners, die Anforderung, Züge aufzuschreiben, das Fehlen von Computerunterstützung — all das verändert das Spiel tiefgreifend.
Plattform-Rating-Vergleich
Grobe Schätzungen basierend auf Spielerbefragungsdaten. Individuelle Variation ist sehr hoch — nur als Orientierungshilfe verwenden.
| FIDE OTB | Chess.com Rapid | Chess.com Blitz | Lichess Rapid | Lichess Blitz |
|---|---|---|---|---|
| 1000 | ~1200–1350 | ~1300–1450 | ~1350–1500 | ~1400–1600 |
| 1200 | ~1400–1550 | ~1500–1650 | ~1550–1700 | ~1600–1800 |
| 1500 | ~1700–1850 | ~1800–1950 | ~1800–2000 | ~1900–2100 |
| 1800 | ~2000–2150 | ~2100–2250 | ~2100–2300 | ~2200–2400 |
| 2000 | ~2200–2350 | ~2300–2450 | ~2300–2500 | ~2400–2600 |
| 2200 | ~2400–2550 | ~2500–2650 | ~2500–2700 | ~2600–2800 |
Die breiten Spannen spiegeln echte Unsicherheit wider. Spieler, die hauptsächlich Blitz online spielen und selten OTB klassisch spielen, haben die größten Lücken. Spieler, die regelmäßig OTB antreten, sehen ihre Plattformen enger zusammenrücken. Die wichtigste Variable: wie viel klassisches OTB-Schach Sie in den letzten 12 Monaten gespielt haben.
Sandbagging: Die dunkle Kunst
Sandbagging — absichtliches Verlieren von Partien, um die eigene Wertung zu senken — ist der umstrittenste Missbrauch des Elo-Systems. Es ist kein neues Problem. Nationale Schachverbände sind sich dessen seit den 1980ern bewusst. Aber der Aufstieg von Geldpreisturnieren, insbesondere solcher mit strikten Ratingklassen-Sektionen, hat es zu einem erheblichen Problem gemacht.
Der Anreiz ist offensichtlich: Ein 1750-Punkte-Spieler, der seine Wertung auf 1550 senkt, kann in der Unter-1600-Sektion teilnehmen, wo er dramatisch stärker als die meisten Mitbewerber ist. Preisgelder warten. Der Sandbagger kassiert seine Gewinne und lässt seine Wertung dann vor dem nächsten Turnier wieder auf ihr natürliches Niveau steigen.
FIDE und nationale Verbände haben Anti-Sandbagging-Bestimmungen eingeführt — Leistungsschwellen, Pflichtberichte für verdächtige Muster und in einigen Fällen direkte Ratinganpassungen. Aber das Erkennungsproblem ist schwierig: Mehrere Partien hintereinander zu verlieren ist statistisch normal. Die Absicht zu beweisen ist fast unmöglich ohne Geständnisse oder überwältigende statistische Beweise.
K-Faktor und wie er ausgenutzt wird
Der K-Faktor bestimmt, wie schnell sich Ihre Wertung pro Partie ändern kann. Höheres K = größere Schwankungen. FIDE verwendet drei Stufen: K=40 für Spieler mit weniger als 30 gewerteten Partien, K=20 für die meisten etablierten Spieler und K=10 für Spieler über 2400 mit vielen aktiven Jahren.
Die K=40-Phase ist besonders anfällig für Ausbeutung. Ein Spieler in seinen ersten 30 gewerteten Partien gewinnt oder verliert 40 Punkte aus einem einzigen Ergebnis gegen einen gleichgewerteten Gegner (im Vergleich zu 20 für einen etablierten Spieler). Erfahrene Spieler, die noch nie formal bewertet wurden — darunter einige, die ausgiebig in inoffiziellen Clubs gespielt haben — treten in diese Phase mit enormen taktischen Vorteilen ein.
Die Provisorische-Rating-Falle
Ihre erste Gruppe gewerteter Partien legt eine Ausgangsbasis fest, die erstaunlich klebrig ist. Wenn Ihre ersten 10 Partien gegen deutlich schwächere oder stärkere Gegner als Ihr wahres Niveau sind — was völlig zufällig ist, nicht Ihre Schuld — können Sie mit einer vorläufigen Wertung enden, die Ihre Stärke um 200+ Punkte falsch darstellt.
Aus einer schlechten vorläufigen Wertung herauszukommen ist langsam. Mit K=20 bringt jeder Sieg gegen einen niedriger bewerteten Spieler nur einen kleinen Gewinn. Es kann 30–50 Partien dauern, einen vorläufigen Ratingfehler zu korrigieren, während Sie konsequent gegen zu leichte oder zu starke Gegner gepaart werden.
Was Ihre Wertung wirklich aussagt
Nach all dieser Kritik lohnt es sich, klar zu sein: Ihre Wertung bedeutet etwas und ist genuil nützlich — innerhalb ihres angemessenen Rahmens. Hier ist eine ehrliche Aufschlüsselung, was Ihre Elo-Zahl misst und was nicht:
| Ihre Wertung IST ein zuverlässiges Maß für… | Ihre Wertung IST KEIN zuverlässiges Maß für… |
|---|---|
| Relative Stärke gegenüber Spielern im gleichen Pool | Absolute Schachkompetenz unabhängig von der Plattform |
| Ihr erwartetes Ergebnis gegen einen bestimmten Gegner | Wie Sie bei einem anderen Zeitplan abschneiden würden |
| Einen aktuellen Trend in Ihrer Leistung | Wie sich Ihre Stärke mit Spielern vergangener Jahrzehnte vergleicht |
| Paarungsgerechtigkeit innerhalb eines Turniers oder einer Plattform | Plattformübergreifende Vergleiche (z.B. Chess.com vs Lichess) |
Gibt es ein besseres System?
Ja — und es existiert bereits. Glicko-2, entwickelt von Professor Mark Glickman von Harvard, behebt viele strukturelle Probleme des Elo. Es fügt zwei Schlüsselelemente hinzu, die dem grundlegenden Elo fehlen: eine Ratingabweichung (RD), die die Unsicherheit in Ihrer Wertung darstellt, und eine Volatilitäts-Maßzahl, die darstellt, wie konsistent Sie performen.
Lichess verwendet Glicko-2. Wenn Sie auf Lichess "1800 ± 45" sehen, ist das ±45 Ihre Ratingabweichung. Niedrigere RD bedeutet mehr Partien, mehr Gewissheit. Ein neuer Spieler könnte "1500 ± 350" anzeigen — was bedeutet, dass das System der Schätzung überhaupt nicht sicher ist. Das ist weit ehrlicher als eine bloße Elo-Zahl.
Die FIDE hat sich vor allem aus Rückwärtskompatibilitätsgründen gezögert, Glicko-2 zu übernehmen — die bestehende Wertungsdatenbank, die Jahrzehnte zurückreicht, wäre schwer zu migrieren, und Spieler haben starke emotionale Bindungen an ihre Elo-Zahlen. Aber mehrere nationale Verbände sind still zu Glicko-2 oder ähnlichen Systemen gewechselt.