Is my Chess.com rating accurate?

Your Chess.com rating accurately reflects your strength relative to other Chess.com players at that time control. However, it is not directly comparable to a FIDE OTB rating. Due to different player pools, K-factors, and rating inflation, most players find their Chess.com rapid rating is 200–400 points higher than their FIDE rating would be.

Why is my Lichess rating higher than Chess.com?

Lichess uses Glicko-2 rather than Elo and starts new accounts at 1500 rather than a lower provisional number. Lichess ratings tend to run higher than Chess.com ratings by roughly 200–300 points for the same player, primarily because of this starting point and the different rating pool composition. Neither is more "correct" — they are measuring relative strength in different communities.

What is sandbagging in chess?

Sandbagging is deliberately losing games or avoiding rated play to keep your rating artificially low, usually to qualify for lower rating class sections in tournaments with prize money. It is considered cheating and is explicitly prohibited by FIDE and most national federations, but it is difficult to detect and enforce.

Is chess rating inflation real?

Yes — inflation is well-documented. FIDE average ratings have risen significantly over the decades. Contributing factors include the expansion of the rated player pool (new players enter with minimum ratings and earn points from established players), changes in K-factors, and the increasing number of rated games. A 2200-rated player today is generally not stronger than a 2200-rated player from 1985.

What is a provisional rating in chess?

A provisional rating is an early estimate assigned after a small number of rated games (typically 20–30 for FIDE). It has high uncertainty because it is based on limited data. Provisional ratings can fluctuate dramatically and may not accurately reflect your true strength. They are also more volatile — a good or bad run of 5 games can move your number by 100+ points.

What does the K-factor mean in chess ratings?

The K-factor determines how much your rating changes per game. FIDE uses K=40 for new players, K=20 for most active players, and K=10 for established players over 2400. A higher K-factor means larger swings per game. Some players strategically time their rated games to maximise gains from a high K-factor early in their rated career.

What is Glicko-2 and is it better than Elo?

Glicko-2 is a rating system developed by Mark Glickman that adds two measures to the basic Elo number: a Rating Deviation (RD) representing uncertainty, and a volatility measure. Lower RD means higher confidence in the rating. Lichess and the US Chess Federation use Glicko-2. Most experts consider it more statistically accurate than Elo because it explicitly models uncertainty rather than treating all ratings as equally reliable.

Can I convert my online rating to a FIDE estimate?

Rough conversion tables exist, but individual variation is enormous. As a very rough guide, most players find FIDE OTB ≈ Chess.com Rapid minus 200–350 points, and FIDE OTB ≈ Lichess Classical minus 300–400 points. These conversions depend heavily on your time control, the specific games played, and which sample of players you have faced. No formula is accurate for individual cases.

Das Schach-Ratingsystem ist kaputt — Die dunkle Seite des Elo, über die niemand spricht

Ihre Elo-Wertung wird als präzises Maß Ihrer Schachstärke beschrieben. Spieler sind besessen von jedem gewonnenen oder verlorenen Punkt. Turniere werden um Ratingklassen herum aufgebaut. Und doch sind ein 1500-Punkte-Spieler auf Chess.com und ein 1500-Punkte-FIDE-Spieler nicht annähernd gleich stark. Etwas ist kaputt — und niemand in der Schachwelt spricht ausreichend darüber.

Der Elo-Mythos

Arpad Elo war ein ungarisch-amerikanischer Physikprofessor, der sein Ratingsystem in den 1960er Jahren entwickelte, um das frühere Harkness-System des US-Schachverbands zu verbessern. Die USCF nahm es 1960 an, die FIDE 1970. Elos ursprüngliches Paper beschrieb das System als statistische Schätzung, nicht als absolute Wahrheit — ein Punkt, der in der populären Verwendung weitgehend vergessen wurde.

Das System funktioniert nach einem eleganten Prinzip: Ihre Wertung prognostiziert Ihr erwartetes Ergebnis gegen einen Gegner basierend auf dem Wertungsunterschied. Gewinnen Sie mehr als erwartet, steigt Ihre Wertung. Gewinnen Sie weniger als erwartet, sinkt sie. Einfach, transparent und — in einem geschlossenen, stabilen Spielerpool — bemerkenswert effektiv.

Das Problem ist, dass Schach im Jahr 2026 kein geschlossener, stabiler Spielerpool ist. Es ist auf Dutzende Plattformen, Zeitkontrollen, nationale Verbände und Online-Communities aufgeteilt — jede mit ihrer eigenen Ratingskala, Inflationsgeschichte und Spielerpopulation. Das Elo-System wurde dafür nie konzipiert, und die Risse sind überall sichtbar.

Wie Ratinginflation funktioniert

Ratinginflation tritt auf, wenn der Durchschnittswert in einem Pool mit der Zeit nach oben driftet, ohne eine echte Leistungssteigerung darzustellen. In einem perfekt ausbalancierten Elo-System würde jeder von einem Spieler gewonnene Punkt von einem anderen Spieler kommen — ein Nullsummen-Transfer. In der Praxis sind Schach-Rating-Pools jedoch aus mehreren Gründen keine Nullsumme.

Der größte Treiber ist die Expansion des Neuspieler-Pools. Wenn jedes Jahr Tausende neue Spieler einem Ratingsystem beitreten, bringen sie frische Punkte mit (ihre Anfangswertungen). Wenn auch nur ein Bruchteil dieser neuen Spieler stärker ist als ihre Anfangswertung vermuten lässt, pumpen sie echten Wert in den Pool, indem sie etablierte Spieler schlagen.

K-Faktor-Änderungen spielen ebenfalls eine Rolle. 2012 erhöhte die FIDE den K-Faktor von 10 auf 20 für etablierte Spieler. Dies machte Wertungen volatiler und trug zusammen mit der erweiterten Spielerbasis messbar zum Aufwärtsdrift bei. Mehrere Studien haben gezeigt, dass ein 2200-Punkte-Spieler aus den 1990ern heute wahrscheinlich etwa 2300 brauchen würde.

Wichtige Erkenntnis: Ratinginflation bedeutet nicht, dass Spieler schlechter werden — es bedeutet, dass die Zahl, die nötig ist, um als „stark" zu gelten, weiter steigt. Eine FIDE 2000 heute ist nicht dieselbe Leistung wie eine FIDE 2000 von 1985. Spieler hören das nicht gerne, aber die Daten sind in mehreren unabhängigen Analysen konsistent.

Die Online-vs-OTB-Ratinglücke

Hier ist der praktische Einfluss am stärksten spürbar. Bei Hunderttausenden von Spielervergleichen ist das Muster unverkennbar: Spieler haben online konsequent eine höhere Wertung als am Brett. Die typische Lücke bei schnellen Zeitkontrollen beträgt 200–350 Wertungspunkte.

Mehrere Faktoren erklären diese Lücke. Online-Schach wird typischerweise bei schnelleren Zeitkontrollen gespielt, und Blitz-/Rapid-Wertungen messen eine andere Fähigkeitsmischung als klassisches Schach. Online treffen Sie auf eine andere Demografie — einen globalen Pool, der von jüngeren Spielern dominiert wird, die oft unter ihrer wahren Stärke bewertet sind.

Die reale Konsequenz: Spieler, die nur online gespielt haben und bei ihrem ersten OTB-Turnier auftauchen, sind regelmäßig überrascht — und gedemütigt — davon, wie anders die Erfahrung ist. Das langsamere Tempo, die körperliche Präsenz eines Gegners, die Anforderung, Züge aufzuschreiben, das Fehlen von Computerunterstützung — all das verändert das Spiel tiefgreifend.

Plattform-Rating-Vergleich

Grobe Schätzungen basierend auf Spielerbefragungsdaten. Individuelle Variation ist sehr hoch — nur als Orientierungshilfe verwenden.

FIDE OTB	Chess.com Rapid	Chess.com Blitz	Lichess Rapid	Lichess Blitz
1000	~1200–1350	~1300–1450	~1350–1500	~1400–1600
1200	~1400–1550	~1500–1650	~1550–1700	~1600–1800
1500	~1700–1850	~1800–1950	~1800–2000	~1900–2100
1800	~2000–2150	~2100–2250	~2100–2300	~2200–2400
2000	~2200–2350	~2300–2450	~2300–2500	~2400–2600
2200	~2400–2550	~2500–2650	~2500–2700	~2600–2800

Die breiten Spannen spiegeln echte Unsicherheit wider. Spieler, die hauptsächlich Blitz online spielen und selten OTB klassisch spielen, haben die größten Lücken. Spieler, die regelmäßig OTB antreten, sehen ihre Plattformen enger zusammenrücken. Die wichtigste Variable: wie viel klassisches OTB-Schach Sie in den letzten 12 Monaten gespielt haben.

Sandbagging: Die dunkle Kunst

Sandbagging — absichtliches Verlieren von Partien, um die eigene Wertung zu senken — ist der umstrittenste Missbrauch des Elo-Systems. Es ist kein neues Problem. Nationale Schachverbände sind sich dessen seit den 1980ern bewusst. Aber der Aufstieg von Geldpreisturnieren, insbesondere solcher mit strikten Ratingklassen-Sektionen, hat es zu einem erheblichen Problem gemacht.

Der Anreiz ist offensichtlich: Ein 1750-Punkte-Spieler, der seine Wertung auf 1550 senkt, kann in der Unter-1600-Sektion teilnehmen, wo er dramatisch stärker als die meisten Mitbewerber ist. Preisgelder warten. Der Sandbagger kassiert seine Gewinne und lässt seine Wertung dann vor dem nächsten Turnier wieder auf ihr natürliches Niveau steigen.

FIDE und nationale Verbände haben Anti-Sandbagging-Bestimmungen eingeführt — Leistungsschwellen, Pflichtberichte für verdächtige Muster und in einigen Fällen direkte Ratinganpassungen. Aber das Erkennungsproblem ist schwierig: Mehrere Partien hintereinander zu verlieren ist statistisch normal. Die Absicht zu beweisen ist fast unmöglich ohne Geständnisse oder überwältigende statistische Beweise.

K-Faktor und wie er ausgenutzt wird

Der K-Faktor bestimmt, wie schnell sich Ihre Wertung pro Partie ändern kann. Höheres K = größere Schwankungen. FIDE verwendet drei Stufen: K=40 für Spieler mit weniger als 30 gewerteten Partien, K=20 für die meisten etablierten Spieler und K=10 für Spieler über 2400 mit vielen aktiven Jahren.

Die K=40-Phase ist besonders anfällig für Ausbeutung. Ein Spieler in seinen ersten 30 gewerteten Partien gewinnt oder verliert 40 Punkte aus einem einzigen Ergebnis gegen einen gleichgewerteten Gegner (im Vergleich zu 20 für einen etablierten Spieler). Erfahrene Spieler, die noch nie formal bewertet wurden — darunter einige, die ausgiebig in inoffiziellen Clubs gespielt haben — treten in diese Phase mit enormen taktischen Vorteilen ein.

Die Provisorische-Rating-Falle

Ihre erste Gruppe gewerteter Partien legt eine Ausgangsbasis fest, die erstaunlich klebrig ist. Wenn Ihre ersten 10 Partien gegen deutlich schwächere oder stärkere Gegner als Ihr wahres Niveau sind — was völlig zufällig ist, nicht Ihre Schuld — können Sie mit einer vorläufigen Wertung enden, die Ihre Stärke um 200+ Punkte falsch darstellt.

Aus einer schlechten vorläufigen Wertung herauszukommen ist langsam. Mit K=20 bringt jeder Sieg gegen einen niedriger bewerteten Spieler nur einen kleinen Gewinn. Es kann 30–50 Partien dauern, einen vorläufigen Ratingfehler zu korrigieren, während Sie konsequent gegen zu leichte oder zu starke Gegner gepaart werden.

Was Ihre Wertung wirklich aussagt

Nach all dieser Kritik lohnt es sich, klar zu sein: Ihre Wertung bedeutet etwas und ist genuil nützlich — innerhalb ihres angemessenen Rahmens. Hier ist eine ehrliche Aufschlüsselung, was Ihre Elo-Zahl misst und was nicht:

Ihre Wertung IST ein zuverlässiges Maß für…	Ihre Wertung IST KEIN zuverlässiges Maß für…
Relative Stärke gegenüber Spielern im gleichen Pool	Absolute Schachkompetenz unabhängig von der Plattform
Ihr erwartetes Ergebnis gegen einen bestimmten Gegner	Wie Sie bei einem anderen Zeitplan abschneiden würden
Einen aktuellen Trend in Ihrer Leistung	Wie sich Ihre Stärke mit Spielern vergangener Jahrzehnte vergleicht
Paarungsgerechtigkeit innerhalb eines Turniers oder einer Plattform	Plattformübergreifende Vergleiche (z.B. Chess.com vs Lichess)

Gibt es ein besseres System?

Ja — und es existiert bereits. Glicko-2, entwickelt von Professor Mark Glickman von Harvard, behebt viele strukturelle Probleme des Elo. Es fügt zwei Schlüsselelemente hinzu, die dem grundlegenden Elo fehlen: eine Ratingabweichung (RD), die die Unsicherheit in Ihrer Wertung darstellt, und eine Volatilitäts-Maßzahl, die darstellt, wie konsistent Sie performen.

Lichess verwendet Glicko-2. Wenn Sie auf Lichess "1800 ± 45" sehen, ist das ±45 Ihre Ratingabweichung. Niedrigere RD bedeutet mehr Partien, mehr Gewissheit. Ein neuer Spieler könnte "1500 ± 350" anzeigen — was bedeutet, dass das System der Schätzung überhaupt nicht sicher ist. Das ist weit ehrlicher als eine bloße Elo-Zahl.

Die FIDE hat sich vor allem aus Rückwärtskompatibilitätsgründen gezögert, Glicko-2 zu übernehmen — die bestehende Wertungsdatenbank, die Jahrzehnte zurückreicht, wäre schwer zu migrieren, und Spieler haben starke emotionale Bindungen an ihre Elo-Zahlen. Aber mehrere nationale Verbände sind still zu Glicko-2 oder ähnlichen Systemen gewechselt.

Häufig gestellte Fragen

Ist mein Chess.com-Rating genau?

Ihr Chess.com-Rating spiegelt Ihre Stärke genau im Vergleich zu anderen Chess.com-Spielern bei diesem Zeitformat wider. Es ist jedoch nicht direkt mit einer FIDE-OTB-Wertung vergleichbar. Aufgrund verschiedener Spielerpools, K-Faktoren und Ratinginflation stellen die meisten Spieler fest, dass ihr Chess.com-Rapid-Rating 200–400 Punkte höher ist als ihre FIDE-Wertung wäre.

Warum ist mein Lichess-Rating höher als Chess.com?

Lichess verwendet Glicko-2 statt Elo und beginnt neue Konten bei 1500 statt einer niedrigeren provisorischen Zahl. Lichess-Ratings tendieren dazu, für denselben Spieler ungefähr 200–300 Punkte höher zu sein als Chess.com-Ratings. Keines ist "korrekter" — sie messen relative Stärke in verschiedenen Communities.

Was ist Sandbagging im Schach?

Sandbagging ist das absichtliche Verlieren von Partien oder das Vermeiden von gewerteten Spielen, um Ihre Wertung künstlich niedrig zu halten, normalerweise um sich für niedrigere Ratingklassen-Sektionen in Turnieren mit Preisgeldern zu qualifizieren. Es gilt als Betrug und ist von FIDE und den meisten nationalen Verbänden ausdrücklich verboten.

Ist Schach-Rating-Inflation real?

Ja — Inflation ist gut dokumentiert. FIDE-Durchschnittswertungen sind im Laufe der Jahrzehnte erheblich gestiegen. Beitragende Faktoren sind die Expansion des gewerteten Spielerpools, Änderungen der K-Faktoren und die steigende Anzahl gewerteter Partien. Ein 2200-Punkte-Spieler heute ist generell nicht stärker als ein 2200-Punkte-Spieler von 1985.

Was ist eine vorläufige Wertung im Schach?

Eine vorläufige Wertung ist eine frühe Schätzung, die nach einer kleinen Anzahl gewerteter Partien vergeben wird (typischerweise 20–30 für FIDE). Sie hat hohe Unsicherheit, weil sie auf begrenzten Daten basiert. Vorläufige Wertungen können dramatisch schwanken und spiegeln Ihre wahre Stärke möglicherweise nicht genau wider.

Was bedeutet der K-Faktor bei Schach-Ratings?

Der K-Faktor bestimmt, wie sehr sich Ihre Wertung pro Partie ändert. FIDE verwendet K=40 für neue Spieler, K=20 für die meisten aktiven Spieler und K=10 für etablierte Spieler über 2400. Ein höherer K-Faktor bedeutet größere Schwankungen pro Partie.

Was ist Glicko-2 und ist es besser als Elo?

Glicko-2 ist ein von Mark Glickman entwickeltes Ratingsystem, das zwei Maßzahlen zur grundlegenden Elo-Zahl hinzufügt: eine Ratingabweichung (RD), die Unsicherheit darstellt, und eine Volatilitätsmaßzahl. Niedrigere RD bedeutet höheres Vertrauen in die Wertung. Lichess und die US Chess Federation verwenden Glicko-2.

Kann ich mein Online-Rating in eine FIDE-Schätzung umrechnen?

Grobe Umrechnungstabellen existieren, aber die individuelle Variation ist enorm. Als sehr grobe Richtlinie stellen die meisten Spieler fest: FIDE OTB ≈ Chess.com Rapid minus 200–350 Punkte, und FIDE OTB ≈ Lichess Klassisch minus 300–400 Punkte. Keine Formel ist für Einzelfälle genau.

Das Schach-Ratingsystem ist kaputt Die dunkle Seite des Elo, über die niemand spricht