CLV — Closing Line Value
Misst, ob dein Modell schärfer als Pinnacle kurz vor Spielbeginn war.
Pinnacle's Schlusskurs gilt als genauester Marktpreis — geformt durch professionelle Wetteinsätze weltweit.
CLV% = (Modell-Fairquote / Pinnacle-Schlusskurs) – 1
▲ Positiv → dein Modell sah mehr Wert als der Markt am Ende.
▼ Negativ → der Markt war schärfer als dein Modell.
Langfristig positiver CLV = struktureller Edge, unabhängig von kurzfristigen Ergebnissen.
RPS — Ranked Probability Score
Misst, wie präzise das Modell Wahrscheinlichkeiten verteilt — nicht nur ob das richtige Ergebnis vorhergesagt wurde.
Berücksichtigt, wie nah eine Vorhersage am tatsächlichen Ergebnis war: ein "knapper Verlust" wird weniger bestraft als ein komplett falsches Ergebnis.
RPS: 0 = perfekt · 1 = schlecht
Typischer Pinnacle-Wert: 0.183 – 0.195 (je nach Liga).
Anders als Brier Score erfasst RPS die Rangordnung der Ergebnisse (H→D→A) — besser geeignet für Fußball.
RPS Skill Score
Setzt deinen RPS ins Verhältnis zur Pinnacle-Baseline — die eigentliche Frage: Wie viel besser als der Markt bist du?
Skill = (Pinnacle-RPS – Model-RPS) / Pinnacle-RPS × 100
▲ Positiv → dein Modell ist schärfer als Pinnacle.
▼ Negativ → Pinnacle ist noch genauer.
Selbst kleine positive Werte (+2–5%) sind bei diesem Benchmark bedeutsam.
Walk-Forward-Validierung
Zeigt, wie sich CLV und RPS über die Zeit entwickeln — kein statischer Durchschnitt, sondern ein rollendes Fenster der letzten n Spiele.
Erkennt saisonale Schwächen (z.B. Saisonbeginn ohne Formwerte) und ob das Modell sich verbessert oder verschlechtert.
Fenster = letzte n aufgelöste Predictions
Im Gegensatz zu einem Gesamt-Durchschnitt zeigt Walk-Forward wann das Modell gut oder schlecht performt.
🧭 Marktdrift-Richtungsgenauigkeit
Misst ob das Modell die Richtung der Marktbewegung von Opening zu Closing korrekt vorhergesagt hat.
Wenn das Modell Home stärker einschätzt als der Opening-Markt, und der Markt sich danach in Richtung Home bewegt — ist das ein Treffer.
Signal = model_p − opening_fair_p · Treffer wenn Signal × Drift > 0
▲ >55% = Modell antizipiert Markt systematisch
▲ 50–55% = schwache Tendenz vorhanden
▼ <50% = kein belastbares Signal
Nur Spiele mit Drift >0.2 Wahrscheinlichkeitspunkte fließen ein — zu geringe Bewegungen liefern kein Signal.
🏦 Pinnacle Markt-Baseline — Woher kommen die Referenzwerte?
Die Baseline-Tabelle berechnet Pinnacle's eigenen RPS aus 87.281 historischen Spielen (CGMBet-Daten, Saisons 2015–2024, 13 Ligen).
Damit wird die Frage beantwortet: Wie gut ist Pinnacle selbst? — und das ist die Messlatte für dein Modell.
Diese Werte sind sofort verfügbar, unabhängig davon wie viele eigene Predictions schon aufgelöst wurden.
Die "Model RPS"-Spalte füllt sich automatisch, sobald eigene aufgelöste Records vorliegen.