SHADOW TRACKING: ASÍ VALIDAMOS NUESTRO SISTEMASHADOW TRACKING: HOW WE VALIDATE OUR SYSTEM

Un backtest puede mentirte. El shadow tracker te dice la verdad. Con 594 picks y +41.9u reales, explicamos el sistema que separa el edge genuino del ruido estadístico.A backtest can lie to you. The shadow tracker tells the truth. With 594 picks and +41.9u real profit, we explain the system that separates genuine edge from statistical noise.

Cualquier sistema de apuestas puede verse brillante en un backtest. Con los datos históricos correctos y suficiente tiempo optimizando, puedes construir un modelo que "predice" el pasado con un 70% de acierto. El problema es que ese 70% desaparece en cuanto empiezas a apostar dinero real.

En AIBG PICKS resolvemos este problema con una capa adicional de validación: el shadow tracker. Es el mecanismo que nos permite saber, con datos reales, qué combinaciones de liga y mercado tienen edge genuino — y cuáles solo parecían tenerlo en papel. Con 594 picks verificados, +41.9u de beneficio y +6.37% de ROI, el shadow tracking es parte esencial de por qué nuestro sistema funciona.

El Problema del Backtest: Por Qué los Datos Históricos Mienten

Un backtest consiste en aplicar tu modelo predictivo a datos históricos para ver cuánto habría ganado. Es una herramienta válida, pero tiene una trampa fundamental: cuando optimizas un modelo sobre los mismos datos que luego usas para evaluar, estás haciendo trampas sin darte cuenta.

Este fenómeno se llama data leakage (fuga de datos) o sobreajuste. El modelo "aprende" los patrones de los datos históricos tan bien que funciona perfectamente en el pasado pero falla en el presente. En apuestas deportivas, esto es especialmente peligroso porque las cuotas cambian, los equipos evolucionan y los mercados se vuelven más eficientes cada temporada.

Ejemplo real de fuga de datos

Un backtest inicial en AIBG mostró que apostar al Over 2.5 en Brasil (Brasileirao) daba +113% de ROI. Parecía el mercado perfecto. Pero cuando corregimos el sobreajuste y aplicamos walk-forward testing — entrenando en datos pasados y evaluando en datos futuros — el ROI real fue -5.9%. Un cambio de 120 puntos porcentuales.

Sin el shadow tracker, habríamos estado apostando en un mercado que en realidad pierde dinero.

La solución no es abandonar los backtests, sino validarlos con datos en tiempo real. Ahí entra el shadow tracking.

Qué es el Shadow Tracker y Cómo Funciona

El shadow tracker es una capa de validación externa al sistema ML principal. No modifica las predicciones del modelo ni interfiere con los picks reales. Simplemente observa desde fuera: registra cada predicción con los datos completos, espera al resultado, y mide si el edge predicho se está materializando en la realidad.

Funciona en tres pasos:

1
Registro — Cada mañana, el sistema escanea más de 380 partidos en 27 ligas. Para cada partido y mercado en nuestra matriz, calcula la probabilidad real del modelo frente a la probabilidad implícita de las cuotas. Si hay edge, lo registra en la base de datos shadow con todos los detalles: cuota, bookmaker, edge estimado, probabilidad del modelo.
2
Espera — El partido se juega. El resultado es real, con dinero real (si es un pick aprobado) o virtual (si es solo seguimiento). El sistema obtiene el marcador final automáticamente.
3
Liquidación — Cada predicción se cierra: WON o LOST. El P&L se actualiza. Con el tiempo, se acumula evidencia estadística de qué combinaciones liga×mercado tienen edge real versus cuáles solo lo tienen en el backtest.

El resultado es una base de datos viva que crece pick a pick y que mide la diferencia entre lo que el modelo predice y lo que ocurre en la realidad.

La Matriz GREEN / YELLOW / RED: El Corazón del Sistema

Con los datos del shadow tracker combinados con los backtests correctamente realizados y los 594 picks reales del sistema, construimos una matriz de clasificación para cada combinación de liga y mercado. Cada combinación recibe un veredicto:

🟢
GREEN
Backtest positivo Y datos reales confirman el edge. Se publican como picks regulares. Ejemplo: E0 (Premier League) × BTTS o SP1 (La Liga) × Over 2.5.
🟡
YELLOW
Backtest positivo pero muestra pocos datos reales (<15 picks). Se muestran a Javier con aviso. Se sigue acumulando evidencia antes de confiar al 100%.
🔴
RED
Backtest negativo Y/O datos reales negativos. Se bloquean automáticamente. Nunca llegan a publicación. Ejemplo: D1 (Bundesliga) × 1X2 = -29.8% ROI real.

Esta clasificación se actualiza automáticamente cada semana con datos nuevos. A medida que se acumulan más picks reales, las YELLOW con edge real suben a GREEN — y las que fallan bajan a RED. Es un sistema auto-calibrante.

Lo Que los Datos Reales Revelan: Sorpresas y Confirmaciones

Tras meses de shadow tracking y 594 picks reales, hemos aprendido cosas que ningún backtest nos habría mostrado. Aquí van los datos de rendimiento por mercado en AIBG PICKS:

Mercado Picks Reales Win Rate ROI Real Estado Matriz
BTTS ~103 61.2% +13.2% 🟢 GREEN
Over/Under 2.5 ~145 57.2% +8.4% 🟢 GREEN
Double Chance ~90 57.8% +7.5% 🟢 GREEN
1X2 ~91 35.2% -5.6% 🔴 RED

El 1X2 fue la gran sorpresa. Los backtests iniciales mostraban resultados mixtos, pero los datos reales son contundentes: el mercado 1X2 es estructuralmente difícil para un sistema ML. Los mercados binarios como BTTS y Over/Under ofrecen predicciones más robustas porque eliminan el empate como fuente de ruido.

594
Picks Verificados
+6.37%
ROI Global Real
55.2%
Win Rate Global
El descubrimiento más valioso: El edge en 1X2 de Liga Profesional Argentina (+19.7% en backtest) sí se confirma en datos reales. El edge en 1X2 de Bundesliga (-29.8%) también se confirma — pero en negativo. La diferencia está en la eficiencia del mercado: cuotas de Bundesliga son mucho más eficientes que las de Argentina.

Shadow Tracking en Acción: Un Ejemplo Real

Para entender cómo funciona el shadow tracker en la práctica, sigamos un pick real de principio a fin:

Shadow Pick — Registro en la base de datos
PartidoSevilla vs Celta — La Liga (SP1)
MercadoBTTS Yes (SP1 × BTTS = 🟢 GREEN)
Cuota bookmaker1.78 (prob. implícita: 56.2%)
Prob. modelo ML64.5% → Edge: +8.3%
Estado pre-partidoRegistrado. Esperando resultado.
Liquidación — El resultado confirma el edge
Marcador finalSevilla 2 – 1 Celta
BTTSSÍ (ambos equipos marcaron)
Resultado shadowWON +0.78u virtual
Acumulado SP1×BTTS+36.3% ROI en muestra

Cada pick liquidado actualiza las estadísticas de su combinación liga×mercado. Con 20+ picks en una combinación, los datos empiezan a ser estadísticamente relevantes. Con 60+, son sólidos. Con 100+, son definitivos.

Regla de Oro: Cuándo Confiar en el Backtest vs los Datos Reales

El shadow tracker no reemplaza al backtest — lo complementa. La regla para saber cuándo confiar en cada fuente es simple:

Regla de prioridad de datos

Menos de 15 picks reales en la combinación: Confía en el backtest (pero con cautela). El backtest tiene más datos. Los 15 picks reales son ruidosos — pueden ser una racha buena o mala.

Entre 15 y 60 picks reales: 60% peso a datos reales, 40% al backtest. Empiezan a aparecer señales, pero todavía hay varianza.

Más de 60 picks reales: Los datos reales son la referencia principal. Si el backtest decía +10% ROI y los datos reales muestran -3%, el backtest estaba sobreajustado. Revisa el modelo.

Conflicto extremo (backtest +20% vs real -15%): Para todo. Hay data leakage o el mercado cambió estructuralmente. No apuestes hasta entender la discrepancia.

Señal de confianza combinada
Confianza = ROI_backtest × 0.4 + ROI_real × 0.6
Aplicar solo cuando hay 15+ picks reales en la combinación liga×mercado. Con menos datos, el backtest tiene más peso.

Tip Práctico: Cómo Aplicar Shadow Tracking a Tu Sistema

No necesitas un sistema ML complejo para hacer shadow tracking. Cualquier apostador sistemático puede aplicar este principio:

Tu shadow tracker personal en 4 pasos

1. Registra ANTES del partido. Anota el pick, la cuota, tu probabilidad estimada y el edge calculado en una hoja de cálculo. No hagas trampa añadiendo picks que "habrías apostado" después de ver el resultado.

2. Segmenta por liga y mercado. No mezcles todo. "Over 2.5 Premier League" y "Over 2.5 Liga Argentina" son dos apuestas diferentes con dinámicas distintas. Necesitas columnas separadas para cada combinación.

3. Espera 50+ picks antes de sacar conclusiones. Con menos de 50 picks, cualquier resultado es ruido. Una racha de 10 victorias seguidas con 30% de win rate teórico es estadísticamente posible.

4. Si el ROI real diverge del teórico en más de 15 puntos, para. Algo está fallando — ya sea tu estimación de probabilidad, el mercado en esa liga, o la eficiencia de las cuotas del bookmaker que usas.

Dato AIBG: Llevamos más de 4 meses de shadow tracking activo. El resultado más sorprendente: el mercado BTTS en La Liga 2 española (SP2) muestra un ROI de +52.2% en datos reales — muy por encima de cualquier backtest. Eso nos llevó a aumentar la confianza en esa combinación. Sin shadow tracking, habríamos sido conservadores con SP2×BTTS. Con él, tenemos la evidencia para confiar.

¿Quieres ver el sistema validado en acción?

En AIBG PICKS cada pick publicado ha pasado por la matriz GREEN/YELLOW/RED. Solo publicamos cuando backtest Y datos reales coinciden. 594 picks, +41.9u, +6.37% ROI — completamente verificados y transparentes.

Volver al Blog

Any betting system can look brilliant on a backtest. With the right historical data and enough time optimising, you can build a model that "predicts" the past with 70% accuracy. The problem is that 70% evaporates the moment you start betting real money.

At AIBG PICKS we solve this problem with an additional validation layer: the shadow tracker. It's the mechanism that tells us, with real live data, which league-market combinations have genuine edge — and which only appeared to have it on paper. With 594 verified picks, +41.9 units profit, and +6.37% ROI, shadow tracking is a core reason our system actually works.

The Backtest Problem: Why Historical Data Lies

A backtest means applying your predictive model to historical data to see how much it would have won. It's a valid tool, but it has a fundamental trap: when you optimise a model on the same data you then use to evaluate it, you're cheating yourself without realising it.

This is called data leakage or overfitting. The model "learns" historical patterns so well it works perfectly in the past but fails in the present. In sports betting this is especially dangerous because odds change, teams evolve, and markets become more efficient every season.

Real example of data leakage

An early AIBG backtest showed that betting Over 2.5 in the Brazilian Brasileirao gave +113% ROI. It looked like the perfect market. But when we corrected the leakage and applied proper walk-forward testing — training on past data and evaluating on future data — the real ROI was -5.9%. A 120-percentage-point swing.

Without the shadow tracker, we would have been betting in a market that actually loses money.

The solution isn't to abandon backtests, but to validate them with real-time data. That's where shadow tracking comes in.

What the Shadow Tracker Is and How It Works

The shadow tracker is a validation layer external to the main ML system. It doesn't modify the model's predictions or interfere with real picks. It simply observes from outside: logs every prediction with full data, waits for the result, and measures whether the predicted edge is actually materialising in reality.

It works in three steps:

1
Register — Every morning the system scans over 380 matches across 27 leagues. For each match and market in our matrix, it calculates the model's true probability against the bookmaker's implied probability. If there's edge, it's logged in the shadow database with full details: odds, bookmaker, estimated edge, model probability.
2
Wait — The match is played. The result is real — with real money if it's an approved pick, or virtual if it's tracking only. The system fetches the final score automatically.
3
Settle — Each prediction closes: WON or LOST. P&L is updated. Over time, statistical evidence accumulates on which league×market combos have real edge versus which only had it in the backtest.

The result is a living database that grows pick by pick and measures the gap between what the model predicts and what actually happens.

The GREEN / YELLOW / RED Matrix: The Heart of the System

Using shadow tracker data combined with properly executed backtests and 594 real picks, we build a classification matrix for each league-market combination. Each combination gets a verdict:

🟢
GREEN
Backtest positive AND live data confirms the edge. Published as regular picks. Example: E0 (Premier League) × BTTS or SP1 (La Liga) × Over 2.5.
🟡
YELLOW
Backtest positive but fewer than 15 live picks. Shown with a warning label. Evidence is still being gathered before full confidence.
🔴
RED
Backtest negative AND/OR live data negative. Blocked automatically — never reaches publication. Example: D1 (Bundesliga) × 1X2 = -29.8% real ROI.

This classification updates automatically each week with new data. As more live picks accumulate, YELLOWs with real edge graduate to GREEN — and those that fail drop to RED. It's a self-calibrating system.

What the Live Data Reveals: Surprises and Confirmations

After months of shadow tracking and 594 real picks, we've learned things no backtest could have shown us. Here's the performance breakdown by market in AIBG PICKS:

Market Live Picks Win Rate Live ROI Matrix Status
BTTS ~103 61.2% +13.2% 🟢 GREEN
Over/Under 2.5 ~145 57.2% +8.4% 🟢 GREEN
Double Chance ~90 57.8% +7.5% 🟢 GREEN
1X2 ~91 35.2% -5.6% 🔴 RED

1X2 was the big surprise. Initial backtests showed mixed results, but live data is unambiguous: the 1X2 market is structurally difficult for an ML system. Binary markets like BTTS and Over/Under deliver more robust predictions because they eliminate the draw as a source of noise.

594
Verified Picks
+6.37%
Global Live ROI
55.2%
Global Win Rate
The most valuable discovery: The 1X2 edge in Argentina's Liga Profesional (+19.7% in backtest) is confirmed by live data. The 1X2 edge in Bundesliga (-29.8%) is also confirmed — but in the negative direction. The difference lies in market efficiency: Bundesliga odds are far more efficient than Argentine odds.

Shadow Tracking in Action: A Real Example

To understand how the shadow tracker works in practice, let's follow a real pick from start to finish:

Shadow Pick — Logged in the database
MatchSevilla vs Celta — La Liga (SP1)
MarketBTTS Yes (SP1 × BTTS = 🟢 GREEN)
Bookmaker odds1.78 (implied prob: 56.2%)
Model probability64.5% → Edge: +8.3%
Pre-match statusRegistered. Awaiting result.
Settlement — Result confirms the edge
Final scoreSevilla 2 – 1 Celta
BTTSYES (both teams scored)
Shadow resultWON +0.78u (virtual)
SP1×BTTS cumulative+36.3% ROI in sample

Each settled pick updates the stats for its league×market combination. With 20+ picks in a combination, data starts to be statistically meaningful. With 60+, it's solid. With 100+, it's definitive.

Golden Rule: When to Trust Backtest vs Live Data

The shadow tracker doesn't replace the backtest — it complements it. The rule for knowing which source to trust is simple:

Data priority rule

Fewer than 15 live picks in the combination: Trust the backtest (with caution). The backtest has more data. 15 live picks are too noisy — they could be a lucky or unlucky streak.

Between 15 and 60 live picks: 60% weight to live data, 40% to backtest. Signals are emerging, but variance is still significant.

More than 60 live picks: Live data is the primary reference. If the backtest showed +10% ROI but live data shows -3%, the backtest was overfitted. Review the model.

Extreme conflict (backtest +20% vs live -15%): Stop everything. There's data leakage or the market has structurally changed. Don't bet until you understand the discrepancy.

Combined confidence signal
Confidence = Backtest_ROI × 0.4 + Live_ROI × 0.6
Apply only when there are 15+ live picks in the league×market combination. With fewer data points, the backtest carries more weight.

Practical Tip: How to Apply Shadow Tracking to Your Own System

You don't need a complex ML system to do shadow tracking. Any systematic bettor can apply this principle with a simple spreadsheet:

Your personal shadow tracker in 4 steps

1. Log BEFORE the match. Write down the pick, odds, your estimated probability, and calculated edge in a spreadsheet. No cheating by adding picks you "would have made" after seeing the result.

2. Segment by league and market. Don't mix everything together. "Over 2.5 Premier League" and "Over 2.5 Argentine Liga" are two different bets with different dynamics. You need separate rows for each combination.

3. Wait for 50+ picks before drawing conclusions. With fewer than 50 picks, any result is noise. A 10-win streak with a theoretical 30% win rate is statistically possible.

4. If live ROI diverges from theoretical by more than 15 points, stop. Something's failing — either your probability estimates, the market in that league, or the odds efficiency at the bookmaker you're using.

AIBG insight: We've been running active shadow tracking for over 4 months. The most surprising result: BTTS in the Spanish Segunda División (SP2) shows +52.2% ROI in live data — well above any backtest figure. That gave us confidence to lean into that combination. Without shadow tracking, we'd have been conservative about SP2×BTTS. With it, we have the evidence to trust it.

Want to see the validated system in action?

At AIBG PICKS every published pick has passed through the GREEN/YELLOW/RED matrix. We only publish when backtest AND live data agree. 594 picks, +41.9u, +6.37% ROI — fully verified and transparent.

Back to Blog