Cómo la IA predice partidos de fútbol: los 6 modelos explicadosHow AI predicts football matches: the 6 models explained

95.000 partidos históricos, 106 variables, 6 modelos de machine learning — y una sola pregunta: ¿dónde está el edge? Así funciona AIBG-126 por dentro.95,000 historical matches, 106 variables, 6 machine learning models — and one single question: where's the edge? This is how AIBG-126 works under the hood.

La mayoría de los sistemas de predicción de fútbol son, en el fondo, análisis manual con una hoja de Excel. Nosotros lo hacemos diferente. AIBG-126 usa seis modelos de machine learning entrenados sobre 95.000 partidos de 31 ligas distintas, combinados en un ensemble que produce probabilidades calibradas para cada resultado posible.

¿El resultado? 522 picks publicados, 54.3% de win rate global y +35.71u de beneficio en mercados seleccionados. En este artículo te explicamos cómo funciona el sistema por dentro — sin jerga innecesaria, con el contexto suficiente para que entiendas por qué nuestras predicciones tienen valor real.

¿Qué es un modelo ensemble y por qué es mejor?

Un modelo "ensemble" (conjunto) es simplemente la combinación de múltiples modelos independientes para producir una predicción más robusta que cualquiera de ellos por separado. La idea es intuitiva: si seis analistas expertos pero con enfoques distintos coinciden en algo, esa coincidencia tiene más peso que la opinión de uno solo.

En machine learning el principio es el mismo. Cada modelo tiene fortalezas y debilidades distintas. Uno puede ser muy bueno prediciendo partidos de ligas con mucha historia en la base de datos, pero peor en ligas con pocos datos. Otro puede capturar bien las tendencias de goles pero fallar en partidos con alta motivación. Al combinar los seis, los errores de uno se compensan con los aciertos de los demás.

La regla de oro del ensemble
Ensemble = mejor que el mejor modelo individual
Siempre y cuando los modelos sean suficientemente distintos entre sí — si todos fallan igual, el ensemble también falla. La diversidad es la clave.

Los 6 modelos de AIBG-126

Cada modelo del ensemble aborda el problema desde un ángulo diferente. Aquí va una explicación no técnica de cada uno:

🌲 XGBoost

El caballo de batalla. Árboles de decisión en cascada — aprende de sus propios errores iterativamente. Excelente con variables numéricas (goles, cuotas, racha). Muy bueno con datos tabulares. El modelo que más peso tiene en el ensemble.

🌳 Random Forest

Construye cientos de árboles de decisión distintos y hace una votación. Más robusto frente al overfitting (aprenderse la historia de memoria sin generalizar). Bueno detectando patrones de liga y temporada que XGBoost puede ignorar.

⚡ LightGBM

Variante de gradient boosting ultrarrápida. Maneja bien grandes volúmenes de datos y features de alta dimensión. Especialmente útil cuando procesamos las 106 variables de golpe — donde otros modelos se ralentizan, este vuele.

🧠 Red Neuronal

Inspirado en el cerebro humano. Puede capturar relaciones no lineales complejas que los árboles pierden — por ejemplo, cómo interaccionan el estado físico del portero con el historial goleador del delantero rival.

📊 Regresión Logística

El modelo más simple de los seis, pero sorprendentemente útil como "ancla" del ensemble. Produce probabilidades muy bien calibradas y actúa como contrapeso cuando los modelos más complejos se sobreajan.

⚽ Poisson Bivariante

Modelo estadístico especializado en fútbol. Predice el número esperado de goles de cada equipo usando fuerza de ataque y defensa ajustada por liga. La base del cálculo de mercados Over/Under y marcador exacto.

¿Cómo se combinan? Cada modelo produce su propia probabilidad para local/empate/visitante. El ensemble calcula una media ponderada según el rendimiento histórico de cada modelo por liga y mercado. El modelo que más ha acertado en Serie A tiene más peso en partidos de Serie A. Es adaptativo.

Las 106 variables: qué analiza el sistema

La calidad de cualquier modelo de ML depende de las variables que le das para aprender. AIBG-126 usa 106 features agrupadas en siete categorías:

Las 7 categorías de variables

1. Forma reciente (últimos 5 partidos): Puntos por partido, rachas, goles marcados/encajados, clean sheets, BTTS rate, Over 2.5 rate — separados por equipo local y visitante.

2. Historial H2H: Últimos 10-15 enfrentamientos directos. Resultados, goles, tendencias, ventaja de campo — el historial entre estos dos equipos específicos vale más que la forma general.

3. Estadísticas de temporada: PPG, posición en tabla, diferencia de goles, xG y xGA (goles esperados), porcentaje de posesión, tiros a puerta.

4. Variables de motivación y contexto: ¿Está luchando por el título? ¿En zona de descenso? ¿Ya clasificado sin nada que ganar? ¿Fatiga por partido de Copa entre semana?

5. Cuotas de mercado (Pinnacle/bet365): Las casas tienen información. Las cuotas de cierre de Pinnacle son las más eficientes del mercado — las incluimos como feature, no como objetivo.

6. Lesiones e importancia de jugadores: xG esperado que se pierde por bajas. Un equipo sin su delantero titular pierde capacidad goleadora — el modelo lo cuantifica.

7. Variables de temporada/fase: Inicio, mitad y final de temporada tienen comportamientos distintos. El modelo lo sabe y ajusta.

106
Variables totales
95K+
Partidos históricos
31
Ligas cubiertas

Calibración: de predicción a probabilidad real

Un modelo puede predecir "70% de probabilidad de victoria local" — pero si a lo largo de 1000 partidos esos casos con 70% predicho solo ganan el 55% de las veces, la predicción no está bien calibrada. Es demasiado confiada. Eso en apuestas es fatal.

AIBG-126 aplica calibración isotónica por liga — un proceso estadístico que ajusta las probabilidades brutas del ensemble para que reflejen fielmente las frecuencias reales históricas. Si el modelo dice 65%, ese 65% debería ocurrir el 65% de las veces en la vida real.

El test de calibración: Brier Score
Brier = Σ (probabilidad_predicha − resultado_real)²
Un Brier Score de 0 = perfección. Un modelo random en fútbol puntúa ~0.33. AIBG-126 apunta por debajo de 0.22 — calibración superior al baseline de mercado.

La calibración también incluye dos correcciones específicas que mejoraron el rendimiento real:

Correcciones de calibración activas

Boost al empate (+3% absoluto): Los modelos Poisson subestiman sistemáticamente la probabilidad del empate en fútbol. Aplicamos un boost correctivo cuando la probabilidad de empate predicha cae por debajo del 35%.

Corrección de sobreconfianza: Las predicciones en el rango 45-65% tienden a ser demasiado extremas — el modelo decía 60% cuando la realidad era 52%. Corregimos encogiéndolas un 8% hacia el 50% antes de calcular el edge.

De la predicción al pick: cómo se calcula el edge

El ensemble produce una probabilidad calibrada para cada resultado. Hasta aquí, es predicción pura. El salto a una apuesta con valor se produce al comparar esa probabilidad con lo que ofrece el mercado.

La fórmula del edge
Edge = (Prob. Real − Prob. Implicita) × 100
Prob. Implicita = 1 / Cuota | Edge positivo = valor. Edge del 5% o más = mínimo para publicar.

AIBG-126 escanea automáticamente 388 partidos en 27 ligas comparando sus probabilidades calibradas contra 14 casas de apuestas en 15 mercados distintos. Solo los picks donde el edge supera el umbral mínimo (5% para la mayoría de mercados, 7% para 1X2) llegan al canal de Telegram.

Ejemplo real paso a paso

Partido: Villarreal vs Real Sociedad (La Liga)

Ensemble predice: Over 2.5 goles → probabilidad real calibrada = 64%

Cuota Bet365: 1.70 → probabilidad implicita = 58.8%

Edge calculado: 64% − 58.8% = +5.2% — pick válido

Stake recomendado: 1/4 Kelly = 1.3u | Publicado en canal a las 08:32 CET

Qué mercados funciona mejor la IA — y por qué

No todos los mercados son iguales para un sistema de ML. Los resultados reales de 522 picks confirman algo que el modelo predice teóricamente: el 1X2 es el más difícil para la IA, mientras que los mercados binarios ofrecen más señal aprovechable.

Mercado Picks Win Rate ROI Por qué la IA funciona aquí
BTTS ~130 ~62% +13%+ 2 resultados, datos de goles muy predecibles
Over/Under 2.5 ~175 ~57% +8%+ Poisson bivariante muy preciso en goles
Double Chance ~95 ~57% +7%+ Cubre 2 de 3 resultados, margen de error mayor
1X2 ~92 ~35% -5%+ 3 resultados, ruido altísimo, empate imprevisible

La lección: la IA es muy buena prediciendo cuántos goles habrá (mercados Over/Under y BTTS), pero mucho peor prediciendo quién ganará específicamente (1X2). El empate en fútbol es casi aleatorio incluso para los mejores modelos — y los mercados binarios eliminan ese ruido.

Acción práctica: Cuando veas un pick de AIBG en Over/Under o BTTS, ese pick viene del tipo de mercado donde el ensemble tiene más ventaja histórica. Son las situaciones donde la señal del modelo supera al ruido. Cuando veas un 1X2, exige mayor edge — el modelo es más incierto.

El sistema que aprende solo: auto-calibración continua

Lo que hace a AIBG-126 diferente no es solo lo que predice hoy, sino cómo mejora automáticamente después de cada semana. El sistema incluye un bucle de aprendizaje activo:

Ciclo de auto-corrección semanal

Paso 1 — Predicción masiva: Cada mañana el sistema predice automáticamente todos los partidos del día en 31 ligas (~50-100 partidos diarios). No solo los que apostamos.

Paso 2 — Liquidación automática: Cuando terminan los partidos, el sistema recoge los resultados reales y compara con sus predicciones. Calcula error por modelo, por liga, por mercado.

Paso 3 — Ajuste de pesos: Los miércoles a las 09:30, un script recalibra automáticamente el peso de cada modelo dentro del ensemble según el rendimiento reciente por liga. Si Random Forest ha fallado en Bundesliga tres semanas seguidas, su peso en partidos de Bundesliga baja.

Paso 4 — Matrix update: Se actualiza la matriz de mercados viables (verde/amarillo/rojo) basándose en ROI acumulado real vs proyectado en backtest. El sistema sabe qué ligas+mercados están dando edge real y cuáles no.

El resultado: AIBG-126 en mayo de 2026 es un sistema significativamente más refinado que en enero. Los mismos datos históricos, pero mejores pesos, mejor calibración, y 5 meses de resultados reales como feedback adicional.

¿Quieres ver el ensemble en acción?

En AIBG PICKS publicamos cada pick con la probabilidad real del ensemble, la probabilidad implicita de la cuota, el edge calculado y el stake recomendado. Todo gratis en Telegram.

Volver al Blog

Most football prediction systems are, at their core, manual analysis with a spreadsheet. We do things differently. AIBG-126 uses six machine learning models trained on 95,000 matches across 31 different leagues, combined into an ensemble that produces calibrated probabilities for every possible outcome.

The result? 522 published picks, 54.3% global win rate and +35.71u profit in selected markets. In this article we explain how the system works from the inside — without unnecessary jargon, with enough context to understand why our predictions carry real value.

What is an ensemble model and why is it better?

An "ensemble" model is simply the combination of multiple independent models to produce a more robust prediction than any single one could alone. The idea is intuitive: if six expert analysts with different approaches all agree on something, that agreement carries more weight than any individual opinion.

In machine learning the principle is the same. Each model has distinct strengths and weaknesses. One might be excellent at predicting matches in data-rich leagues but weaker in leagues with fewer records. Another might capture goal trends well but miss high-motivation matches. By combining all six, one model's errors are offset by the others' strengths.

The golden rule of ensembles
Ensemble = better than the best individual model
As long as the models are sufficiently different from each other — if they all fail the same way, the ensemble fails too. Diversity is the key.

AIBG-126's 6 models

Each model in the ensemble attacks the problem from a different angle. Here's a non-technical explanation of each:

🌲 XGBoost

The workhorse. Cascading decision trees — it learns from its own mistakes iteratively. Excellent with numerical variables (goals, odds, streaks). Very strong with tabular data. The highest-weight model in the ensemble.

🌳 Random Forest

Builds hundreds of different decision trees and votes. More robust against overfitting (memorising history without generalising). Good at detecting league and season patterns that XGBoost might overlook.

⚡ LightGBM

An ultra-fast gradient boosting variant. Handles large data volumes and high-dimensional features well. Especially useful when processing all 106 variables at once — where other models slow down, this one flies.

🧠 Neural Network

Brain-inspired. Can capture complex non-linear relationships that trees miss — for example, how a goalkeeper's fitness interacts with the opposing striker's historical scoring record.

📊 Logistic Regression

The simplest of the six, yet surprisingly useful as an ensemble "anchor." Produces well-calibrated probabilities and acts as a counterweight when the more complex models overshoot.

⚽ Bivariate Poisson

A statistical model specialised in football. Predicts the expected goals for each team using league-adjusted attack and defence strength. The backbone of Over/Under and exact-score market calculations.

How are they combined? Each model produces its own probability for home/draw/away. The ensemble computes a weighted average based on each model's historical performance per league and market. The model that has scored best in Serie A gets more weight in Serie A matches. It's adaptive.

The 106 variables: what the system analyses

The quality of any ML model depends on the variables you give it to learn from. AIBG-126 uses 106 features grouped into seven categories:

The 7 variable categories

1. Recent form (last 5 matches): Points per game, streaks, goals scored/conceded, clean sheet rate, BTTS rate, Over 2.5 rate — split by home and away team separately.

2. H2H history: Last 10-15 head-to-head encounters. Results, goals, trends, home advantage — the history between these two specific teams is worth more than general form.

3. Season statistics: PPG, table position, goal difference, xG and xGA (expected goals), possession percentage, shots on target.

4. Motivation and context variables: Title race? Relegation battle? Already qualified with nothing to play for? Fatigue from a midweek cup match?

5. Market odds (Pinnacle/bet365): Bookmakers hold information. Pinnacle's closing lines are the most efficient in the market — we include them as a feature, not as a target.

6. Injuries and player importance: Expected xG lost from absences. A team missing its first-choice striker loses attacking output — the model quantifies it.

7. Season phase variables: Early, mid, and late season behave differently. The model knows and adjusts.

106
Total variables
95K+
Historical matches
31
Leagues covered

Calibration: from prediction to real probability

A model might predict "70% probability of a home win" — but if across 1,000 matches those 70%-predicted cases only actually win 55% of the time, the prediction isn't well calibrated. It's overconfident. In betting that's fatal.

AIBG-126 applies isotonic calibration per league — a statistical process that adjusts the raw ensemble probabilities so they faithfully reflect actual historical frequencies. If the model says 65%, that 65% should occur 65% of the time in real life.

The calibration test: Brier Score
Brier = Σ (predicted_probability − actual_result)²
A Brier Score of 0 = perfection. A random model in football scores ~0.33. AIBG-126 targets below 0.22 — calibration superior to the market baseline.

Calibration also includes two specific corrections that improved real-world performance:

Active calibration corrections

Draw boost (+3% absolute): Poisson models systematically underestimate draw probability in football. We apply a corrective boost when predicted draw probability falls below 35%.

Overconfidence correction: Predictions in the 45-65% range tend to be too extreme — the model would say 60% when reality was 52%. We correct by shrinking them 8% toward 50% before calculating edge.

From prediction to pick: how edge is calculated

The ensemble produces a calibrated probability for each outcome. Up to here, it's pure prediction. The leap to a value bet happens by comparing that probability against what the market is offering.

The edge formula
Edge = (True Probability − Implied Probability) × 100
Implied Prob. = 1 / Odds | Positive edge = value. Edge of 5%+ = minimum to publish.

AIBG-126 automatically scans 388 matches across 27 leagues, comparing its calibrated probabilities against 14 bookmakers across 15 different markets. Only picks where edge exceeds the minimum threshold (5% for most markets, 7% for 1X2) make it to the Telegram channel.

Real step-by-step example

Match: Villarreal vs Real Sociedad (La Liga)

Ensemble predicts: Over 2.5 goals → calibrated true probability = 64%

Bet365 odds: 1.70 → implied probability = 58.8%

Calculated edge: 64% − 58.8% = +5.2% — valid pick

Recommended stake: 1/4 Kelly = 1.3u | Published to channel at 08:32 CET

Which markets the AI works best in — and why

Not all markets are equal for an ML system. Real results from 522 picks confirm something the model predicts theoretically: 1X2 is the hardest for AI, while binary markets offer more exploitable signal.

Market Picks Win Rate ROI Why AI works here
BTTS ~130 ~62% +13%+ 2 outcomes, goal data highly predictable
Over/Under 2.5 ~175 ~57% +8%+ Bivariate Poisson very accurate for goals
Double Chance ~95 ~57% +7%+ Covers 2 of 3 outcomes, larger error margin
1X2 ~92 ~35% -5%+ 3 outcomes, high noise, draws nearly random

The lesson: AI is very good at predicting how many goals there will be (Over/Under and BTTS markets), but much weaker at predicting specifically who will win (1X2). The draw in football is nearly random even for the best models — and binary markets eliminate that noise.

Practical takeaway: When you see an AIBG pick on Over/Under or BTTS, that pick comes from the type of market where the ensemble has the most historical edge. These are the situations where the model's signal overcomes the noise. When you see a 1X2, demand higher edge — the model is less certain.

The system that learns by itself: continuous auto-calibration

What makes AIBG-126 different isn't just what it predicts today, but how it automatically improves after every week. The system includes an active learning loop:

Weekly self-correction cycle

Step 1 — Mass prediction: Every morning the system automatically predicts all matches of the day across 31 leagues (~50-100 matches daily). Not just the ones we bet on.

Step 2 — Automatic settlement: Once matches finish, the system collects real results and compares against predictions. It calculates error per model, per league, per market.

Step 3 — Weight adjustment: Every Wednesday at 09:30, a script automatically recalibrates each model's weight within the ensemble based on recent per-league performance. If Random Forest has been failing in the Bundesliga for three weeks, its weight in Bundesliga matches goes down.

Step 4 — Matrix update: The viable market matrix (green/yellow/red) is updated based on accumulated real ROI vs projected backtest ROI. The system knows which league+market combinations are delivering real edge and which aren't.

The result: AIBG-126 in May 2026 is a significantly more refined system than in January. Same historical data, but better weights, better calibration, and 5 months of real results as additional feedback.

Want to see the ensemble in action?

At AIBG PICKS we publish every pick with the ensemble's true probability, the implied probability of the odds, the calculated edge, and the recommended stake. All free on Telegram.

Back to Blog