Loading...

El Big Data apuesta por España en el Mundial

Muchas compañías como las casas de apuestas se encuentran deseosas de saber que equipo puede saber el próximo ganador del Mundial de Rusia. ¿Cómo podemos saber quién será? ¿Hay alguna forma de predecir cómo se enfrentarán los equipos? ¿Podría el Big Data, que ya ha transformado innumerables otras industrias, también desbloquear una comprensión más profunda del fútbol?

Gracias a que el Big Data es una gran colección de conjuntos de datos que no se pueden almacenar en un sistema tradicional, sumado al gran tamaño que tiene, y unido al Data Science, así como el procesamiento que esto conlleva es posible estimar un ganador para el mundial de fútbol de este año.

Big Data enfocado al fútbol

¿Qué es lo que realmente se recopila? El gerente de marketing de Opta Sports, Peter Deeley, explicó que para cada partido de fútbol, su compañía recolecta alrededor de 2000 tipos de datos individuales, la mayoría centrados en acciones en directo sobre el terreno de juego. Un equipo de tres Data Scientist, uno para cada lado y alguien que verifique los momentos difíciles, se sentarán en el centro de datos de la compañía, y grabará todo lo que sucede en el terreno de juego: cada pase, cruce y disparo, así como las posiciones en el campo donde cada interacción ha tenido lugar para poder realizar un posterior análisis y predicción.

La empresa Stats realiza el mismo tipo de análisis, y Paul Power, un Data Scientist de la compañía, comentó que no solo los humanos recopilan datos, sino también las nuevas tecnologías de visión por computadora, complementándose mutuamente. Paul explica con un ejemplo de si un jugador está acorralado patea la pelota por desesperación y afortunadamente la pelota es recibida por un jugador en el mismo equipo. Para una máquina, esto puede parecer simplemente un pase largo, ya que las máquinas no pueden resolver el contexto de lo que está sucediendo, o la mirada de pánico en la cara del jugador: registraría un pase largo, mientras que técnicamente el evento es técnicamente algo distinto. Lo que significa que sin un humano para realizar estos comentarios, los datos registrados pueden ser menos precisos.

¿Cómo funciona este mecanismo de Big Data?

La empresa Gracenote ofrece estadísticas basadas en las clasificaciones de los equipos, que tienen en cuenta los resultados, la ubicación y la importancia de los partidos. Después de la gran cantidad de datos que se recolecta un algoritmo predictivo se ejecuta más de un millón de veces, produciendo estimaciones para las oportunidades de cada equipo de avanzar en el torneo, el Big Data desempeña un papel crucial como medio para que el Data Science consiga analizar la información. Además se han incluido variables tan dispersas como el PIB y la población de un país, la clasificación de equipos nacionales de la FIFA, la edad media de los jugadores, el número de jugadores de la Liga de Campeones, entre otros.

Por otro lado, la empresa Bing se ha sumado al carro y también ha querido predecir el finalista basándose en el Big Data con su posterior Data Science, el algoritmo predictivo de Bing tiene en cuenta los resultados históricos de los equipos (ganadas y derrotas, margen de victoria, condiciones meteorológicas…). Precisamente debido a estos factores (lesiones, meteorología, que diferencia hay si juega como anfitrión, si está jugando en su continente o si ha ganado los ultimos mundiales etc…), las probabilidades serán actualizadas constantemente durante la competición, día a día.

Los Data Scientists de cada una de las empresas pudieron entonces modificar el modelo ejecutándolo cientos de miles de veces para realizar mejoras iterativas, ajustando el peso relativo de cada factor en el algoritmo.

¿Qué conclusiones podemos sacar de los resultados?

Las predicciones de Gracenote colocan a Brasil primero, dando al equipo un 21% de posibilidades de levantar el trofeo. España ocupa el segundo lugar, Alemania en tercer lugar y Argentina en cuarto. Según la universidad de Gante que España sería el ganador con el 17,8% de probabilidades, siempre que Alemania no pase a cuartos de final. Porque los germanos tendrían una fase de grupos y octavos más dificil que los de España, así que sus probabilidades de quedar fuera son mayores.Con el método del bosque aleatorio se calcula que las posibilidades de Alemania de alcanzar los cuartos de final son del 58%.

Sin embargo, según la predicción de Opta el posible ganador es Brasil con un 14.2% de probabilidades de ganar, aunque también propone a Alemania, dándoles un 11.4% de posibilidades de llevarse a casa el trofeo nuevamente.

Usando los datos detallados que tiene sobre los jugadores y las clasificaciones de equipo en FIFA 2018 y su complemento en la Copa del Mundo, realizó una simulación del torneo y Francia fue la ganadora final, derrotando a Alemania en la final.

Las clasificaciones de la FIFA, que son ligeramente menos impulsadas por datos, tienen a Alemania en primer lugar, con Brasil, Bélgica y Portugal en segundo, tercer y cuarto lugar, respectivamente.

El Big Data y el análisis predictivo son tecnologías que vienen pisando fuerte en los últimos años. La oferta de puestos de trabajo se ha disparado y cada día se requieren más y más profesionales formados en este ámbito. Si estás interesado en convertirte en un especialista en Big Data, ¡estás de suerte! Desde la Universidad Camilo José Cela te ofrecemos el máster en Big Data y Business Analytics. Aprenderás todo lo necesario para convertirte en un profesional del Big Data y la ciencia de datos.

Solicita Información

Rellene este formulario para enviarnos cualquier consulta. En breve nos pondremos en contacto contigo.



Dirección
Campus Almagro UCJC
(Almagro 5, Madrid-España)
 Anterior  Todos Siguiente