El poder de los datos: el escándalo del tenis

Posted by in Noticias

La semana pasada comenzó el Open de Australia de tenis, y casi al tiempo que empezaban los primeros partidos saltaba la noticia, donde los protagonistas son los datos. El poder de los datos, que analizados, dictaminan una serie de comportamientos sospechosos en un grupo de jugadores en relación con las apuestas deportivas, y el escándalo ya está servido.

Muchos medios de comunicación han abierto incluso sus portadas con titulares impactantes sobre el amaño de apuestas en el tenis, precísamente en uno de sus grandes torneos, un Grand Slam.

El artículo completo donde se detalla el análisis es este: http://www.buzzfeed.com/johntemplon/como-se-hizo-tennis-racket. Y aquí en inglés, más largo y con más detalles.

El poder de los datos

Si estas interesado en profundizar sobre el tema, hay bastante literatura, e incluso código!

Si estras a este repositorio de GitHub, descubrirás el algoritmo que ha desvelado dicho comportamiento por parte de los jugadores sospechosos, cuyos nombres no son desvelados. Incluso puedes ver el notebook con la aplicación del algoritmo, y por supuesto, los datos están totalmente disponibles para que te los descargues.

Lo primero que habría que preguntarse es por la procedencia de dichos datos, si han sido proporcionados por las casas de apuestas, o bien han sido extraidos de éstas mediante métodos de WebScrapping. Al tratarse de datos anonimizados, surge esta duda.

Un vistazo a los datos del análisis (son unos 50 megas) desvela que sólo se conoce la cuota antes de inicio, y la final, el movimiento de cuotas durante el partido, el año, la probabilidad del ganador y del perdedor, así como los nombres anonimizados. Todos los datos se han obtenido de una casa concreta de apuestas, en partidos de la ATP entre 2009 y septiembre de 2015, con más de 25.000 partidos oficiales.

Sorprende que, incluso sin datos proporcionados por las propias casas de apuestas, las conclusiones sean tan determinantes, y estén provocando un revuelo en un mundo «entre caballeros», cómo siempre se ha denominado al tenis. También se han limpiado los datos, y eliminado aquellos datos con porcentajes extremos, para centrarse sólo en la mitad de la campana.

Más datos, ¿nuevas conclusiones?

Probablemente, las casas de apuestas podrían confirmar la validez de las conclusiones sí ellas también ejecutaran el mismo procedimiento, pero incluso pueden ir más allá, porque de un solo partido se tienen multitud de datos. Por un lado, la variedad de apuestas que se realiza en un partido de tenis es grandísima. Desde quien gana un juego, cuanto quedará el set, que número de juegos se hará en un set, marcadores, sets, … Es decir, que no solo se limitan a «Gana A o Gana B», y claro, detectar comportamientos irregulares es francamente dificil con los «pocos» datos obtenidos.

En cualquier caso, en los datos no vienen la cantidad jugada de cada partido, lo que sí daría una importante pista sobre si ese partido está siendo seguido por las mafias de apuestas.

Los tenistas, ¿qué dicen?

Sin duda, los protagonistas de la raqueta confirman la existencia de redes mafiosas de apuestas que hace que el asunto se enturbie todavía más. Incluso el número 1 del mundo, Novak Djokovic fue tentado, allá por 2007.

Me suena un poco raro que tenistas clasificados entre los primeros puestos de la ATP tengan necesidades de entrar al juego de las apuestas, cuando tienen sueldos y ganancias más que decentes, y además, detrás están grandes patrocinadores, que también suponen buenos ingresos.

Además, el aspecto mental del tenis es tan frágil que multitud de acontecimientos pueden ocurrir para que en mitad de un partido, suceda todo lo contrario, sin estar amañado: una lesión, cansancio temporal, un problema con la novia, o con tu madre, …. son más que suficientes para que uno «se salga» del partido, momentaneamente o no. Esto lo sé porque yo mismo soy practicante de este deporte, y no todo es físico, que también.

Asaltando la privacidad

Supongo que atajar o verificar estos datos requerirá un análisis de emails, whatsapp, telegram, tablet, móvil, … por parte de los tenistas implicados, lo que atenta contra su privacidad.

Así que, empezamos 2016 con un buen lío a la vista, por un análisis de datos. Veremos cómo termina, y qué consecuencias tiene, no sólo para el mundo del tenis, sino también para las apuestas.

Buen día.