Retomamos la serie de artículos en el blog que analizan una prueba de triatlón. Ahora que empiezan a reactivarse con cuentagotas las competiciones internacionales y de las grandes franquicias, hemos creído interesante analizar la prueba que se celebró este fin de semana en Dubai: El IM 70.3 de Dubai.
Espero que este análisis pueda valerte, si estás pensado en participar en la prueba o si alguna vez has participado en la misma. Por supuesto que el análisis se puede hacer más profundo o con más detalle pero seguro que las conclusiones te parecen interesantes.
Disclaimer: En este primer análisis sólo analizaré la edición de 2021 pero será interesante para futuros posts en el blog la comparativa con otros años.
¡Comencemos!
Análisis inicial de los datos del IM 70.3 Dubai 2021
Como siempre, la clasificación la obtenemos de la página oficial de Ironamn y los limpiamos porque hay algunas filas que podían tener errores o no ser fácilmente tratables por nuestro programa de análisis.
Lo primero que vemos es que tenemos un total de 1266 datos de triatletas con un montón de campos de datos por cada triatleta para poder analizar. En esta ocasión hemos podido hacernos con los datos de las 2 transiciones por lo que haremos un análisis también de las transiciones y veremos si podemos sacar alguna conclusión con ellas.
Consideraciones de esta edición del IM 70.3 de Dubai
Parece que en esta edición se han cumplido los pronósticos y que en categoría profesional ganaron los favoritos tanto en masculino como en femenino. Los flamantes campeones fueron Daniel Bakkergard y Daniela Ryf.
Hubo un nutrido grupo de 22 españoles que viajaron a Dubai para competir y por eso hago un llamamiento a que compartan sus impresiones de la prueba y que se animen a contrastar y comentar este análisis con sus propias experiencias. El mítico Iván Raña acabó en el puesto 23.
Resumen de las características de la prueba:
- La natación se realiza en aguas abiertas, en océano.
- El circuito de bici es muy rápido y plano. Perfecto para rodadores que aguanten bien la posición acoplada.
- La carrera también tiene un circuito muy plano y rápido.
- La temperatura durante la prueba es crucial y en este año especialmente hubo momentos de 30º que para los triatletas no acostumbrados a estas alturas del año al calor pudo pasar factura.
¿Cuántos triatletas fueron Finishers?
Vamos a ver cuántos triatletas lograron acabar, cuántos de ellos fueron descalificados (DQ), cuántos no tomaron la salida (DNS) y cuántos no pudieron acabar (DNF):
Como vemos, a pesar un IM muy duro, un alto porcentaje de triatletas lograron cumplir con el objetivo de finalizar la prueba. Pero lo más llamativo es el alto porcentaje de “No presentados”. Probablemente fueron triatletas que en el último momento no pudieron o no quisieron viajar, seguramente por la situación internacional existente.
El número de triatletas que fueron Finishers fue de 1033.
¿Qué países participaron en el IM 70.3 Dubai?
Veamos qué nacionalidad tenían los distintos participantes:
Vemos una amplia variedad de países entre los participantes (tanto que ni siquiera entran en la imagen). El país que más representantes tenía era Reino Unido, seguido de cerca por Rusia. Cierra el podium de participación Kazajstan. Como te decía antes, los españoles Finishers fueron 22.
¿Cómo es la distribución por sexos en el IM 70.3 de Dubai?
En participación por sexos la cosa quedo como sigue. Hubo una participación de 160 mujeres y de 872 hombres (Finishers). Por tanto, como suele ser normal, el número de mujeres muy bajo y representan únicamente un 12,01% del total de participantes (Finishers).
Vamos a ver ahora cómo es la participación de hombres y mujeres en el Ironman 70.3 Dubai…
En este caso, seleccionamos sólo los participantes que finalizaron la prueba, es decir, que fueron Finishers. Además comparamos los tiempos de ambos sexos para ver qué distribución tienen en el tiempo:
Como vemos, el tiempo en las mujeres es ligeramente superior a los hombres en general. Vemos que los primeros hombres acabaron en un poco menos de 3 horas y media y las primeras mujeres superaron hicieron algo menos de 4 horas cuando pisaron la línea de salida.
Además, podemos observar que un gran grupo de mujeres finalizó en el entorno de las 6 horas y un gran grupo de hombres entorno a las 5 horas.
¿Cómo es la distribución en grupos de edad de la prueba?
Como sabes, si eres triatleta estarás encuadrado en un grupo de edad. Siempre es interesante saber si luchas contra un número muy elevado de participantes en tu categoría o si por el contrario es un número bajo.
Para hombres la distribución por grupos de edad quedaría así:
Como verás, la categoría con mayor número de participantes es M4044(202) y M3539 (182).
En porcentajes quedaría algo así:
Para mujeres sería la siguiente:
La verdad es que en categoría femenina casi todas las categorías tienen un número muy bajo de participantes, pero destaca el grupo F3539 con 37 participantes.
¿Fueron los hombres en media más rápidos en los tres segmentos?
Veamos ahora los tiempos de ambos sexos en los diferentes segmentos y comparémoslos para saber cómo se distribuyeron en el tiempo:
Como vemos, la mediana (línea de rayas discontinuas) del tiempo invertido en el sector de la natación por hombres y mujeres están muy próximas y rondando los 38-39 minutos. En mujeres la mediana es de 40 minutos y en hombres es de 38 minutos. Una diferencia menos del 5%
En la bicicleta, la diferencia en tiempo entre los 2 sexos es muy clara. La mediana para hombres es de 2h32′ y para mujeres es 2h48′. Una diferencia del 10%.
También en el sector de la carrera apreciamos diferencias entre la mediana de los los dos sexos aunque menos abultada. El tiempo de la mediana de las mujeres fue 2h07′ y en hombres de 1h58′. La diferencia es del 7%.
También es bastante llamativo de este gráfico el hecho de que haya una larga cola en todos los segmentos. Lo cual quiere decir que los resultados de los triatletas se condensan en las horas centrales y luego hay muchos espacios entre unos y otros en la clasificación final.
¿Cómo se distribuyen los tiempos en los 3 segmentos?
Quería también ver cómo los participantes lo hacen en cada uno de los segmentos. Para ello voy a distribuir los participantes en un gráfico y ver si hay grupos o podemos sacar alguna conclusión en cuanto a los tiempos:
La mayorías de los participantes acabaron la natación en menos de 45′. Y un gran número de participantes acaban en menos de 40′.
En ciclismo podemos distinguir claramente 2 grandes grupos. Un primer grupo que acaba en menos de 2h40′ y otro grupo por encima de ese tiempo.
En el segmento de carrera, tenemos un primer grupo que podemos distinguir en menos de 2h10′ pero el gran grupo está en la franja de 2h10′-2h40′. Podemos decir entonces que la gran mayoría acaba la carrera en menos de 2h40′. Y, por tanto, tenemos un tercer grupo que hace un tiempo superior a las 2h40′.
Vamos a profundizar en cada uno de los segmentos. Veamos la gráfica para la natación pormenorizada y para todos los grupos de edad:Vemos claramente que el 10% de los triatletas (los elegidos) acaban en menos de 30′. Así que si quieres salir delante en la natación ya sabes el tiempo que debes hacer…
El 25% de los triatletas nada en menos de 35 minutos. Y el 50% de los triatletas acaba la natación en menos de 39′
Veamos ahora la Bici:
Afinando, el 10% de los triatletas acaban su segmento de bici en un poco más de 2h10′. El 25% lo hace en un poco mas de 2h20′ y el 50% acabó en menos de 2h35′.
Y, por último, la carrera:
Los top del 10% lo acaban en menos de 1h30′. El 25 % entorno a la 1h42′ y el 50% lo acaba en menos de 2h.
Con estos gráficos te puedes hacer una idea según el tiempo que esperes hacer en qué puesto de la clasificación podrías haber caído en 2021. ¡Ojo! recuerda que cada año los tiempos suelen mejorar así que calcula bien 🙂
¿Hay posibilidades de mejorar mi resultado final con poco coste en algún segmento?
Para esto habría que analizar la distribución del ranking total con el tiempo total y ver si recortando muy poco mi tiempo en alguna parte del recorrido se hubiera traducido en una mejora considerable en el ranking general. Veamos la distribución:Como ya sabemos, hace falta profundizar y hacer zoom para poder ver algún detalle, así que voy a coger un grupo de edad y lo haremos zoom. Elijo M40-45 por ser el más numeroso y le doy zoom para fijarme en los 20 primeros resultados:
Y efectivamente aquí lo vemos muy bien.
Fíjate primero en las flechas. Representan un salto acusado en el tiempo. Es decir los 4 primeros triatletas se distanciaron entre sí bastante en la línea de meta, por lo que una mejora ahí sería más complicado.
Sin embargo, fijándonos en los círculos, destacamos puestos que podrían haber variado pues la diferencia es escas. Por ejemplo, entre el 5º y el 6º la diferencia fue menor de 1 minuto. Si lo hubiera sabido el 6º durante la carrera (suponiendo que él iba detrás), ¿no crees que habría apretado? 🙂
Lo mismo ocurre con los puestos 12 y 13 ó 16 y 17.
Disclaimer: Hay alguna “errata” en este gráfico en los puestos 10 y 11 que puede venir motivado por algún tipo de dato mal en la clasificación que no se haya podido limpiar bien.
No puedo hacer el análisis pormenorizado de cada uno de los grupos de edad pero si lo necesitas, anímate y deja un comentario y prometo intentar darte respuesta y hacerte el mismo análisis para el grupo de edad y las posiciones que te interesen.
¿Podemos predecir el resultado en esta prueba de un triatleta sabiendo su mejor segmento?
La pregunta que siempre nos solemos hacer es si podemos predecir el resultado final de un triatleta sabiendo que un triatleta es un buen nadador o un buen ciclista o un buen corredor. ¿Es esto posible?
Vamos a analizar si hay relación entre el ranking parcial en un segmento determinado y el ranking al final de la prueba. Si conseguimos encontrar una correlación podríamos planificar el entrenamiento para esta prueba sabiendo que un determinado segmento tiene más peso sobre el resto en el resultado final. Pero veamos qué dicen los datos:
En términos generales vemos que hay muchísima dispersión en los datos de natación, algo menos en los de bicicleta y poca en la de carrera. En general, hay poca correlación entre el resultado que obtiene el triatleta en cada segmento con el resultado final en la prueba por separado. Esto quiere decir que hubo triatletas muy variados y no dominadores de 1 segmento en particular sino bastante compensados en los 3 segmentos. Por tanto, un buen resultado en bici, como cabría esperar, no garantiza un buen resultado final a la vista de los datos.
La conclusión que podemos sacar es que debes ser bueno en los tres segmentos y que ser un buen ciclista o un buen corredor en esta carrera no te garantiza tener un buen resultado final.
Pero, quizás pienses que los datos tienen truco. Es decir, puedes pensar que, claro, como la natación es el segmento en el que menos tiempo se invierta, por eso cuenta menos. Vale, te acepto el reto.
Hay una cosa que se llama normalización y que sirve precisamente para esto. No entro en detalle en el proceso pero básicamente consistirá en comparar los tiempos de manera que no influya su longitud y podamos seguir midiendo esa correlación.
Veamos los resultados normalizados:
Como vemos las gráficas y los coeficientes de correlación siguen siendo muy similares. Por tanto, eliminando la diferencia del tiempo invertido en cada segmento, tampoco se observan correlaciones entre el ranking de un determinado segmento y el ranking en meta.
Debo de admitir que me sorprende el resultado. Siempre se dice que un IM o en un 70.3 lo que más cuenta es la bici… Pues no parece que aquí se cumpla, pero vamos a indagar un poco más en los datos…
Ahora analizaremos la correlación entre el tiempo de cada segmento y la posición final en la prueba:
¡Ahora sí vemos correlación! Un gran correlación, de hecho, en el segmento de carrera y un fuerte correlación en el segmento de ciclismo. Es decir, que el puesto de cada segmento no es relevante para el resultado final en la prueba pero sí el tiempo que hagas en cada segmento. Super curioso.
Es decir, no influye que hagas un puesto 10 en la carrera en tu grupo de edad pero sí influye que el tiempo sea bueno para que tu ranking final sea bueno.
Como siempre digo, hay que ver cada caso por separado. Y además, deberíamos de aislar datos de grupos de edad para tener una lectura más acertada de los datos pero, sin duda, las conclusiones son curiosas.
Recurramos a la matriz de dispersión para que podáis ver todas las correlaciones que existen con los datos que tenemos. Además aprovecho también para añadir las transiciones por si podemos también sacar alguna conclusión con ellas:
Aquí vemos de una forma visual todo lo que ya he explicado anteriormente y cómo cada segmento influye en la posición final.
El gráfico nos confirma de una sóla vez todas las conclusiones anteriores. Además, en cuanto a las transiciones, vemos que no tienen una fuerte correlación. Podríamos decir que, aunque debas hacerlas bien, si una transición se te tuerce no será tan dramático.
Y hasta aquí este primer análisis del Ironman 70.3 de Dubai 2021. Me queda pendiente para un futuro una comparativa con años anteriores para saber cómo evolucionan tiempos y resultados.
Si te ha gustado compártelo en las redes sociales y si además nos dejas un comentario, te lo agradeceremos en el alma 🙂 Por supuesto, si tienes algo que comentar, encuentras algún error o quieres alguna aclaración adicional, siéntete libre y ponlo en los comentarios también!