Ironman Lanzarote 2019: Análisis de Datos de la Prueba

Hola, me han invitado a Todo Triatlón para que dé una visión desde el punto de vista de los datos del posiblemente triatlón de la marca Ironman más duro del mundo.

Espero que este análisis pueda valerte, si estás pensado en participar en la prueba o si alguna vez has participado en la misma. Por supuesto que el análisis se puede hacer más profundo o con más detalle pero seguro que las conclusiones te parecen interesantes.

Disclaimer: En este primer análisis sólo analizaré la edición de 2019 pero será interesante para futuros posts en el blog la comparativa con otros años.

¡Comencemos!

Análisis inicial de los datos del IM de Lanzarote 2019

Los datos están directamente descargados de la página oficial de Ironman y limpiados puesto que algunas filas podían tener errores o no ser fácilmente tratables.

Lo primero que vemos es que tenemos un total de 1645 datos de triatletas y que las columnas que tiene (15) son las típicas de una clasificación de triatlón. Lástima que no tengamos datos de transiciones aislados. Suponemos que los datos de las transiciones están sumados a los datos del tiempo de bici.

Consideraciones de esta edición del IM de Lanzarote

Para la realización de este artículo también he preguntado a grandes triatletas y entrenadores especializados en esta prueba. Una cosa es el análisis de datos y otra es sacar conclusiones. Los datos deben ser siempre interpretados teniendo en cuenta datos de especialistas que le den más sentido a las conclusiones.

Hay que tener varias consideraciones a la hora de analizar esta edición del Ironman de Lanzarote:

  • En 2019 el recorrido de ciclismo se modificó con respecto a otros años, por lo que la comparativa con ediciones anteriores hay que leerla teniendo en cuenta este dato.
  • La natación no volverá a ser igual. La forma de salida se cambió y 2019 fue la última vez que se salió en grupo. Las próximas ediciones la salid será con el modelo «roll-down», es decir por tandas. Por tanto, también habrá que tenerlo en cuenta a la hora de analizar y comparar estos datos con futuras ediciones.

Comentario de calidad del mítico triatleta Carmelo Ruíz. Es el triatleta que mejor conoce la prueba. Comenzó a hacer triatlón en 1994 cuando nuestro deporte era un desconocido para el gran público. Es el español que más veces ha finalizado el IM de Lanzarote Es un mítico de esta prueba y se conoce hasta el último bache de la carretera 🙂

 

¿Cuántos triatletas fueron Finishers?

Vamos a ver cuántos triatletas lograron acabar, cuántos de ellos fueron descalificados (DQ), cuántos no tomaron la salida (DNS) y cuántos no pudieron acabar (DNF):

Como vemos, a pesar un IM muy duro, un alto porcentaje de triatletas lograron cumplir con el objetivo de finalizar la prueba.

¿Qué países participaron en el IM de Lanzarote?

Veamos qué nacionalidad tenían los distintos participantes:

Como era de esperar el país con mas representantes fue España, seguido muy de cerca por UK. El resto de países ya queda más alejados.

¿Cómo es la distribución por sexos en el Ironman de Lanzarote?

Ahora vamos a ir complicando un poco el análisis. Antes de nada, decir que hubo una participación de 142 mujeres y de 1503 hombres. Por tanto, la muestra de mujeres es relativamente baja y representan únicamente un  8,63% del total de participantes.

Vamos a ver ahora cómo es la participación de hombres y mujeres en el Ironman Lanzarote.

En este caso, seleccionamos sólo los participantes que finalizaron la prueba, es decir, que fueron Finishers. Además comparamos los tiempos de ambos sexos para ver qué distribución tienen en el tiempo:

Como vemos, el tiempo en las mujeres es ligeramente superior a los hombres en general. Vemos que los primeros hombres acabaron en un poco menos de 9 horas y las primeras mujeres superaron las 10 horas cuando pisaron la línea de salida.

Además, podemos observar que un gran grupo de mujeres finalizó en el entorno de las 13 horas. En hombres está algo más repartido entre las 12 y las 13 horas como espacio más concurrido en la línea de meta.

¿Cómo es la distribución en grupos de edad de la prueba?

Como sabes, si eres triatleta estarás encuadrado en un grupo de edad. Siempre es interesante saber si luchas contra un número muy elevado de participantes en tu categoría o si por el contrario es un número bajo.

Para hombres la distribución por grupos de edad quedaría así:

Así que la categoría con mayor número de participantes es M4044(269) y M4549 (261).

En porcentajes quedaría algo así:

Para mujeres sería la siguiente:

La verdad es que en categoría femenina casi todas las categorías tienen un número muy bajo de participantes.

¿Fueron los hombres en media más rápidos en los tres segmentos?

Pero demos un paso más y profundicemos para ver los tiempos en los diferentes segmentos y compararlos:

Como vemos, la mediana del tiempo invertido en el sector de la natación por hombres y mujeres están muy próximas y rondando la hora de competición. En mujeres la mediana es de 1h17′ y en hombres es de 1h14′. Una diferencia del 10%

En la bicicleta, la diferencia en tiempo entre los 2 sexos es más nítida aún. La mediana para hombres es de 7h11′ y para mujeres es  7h29′. Una diferencia del 4%.

Lo más curioso de este gráfico es la mediana en el sector de carrera. Curiosamente la mediana en chicas se sitúa por delante de los chicos. El tiempo de la mediana de las mujeres fue 4h20′ y en hombres de 4h30′. La diferencia es del 3,5%. Esto indica que las pocas corredoras que había eran muy buenas corredoras.

Esta conclusión también viene a demostrar con datos un estudio sobre la influencia de ser hombre o mujer en la fatiga. En él se demuestró que las mujeres tienen mejor rendimiento en situaciones prolongadas de esfuerzo que los hombres.

Comentario de calidad del mítico entrenador Pablo Cabeza. Ha sido siempre atleta, y triatleta desde 1995. Además es un reputado entrenador especializado en triatlón. En su carrera triatleta, se ha clasificado 2 veces para el Ironman de Hawaii.

También es bastante llamativo de este gráfico el hecho de que haya una larga cola en todos los segmentos.

¿Cómo se distribuyen los tiempos en los 3 segmentos?

Quería también ver cómo los participantes lo hacen en cada uno de los segmentos. Para ello voy a distribuir los participantes en un gráfico y ver si hay grupos o podemos sacar alguna conclusión en cuanto a los tiempos:

Como se puede ver la mayoría de los participantes acabaron la natación en menos de 1h30′. Incluso podríamos decir que un porcentaje muy elevado de participantes hacen un tiempo inferior a la hora y 20 minutos.

En ciclismo vemos una distribución en el tiempo bastante homogénea. Una pirámide bastante estándar. Quizás podríamos distinguir 2 grandes grupos. Uno con tiempos menores a 7 horas y otro por encima de las 7 horas. Además parece que el grupo de los «selectos» triatletas acaban en menos de 6h20′ este segmento.

En cuanto a la carrera, vemos claramente que la mayoría completa este segmento en menos de 5 horas. Podríamos también diferenciar  3 grupos generales. Los que acaban en menos de 4horas, los que están entre 4h20′ y esas 5 horas y los y los que acaban en más de 5 horas.

Pero desgranemos un poco más cada sector. Vamos a ver las gráficas para cada sector pormenorizadamente (podríamos incluso afinar más y analizar sólo para un grupo de edad determinado):

Efectivamente, vemos que el 10% de los triatletas acaban en poco más de 1 hora. El 25% lo hacen en 1h7′ y ya el 50% de los triatletas acaban en menos de 1h15′.

Veamos ahora la Bici:

Afinando, el 10% de los triatletas acaban su segmento de bici en menos de 6h05′. El 25% lo hace en menos de 6h36′ y el 50% acabará en menos de 7h12′.

Y, por último, la carrera:

Los top del 10% lo acaban en menos de 3h32′. El 25 % en menos de 3h57′ y el 50% lo acaba en menos de 4h28′.

Con estos gráficos te puedes hacer una idea según el tiempo que esperes hacer en qué puesto de la clasificación podrías haber caído en 2019. ¡Ojo! recuerda que cada año los tiempos suelen mejorar así que calcula bien 🙂

¿Hay posibilidades de mejorar mi resultado final con poco coste en algún segmento?

Para esto habría que analizar la distribución del ranking total con el tiempo total y ver si recortando muy poco mi tiempo en alguna parte del recorrido se hubiera traducido en una mejora considerable en el ranking general.

Veamos. La gráfica sería algo así:

Sí, ya sé, no se ve nada 🙂 Y además sólo son los grupos masculinos.

Es preciso filtrar más para ver algo en condiciones. Como mi categoría es M40-44 voy a hacerlo con esa categoría y enfocándome en el top-20, por ejemplo, para el ranking de la categoría:

Wow! Aquí se ve muy bien. Vemos cosas como que el 2º y 3er clasificado sólo se diferenciaron en 1 minuto en meta. O que entre el 4º y el 7º sólo hay una diferencia de 6 minutos. Esa puede ser la diferencia entre coger una plaza para clasificarse en Kona o no cogerla.

Disclaimer: Hay alguna «errata» en este gráfico que puede venir motivado por algún tipo de dato mal en la clasificación que no se haya podido limpiar bien.

No puedo hacer el análisis pormenorizado de cada uno de los grupos de edad pero si lo necesitas, anímate y deja un comentario y prometo intentar darte respuesta.

¿Podemos predecir el resultado en esta prueba de un triatleta sabiendo su mejor segmento?

La siguiente pregunta que me surgía es si, sabiendo que un triatleta es un buen nadador o un buen ciclista o un buen corredor podremos predecir su resultado en esta carrera.

Vamos a analizar si hay relación entre el ranking parcial en un segmento determinado y el ranking al final de la prueba. Si conseguimos encontrar una correlación podríamos planificar el entrenamiento para esta prueba sabiendo que un determinado segmento tiene más peso sobre el resto en el resultado final. Pero veamos qué dicen los datos:

En términos generales vemos que hay muchísima dispersión en los datos de natación. Esto quiere decir que hay muy poca correlación del resultado de la natación con respecto al resultado final en la prueba. Parece lógico y en este caso hace honor a la frase (que no me gusta nada): «En Ironman, la natación es un trámite». Mas adelante volveré sobre esta frase.

Por contra, en bicicleta sí que parece que existe una correlación entre la actuación en bici y el resultado final de la prueba.

En el segmento de la carrera vemos una dispersión más homogenea. Parece que existe una correlación también aunque menos fuerte que en bici y más fuerte que en natación.

La conclusión que podemos sacar es que debes ser bueno en los tres segmentos, pero especialmente lo debe ser en bici y después en carrera para conseguir un buen puesto final. Hacerlo mal en natación no es indicio de que tendrás un mal resultado final pero sin embargo, fallar en cualquiera de los otros 2 segmentos sí que te hará caer en el ranking final de la prueba.

Pero, quizás pienses que los datos tienen truco. Es decir, puedes pensar que, claro, como la natación es el segmento en el que menos tiempo se invierta, por eso cuenta menos. Vale, te acepto el reto.

Hay una cosa que se llama normalización y que sirve precisamente para esto. No entro en detalle en el proceso pero básicamente consistirá en comparar los tiempos de manera que no influya su longitud y podamos seguir midiendo esa correlación.

Veamos los resultados normalizados:

¡Qué curioso! Fíjate cómo ha subido la correlación en la natación. El ciclismo sigue siendo el segmento con mayor correlación con el resultado final, seguido de la carrera pero fíjate que la natación ha subido mucho ahora.

Esto nos indica que realmente la natación aunque es el segmento que menos influye también influye en el resultado final ¡ojo!

Sin embargo, también sacamos en conclusión que los segmentos son proporcionales en distancia y tiempo el resultado de cada segmento. Es decir, que a mayor distancia y tiempo en ese segmento mayor influye en el resultado final.

Sería bueno comprobar esto en cada grupo de edad o incluso si se repite el patrón entre hombres y mujeres… Si quieres que lo analice deja un comentario y veré qué puedo hacer 🙂

Os dejo un gráfico que es una matriz de dispersión para que podáis ver todas las correlaciones que existen con los datos que tenemos:

Aquí vemos de una forma visual todo lo que ya he explicado anteriormente y cómo cada segmento influye en la posición final.

Y hasta aquí este primer análisis del Ironman de Lanzarote 2019. Me queda pendiente para un futuro una comparativa con años anteriores para saber cómo evolucionan tiempos y resultados.

Si te ha gustado compártelo en las redes sociales y si además nos dejas un comentario, te lo agradeceremos en el alma 🙂 Por supuesto, si tienes algo que comentar, encuentras algún error o quieres alguna aclaración adicional, siéntete libre y ponlo en los comentarios también!

1 Comentario
  1. Excelente estudio! Felicidades!

    Deje una respuesta

    Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

    ACEPTAR
    Aviso de cookies
    TodoTriatlon
    Logo
    Enable registration in settings - general