8 - Gráficos de densidad y estimación de distribución

Lección 8 del curso Estadística Descriptiva.

En la lección anterior hablamos de los histogramas y vimos cómo utilizar esta herramienta para visualizar y extraer información relevante a partir de la distribución de nuestros datos.

En esta lección veremos qué es la estimación de la distribución de los datos y cómo con esta información se pueden construir los gráficos de densidad, una herramienta que también nos permite visualizar la distribución de nuestros datos.

Además, veremos las ventajas que ofrecen los gráficos de densidad frente al uso de histogramas y cómo podemos combinar esta herramienta con los gráficos tipo boxplot para, de manera simultánea y en una sola gráfica, visualizar todos los detalles de la distribución de nuestros datos.

Contenido exclusivo suscriptores

Suscríbete para tener acceso al video con la explicación detallada de esta lección. Además podrás disfrutar de todos los cursos de la Academia Online

Muy bien, acabamos de entender qué es la estimación de la distribución de los datos, que es simplemente un conjunto de técnicas computacionales que permiten calcular la distribución de probabilidades que tendría la variable que estamos analizando.

Y hemos visto que la forma de representar esta distribución estimada es a través de los gráficos de densidad (también conocidos como gráficos de distribución de probabilidades) que son similares a los histogramas pero que en lugar de barras usan una curva continua para mostrar la distribución de los datos.

La ventaja de estos gráficos de densidad radica en el hecho de que la estimación de la distribución se hace directamente a partir de los datos y es independiente del número de intervalos que escojamos (como sí ocurría con los histogramas).

Esto hace que con estos gráficos de densidad tengamos una representación fiel de la distribución de los datos sin las ambigüedades que tiene definir el número de intervalos en el caso de los histogramas.

Y además vimos que podemos combinar estos gráficos de densidad con los gráficos de caja (boxplots) para crear gráficos de violín donde simultáneamente podemos ver la mediana, el rango intercuartiles, los valores extremos, el rango de valores y la distribución misma de nuestros datos.

Y con esto ya hemos culminado este tercer módulo del curso donde hemos visto herramientas para realizar el análisis univariado de datos numéricos.

Así que en el siguiente módulo nos enfocaremos en herramientas que nos permitirán realizar este mismo tipo de análisis pero aplicado a variables categóricas. Y en particular en la siguiente lección veremos cómo generar gráficos de barras simples para analizar el comportamiento de variables categóricas.

Ver todas las lecciones de este curso