Tópicos Ciencia e investigaciones Psicometría

Prueba de Kolmogórov-Smirnov: qué es y cómo se usa en estadística


En estadística, son muy conocidas y utilizadas las pruebas paramétricas y no paramétricas. Una prueba no paramétrica muy empleada es la prueba de Kolmogórov-Smirnov, que permite verificar si las puntuaciones de la muestra siguen o no una distribución normal.

Pertenece al grupo de las llamadas pruebas de bondad de ajuste. En este artículo conoceremos sus características, para qué sirve y cómo se aplica.

Pruebas no paramétricas

La prueba de Kolmogórov-Smirnov es un tipo de prueba no paramétrica. Las pruebas no paramétricas (también llamadas de distribución libre) son utilizadas en estadística inferencial, y tienen las siguientes características:

  • Plantean hipótesis sobre bondad de ajuste, independencia...
  • El nivel de medida de las variables es bajo (ordinal).
  • No tienen excesivas restricciones.
  • Son aplicables a muestras pequeñas.
  • Son robustas.

Prueba de Kolmogórov-Smirnov: características

La prueba de Kolmogórov-Smirnov es una propia perteneciente a la estadística, concretamente a la estadística inferencial. La estadística inferencial pretende extraer información sobre las poblaciones.

Se trata de una prueba de bondad de ajuste, es decir, sirve para verificar si las puntuaciones que hemos obtenido de la muestra siguen o no una distribución normal. Es decir, permite medir el grado de concordancia existente entre la distribución de un conjunto de datos y una distribución teórica específica. Su objetivo es señalar si los datos provienen de una población que tiene la distribución teórica especificada, es decir, lo que hace es contrastar si las observaciones podrían razonablemente proceder de la distribución especificada.

La prueba de Kolmogórov-Smirnov aborda la siguiente pregunta: ¿Provienen las observaciones de la muestra de alguna distribución hipotética?

Hipótesis nula e hipótesis alternativa

Como prueba de bondad de ajuste, responde a la pregunta de: “¿la distribución muestral (empírica) se ajusta a la poblacional (teórica)?”. En este caso, la hipótesis nula (H0) establecerá que la distribución empírica es similar a la teórica (la hipótesis nula es la que no se intenta rechazar). En otras palabras, la hipótesis nula establecerá que la distribución de frecuencias observada es consistente con la distribución teórica (y que se da por lo tanto un buen ajuste).

En contraste, la hipótesis alternativa (H1) establecerá que la distribución de frecuencias observada no es consistente con la distribución teórica (mal ajuste). Como en otras pruebas de contraste de hipótesis, el símbolo α (alfa) indicará el nivel de significación de la prueba.

¿Cómo se calcula?

El resultado de la prueba de Kolmogórov-Smirnov se representa mediante la letra Z. La Z se calcula a partir de la diferencia mayor (en valor absoluto) entre las funciones de distribución acumuladas teórica y observada (empírica).

Supuestos

Para poder aplicar la prueba de Kolmogórov-Smirnov correctamente, se deben asumir una serie de supuestos. Primeramente, la prueba asume que los parámetros de la distribución de prueba se han especificado previamente. Este procedimiento estima los parámetros a partir de la muestra.

Por otro lado, la media y la desviación estándar de la muestra son los parámetros de una distribución normal, los valores mínimo y máximo de la muestra definen el rango de la distribución uniforme, la media muestral es el parámetro de la distribución de Poisson y la media muestral es el parámetro de la distribución exponencial.

La capacidad de la prueba de Kolmogórov-Smirnov para detectar desviaciones a partir de la distribución hipotetizada puede disminuir gravemente. Para contrastarla con una distribución normal con parámetros estimados, se debe considerar la posibilidad de utilizar la prueba de K-S Lillliefors.

Aplicación

La prueba de Kolmogorov-Smirnov se puede aplicar sobre una muestra para comprobar si una variable (por ejemplo, las notas académicas o los ingresos €) se distribuyen normalmente. Esto a veces es necesario saberlo, ya que muchas pruebas paramétricas requieren que las variables que emplean sigan una distribución normal.

Ventajas

Algunas de las ventajas de la prueba de Kolmogórov-Smirnov son:

  • Es más poderosa que la prueba Chi cuadrado (χ²) (también prueba de bondad de ajuste).
  • Es fácil de calcular y usar, y no requiere agrupación de los datos.
  • El estadístico es independiente de la distribución de frecuencias esperada, solo depende del tamaño de la muestra.

Diferencias con las pruebas paramétricas

Las pruebas paramétricas, a diferencia de las no paramétricas como la prueba de Kolmogórov-Smirnov, tienen las siguientes características:

  • Plantean hipótesis sobre parámetros.
  • El nivel de medida de las variables es cuantitativo como mínimo.
  • Existen una serie de supuestos que se deben cumplir.
  • No pierden información.
  • Tienen una alta potencia estadística.

Algunos ejemplos de pruebas paramétricas serían: la prueba de t para diferencia de medias o el ANOVA.