Estadístico suficiente

3 min

Un estadístico suficiente para un parámetro Θ, es aquel capaz de recoger o resumir toda la información que la muestra de una variable aleatoria X contiene.

Sabemos que un estadístico es una función real de la muestra. Esto es, toma valores reales contenidos en la muestra. A partir de ahí, cómo hemos visto en el artículo en que se define el concepto de estadístico, debemos procurar que el estadístico tenga ciertas propiedades. ¿Para qué exigirle tales propiedades? Para asegurarnos de que el estadístico es útil para nuestros fines.

La suficiencia es una de esas propiedades. De manera mucho más sencilla, diremos que un estadístico es suficiente si utiliza toda la información contenida en la muestra.

¿Cómo saber si un estadístico es suficiente?

Lógicamente, la duda que surge es: ¿Cómo puedo saber si un estadístico T cumple la propiedad de suficiencia? O bien ¿Cómo puedo encontrar, en caso de existir, un estadístico que cumpla la propiedad de suficiencia. La respuesta a estas dos preguntas la encontramos en dos teoremas:

  • Criterio de factorización de Fisher-Neyman: Este criterio enuncia que dado un estadístico T, si cumple ciertas condiciones, entonces, será un estadístico suficiente.
  • Teorema de Darmois: Este teorema da respuesta a la segunda pregunta. Es decir, nos permite encontrar un estadístico suficiente mediante una serie de procedimientos.

Ejemplo de estadístico suficiente

Supongamos que queremos calcular el ingreso medio anual de las familias que residen en Chile. Para ello, seguiremos el siguiente proceso:

  1. Recoger información (muestra): Como no podemos preguntar a todas y cada una de las familias que reside en Chile cuanto ingresa anualmente, tomaremos una muestra representativa de, por ejemplo, 1.000 familias.
  2. Identificar la variable aleatoria objeto de estudio: La variable aleatoria objeto de estudio, es el ingreso familiar. Así pues: X → Ingreso familiar
  3. Elegir el estadístico adecuado: El estadístico adecuado para calcular el ingreso medio no es otro que la esperanza de X. En otras palabras, la media muestral de X.
  4. ¿Cómo puedo saber si el estadístico media muestral es un estadístico suficiente? Como ya tenemos la expresión matemática del estadístico, utilizaremos el criterio de factorización de Fisher-Neyman. O bien, el Teorema de Darmois. Son fórmulas creadas a este fin.

Tras aplicar los debidos cálculos, llegamos a la conclusión de que el estadístico media muestral cumple con el requisito o propiedad de suficiencia. Al asegurar que cumple este requisito, estamos asegurando que esta función (estadístico) que permite sintetizar la información (la media del ingreso), utiliza toda la información contenida en la muestra (las 1.000 familias).

¿Por qué es importante que utilice toda la información contenida en la muestra?

Ahora que sabemos que la media muestral es un estadístico suficiente, supongamos un caso. ¿Qué sentido tendría querer calcular el ingreso medio en base a esas 1.000 familias chilenas y que solo utilizásemos los datos de 500 familias?

Claro está, que no tendría ningún sentido. Queremos un resumen de toda la información. Es decir, lo que hemos definido como estadístico suficiente.