Matemáticas

Estimación puntual: propiedades, métodos, ejemplos, ejercicios resueltos


¿Qué es la estimación puntual?

La estimación puntual de los parámetros estadísticos de alguna característica poblacional, es aquella que se realiza a partir de una o varias muestras de dicha característica, representada como variable aleatoria.

Las poblaciones pueden ser diversas: las mujeres de una ciudad, los pacientes de un hospital, los tornillos fabricados por cierta industria en un mes y muchos otros.

En la población de mujeres de una ciudad, un estudio estadístico puede enfocarse en diversas características de dicha población: por ejemplo la talla de zapatos, la estatura, la medida de cintura, color del cabello, número de hijos, edad e infinidad de otras características.

Una vez elegida la población y la característica que quiere someterse a un estudio estadístico, se elige una muestra de tamaño n, que por lo general es bastante menor que el tamaño N de la población total.

Propiedades de la estimación puntual

Conocidos los datos de una muestra, los cuales se representan mediante una variable aleatoria X, estos se representan mediante un conjunto de n números reales: (x1, x2,…., xn).

Con estos datos pueden calcularse algunos estadísticos de la muestra:

  • Media muestral: = (x1+x2,…., +xn)/n.
  • Varianza muestral: S2 = [(x1‾ )2 + …. +(xn)2]/n.
  • Cuasi-varianza muestral: Sc2 = [(x1 ‾ )2 + …. +(xn)2]/(n 1).
Una población que siga una distribución normal tendrá valor central mu y desviación estándar sigma

Por otra parte, la media poblacional μ y la varianza poblacional σ2 requerirían del conocimiento de todos los datos de la población total, la cual tiene un tamaño N >>n. En consecuencia, muchas veces se hace inviable conocer en forma exacta los parámetros poblacionales.

En vista de esto, los valores poblacionales suelen aproximarse por los valores muestrales, aproximación conocida como estimación puntual. Será buena o mala, dependiendo principalmente de la cantidad de datos y la calidad de la muestra. A la muestra se la conoce como el estimador.

Un buen estimador debe poseer algunas características o propiedades deseables:

  • Coherencia
  • Variación mínima 
  • Eficiencia.

1.- Coherencia

Una muestra debe tener suficiente número de datos como para que la estimación de los parámetros sea consistente. Por ejemplo, si se toman tres o más muestras y los estadísticos muestrales son muy disímiles entre sí, entonces no sería apropiado tomar como estimación puntual alguno de estos resultados. 

En la mayoría de los casos basta con tomar muestras de mayor número de datos, para que los parámetros estadísticos obtenidos a partir de ellas comiencen a mostrar convergencia o coincidencia, siempre con cierta tolerancia. En caso de que no se observe convergencia, pese al aumento de los datos, habría que revisar la calidad de los mismos, ya que pudieran tener sesgo, o simplemente fueron mal tomados.

2.- Variabilidad mínima

Si se dispone de varios estimadores cuyos valores medios coinciden con cierta tolerancia, se escogen aquellos que tengan la menor varianza muestral.

3.- Eficiencia

Un estimador de tamaño n es eficiente a partir del momento que las varianzas muestrales de las medias tienden a cero, a medida que n tiende a infinito. Es lo que se denomina eficiencia asintótica del estimador.

Métodos

A continuación se enumeran algunas prácticas o métodos que permitirán hacer una estimación puntual acertada de los parámetros poblacionales, partiendo de una muestra.

1.-Partición aleatoria

Se usa la partición aleatoria de una muestra para chequear consistencia. Este método consiste en tomar una muestra de tamaño n y dividirla en forma aleatoria en dos muestras, de tamaño n/2 cada una.

Si la media muestral y la varianza muestral coinciden con cierto número de cifras significativas, usualemente 2 o 3 cifras, entonces se puede afirmar que hay coherencia entre ellas.

Por otra parte, si hay coincidencia a nivel de cifras significativas entre los parámetros estadísticos calculados con la muestra original de tamaño n y las dos submuestras, también hay convergencia, y puede afirmarse que el tamaño de la muestra es suficiente. De lo contrario, sería necesario tomar datos adicionales, para elevar la cantidad de datos muestrales.

2.- Método de los momentos

Este método consiste en igualar los momentos de una muestra aleatoria de tamaño n, con los obtenidos de la candidata a distribución muestral. Si la distribución candidata tiene m parámetros, entonces será necesario igualar m momentos.

3.- Método de la máxima credibilidad

Fue propuesto por Fisher, uno de los padres de la ciencia estadística, aproximadamente hace cien años. Consiste en optimizar o maximizar la probabilidad de ocurrencia de determinado conjunto de valores muestrales.

Ejemplo

Supóngase que el comportamiento de cierta variable poblacional sigue una distribución exponencial, cuya densidad de probabilidad viene dada por:

 f(x; λ) = λ ⋅ Exp(−λ⋅x)

Claramente se trata de una distribución de un único parámetro λ.

Para hacer una estimación de dicho parámetro poblacional, puede hacerse uso de una muestra aleatoria de tamaño n, cuyos resultados son los siguientes: (x1, x2,…., xn)

Se obtiene el primer momento de la muestra, que es el valor medio , mediante:

= (x1 + x2 + …+ xn) / n

Puede demostrarse que primer momento de la distribución exponencial es la integral de 0 hasta infinito de la función x⋅f(x; λ), y su resultado es 1/λ.

Igualando el momento muestral con el de la distribución poblacional, se concluye que la estimación puntual de λ es 1/.

Ejercicios resueltos

Ejercicio 1

Sobre un estudio efectuado con 100 datos, se determinó que el tiempo promedio que tarda una persona en visualizar un video de youtube, una vez recibida la notificación, es de 3 minutos. Hallar la distribución de probabilidad del tiempo empleado en ver el video, una vez recibida la notificación.

Solución

Se supondrá que la probabilidad máxima de que una persona revise un video ocurre justo después de la notificación, pero si pasa mucho tiempo después de la misma, la probabilidad de que la persona vea el video es muy baja.

Este es el comportamiento típico de una distribución exponencial, por tanto, se puede modelar el comportamiento poblacional mediante la siguiente distribución de probabilidad, para el tiempo t (en minutos), medido a partir de la notificación:

 f(t; λ) = λ ⋅ Exp(−λ⋅t)

En este tipo de distribución, la esperanza o promedio es =1/λ, tal como se explicó en el apartado anterior. Entonces, a partir de la información de la muestra se puede aproximar λ:

λ ≈ ⅓.

Ejercicio 2

Se realiza una encuesta con una sola pregunta, cuyas respuestas posibles son: sí (1) o no (0). Los resultados de la encuesta en la que todos respondieron fueron: 26 sí y 14 no.

Bajo la suposición de que la respuesta es aleatoria, entonces la distribución de estos resultados es una distribución binomial cuya probabilidad es:

P = p26 · (1−p)14

Se puede demostrar que el máximo de dicha función ocurre cuando p toma el valor 26/40, y este es el valor que hace que los valores muestrales obtenidos sean los más probables.