Matemáticas

Muestreo aleatorio: metodología, ventajas, desventajas, ejemplos


El muestreo aleatorio es la forma de seleccionar una muestra estadísticamente representativa a partir de una población dada. Parte del principio de que todo elemento de la muestra debe tener la misma probabilidad de ser seleccionado.

Un sorteo es un ejemplo de muestreo aleatorio, en el que a cada miembro de la población de participantes se le asigna un número. Para elegir los números correspondientes a los premios del sorteo (la muestra) se usa alguna técnica aleatoria, por ejemplo extraer de un buzón los números que fueron anotados en tarjetas idénticas.

En el muestreo aleatorio es fundamental elegir en forma adecuada el tamaño de la muestra, porque una muestra no representativa de la población, puede conducir a conclusiones erradas, debido a fluctuaciones estadísticas.

Índice del artículo

El tamaño de la muestra

Existen fórmulas para determinar el tamaño adecuado de una muestra. El factor más importante a considerar es si se conoce o no el tamaño de la población. Veamos las fórmulas para determinar el tamaño de la muestra:

Caso 1: no se conoce el tamaño de la población

Cuando el tamaño N de la población es desconocida, es posible seleccionar una muestra de tamaño n adecuado, para determinar si cierta hipótesis es verdadera o falsa.

Para ello se emplea la siguiente fórmula:

n = (Zp q)/(E2)

Donde:

-p es la probabilidad que la hipótesis sea cierta.

-q es la probabilidad de que no lo sea, por lo tanto q = 1 – p.

-E es el margen relativo de error, por ejemplo un error de 5% tiene un margen E=0,05. 

-Z tiene que ver con el nivel de confianza requerido por el estudio.

En una distribución normal tipificada (o normalizada), un nivel de confianza de 90% tiene Z= 1,645, porque la probabilidad de que el resultado esté comprendido entre -1,645σ y +1,645σ es del 90%, donde σ es la desviación estándar.

Niveles de confianza y sus correspondientes valores Z 

1.- 50% de nivel de confianza corresponde a Z= 0,675.

2.- 68.3% de nivel de confianza corresponde a Z= 1.

3.- 90% de nivel de confianza equivale a Z= 1,645.

4.- 95% de nivel de confianza se corresponde con Z= 1,96

5.- 95,5% de nivel de confianza se corresponde con Z= 2.

6.- 99,7% de nivel de confianza es equivalente a Z= 3.

Un ejemplo en el que puede aplicarse esta fórmula sería en un estudio para determinar el peso promedio de los guijarros de una playa.

Claramente no es posible estudiar y pesar todos los guijarros de la playa, por lo que conviene extraer una muestra lo más aleatoria posible y con el número de elementos adecuado.

Caso 2: el tamaño de la población es conocido

Cuando el número N de elementos que componen cierta población (o universo) es conocido, si se quiere seleccionar por muestreo aleatorio simple una muestra de tamaño n estadísticamente significativa, esta es la fórmula: 

n = (Z2p q N)/(N E2 + Z2p q)

Donde:

-Z es el coeficiente asociado al nivel de confianza.

-p es la probabilidad de éxito de la hipótesis.

-q es la probabilidad de fracaso en la hipótesis, p + q = 1.

-N es el tamaño de la población total.

-E es el error relativo del resultado del estudio.

Ejemplos

La metodología para extraer las muestras depende mucho del tipo de estudio que se requiera hacer. Por ello el muestreo aleatorio tiene infinidad de aplicaciones:

Encuestas y cuestionarios

Por ejemplo en encuestas telefónicas, se eligen las personas a ser consultadas mediante un generador de números aleatorios, aplicable a la región en estudio.

Si se quiere aplicar un cuestionario a los empleados de una empresa grande, entonces puede recurrirse a la selección de los encuestados a través de su número de empleado, o número de carnet de identidad.

Dicho número debe elegirse también de forma aleatoria, usando por ejemplo un generador de números al azar.

Control de calidad

En el caso de que el estudio sea sobre las piezas fabricadas por una máquina, deben elegirse piezas en forma aleatoria, pero de lotes fabricados en distintos momentos del día, o en días o semanas diferentes.

Ventajas

El muestreo aleatorio simple:

– Permite disminuir los costos de un estudio estadístico, debido a que no es necesario estudiar la población total para obtener resultados estadísticamente fiables, con los niveles de confianza deseados y el nivel de error requerido en el estudio.

– Evita el sesgo: como la elección de los elementos a ser estudiados es completamente al azar, el estudio refleja fielmente las características de la población, aunque únicamente se estudió parte de la misma.

Desventajas

– El método no es adecuado en los casos que se desea conocer las preferencias en diferentes grupos o estratos poblacionales.

En este caso es preferible determinar previamente los grupos o segmentos sobre los que se quiere hacer el estudio. Una vez definidos los estratos o grupos, entonces si conviene sobre cada uno de ellos aplicar el muestreo aleatorio.

– Es muy poco probable que se obtenga información sobre los sectores minoritarios, de los cuales en ocasiones es necesario conocer sus características.

Por ejemplo si se trata de hacer una campaña sobre un producto costoso, es necesario conocer las preferencias de los sectores minoritarios más pudientes.

Ejercicio resuelto

Se quiere estudiar la preferencia de la población por cierto refresco de cola, pero no hay ningún estudio previo en dicha población, de la que se desconoce su tamaño.

Por otra parte, la muestra tiene que ser representativa con un nivel de confianza mínimo del 90% y las conclusiones deben tener un error porcentual de 2%.

-¿Cómo determinar el tamaño n de la muestra?

-¿Cuál sería el tamaño de la muestra si se flexibiliza el margen de error hasta 5%?

Solución

Puesto que se desconoce el tamaño de la población, para determinar el tamaño de la muestra se emplea la fórmula dada anteriormente:

n = (Z2p q)/(E2)

Suponemos que hay igual probabilidad de preferencia (p) por nuestra marca de refresco que de no preferencia (q), entonces p = q = 0,5.

Por otra parte como el resultado del estudio debe tener error porcentual menor al 2%, entonces el error relativo E será 0,02.

Por último, un valor Z=1,645 produce un nivel de confianza de 90%.

Resumiendo, se tienen los valores siguientes:

Z= 1,645

p= 0,5

q= 0,5

E= 0,02

Con estos datos se calcula el tamaño mínimo de la muestra:

n = (1,6452 0,5 0,5)/(0,022) = 1691,3

Esto significa que el estudio con el margen de error requerido y con el nivel de confianza elegido, debe tener una muestra de encuestados de por lo menos 1692 individuos, elegidos mediante muestreo aleatorio simple.

Si se pasa de un margen de error de 2% a 5%, entonces el nuevo tamaño de la muestra es:

n = (1,6452 0,5 0,5)/(0,052) = 271

Que es un número de individuos significativamente menor. Como conclusión, el tamaño de la muestra es muy sensible al margen de error deseado en el estudio.

Referencias

  1. Berenson, M. 1985.Estadística para Administración y Economía, Conceptos y Aplicaciones. Editorial Interamericana.
  2. Estadística. Muestreo aleatorio. Tomado de: enciclopediaeconomica.com.
  3. Estadística. Muestreo. Recuperado de: estadistica.mat.uson.mx.
  4. Explorable. Muestreo aleatorio. Recuperado de: explorable.com.
  5. Moore, D. 2005. Estadística Básica Aplicada. 2da. Edición.
  6. Netquest. Muestreo aleatorio. Recuperado de: netquest.com.
  7. Wikipedia. Statistical sampling. Recuperado de: en.wikipedia.org