Estadística

Selecciones al azar con o sin reemplazo (con ejemplos y ejercicios)


La selección al azar consiste en elegir, de manera aleatoria, un elemento o muestra, partiendo de un conjunto de datos u objetos. Con reemplazo significa retornar el elemento  al conjunto original, y sin reemplazo quiere decir que no regresa.

En el primer caso, cuando el elemento seleccionado vuelve al conjunto de origen, este no se modifica, dejando abierta la posibilidad de que dicho elemento sea escogido más de una vez. De esta manera se pueden llevar a cabo infinitas extracciones sobre una misma población, aun cuando esta conste de N elementos, siendo N finito.

Pero si la selección se hace sin reposición, el conjunto original de elementos cambia cada vez que se extrae de él algún elemento para conformar la muestra. Y los elementos extraídos ya no tienen posibilidad de ser seleccionados de nuevo.

Como la población va decreciendo, el número de extracciones que se puede hacer sobre ella es finito.

Si el tamaño de la población N es pequeño, existe una diferencia significativa entre seleccionar elementos al azar con o sin reemplazo. En cambio, cuando N es muy grande, la diferencia es mucho menor, como se verá más adelante.

Selección con reemplazo

La probabilidad de que ocurra determinado evento x, es el cociente entre el número de casos favorables y el total de casos:

P(x)= casos favorables/total de casos.

Si la población consta de N elementos diferentes: x1, x2, x3…, la probabilidad de escoger al elemento x1 es P(x1) = 1/N.

Como hay reposición, el tamaño de la población sigue siendo N, entonces, la probabilidad de escoger el siguiente elemento x2 es P(x2) = 1/N.

Y de igual forma, cada uno de los restantes elementos tiene igual probabilidad de ser seleccionado:

P(xn) = 1/N

Por lo tanto, al ser los eventos independientes entre sí, la probabilidad conjunta de ocurrencia es el producto de las probabilidades de cada uno de ellos:

P(x1, x2, x3…xn)= (1/N) × (1/N) ×…× (1/N)

Selección sin reemplazo

Al escoger un elemento determinado sin reposición de una población de tamaño N, la probabilidad de que tal elemento sea elegido es:

P(x1) = 1/N

Una vez hecho esto, quedan N−1 elementos en la población, por lo tanto, la probabilidad de elegir al siguiente es:

P(x2) = 1/(N−1)

Elegido este elemento, la población consta ahora de N−2 elementos, en tal caso, la probabilidad de elegir al siguiente es:

P(x3) = 1/(N−2)

Y así sucesivamente. La probabilidad para el n-ésimo elemento es:

P(xn) = 1/[N−(n-1)]

Finalmente, la probabilidad conjunta de seleccionar a los elementos x1, x2, x3… como parte de la muestra, es el producto de cada una de las probabilidades:

P(x1, x2, x3…)= 1/N × 1/(N−1) × 1/(N−2) ×… × 1/[N−(n-1)] = 1/[N × (N−1) × (N−2) ×… × [N−(n-1)]

Ejemplos

En estadística, la acción de seleccionar la muestra es un experimento, el conjunto de posibles resultados es el espacio muestral y los resultados del experimento constituyen un evento.

Ejemplo 1

Se dispone de una caja con canicas de distintos colores: 12 rojas, 7 azules y 5 verdes. El experimento consiste en extraer una sola canica al azar.

Como en total hay 24 canicas en la caja, de las cuales 12 son rojas, la probabilidad de sacar una canica roja, denotada P(R), es:

P(R)= 12/24 = 1/2 = 0.5

Tras esto, se desea conocer la probabilidad de extraer una canica verde, es decir, P(V).

Esta probabilidad depende de si la canica roja que se extrajo en primer lugar se regresa a la caja o no. Si la canica roja se pone nuevamente en la caja con las demás, la selección es con reemplazo o reposición, y de lo contrario se trata de una selección sin reemplazo.

En una selección con reemplazo, el espacio muestral no cambia, sigue habiendo 24 canicas en la caja y la probabilidad de extraer una canica verde es:

P(V) = 5/24 = 0.21

Y si la canica roja inicial no se devuelve a la caja, en esta quedan 23 canicas, y la probabilidad de extraer una verde debe ser algo mayor:

P(V) = 5/23 = 0.22

Ejemplo 2

En otro experimento con la caja de canicas, se quiere calcular la probabilidad de que, al extraer dos canicas, la primera sea roja y la siguiente sea azul. Se puede proceder de dos maneras:

a) Con reemplazo

Ambos eventos son independientes, es decir, el color de la canica extraída primero no influye en la probabilidad de sacar otra canica de determinado color.

P(RA) = (12/24) × (7/24) = 84/576 = 0.146

b) Sin reemplazo

Al dejar la primera canica fuera, si esta fue de color rojo, la probabilidad de extraer una azul la segunda vez es un poco mayor:

P(RA) = (12/24) × (7/23) = 84/552 = 0.152

Ejemplo 3

Una ciudad tiene 30.000 habitantes, de los cuales 15.423 son mujeres. Se quiere calcular la probabilidad de que, al seleccionar a dos habitantes, ambos sean mujeres.

a) Con reemplazo

Sea P(M) la probabilidad de que el habitante seleccionado sea mujer, entonces:

P(M) = 15.423/30.000 = 0.51410

Entonces, la probabilidad de que la segunda persona escogida también sea mujer es:

P(MM) = P(M) × P(M) = 0.51402 = 0.2643

b) Sin reemplazo

Si la primera persona escogida no es “devuelta”, entonces la probabilidad de escoger una mujer en el segundo intento es:

P(M) = 15.422/29.999 = 0.51408

No existe una diferencia significativa con el caso anterior. Y el producto 0.51410×0.51408 es casi igual a 0.2643, el lector lo puede comprobar con la calculadora.

Ejercicio resueltos

Una caja tiene 5 creyones verdes, 2 creyones azules y 3 creyones rojos, todos nuevos e idénticos. Determinar la probabilidad de que, al extraer dos creyones de la caja, ninguno de ellos sea rojo:

a) Con reemplazo. ¿Son independientes estos eventos?

b) Sin reemplazo, indicando si los eventos son o no independientes.

Solución a

Hay 10 creyones en total, de las cuales 3 son rojos y 7 no lo son. La probabilidad P(R*) de que el primer creyón no sea rojo es:

P1(R*) = 7/10 = 0.7

Se devuelve el creyón a la caja y se hace la segunda extracción, con el mismo resultado:

P2(R*) = 7/10 = 0.7

Los eventos son independientes, por lo tanto, la probabilidad de que en este experimento ningún creyón sea rojo es:

P1(R*) × P2(R*) = 0.7 × 0.7 = 0.49

Solución b

La probabilidad de obtener un creyón que no sea rojo en el primer intento, es la misma que en el apartado a). Pero en la segunda extracción, ya quedan 9 creyones en la caja, por lo tanto:

P2(R*) = 6/9 = 0.666…

Y en este caso, la probabilidad de extraer un creyón que no es rojo es:

P1(R*) × P2(R*) = 0.7 × 0.666… = 7/15 = 0.47

Los eventos no son independientes.