19. Distribución de probabilidad hipergeométrica
Cuando una población se divide en 2 grupos, digamos éxitos y fracasos y se elige un subconjunto de esta población, es natural que en esta muestra queden representados los dos grupos. En los experimentos hipergeométricos interesa el número de representantes de alguno de los grupos en la muestra.
Un experimento se clasifica como Hipergeométrico si cumple las siguientes propiedades:
- La población o conjunto donde debe llevarse a cabo el muestreo consta de objetos.
- Cada objeto puede caracterizarse éxito o fracaso . Hay éxitos en la población.
- Se saca una muestra de objetos de forma tal que sea igualmente probable que se obtenga cada muestra.
- La variable aleatoria observada es el número de éxitos obtenidos en la muestra.
Los tipos de aplicaciones en los cuales la distribución es hipergeométrica son muy similares a aquellos donde se aplica la binomial. Una manera de entender la diferencia entre ambas es analizando el esquema con que se lleva a cabo el muestreo. Mientras que en la distribución binomial el muestreo se realiza con reemplazo de cada artículo, después de observarse, en la hipergeométrica el muestreo se lleva a cabo sin reemplazo.
Por ejemplo de un naipe se desea extraer una muestra de 5 cartas y calcular la probabilidad de obtener 3 cartas rojas. En este caso se deben muestrear 5 objetos, para cada objeto se considera como éxito el hecho que la carta sea roja y como fracaso que sea negra, hay 26 éxitos en la población, toda muestra de 5 cartas tiene la misma probabilidad de ser elegida.
El conjunto de valores posibles para la variable aleatoria en un experimento hipergeométrico está restringido por dos condiciones importantes, la primera de ellas es que en la muestra puede haber a lo sumo éxitos mientras que al menos hay éxitos.
La distribución de probabilidad depende de:
- el tamaño de la muestra ,
- el tamaño del conjunto sobre el cual se toman los objetos ,
- y el número de éxitos, en el conjunto sobre el que se hace el muestreo.
El cálculo de la distribución de probabilidad para un valor de los posibles de la variable aleatoria se puede hacer de manera simple pues la probabilidad puede reducirse a un problema de conteo. Se eligen de los éxitos y se eligen de los que no son éxitos, y se divide entre el total de posibles maneras de escoger los elementos de los . Esto conduce a la expresión:
Si sigue una distribución hipergeométrica, con las condiciones descritas se cumplen:
(a.)
(b.)
Los cálculos asociados con los ejercicios que involucran hipergeométricas pueden hacerse utilizando la herramienta adjunta:
Un equipo de trabajo de 5 personas se va a seleccionar de entre cinco hombres y tres mujeres. Si la variable aleatoria es el número de hombres en el equipo, ¿cuál es la distribución de probabilidad asociada?
Solución
Los posibles valores de esta variable aleatoria son y y las probabilidades son:
El lector puede verificar que la media para esta distribución es
De una población de 500 animales se capturan 200, se marcan y se sueltan para que vuelvan a mezclarse con el resto de la población.
La probabilidad de que en una muestra de 20 animales capturados o recapturados haya 4 o menos marcados se puede calcular por
Mientras tanto, la probabilidad de que aparezcan 3 o más animales marcados en una captura o recaptura de 20 es: