21. La distribución Normal
En general las distribuciones de probabilidad son herramientas muy necesarias en el estudio de problemas probabilísticos y estadísticos.
Entre las distribuciones de probabilidad continuas, la distribución normal, es la más utilizada y la más importante.
Muchas mediciones dentro de poblaciones siguen distribuciones normales y en casos donde poblaciones no distribuyen normalmente, es común que ciertos promedios y ciertos valores acumulados se distribuyan en forma normal, esta última observación se conoce como el teorema del límite central. En términos muy simples, una población sigue una distribución normal respecto a alguna medición cuando el grueso de los valores de la población se distribuyen cerca de la media y existe cierta simetría en la forma en que se distribuyen los datos alrededor de la media.
En términos matemáticos la definición es la siguiente:
Una variable aleatoria sigue una distribución normal con parámetros y , lo que denotamos por es , si la función de densidad de probabilidad tiene la forma.
Se puede demostrar que la media de esta distribución es y la desviación es .
En la versión electrónica se da una herramienta con la que usted puede explorar la forma de la gráficas de distribuciones normales. Se puede variar la media y la desviación estándar para analizar distintos casos.
Además la distribución de probabilidad acumulada es decir, se calcula por la integral:
Para efectos operacionales, las distribuciones normales son difíciles pues los cálculos que deben hacerse son complejos.
Entre las normales, la distribución más importante es la que se llama normal estándar, una normal cuya media es 0 y cuya desviación estándar es 1. De hecho en estas mismas notas veremos que toda probabilidad que implique la distribución normal puede reducirse a una en que se utilice la normal estándar.
Una variable aleatoria sigue una distribución normal estándar si la función de densidad de probabilidad tiene la forma.
Y en este caso el cálculo de la distribución de probabilidad acumulada es,
La última expresión es una variante de una función que se conoce como la función error [1], y solo hay formas numéricas de aproximar sus valores [3, 2].
Los valores de la función se pueden obtener en tablas que aparecen en libros de probabilidades o bien utilizando la herramienta provista en estas notas. En el script que sigue usamos una fórmula equivalente que es más conveniente para el cálculo computacional
Otra opción para el script es
Eventualmente se necesita utilizar la función inversa de la distribución normal, es decir dada una probabilidad calcular un valor de la variable aleatoria que produciría tal probabilidad. Esta herramienta también se provee y tiene la siguiente interfaz:
21.1 Algunas Propiedades Importantes
Como la función de distribución de probabilidad es simétrica, y además el área total acumulada, sobre toda la recta real es 1, entonces para cualquier real se obtiene la siguiente propiedad:
|
| (1.29) |
Para finalizar este corto recorrido por la distribución normal invitamos al lector a seguir cuidadosamente las siguientes líneas.
Si sigue una distribución normal con parámetros y entonces si aplicamos el cambio de variable a la integral en
obtenemos
Las notas finales de un curso se distribuyen en forma normal con una media de 75 y una desviación estándar de 10. Si la nota de aprobación es de 70 que porcentaje de los estudiantes aprobarán el curso.
Solución:
Primero debe notar que la afirmación de que las notas siguen una distribución normal debe entenderse en el sentido aproximado.
El porcentaje solicitado puede obtenerse al encontrar el valor
Dadas las propiedades de las distribuciones de probabilidad se tiene que
La distribución de peso de ciertos bultos de papel para reciclaje es normal con media de 50 kilos y desviación estándar de 10 kilos. La persona que transporta los paquetes cobra 100 colones por bulto pero desea imponer un peso máximo después del cual cobrar un recargo. Cuál debería ser ese peso para que los bultos tengan una probabilidad mayor al 10% de pagar tal recargo.
Solución
Hay dos aspectos importantes que se deben notar, el primero de ellos es que si es la variable aleatoria para el peso de cada paquete lo que se debe encontrar es un valor tal que:
lo que se reduce a encontrar un que cumpla con:
El problema es inverso en el sentido de que no se busca una probabilidad, sino un valor que permita obtener cierta probabilidad.
El segundo aspecto que debe tenerse en cuenta es que para poder utilizar las barras de cálculo de que se dispone en estas notas o las tablas, la distribución debe normalizarse en el sentido de 15.
La siguiente herramienta (script) permite resolver el problema indicado, a saber si se tiene una probabilidad encontrar el valor tal que .
Uniendo ese par de observaciones se debe resolver:
Utilizando en barra de asistencia la herramienta normal inversa se obtiene la ecuación:
de donde