21. La distribución Normal

En general las distribuciones de probabilidad son herramientas muy necesarias en el estudio de problemas probabilísticos y estadísticos.

Entre las distribuciones de probabilidad continuas, la distribución normal, es la más utilizada y la más importante.

Muchas mediciones dentro de poblaciones siguen distribuciones normales y en casos donde poblaciones no distribuyen normalmente, es común que ciertos promedios y ciertos valores acumulados se distribuyan en forma normal, esta última observación se conoce como el teorema del límite central. En términos muy simples, una población sigue una distribución normal respecto a alguna medición cuando el grueso de los valores de la población se distribuyen cerca de la media y existe cierta simetría en la forma en que se distribuyen los datos alrededor de la media.

En términos matemáticos la definición es la siguiente:

Definición 22.

Una variable aleatoria X sigue una distribución normal con parámetros μ y σ, lo que denotamos por X es N(μ, σ2), si la función de densidad de probabilidad tiene la forma.

fX(x) = 1 2πσe(xμ)2 2σ2   Para  x ∞.

Se puede demostrar que la media de esta distribución es μ y la desviación es σ.

En la versión electrónica se da una herramienta con la que usted puede explorar la forma de la gráficas de distribuciones normales. Se puede variar la media y la desviación estándar para analizar distintos casos.

Puedes interactuar aquí o abrirla en ventana aparte

Además la distribución de probabilidad acumulada es decir, P[X x] se calcula por la integral:

FX(x) = P[X x] = 1 2πσxe(tμ)2 2σ2 dt

Para efectos operacionales, las distribuciones normales son difíciles pues los cálculos que deben hacerse son complejos.

Entre las normales, la distribución más importante es la que se llama normal estándar, una normal cuya media es 0 y cuya desviación estándar es 1. De hecho en estas mismas notas veremos que toda probabilidad que implique la distribución normal puede reducirse a una en que se utilice la normal estándar.

Definición 23.

Una variable aleatoria X sigue una distribución normal estándar si la función de densidad de probabilidad tiene la forma.

φ(x) = 1 2πex2 2  Para  x ∞.

Y en este caso el cálculo de la distribución de probabilidad acumulada es,

Φ(x) = P[X x] = 1 2πxet2 2 dt.

La última expresión es una variante de una función que se conoce como la función error erf(x), [1], y solo hay formas numéricas de aproximar sus valores [32].

Los valores de la función Φ(x) se pueden obtener en tablas que aparecen en libros de probabilidades o bien utilizando la herramienta provista en estas notas. En el script que sigue usamos una fórmula equivalente que es más conveniente para el cálculo computacional

Puedes interactuar aquí o abrirla en ventana aparte

Otra opción para el script es

Puedes interactuar aquí o abrirla en ventana aparte

Eventualmente se necesita utilizar la función inversa de la distribución normal, es decir dada una probabilidad calcular un valor de la variable aleatoria que produciría tal probabilidad. Esta herramienta también se provee y tiene la siguiente interfaz:

21.1 Algunas Propiedades Importantes

Como la función de distribución de probabilidad es simétrica, y además el área total acumulada, sobre toda la recta real es 1, entonces para cualquier x real se obtiene la siguiente propiedad:

Φ(x) + Φ(x) = 1,
(1.29)

Para finalizar este corto recorrido por la distribución normal invitamos al lector a seguir cuidadosamente las siguientes líneas.

Si X sigue una distribución normal con parámetros μ y σ entonces si aplicamos el cambio de variable ω = tμ σ a la integral en

P[X x] = 1 2πσxe(xμ)2 2σ2 dt,

obtenemos

P[X x] = 1 2πxμ σ eω2 2 dt = Φ (xμ σ ).
Teorema 15.

Si X sigue una distribución de probabilidad normal con media μ y desviación estándar σ entonces

P[X x] = Φ (xμ σ )
(1.30)
Ejemplo 22.

Las notas finales de un curso se distribuyen en forma normal con una media de 75 y una desviación estándar de 10. Si la nota de aprobación es de 70 que porcentaje de los estudiantes aprobarán el curso.

Solución:

Primero debe notar que la afirmación de que las notas siguen una distribución normal debe entenderse en el sentido aproximado.

El porcentaje solicitado puede obtenerse al encontrar el valor P[X 70].

Dadas las propiedades de las distribuciones de probabilidad se tiene que

P[X 70] = 1 P[X 70] = 1 Φ (70 75 10 ) = 1 0.3085 = 0.6915.
Ejemplo 23.

La distribución de peso de ciertos bultos de papel para reciclaje es normal con media de 50 kilos y desviación estándar de 10 kilos. La persona que transporta los paquetes cobra 100 colones por bulto pero desea imponer un peso máximo después del cual cobrar un recargo. Cuál debería ser ese peso para que los bultos tengan una probabilidad mayor al 10% de pagar tal recargo.

Solución

Hay dos aspectos importantes que se deben notar, el primero de ellos es que si X es la variable aleatoria para el peso de cada paquete lo que se debe encontrar es un valor r tal que:

P[X r] > 0.1,

lo que se reduce a encontrar un r que cumpla con:

P[X r] 0.9,

El problema es inverso en el sentido de que no se busca una probabilidad, sino un valor que permita obtener cierta probabilidad.

El segundo aspecto que debe tenerse en cuenta es que para poder utilizar las barras de cálculo de que se dispone en estas notas o las tablas, la distribución debe normalizarse en el sentido de 15.

La siguiente herramienta (script) permite resolver el problema indicado, a saber si se tiene una probabilidad p encontrar el valor r tal que P[XX r] = p.

Puedes interactuar aquí o abrirla en ventana aparte

Uniendo ese par de observaciones se debe resolver:

P [X50 10 r50 10 ] 0.9.

Utilizando en barra de asistencia la herramienta normal inversa se obtiene la ecuación:

r50 10 = 1.286,

de donde r > 62.86

[Siguiente][Inicio]