Distribución normal

3 min

La distribución normal es un modelo teórico capaz de aproximar satisfactoriamente el valor de una variable aleatoria a una situación ideal. 

En otras palabras, la distribución normal adapta una variable aleatoria a una función que depende de la media y la desviación típica. Es decir, la función y la variable aleatoria tendrán la misma representación pero con ligeras diferencias.

Una variable aleatoria continua puede tomar cualquier número real. Por ejemplo, las rentabilidades de las acciones, los resultados de un examen, el coeficiente de inteligencia IQ y los errores estándar son variables aleatorias continuas.

Una variable aleatoria discreta toma valores naturales. Por ejemplo, el número de estudiantes en una universidad.

La distribución normal es la base de otras distribuciones como la distribución t de Student, distribución ji-cuadrada, distribución F de Fisher y otras distribuciones.

Fórmula de la distribución normal

Dada una variable aleatoria X, decimos que la frecuencia de sus observaciones puede aproximarse satisfactoriamente a una distribución normal tal que: 

Donde los parámetros de la distribución son la media o valor central y la desviación típica: 

En otras palabras, estamos diciendo que la frecuencia de una variable aleatoria X puede representarse mediante una distribución normal.   

Representación

Función de densidad de probabilidad de una variable aleatoria que sigue una distribución normal.

Propiedades

  • Es una distribución simétrica. El valor de la media, la mediana y la moda coinciden. Matemáticamente, 

Media = Mediana = Moda

  • Distribución unimodal. Los valores que son más frecuentes o que tienen más probabilidad de aparecer están alrededor de la media. En otras palabras, cuando nos alejamos de la media, la probabilidad de aparición de los valores y su frecuencia descienden. 

¿Qué necesitamos para representar una distribución normal?

  • Una variable aleatoria. 
  • Calcular la media. 
  • Calcular la desviación típica. 
  • Decidir la función que queremos representar: función de densidad de probabilidad o función de distribución. 

Ejemplo teórico

Suponemos que queremos saber si los resultados de un examen pueden aproximarse satisfactoriamente a una distribución normal. 

Sabemos que en este examen participan 476 estudiantes y que los resultados podrán oscilar entre 0 y 10. Calculamos la media y la desviación típica a partir de las observaciones (resultados del examen).

Entonces, definimos la variable aleatoria X como los resultados del examen que depende de cada resultado individual. Matemáticamente, 

El resultado de cada estudiante se anota en una tabla. De esta forma, obtendremos una visión global de los resultados y de su frecuencia.

ResultadosFrecuencia
020
131
244
356
464
566
662
751
839
926
1016
TOTAL475

Una vez hecha la tabla, representamos los resultados del examen y las frecuencias. Si el gráfico se parece a la imagen anterior y cumple con las propiedades, entonces, la variable resultados del examen puede aproximarse satisfactoriamente a una distribución normal de media 4,86 y desviación típica de 2,56.

¿Los resultados del examen pueden aproximarse a una distribución normal?

Razones para considerar que la variable resultados del examen sigue una distribución normal: 

  • Distribución simétrica. Es decir, existe el mismo número de observaciones tanto a la derecha como a la izquierda del valor central. También, que la media, la mediana y la moda tienen el mismo valor. 

Media = Mediana = Moda = 5

  • Las observaciones con más frecuencia o probabilidad están alrededor del valor central. En otras palabras, las observaciones con menos frecuencia o probabilidad se encuentran lejos del valor central. 

La distribución normal describe la variable aleatoria mediante una aproximación que produce errores estándar (las barras encima de cada columna). Estos errores son la diferencia entre las observaciones reales (resultados) y la función de densidad (distribución normal). 

Francisco Coll Morales

Muchas gracias Luz;

La verdad es que, pese a que contamos con un equipo multidisciplinar, casi todos los autores en Economipedia provienen de los grados de Economía, derecho y ADE.

Estamos muy contentos de que te guste la página, así como que te sirva de ayuda.

Un abrazo de parte del equipo de Economipedia.

Accede para responder

Paula Rodó

Hola Jose,

El artículo está enfocado hacia las variables aleatorias continuas dado que son las más utilizadas en las finanzas. En el ejemplo se utiliza una variable discreta para simplificar. Si lo prefiere, puede añadir decimales a la variable resultados del examen para que tenga la condición de continuidad. Gracias por su comentario, modificaremos el artículo para facilitar la comprensión.

Un saludo.

Accede para responder

Paula Rodó

Hola Carlos,

Sí, les variables discretas también pueden tener una distribución normal.

La diferencia entre una variable discreta y una variable continua es que la variable continua tiene infinitas posibilidades entre observaciones y la variable discreta no existe nada entre observaciones. Entonces, si representas un conjunto de datos discreto y ves que los valores centrales aparecen con más frecuencia que los valores extremos, verás como va tomando la forma de una distribución normal. Puedes calcular la función de densidad de probabilidad (pdf) de esos valores y obtendrás la probabilidad (según la distribución normal) para cada valor de tu conjunto de datos. Cuántos más datos tenga tu conjunto de datos, más se parecerá a la distribución normal porque estás añadiendo continuidad a la serie.

Un saludo.

Accede para responder

Evelyn

Holaa, me hacen una pregunta en mi exámen final, que no logro responder, es que beneficio tiene que una distribución normal tenga una gráfica simétrica respecto del eje vertical? Sería de gran ayuda una respuesta. Gracias.

Accede para responder

Juan José

¿A partir de cuántas observaciones puedo utilizar la distribución normal?

Por ejemplo, en otro artículo mencionan que "A partir de 30 observaciones, la distribución t se parece mucho a la distribución normal y, por tanto, utilizaremos la distribución normal."

Tengo 48 observaciones para realizar un pronóstico de ventas con suavización exponencial doble, y me gustaría saber cuál debe ser el tamaño de mis datos para asumir que se distribuyen normalmente. Mi profesor que mínimo son 28, pero no encuentro literatura que me lo indique explícitamente.

Les agradezco.

Accede para responder

Paula Rodó

Hola Juan.

Gracias por tu comentario.
El objetivo por el cual se prefiere trabajar con la distribución normal que con otras distribuciones es por sus propiedades estadísticas.
Para saber si tus datos siguen una distribución normal podrías hacer un prueba de Jarque-Bera y determinar si la asimetría y la curtosis de tus datos son normales.
Es tan importante el número de datos del conjunto como su distribución para aproximarla a la distribución normal.
La distribución t-Student es una distribución continua pensada para estimar la media de una población normalmente distribuida con una muestra pequeña, entonces, a partir de 30 observaciones ya se considera una distribución normal. Si no encuentras literatura al respecto, puedes demostrarlo simulando unos datos e incrementando los grados de libertad hasta llegar a 30 y ver que encaja con una distribución normal ya que los grados de libertad dependen del tamaño de la muestra.

Un saludo.

Accede para responder

danielgarcia.r94

Hola, estoy aprendiendo sobre estadística y tengo una duda. He replicado el estudio propuesto como ejemplo y los datos no me coinciden: La sumatoria total de los estudiantes me sale 475 y la desviación estándar me sale 2.556147994. Indicar si estos datos son correctos

Accede para responder

José Francisco López

Gracias por avisarnos Daniel.

Así es, ya lo hemos modificado. Estos serían los cálculos:

μ = (0.042×0+0.065×1+0.093×2+0.118×3+0.135×4+0.139×5+0.131×6+0.107×7+0.082×8+0.055×9+0.034×10) / (0.042+0.065+0.093+0.118+0.135+0.139+0.131+0.107+0.082+0.055+0.034) = 4.86113886

σ = √( (0.042×(0-4.86113886)²+0.065×(1-4.86113886)²+0.093×(2-4.86113886)²+0.118×(3-4.86113886)²+0.135×(4-4.86113886)²+0.139×(5-4.86113886)²+0.131×(6-4.86113886)²+0.107×(7-4.86113886)²+0.082×(8-4.86113886)²+0.055×(9-4.86113886)²+0.034×(10-4.86113886)²) / (0.042+0.065+0.093+0.118+0.135+0.139+0.131+0.107+0.082+0.055+0.034) ) = 2.55639651

Gracias!

Accede para responder