numero1 articulo 4

PRUEBA DE NORMALIDAD DE GEARY


Jose Romero Cortes

INTRODUCCION

Muchos de los resultados teóricos y prácticos de la estadística paramétrica descansan en la distribución normal. El investigar si una muestra aleatoria de tamaño n proviene de una distribución normal resulta de interés, y de hecho existen muchas pruebas estadísticas al respecto entre las que destacan las siguientes:

  • Prueba de Karl Pearson, basada en la distribución chi cuadrada y que corresponde a una prueba de bondad de ajuste.
  • Prueba de Smirnov Kolmogorov, descansa en los desvíos de la distribución teórica y empírica.
  • Prueba de Cramer-Von Mises, es útil para pequeñas muestras y usa los momentos como criterio.
  • Prueba de Gram-Charlier, usa la distribución de mismo nombre para inferir si la muestra es normal.
  • Prueba de Jarque y Bera, utiliza un estadístico en prueba que involucra la curtosis y la asimetría.
  • Prueba de R.C. Geary, usa los cumulantes muestrales y sus medias y desviaciones estándar.
  • Otras, como la de Shapiro- Wilk y aquéllas basadas en métodos numéricos.

El criterio de R.C. Geary, se basa en el cálculo de los cumulantes muestrales, generando un estadístico que descontando estos valores de sus medias y dividido por sus desviaciones estándar, tiene ventajas sobre otros criterios porque:

  • Es simple ya que usa directamente los datos sin tener que construir la distribución de frecuencias.
    La potencia de la prueba, para tamaños de muestra medios o grande es mayor para desvíos de normalidad expresados por moderados, donde este parámetro aparece en:

    que corresponde al campo simétrico universal, donde si = 0 se tiene una normal, pero cuando 0 se tiene un alejamiento a ésta. La prueba de Geary es sensible a ésto y se manifiesta en la potencia de esta prueba.

  • Es fácil de incorporar funciones de variables aleatorias originales.
  • Aparece en software reciente, sobre todo en el aspecto de control estadístico de la calidad.

PRUEBA DE NORMALIDAD DE R.C. GEARY

Sea x1, x2, ......, xn una muestra aleatoria de tamaño n de alguna distribución y sea c > 0, considere:

Especificamente cuando c=4:

a(c) = estimador de curtosis

donde:


donde k2 y k4 son los cumulantes 2o y 4o respectivamente.

esto es:


con 1 por la desigualdad de Cauchy-Schwartz y para distribuciones simetricas unimodales y de la desigualdad de Gauss-Winclker se tiene que 1.8 .

Por tanto:

Mesocurtica si = 3

Platicurtica si < 3

Leptocurtica si > 3

Del desarrollo anterior, probar normalidad de muestras usando el criterio de Geary equivale a lo siguiente:

Supongase que se desea probar:

Ho:{X1, X2,....., Xn} Normal

Ha:{X1, X2,....., Xn} Normal

Región crítica o de rechazo:

Si rechace Ho con significancia .

APLICACION

Con el propósito de usar el criterio de R.C. Geary para probar normalidad de muestras a continuación se presentan cinco ejemplos, uno de ellos obtenido de un experimento y los restantes en base a muestras simuladas de distribuciones exponenciales y normales, generandose los siguientes datos:

(1)

46.0, 57.3, 62.5, 50.0, 57.3, 50.0, 50.5, 50.0, 48.0, 39.0

52.6, 49.8, 51.0, 60.4, 66.5, 50.5, 50.5, 50.5, 45.5, 51.5

47.9, 58.8, 52.0, 46.35, 46.8


(2)

2.16, 5.98, 20.90, 0.94, 2.45, 5.69, 4.09, 2.82, 7.44, 1.48

0.67, 3.15, 0.68, 7.04, 3.77, 16.57, 2.86, 0.32, 10.39, 2.27

14.73, 0.63, 5.34, 4.83, 4.18


(3)

12.25, 3.90, 3.95, 7.35, 7.50


(4)

12.25, 3.90, 3.95, 7.35, 7.50, 7.75, 5.90, -8.55, 10.40, 3.25

0.60, 11.70, 0.55, -4.90, 4.05, 11.70, 10.40, 9.25, 15.00, 7.80

0.05, 5.50, 0.10, 14.15, 2.60,


(5)

10.50, 31.65, 71.26, 4.64, 12.04, 0.07, 19.21, 1.74, 0.05, 25.28


A continuación se presenta el cuadro de inferencias asociadas a estas muestras:
NOTA:
para poder ver mejor la imagen haz click sobre ella.

(*)

(3),(4) Muestra simulada de

(2),(5) Muestra simulada de

(1) Datos experimentales.


COMPUTO ESTADISTICO.

Debido a que la E(a(c)) y V(a(c)), son complicadas en cuanto a su cálculo se diseño una hoja de cálculo en Excel con los siguientes pasos:

1. Introducir los datos, digamos

x1, x2, x3, ....., xn

2. Se efectua el cálculo de la media y varianza teóricas de la curtosis para un tamaño de muestra n y se calcula ZG, comparandose con valores Z con = 0.05, esto se ilustra a continuación referido a las celdas de la hoja de cálculo Excel.

E(a(c))

E(a(c))

V(a(c))

3. La salida es la inferencia de si la muestra proviene de una población normal, esto es, si < 1.96.

El desarrollo anterior se ilustra a continuación, utilizando el primer caso del ejemplo de aplicación:

1. Entrada de datos.

2. Los cálculos del estadístico de prueba ZG aparecen en el paso 2. del desarrollo anterior.

3. La inferencia se muestra en la ficha.

Donde la hoja contempla un tamaño de muestra hasta de 1000, pero sin embargo es fácil expanderlo, o utilizando un procedimiento de Visual Basic en el mismo Excel es casi equivalente.


CONCLUSIONES

La prueba de Geary aunque formulada en la década de los 30's, es más reciente que la prueba X² o la de Smirnov, que son las más usadas, aún cuando éstas son para cualquier distribución. Sin embargo la de prueba de Geary es exclusivamente referida a la distribución normal, además sus características de sencillez, potencia y aplicación la hacen actual e importante en la teoría de la normalidad.


BIBLIOGRAFIA

1. KENDALL, M. (1977)
"The Advanced Theory of Statistics"
Charles Griffin Company Limited, London High Wycombe, Vols. I-II.

2. GEARY R.C, (1938)
"Test of Normality"
Journal Royal Statistics Society.

3. GEARY R.C, (1935)
"Extension of A Theorem by Harald Cramer on the Frecuency Distribution of Quotient of Two Variables"
Journal Royal Statistics Society, 107,56.

4. BOWMANN, K.O., (1973)
"Power of The Kurtosis Statistic, B2 In Test of Departure from Normality"
Biometrika, Vol. 60, p.p. 623-28.



regreso numeros
ÿ