2.1.7 Pruebas de Normalidad y ajuste de los datos

 

METODO DE BOX-COX  




Son una familia de transformaciones potenciales usadas en estadística para corregir sesgos en la distribución de errores, para corregir varianzas desiguales (para diferentes valores de la variable predictora) y principalmente para corregir la no linealidad en la relación (mejorar correlación entre las variables). Esta transformación recibe el nombre de los estadísticos George E. P .Box y David Cox.

La transformación potencial está definida como una función continua que varía con respecto a la potencia lambda (). Para los datos (Y1,..., Yn). se realiza la transformación .

Procedimiento para la transformación.
Para llevar a cabo una transformación potencial, dado un valor de lambda , se calcula primero la media Geométrica de los valores Y1 (K2). Después se sustituye este valor para calcular el parámetro K1.

Procedimiento para la selección del mejor valor de 

Primero se deben seleccionar el rango de valores de lambda  de los cuales se quiere seleccionar el que logra que la transformación se acerque al máximo a los datos. Para cada valor de  se realiza la transformación del paso anterior. Finalmente se sustituyen los valores de la o las variables explicativas en las diferentes funciones y se calculan los cuadrados de los residuales estadísticos. Aquella que tenga el menor valor de la suma de residuales será la mejor opción. Note que K2 es un valor fijo para todos los casos y que sólo hay que calcular de nuevo el valor K1.


Estadístico de
Anderson-Darling


¿Qué es el estadístico de Anders
on-Darling?

El estadístico Anderson-Darling mide qué tan bien siguen los datos una distribución específica. Para un conjunto de datos y distribución en particular, mientras mejor se ajuste la distribución a los datos, menor será este estadístico. Por ejemplo, usted puede utlizar el estadístico de Anderson-Darling para determinar si los datos cumplen el supuesto de normalidad para una prueba t.

Las hipótesis para la prueba de Anderson-Darling son:
  • H0: Los datos siguen una distribución especificada
  • H1: Los datos no siguen una distribución especificada

Utilice el valor p correspondiente (si está disponible) para probar si los datos provienen de la distribución elegida. Si el valor p es menor que un nivel de significancia elegido (por lo general 0.05 o 0.10), entonces rechace la hipótesis nula de que los datos provienen de esa distribución. Minitab no siempre muestra un valor p para la prueba de Anderson-Darling, porque este no existe matemáticamente para ciertos casos.

También puede utilizar el estadístico de Anderson-Darling para comparar el ajuste de varias distribuciones con el fin de determinar cuál es la mejor. Sin embargo, para concluir que una distribución es la mejor, el estadístico de Anderson-Darling debe ser sustancialmente menor que los demás. Cuando los estadísticos están cercanos entre sí, se deben usar criterios adicionales, como las gráficas de probabilidad, para elegir entre ellos.


Transformación de Johnson


La transformación de Johnson selecciona de manera óptima una de las tres familias de distribución para transformar los datos a fin de que sigan una distribución normal.
  1. Considera casi todas las funciones de transformación potencial del sistema de Johnson.
  2. Estima los parámetros en la función utilizando el método descrito en Chou, et al.1
  3. Transforma los datos utilizando la función de transformación.
  4. Calcula los estadísticos de Anderson-Darling y el valor p correspondiente para los datos transformados.
  5. Selecciona la función de transformación que tiene el valor p más grande que sea mayor que el criterio del valor p (el valor predeterminado es 0.10) que usted especifique en el cuadro de diálogo Transformar. De lo contrario, no es apropiado una transformación.















Comentarios

Entradas populares de este blog

1.12 Elaboración de procedimientos de operación, instrucciones de trabajo y ayudas visuales.

2.1.1 La variabilidad y sus orígenes en los procesos: Causas comunes de variación y causas especiales de variación.

2.1.8.4 Límites Naturales o reales en una carta de control VS Límites de Especificación.