Test de shapiro wilk

Prueba de shapiro-wilk tamaño de la muestra

La hipótesis nula de esta prueba es que la población está distribuida normalmente. Por lo tanto, si el valor p es menor que el nivel alfa elegido, se rechaza la hipótesis nula y hay pruebas de que los datos analizados no están distribuidos normalmente. Por otro lado, si el valor p es mayor que el nivel alfa elegido, entonces no se puede rechazar la hipótesis nula (que los datos proceden de una población con distribución normal) (por ejemplo, para un nivel alfa de 0,05, un conjunto de datos con un valor p inferior a 0,05 rechaza la hipótesis nula de que los datos proceden de una población con distribución normal)[4].
Al igual que la mayoría de las pruebas de significación estadística, si el tamaño de la muestra no es lo suficientemente grande, esta prueba puede detectar incluso desviaciones triviales de la hipótesis nula (es decir, aunque puede haber algún efecto estadísticamente significativo, puede ser demasiado pequeño para tener alguna importancia práctica); por lo tanto, suele ser aconsejable una investigación adicional del tamaño del efecto, por ejemplo, un gráfico Q-Q en este caso[5].
La simulación de Monte Carlo ha revelado que Shapiro-Wilk tiene la mejor potencia para una significación determinada, seguida de cerca por Anderson-Darling cuando se comparan las pruebas de Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors y Anderson-Darling[6].

Hipótesis nula de la prueba de shapiro-wilk

La evaluación de la normalidad de los datos es un requisito previo para muchas pruebas estadísticas, ya que los datos normales son un supuesto subyacente en las pruebas paramétricas. Existen dos métodos principales para evaluar la normalidad: gráficamente y numéricamente.
Esta guía de «inicio rápido» le ayudará a determinar si sus datos son normales y, por tanto, si se cumple este supuesto en sus datos para las pruebas estadísticas. Los enfoques pueden dividirse en dos temas principales: basarse en pruebas estadísticas o en la inspección visual. Las pruebas estadísticas tienen la ventaja de emitir un juicio objetivo sobre la normalidad, pero tienen la desventaja de que a veces no son lo suficientemente sensibles a tamaños de muestra bajos o son demasiado sensibles a tamaños de muestra grandes. Por ello, algunos estadísticos prefieren utilizar su experiencia para emitir un juicio subjetivo sobre los datos a partir de los trazados/gráficos. La interpretación gráfica tiene la ventaja de permitir un buen juicio para evaluar la normalidad en situaciones en las que las pruebas numéricas podrían ser demasiado o poco sensibles, pero los métodos gráficos carecen de objetividad. Si no tiene mucha experiencia en la interpretación gráfica de la normalidad, probablemente sea mejor confiar en los métodos numéricos.

Estadística de la prueba de shapiro-wilk

La hipótesis nula de esta prueba es que la población está distribuida normalmente. Por lo tanto, si el valor p es menor que el nivel alfa elegido, se rechaza la hipótesis nula y hay pruebas de que los datos analizados no están distribuidos normalmente. Por otro lado, si el valor p es mayor que el nivel alfa elegido, entonces no se puede rechazar la hipótesis nula (que los datos proceden de una población con distribución normal) (por ejemplo, para un nivel alfa de 0,05, un conjunto de datos con un valor p inferior a 0,05 rechaza la hipótesis nula de que los datos proceden de una población con distribución normal)[4].
Al igual que la mayoría de las pruebas de significación estadística, si el tamaño de la muestra no es lo suficientemente grande, esta prueba puede detectar incluso desviaciones triviales de la hipótesis nula (es decir, aunque puede haber algún efecto estadísticamente significativo, puede ser demasiado pequeño para tener alguna importancia práctica); por lo tanto, suele ser aconsejable una investigación adicional del tamaño del efecto, por ejemplo, un gráfico Q-Q en este caso[5].
La simulación de Monte Carlo ha revelado que Shapiro-Wilk tiene la mejor potencia para una significación determinada, seguida de cerca por Anderson-Darling cuando se comparan las pruebas de Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors y Anderson-Darling[6].

Prueba de shapiro-wilk python

La hipótesis nula de esta prueba es que la población está distribuida normalmente. Por lo tanto, si el valor p es menor que el nivel alfa elegido, entonces se rechaza la hipótesis nula y hay pruebas de que los datos analizados no están distribuidos normalmente. Por otro lado, si el valor p es mayor que el nivel alfa elegido, entonces no se puede rechazar la hipótesis nula (que los datos proceden de una población con distribución normal) (por ejemplo, para un nivel alfa de 0,05, un conjunto de datos con un valor p inferior a 0,05 rechaza la hipótesis nula de que los datos proceden de una población con distribución normal)[4].
Al igual que la mayoría de las pruebas de significación estadística, si el tamaño de la muestra no es lo suficientemente grande, esta prueba puede detectar incluso desviaciones triviales de la hipótesis nula (es decir, aunque puede haber algún efecto estadísticamente significativo, puede ser demasiado pequeño para tener alguna importancia práctica); por lo tanto, suele ser aconsejable una investigación adicional del tamaño del efecto, por ejemplo, un gráfico Q-Q en este caso[5].
La simulación de Monte Carlo ha revelado que Shapiro-Wilk tiene la mejor potencia para una significación determinada, seguida de cerca por Anderson-Darling cuando se comparan las pruebas de Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors y Anderson-Darling[6].

Acerca del autor

admin

Ver todos los artículos