En estadística el criterio de Cramér-von Mises se emplea para juzgar la bondad de una función de distribución acumulada comparada con una función de distribución empírica , o para comparar dos distribuciones empíricas. También se utiliza como parte de otros algoritmos, tal como la estimación de la distancia mínima. Se define como:
Aplicándolo a una única muestra, es la distribución teórica y es la empírica. Alternativamente las dos distribuciones pueden ser estimadas empíricamente; esto se conoce como un caso de dos muestras.
El criterio lleva los apellidos de Harald Cramér y Richard Edler von Mises, quienes fueron los primeros en exponerlo entre los años 1928-1930. La generalización de las dos muestras es obra de Theodore Wilbur Anderson.[1]
El criterio es una alternativa al test de Kolmogorov-Smirnov.
Test de Cramér-von Mises (una muestra)
Sean los valores observados, en orden creciente. Entonces el estadístico es[1]: 1153 [2]
Si este valor es mayor que el valor tabulado, se puede rechazar la hipótesis de que los datos provienen de la distribución
Test de Watson
Una versión modificada del criterio es el test de Watson,[3] el cual usa el estadístico U2, donde[2]
donde
Test de Cramér–von Mises test (dos muestras)
Sean y los valores observados en la primera y segunda muestra respectivamente, en orden creciente. Sean los rangos de x en la muestra combinada, y sean los rangos de y en la muestra combinada. Anderson[1]: 1149 muestra que
donde U se define como
Si el valor de T es mayor que los valores tabulados,[1]: 1154–1159 se puede rechazar la hipótesis de que las dos muestras provienen de la misma distribución. Esto implica que no hay duplicados en , , y en las secuencias . Por tanto es única, y su rango es en . Si hay duplicados, y en son valores idénticos, donde se puede utilizar el enfoque del medio rango[4] método: asignar a cada duplicado un rango de . En las ecuaciones precedentes, en las expresiones y , los duplicados pueden alterar las cuatro variables , , , y .
Referencias
- ↑ a b c d Anderson (1962)
- ↑ a b Pearson & Hartley (1972) p 118
- ↑ Watson (1961)
- ↑ Ruymgaart (1980)
Bibliografía
- Anderson, TW (1962). «On the Distribution of the Two-Sample Cramer–von Mises Criterion» (PDF). The Annals of Mathematical Statistics (Institute of Mathematical Statistics) 33 (3): 1148-1159. ISSN 0003-4851. doi:10.1214/aoms/1177704477. Consultado el 12 de junio de 2009.
- M. A. Stephens (1986). «Tests Based on EDF Statistics». En D'Agostino, R.B. and Stephens, M.A., ed. Goodness-of-Fit Techniques. New York: Marcel Dekker. ISBN 0-8247-7487-6.
- Pearson, E.S., Hartley, H.O. (1972) Biometrika Tables for Statisticians, Volume 2, CUP. ISBN 0-521-06937-8 (page 118 and Table 54)
- Ruymgaart, F. H., (1980) "A unified approach to the asymptotic distribution theory of certain midrank statistics". In: Statistique non Parametrique Asymptotique, 1±18, J. P. Raoult (Ed.), Lecture Notes on Mathematics, No. 821, Springer, Berlín.
- Watson, G.S. (1961) "Goodness-Of-Fit Tests on a Circle", Biometrika, 48 (1/2), 109-114
Lecturas
Enlaces externos