Distribución uniforme discretaEn teoría de probabilidad y estadística, la distribución uniforme discreta es una distribución de probabilidad discreta simétrica que surge en espacios de probabilidad equiprobables, es decir, en situaciones donde de resultados diferentes, todos tienen la misma probabilidad de ocurrir. Un ejemplo simple de la distribución uniforme discreta es tirar los dados. Los valores posibles son 1, 2, 3, 4, 5, 6 y cada vez que se lanza el dado, la probabilidad de una puntuación determinada es de 1/6. Si se lanzan dos dados y se suman sus valores, la distribución resultante ya no es uniforme porque no todas las sumas tienen la misma probabilidad. Aunque es conveniente describir distribuciones uniformes discretas sobre enteros, como este, también se pueden considerar distribuciones uniformes discretas sobre cualquier conjunto finito . Por ejemplo, una permutación aleatoria es una permutación generada uniformemente a partir de las permutaciones de una longitud determinada, y un árbol de expansión uniforme es un árbol de expansión. generado uniformemente a partir de los árboles de expansión de un gráfico dado. La distribución uniforme discreta en sí misma es intrínsecamente no paramétrica. Es conveniente, sin embargo, para representar sus valores en general por todos los números enteros en un intervalo [ a , b ], de modo que a y b se convierten en los principales parámetros de la distribución (a menudo uno simplemente considera el intervalo [1, n ] con solo el parámetro n ). Con estas convenciones, la función de distribución acumulativa (CDF) de la distribución uniforme discreta se puede expresar, para cualquier k ∈ [ a , b ], como DefiniciónNotaciónSi es una variable aleatoria discreta cuyo soporte es el conjunto y tiene una distribución uniforme discreta entonces escribiremos . Función de probabilidadLa función de probabilidad de es para PropiedadesLa familia de distribuciones uniformes sobre rangos de números enteros (con uno o ambos límites desconocidos) tiene un estadístico suficiente de dimensión finita, es decir, el triple del máximo de la muestra, el mínimo de la muestra y el tamaño de la muestra, pero no es una familia exponencial de distribuciones, porque el soporte varía con los parámetros. Para las familias cuyo apoyo no depende de los parámetros, el teorema de Pitman-Koopman-Darmois establece que solo las familias exponenciales tienen una estadística suficiente cuya dimensión está acotada a medida que aumenta el tamaño de la muestra. La distribución uniforme es, por tanto, un ejemplo sencillo que muestra el límite de este teorema. Si entonces la variable aleatoria satisface algunas propiedades. MediaLa media de la variable aleatoria es: VarianzaLa varianza de la variable aleatoria es Suma
Dado trapezoidal de diez caras, numeradas 00, 10, 20, ···, 90.
Dado trapezoidal de diez caras, numeradas del 0 al 9.
EjemplosLa Universidad Politécnica de Madrid citó algunos ejemplos.[2]
Problema del tanque alemánSe puede formular el problema de la estimación del máximo en una población de la siguiente manera:
Para la estimación puntual (estimar un valor único para el total), el estimador de mínima varianza sin sesgo viene dado por la fórmula: donde m es el mayor número de serie observado (máximo de la muestra) y k es el número de tanques observado (tamaño de la muestra).[4][5][6] La fórmula puede entenderse como
En la primera ecuación, el primer sumando es el máximo y el segundo sumando es el hueco medio. El nombre del estimador (sin sesgo) se puede entender si consideramos que estamos tomando el máximo de la muestra como nuestra estimación básica y luego corrigiendo su sesgo, tendente a "subestimar" el verdadero máximo de la población, puesto que el máximo en la muestra puede ser igual o menor, pero nunca mayor que el máximo de la población. Nótese que, debido a la suposición de que no hay reemplazo, una vez se ha observado un número de serie, ya no se encuentra en el repositorio de observaciones y no puede volver a ser visto. Datos específicos Se han citado las siguientes estimaciones para algunos meses específicos:[8][9]
ContramedidasPara confundir el análisis de los números de serie, se pueden excluir los números de serie o reducir la información auxiliar utilizable. Alternativamente, se pueden utilizar números de serie que resistan el criptoanálisis, de forma más efectiva eligiendo números aleatoriamente sin reemplazo de una lista que sea mucho mayor que el número de objetos producidos, o produciendo números aleatorios y comprobándolos con la lista de números ya asignados; es probable que se produzcan colisiones a menos que el número de dígitos posibles sea más del doble del número de dígitos en el número de objetos producidos (donde el número de serie puede estar en cualquier base); véase problema del cumpleaños.[10] Para ello, se puede utilizar un generador de números pseudoaleatorios criptográficamente seguro. Todos estos métodos requieren una tabla de búsqueda (o romper el cifrado) para pasar del número de serie al orden de producción, lo que complica el uso de los números de serie: por ejemplo, no se puede recuperar un rango de números de serie, sino que hay que buscar cada uno por separado o generar una lista. Alternativamente, se pueden encriptar los números de serie secuenciales mediante un cifrado por sustitución simple, que permite una fácil decodificación, pero que también es fácilmente deducible mediante análisis de frecuencias: aún cuando se empiece desde un punto arbitrario, el texto sin formato tiene un patrón (o sea, los números se encuentran en secuencia). Hay un ejemplo de ello en la novela de Ken Follett Doble juego (Code to Zero), donde el encriptado de los números de serie del cohete Jupiter-C son obtenidos como:
La palabra clave aquí es Huntsville (donde se omiten las letras repetidas) lo que provee una clave de diez letras.[11] Por lo tanto el cohete número 13 era "HN", y el número del cohete 24 era "UT". Véase tambiénReferencias
|
Portal di Ensiklopedia Dunia