Notación de placasEn la inferencia bayesiana, la notación de placas es un método para representar variables que se repiten en un modelo gráfico. En lugar de dibujar cada variable repetida individualmente, se usa una placa o rectángulo para agrupar variables que se repiten juntas en un subgrafo , y se dibuja un número en la placa para representar el número de repeticiones del subgrafo en la placa.[1] Los supuestos son que el subgrafo se duplica muchas veces, las variables en el subgrafo están indexadas por el número de repetición, y cualquier enlace que cruza un límite de placa se replica una vez por cada repetición del subgrafo.[2] EjemploEn este ejemplo, consideramos Latent Dirichlet Allocation , una red bayesiana que modela cómo los documentos en un corpus están relacionados tópicamente. Existen dos variables que no están en ninguna placa; α es el parámetro del Dirichlet uniforme anterior en las distribuciones de temas por documento, y β es el parámetro del Dirichlet uniforme anterior en la distribución de palabras por tema. La placa más externa representa todas las variables relacionadas con un documento específico, que incluyen , la distribución del tema para el documento i. La M en la esquina de la placa indica que las variables internas se repiten M veces, una vez para cada documento. La placa interna representa las variables asociadas a cada una de las palabras en el documento i: es el tema para la palabra jotaésima en el documento i, y es la palabra real utilizada.
La N en la esquina representa la repetición de las variables en la placa interna veces, una vez para cada palabra en el documento i. El círculo que representa las palabras individuales está sombreado, lo que indica que cada es observable, y los otros círculos están vacíos, lo que indica que las otras variables son variables latentes. Los bordes dirigidos entre variables indican dependencias entre las variables: por ejemplo, cada depende de y β. ExtensionesVarios autores crearon una serie de extensiones para expresar más información que simplemente las relaciones condicionales. Sin embargo, pocos de estos se han convertido en estándar. Quizás la extensión más comúnmente utilizada es usar rectángulos en lugar de círculos para indicar variables no aleatorias, ya sea parámetros a calcular, hiperparámetros con un valor fijo (o calculado a través de Bayes empíricos), o variables cuyos valores se calculan de manera determinista a partir de una variable aleatoria. El diagrama que aparece arriba muestra algunas convenciones no estándar usadas en algunos artículos en Wikipedia (por ejemplo, Bayes variacional):
Implementación de softwareLa notación de placas se implementó en varios paquetes de dibujo de TeX/LaTeX, pero también como parte de interfaces gráficas de usuario para los programas estadísticos bayesianos como BUGS y BayesiaLab. Referencias
|
Portal di Ensiklopedia Dunia