Regresiones aparentemente no relacionadasEn econometría, las regresiones aparentemente no relacionadas o Seemingly unrelated regressions (SUR) por sus siglas en inglés[1][2][3][4][5] es un modelo, propuesto por Arnold Zellner en (1962), es una generalización de un modelo de una regresión lineal que consta de varias ecuaciones, cada uno con su propia variable dependiente y potencialmente diferentes conjuntos de variables explicativas exógenas. Cada ecuación es una regresión lineal válida por sí misma y se puede estimar por separado, por lo que el sistema se llama aparentemente sin relación,[3] aunque algunos autores sugieren que el término aparentemente relacionada sería más apropiado,[1] ya que los términos de error se supone que están correlacionados a través de las ecuaciones.[6] El modelo se puede estimar ecuación por ecuación utilizando métodos estándares como mínimos cuadrados ordinarios (MCO). Estas estimaciones son consistentes, sin embargo por lo general no son tan eficientes como con el método SUR, que asciende a mínimos cuadrados generalizados factibles con una forma específica de la matriz de varianza-covarianza. Hay dos casos importantes en los que el SUR es de hecho equivalente a los MCO, estos son: cuando los términos de error no tienen correlación entre las ecuaciones (para que sean verdaderamente no relacionadas), o cuando cada ecuación contiene exactamente el mismo conjunto de regresores del lado derecho. El modelo SUR puede ser visto ya sea como la simplificación del modelo lineal general donde ciertos coeficientes en la matriz están restringidos a ser iguales a cero, o como la generalización del modelo lineal general donde se permite a los regresores en la del lado de mano derecha sean diferentes en cada ecuación. El modelo SUR puede generalizarse aún más en el modelo de ecuaciones simultáneas, donde los regresores del lado derecho se les permite ser las variables endógenas así. El modeloSupongamos que hay m ecuaciones de regresión Aquí i representa el número de la ecuación, r = 1, …, R es el índice de la observación y estamos tomando la transpuesta de la vector columna. El número de observaciones R se supone que ser grande, de modo que en el análisis tomamos R → , Mientras que el número de ecuaciones m permanece fija. Cada ecuación i tiene una única variable de respuesta y del ir y un vector i k-dimensional de regresores x ir. Si apilamos observaciones correspondientes a la ecuación i-ésimo en vectores y matrices-R dimensional, a continuación, el modelo se puede escribir en forma vectorial como donde yi y εi son R×1 vectores, Xi es una matriz R×ki, y βi es un ki×1 vector.
La suposición del modelo es que los términos de error εir son independientes a lo largo del tiempo, pero pueden tener correlaciones contemporáneas cruzadas. Por lo tanto, suponemos que E[ εir εis | X ] = 0 siempre que r ≠ s, mientras que E[ εir εjr | X ] = σij. Denominando Σ = [σij] a matriz de skedasticity m × m de cada observación, la matriz de covarianza de los términos de error ε será igual a[4]: eq. (2.4) [6]: 332 donde IR es la matriz de identidad dimensional y ⊗ denota el producto matriz Kronecker.[7]: 197 EstimaciónEl modelo SUR generalmente se estima utilizando el método de mínimos cuadrados generalizados (FGLS) factible. Este es un método de dos pasos en el que en el primer paso ejecutamos la regresión ordinaria de mínimos cuadrados para (1). Los residuos de esta regresión se utilizan para estimar los elementos de la matriz :[7]: 198 En el segundo paso, ejecutamos la regresión por mínimos cuadrados generalizados para (1) usando la matriz de varianza : Este estimador es imparcial en muestras pequeñas suponiendo que los términos de error ε ir tienen una distribución simétrica; en muestras grandes es consistente y asintóticamente normal con distribución límite[7]: 198 Se sugirieron otras técnicas de estimación además del FGLS para el modelo SUR: el método de máxima verosimilitud (ML) bajo el supuesto de que los errores se distribuyen normalmente; los mínimos cuadrados iterativos generalizados (IGLS), donde los residuos del segundo paso de FGLS se utilizan para volver a calcular la matriz , luego estimar otra vez usando GLS, y así sucesivamente, hasta que se logre la convergencia; el esquema iterativo de mínimos cuadrados ordinarios (IOLS), donde la estimación se realiza sobre la base de ecuación por ecuación, pero cada ecuación incluye como regresores adicionales los residuos de las ecuaciones estimadas previamente para contabilizar las correlaciones de ecuaciones cruzadas, la estimación es ejecutar iterativamente hasta que se logre la convergencia. Kmenta y Gilbert (1968) llevaron a cabo un estudio de Monte Carlo y establecieron que los tres métodos (IGLS, IOLS y ML) arrojan los resultados numéricamente equivalentes; también encontraron que la distribución asintótica de estos estimadores es la misma que la distribución del FGLS. estimador, mientras que en muestras pequeñas ninguno de los estimadores fue más superior que los otros.[8] Zellner y Ando (2010) desarrollaron un método directo de Monte Carlo para el análisis bayesiano del modelo SUR.[9] Referencias
|
Portal di Ensiklopedia Dunia