regresiones que aparentemente no estan relacionadas

Amanda Hein | Download | HTML Embed
  • Apr 19, 2001
  • Views: 58
  • Page(s): 12
  • Size: 53.45 kB
  • Report

Share

Transcript

1 BANCO CENTRAL DE COSTA RICA DIVISIN ECONMICA DEPARTAMENTO DE INVESTIGACIONES ECONMICAS NT-06-96 REGRESIONES QUE APARENTEMENTE NO ESTAN RELACIONADAS (SUR) Rigoberto Araya Monge Juan E. Muoz Gir NOVIEMBRE, 1996

2 REGRESIONES QUE APARENTEMENTE NO ESTAN RELACIONADAS (SUR) El documento desarrolla la tcnica economtrica conocida como SUR, la cual constituye un caso muy especfico de un sistema de ecuaciones simultneas en el que la correlacin entre las ecuaciones se origina entre los errores de stas y no en la incorporacin de variables endgenas como variables predeterminadas en otras ecuaciones del sistema. A manera de ejemplo, la tcnica se aplica a la estimacin de funciones de oferta de exportaciones agrcolas e industriales consideradas no tradicionales. En el documento se citan otros casos en los que las regresiones aparentemente no relacionadas se pueden aplicar. I.INTRODUCCIN Usualmente, cuando la econometra avanzada hace referencia a los modelos de ecuaciones simultneas, se piensa de inmediato en aquellos sistemas en los que se especifican variables endgenas en algunas ecuaciones como predeterminadas en otras ecuaciones del mismo modelo. Bajo esta especificacin existe entonces una correlacin identificable de los trminos de error entre las ecuaciones del sistema.1 Para las ecuaciones simultneas, la aplicacin del mtodo de mnimos cuadrados ordinarios (MCO) resulta en estimadores sesgados y con errores cuadrados medios que pueden ser bastante elevados, especialmente en muestras pequeas. De aqu que se utilizan procedimientos especializados tales como la estimacin recursiva, los mnimos cuadrados en dos y tres etapas (MC2E, MC3E), o bien la estimacin mximo verosmil con informacin limitada (LIML, de Limited-Information Maximum Likelihood) o con informacin completa (FIML, de Full-Information Maximum Likelihood). Sin embargo, considrese un conjunto de ecuaciones de regresin de la siguiente forma: (1) y 1i = 1 + 2 X 2 i + 3 X 3 i +L+ K X Ki + u 1 i y 2 i = 1 + 2 X2 i + 3 X3i +L+ K XKi + u2 i y 3i = 1 + 2 X2 i + 3 X3 i +L+K XKi + u 3 i M y Mi = 1 + 2 X2 i + 3 X3 i +L+K XKi + u Mi i = 1, . . . , N En este sistema existen M variables endgenas denotadas como yMi, cada una asociada con un trmino de error uMi, as como con un conjunto de K variables exgenas XKi. La relacin entre las variables endgenas y las exgenas est dada por los coeficientes K. El nmero de observaciones i para cada variable (endgenas, exgenas y trminos de error) es de N. En principio se podra razonar que, al no observarse variables endgenas yMi como variables predeterminadas en otras ecuaciones del sistema, cada una de las ecuaciones podra ser estimada con el uso de mnimos cuadrados ordinarios. Esto sera posible si las ecuaciones fueran completamente independientes en el sentido de que la variabilidad de alguna de las 1 No debe confundirse con el problema de autocorrelacin, el cual toma lugar cuando existe correlacin de los trminos de error dentro de cada ecuacin. 1

3 variables endgenas no afectara el comportamiento de alguna otra ecuacin. En el vocabulario economtrico ello sera equivalente a decir que la matriz de variancias y covariancias del sistema de ecuaciones tiene tringulos iguales a cero. En otras palabras, sera una matriz con una diagonal diferente de cero y cuyas entradas seran las variancias de los trminos de error de cada ecuacin. Esta conjetura, sin embargo, podra ser incorrecta si se detectara algn tipo de movimiento simultneo de todas las ecuaciones originado por una supuesta relacin contempornea entre los trminos de error que no se origina por la presencia de variables endgenas como variables predeterminadas en las ecuaciones. Es decir, las regresiones que no estn aparentemente correlacionadas, s lo estaran por medio de correlaciones implcitas, sin modelar especficamente, entre los trminos de error. Las siglas SUR provienen del nombre que recibe en ingls este sistema de ecuaciones (Seemingly Unrelated Regressions). Como ejemplos de regresiones SUR se pueden considerar los siguientes : 1.Para un conjunto de bancos comerciales se pueden obtener observaciones de sus niveles de utilidades y expresarlos en funcin de variables propias de cada banco, como por ejemplo nivel de crdito, riesgos asociados con la cartera, concentracin de los activos, nivel de endeudamiento, etc. En principio, se podra suponer que las utilidades de cada banco responden a la poltica de cada uno de ellos. Sin embargo, se puede pensar en un escenario en el que las ecuaciones de las utilidades podran mostrar covariancias por medio de los trminos de error, lo cual convertira al modelo en un sistema SUR. 2.Los modelos SUR pueden ser de gran utilidad para modelar sistemas de demanda ya sean de gasto lineal o de otras formas. Lo importante de destacar es que el procedimiento de estimacin permitira obtener estimadores insesgados de las elasticidades cruzadas de las ecuaciones de demanda de los diferentes bienes en el sistema. Pueden ser aplicables a casos particulares tales como demandas por bienes de consumo similares (productos lcteos, cigarrillos, cervezas, por ejemplo), demandas por diferentes activos financieros, ofertas de productos agrcolas, etc. 3.En un contexto macroeconmico se podra plantear el inters de medir el impacto que sobre la inflacin de un grupo de pases tendra un cambio en el precio internacional de los combustibles. Como estos, se podran seguir citando casos especficos en los que se aplicara el procedimiento de regresiones SUR. El aspecto importante por rescatar es la posibilidad que existe de cometer un serio error por considerar independientes a varias ecuaciones de regresin, cuando en realidad estn asociadas por medio de los trminos de error. No existe un procedimiento economtrico que le diga al investigador que tiene que aplicar el mtodo SUR. Slo la experiencia y el conocimiento terico le permitiran identificar la necesidad de utilizarlo. II.LA ESPECIFICACIN DEL MODELO GENERAL Suponga que la representacin matricial de la m-sima ecuacin del sistema (1) es de la siguiente forma: (2) y m = X m m + Um m = 1,. . .,M 2

4 donde los vectores y y U son de orden (N x 1), X es una matriz de orden (N x Km ), donde Km es el nmero de variables exgenas en la m-sima ecuacin,2 y m es un vector de parmetros de orden (Km x 1). Al considerar las M ecuaciones de forma matricial se tiene la siguiente representacin: y1 X 1 0 L 0 1 U 1 y 0 X2 L 0 2 U 2 (3) 2 = + M M M O M M M y M 0 0 L X M M U M la cual se puede expresar, en forma matricial, como: (4) Y = X + U donde la dimensin de Y es (MN x 1), la de X es (MN x K), la de es (K x 1), y la de U es (MN x M 1). En este caso, K = K m . m =1 Dado que umi es el valor observado del trmino de error de la m-sima ecuacin en el i-simo perodo, el supuesto de correlacin contempornea de los errores, pero no correlacin serial, [ ] implica que E u mi u js = si i = s, pero es igual a cero si i s. En otras palabras, cuando los mj perodos i y s coinciden existe una covariancia diferente de cero entre los errores de las ecuaciones m y j. En forma matricial se puede especificar una matriz de variancias y [ ] covariancias para las ecuaciones m y j como E U m U1j = mj I N , donde I es la matriz identidad de orden N. Para los M vectores de trminos de errores existe una matriz de variancias y covariancias que asume la siguiente forma: 11 I N 12 I N L 1M I N I 22 I N L 2 M I N (5) = E[ UU1 ] = 21 N = IN M M O M M 1 I N M 2 I N L MM I N donde es el producto Kronecker y la matriz de variancias y covariancias de la forma: 11 12 L 1M 22 L 2 M (6) = 21 M M O M M 1 M 2 L MM 2 El nmero de variables exgenas no tiene que ser el mismo para cada una de las ecuaciones. Es ms, la eficiencia del mtodo SUR aumenta en el tanto que las variables X muestren una menor asociacin entre ecuaciones. 3

5 La matriz es simtrica y se supone que es positiva definida y que no es singular.3 Note en esta estructura matricial que el producto mj IN denota que los trminos de error dentro de cada ecuacin son homocedsticos (variancia del error constante) y que no tienen autocorrelacin en el tiempo. III.ESTIMACIN CON MATRIZ CONOCIDA Dado que el modelo no involucra la simultaneidad de las variables endgenas en el sentido de los sistemas de ecuaciones simultneas, el procedimiento de estimacin de un modelo SUR, cuando son conocidas las variancias y covariancias de la matriz , es el correspondiente al de mnimos cuadrados generalizados. En este caso, el estimador toma la forma: $ = [ X11 X] X11 Y 1 (7) la cual es equivalente a: [ ] $ = X1 ( 1 I) X X1 ( 1 I ) Y 1 (8) Este estimador es de la clase MELI, es decir, el mejor estimador lineal insesgado. El estimador expresado detalladamente es de la forma: M 1m 1 $1 11 X 11 X 1 1 X 1 ym 12 X 11 X 2 L 1 M X 11 X M mM=1 $ 21 1 2m X 1 y X2 X1 22 X 12 X 2 L 2 M X 21 X M (9) = 2 = $ 2 m M M M O M m =1 $ M1 1 M M X M X 1 X M X 2 M2 1 L MM X 1M X M M Mm X 1M y m m = 1 donde los escalares mj corresponden al elemento (m,j) de la matriz inversa de . La matriz de variancias y covariancias del estimador mnimo cuadrtico generalizado de es: [ $ ) = ( X 11 X) 1 = X1 ( 1 I) X ] 1 (10) VAR ( En la discusin de los estimadores SUR hay tres aspectos que destacar sobre su eficiencia (entendida como variancia mnima). Primero, cuanto ms elevada la correlacin contempornea de los trminos de error entre ecuaciones mayor ser la ganancia en eficiencia del estimador generalizado. Esto conduce al segundo aspecto de que si la correlacin contempornea es muy baja (los tringulos de la matriz se aproximan a cero), no hay una ganancia importante por aplicar la regresin SUR a las ecuaciones en vez de utilizar los mnimos cuadrados ordinarios en cada ecuacin. Tercero, si cada una de las ecuaciones del 3 El producto Kronecker es la expansin de cada una de las entradas de una matriz (en este caso las variancias y covariancias de la matriz ) por una matriz (en este ejemplo IN). Se dice que una matriz es simtrica cuando las entradas de sus tringulos superior e inferior son iguales. 4

6 sistema tiene las mismas variables exgenas, entonces los estimadores SUR son equivalentes a los mnimos cuadrados ordinarios. En general, cualquier ganancia en eficiencia (mnima variancia) tiende a ser mayor cuando las variables explicativas en las diferentes ecuaciones no estn altamente correlacionadas. IV.ESTIMACIN CON MATRIZ DESCONOCIDA En la prctica economtrica es poco probable contar con los verdaderos valores de las variancias y covariancias (mj ) de los errores, por lo que es necesario recurrir a una estimacin preliminar de los errores. Este procedimiento se logra mediante la aplicacin del mtodo de mnimos cuadrados ordinarios a cada una de las ecuaciones del sistema. El estimador es de la forma b m = ( X1m X) 1 X1m y m , el cual permite obtener una primera estimacin de errores mnimo cuadrticos u$ m = y m Xm b m para cada ecuacin. Si bien las variancias y covariancias calculadas con estos errores mnimo cuadrticos son sesgadas en muestras pequeas, tienen la propiedad de consistencia que permite continuar con el procedimiento SUR. La forma genrica de clculo es la siguiente: $ mj = 1 u$ 1m u$ j = 1 u$ mi u$ ji N (11) N N i =1 Si se definiera $ como la matriz de variancias y covariancias conformada por las estimaciones $ mj , el correspondiente estimador mnimo cuadrtico generalizado asume la forma: ~ [ ( ) ] ( ) 1 (12) $ 1 I X X 1 = X1 $ 1 I Y Este estimador es de uso generalizado y en la literatura se le conoce como el estimador mnimo cuadrtico generalizado de Zellner. Sin embargo, otro estimador con propiedades asintticas ms deseables es el de carcter iterativo. Es decir, una vez que se cuenta con los estimadores de la frmula (12), se calculan los errores y las variancias a partir de ellos, los cuales se utilizan en un nuevo clculo de los mnimos cuadrados generalizados. El procedimiento se repite hasta que la funcin de verosimilitud alcance un mximo. En el tanto que las variancias y covariancias tiendan a permanecer constantes, ambos procedimientos (el de Zellner y el iterativo) tienen la misma distribucin lmite. Esta distribucin es aproximadamente normal con una media y con una matriz de variancias y covariancias [ ( ) ] 1 $ 1 I X consistentemente estimada por X 1 . Por consiguiente, el estimador de Zellner y el estimador iterado sern asintticamente ms eficientes que el estimador mnimo cuadrtico. En muestras finitas, sin embargo, existe una regin en el espacio paramtrico de en la que el estimador mnimo cuadrtico es ms eficiente. Es el caso cuando la prdida de eficiencia originada por el uso de una estimacin de , en vez de la verdadera matriz, es mayor que la ganancia obtenida por utilizar un estimador mnimo cuadrtico generalizado (especialmente si las correlaciones contemporneas entre los errores son pequeas). El caso extremo es cuando es diagonal y el estimador mnimo cuadrtico es el relevante. V.PRUEBA PARA CORRELACIN CONTEMPORNEA 5

7 Como se ha mencionado anteriormente, si no existiera correlacin contempornea el mtodo de estimacin ms eficiente es el de los mnimos cuadrados generalizados. Por tanto, es recomendable llevar a cabo una prueba de hipotsis para determinar si las covariancias contemporneas son iguales a cero. Las hiptesis para esta prueba son: H0 : mj = 0 H1 : al menos una de las covariancias es diferente de cero La prueba estadstica apropiada es el multiplicador de Lagrange, recomendado por Breusch y Pagan, el cual se calcula como: M m 1 d.a . (13) = N r mj2 2M( M 1)/ 2 m= 2 j=1 donde r2 es el coeficiente de correlacin cuadrado calculado como:4 $ 2mj (14) rmj2 = $ mm $ jj Luego de exponer estos aspectos tericos, se prosigue con una aplicacin del mtodo SUR a un caso especfico de estimacin de funciones de oferta de exportaciones de productos no tradicionales. El ejemplo no pretende un anlisis econmico de los determinantes de las exportaciones. El objetivo es, precisamente, el desarrollo prctico de la tcnica economtrica y la explicacin de los resultados que de ella se pueden desprender. VI.UNA APLICACIN ECONOMTRICA Como ejemplo de aplicacin, supngase que existe el inters de estimar los parmetros de los determinantes de las ofertas de exportaciones de productos no tradicionales, las cuales se definen de la siguiente forma:5 (15) XNTAi = c1 + c2 VAAK i + c 3 TI i + c 4 ITCERAAi + u1i (16) XNTI I = c5 + c 6VAIK i + c 7 TI i + c8 ITCERAI i + u2 i donde: XNTA: valor en trminos constantes de las exportaciones de productos agrcolas no tradicionales, calculado en millones de dlares XNTI: valor en trminos constantes de las exportaciones de productos industriales no tradicionales, calculado en millones de dlares. VAAK: valor agregado en trminos constantes de la produccin agrcola expresado en dlares. 4 Las letras d.a. indican distribucin asinttica. 5 El ao base para el clculo de los trminos constantes es 1966. 6

8 VAIK: valor agregado en trminos constantes de la produccin industrial expresado en dlares. TI: trminos de intercambio. ITCERAA: ndice del tipo de cambio real ajustado por los certificados de abono tributario otorgados al sector agrcola no tradicional. ITCERAI: ndice del tipo de cambio real ajustado por los certificados de abono tributario otorgados al sector industrial no tradicional. Para llevar a cabo la estimacin de los parmetros de acuerdo con el mtodo de Zellner se procede, en primera instancia, a estimar las ecuaciones (15) y (16) con el uso del mtodo de mnimos cuadrados ordinarios. Los resultados se presentan a continuacin. VARIABLE DEPENDIENTE: EXPORTACIONES AGRCOLAS NO TRADICIONALES (XNTA) PERODO: 1971-1994 NMERO DE OBSERVACIONES DISPONIBLES: 24 VARIABLE COEFICIENTE DESVIACIN ESTADSTICO T SIGNIFICANCIA ESTNDAR Constante -9.650261 700.5626 -0.013775 0.9891 VAAK(-2) 0.363583 0.142075 2.559088 0.0187 TI(+1) 0.552832 0.116629 4.740099 0.0001 ITCERAA 0.000794 0.045120 0.017605 0.9861 R2 0.982819 R2 ajustado 0.980242 Durbin-Watson 1.901055 Prueba F 0.000000 7

9 VARIABLE DEPENDIENTE: EXPORTACIONES INDUSTRIALES NO TRADICIONALES (XNTI) PERODO: 1971-1994 NMERO DE OBSERVACIONES DISPONIBLES: 24 VARIABLE COEFICIENTE DESVIACIN ESTADSTICO T SIGNIFICANCIA ESTNDAR Constante 394.1428 1257.450 0.313446 0.7572 VAIK(-2) 0.949121 0.054992 17.25920 0.0000 TI(+1) 0.425608 0.126951 3.352547 0.0032 ITCERAI -0.004476 0.022392 -0.199908 0.8436 R2 0.994623 R2 ajustado 0.993816 Durbin Watson 2.012526 Prueba F 0.000000 Las variables estn expresadas en sus niveles originales para una muestra de frecuencia anual desde 1969 hasta 1995. Los resultados muestran la importancia del valor agregado, como variable de escala, pero con un rezago de dos perodos en relacin con el perodo de exportacin. Adicionalmente, la variable de trminos de intercambio mejora sensiblemente los resultados cuando se considera como una expectativa de precios para el ao siguiente.6 Los tipos de cambio reales no tienen significancia, pero no se excluyen del siguiente paso a la espera de que mejoren su importancia con el mtodo SUR. Si bien los resultados son satisfactorios con la aplicacin del mtodo tradicional de estimacin, se contina con la aplicacin de la tcnica SUR. El segundo paso consiste en valorar el coeficiente de correlacin de las series de errores de ambas ecuaciones. Ese coeficiente se ubica en 0,41, el cual se puede considerar en el rango moderado de correlacin. Para seguir adelante se procede a aplicar el comando SUR del paquete economtrico TSP. Los resultados son los siguientes:7 6 La consideracin de los trminos de intercambio adelantados en un perodo implican previsin perfecta por parte de los exportadores, en contraposicin al tradicional rezago que se podra incluir como una previsin ingenua. 7 Con el propsito de valorar en toda su extensin los resultados del ajuste, se dejan explcitas las variables que no son significativas. 8

10 VARIABLES DEPENDIENTES EXPORTACIONES AGRCOLAS NO TRADICIONALES Y EXPORTACIONES INDUSTRIALES NO TRADICIONALES MTODO DE ESTIMACIN: REGRESIONES QUE APARENTEMENTE NO ESTN RELACIONADAS (SUR) PERODO: 1969- 1995 ECUACIN DE EXPORTACIONES AGRCOLAS NO TRADICIONALES (XNTA) VARIABLES COEFICIENTE DESVIACIN ESTADSTICO T SIGNIFICANCIA ESTNDAR Constante -62.68822 638.8089 -0.098133 0.9223 VAAK( -2) 0.569217 0.121249 4.694622 0.0000 TI(+1) 0.388051 0.099870 3.885542 0.0004 ITCERAA 0.001736 0.040977 0.042367 0.9664 R2 0.981020 R2 ajustado 0.978173 Durbin-Watson 1.890328 ECUACIN DE EXPORTACIONES INDUSTRIALES NO TRADICIONALES (XNTI) VARIABLES COEFICIENTE DESVIACIN ESTADSTICO T SIGNIFICANCIA ESTNDAR Constante 454.2318 1142.665 0.397520 0.6931 VAIK(-2) 0.938786 0.046931 20.00342 0.0000 TI(+1) 0.447956 0.109254 4.100149 0.0002 ITCERAI -0.005126 0.020321 -0.252232 0.8022 R2 0.994613 R2 ajustado 0.993805 Durbin-Watson 2.020880 En general se puede observar que las significancias de las estimaciones mejoran con el mtodo SUR para el caso de la primera ecuacin, especficamente. Adems, el estadstico t asociado con VAAK(-2) en la primera ecuacin muestra una variacin importante, as como tambin el correspondiente a los trminos de intercambio en la segunda ecuacin. Las variables de tipo de cambio real y las constantes, aun cuando insignificantes, mejoran sutilmente su importancia. VII.COMENTARIOS FINALES Si bien el ejemplo desarrollado no captura plenamente la ganancia de eficiencia del mtodo SUR, habra que considerar la posibilidad de buscarla al incorporar funciones de oferta de los restantes productos de exportacin, con lo cual se completara el marco global del sector exportador. En efecto, recurdese que el coeficiente de correlacin entre los trminos de error de las dos ecuaciones se ubica en 0,41, lo cual conduce a un estadstico Breusch-Pagan relativamente bajo (0,17). No es de esperar entonces una ganancia importante en la eficiencia de la estimacin. Sin embargo, lo importante de resaltar en este ejercicio es la introduccin de un mtodo de estimacin simultnea que puede rendir mejores resultados en aplicaciones prcticas tales como las mencionadas en este documento. Adems, con la incorporacin de paquetes economtricos con tcnicas avanzadas como SUR se ampliar y se mejorar considerablemente el mbito de accin de los estudios economtricos. [email protected] 9

11 F:....\NT\NT1996\NT-06-96.DOC 10

Load More