Sunspots. La actividad solar

vista por la estadística.

 

  1. INTRODUCCIÓN

 

Este trabajo es el resultado final de varias semanas de dedicación a la asignatura de series temporales cuyo fin último era la aplicación de las técnicas estudiadas al análisis de una serie temporal real, con el fin de poner en práctica todo aquello que en los libros se nos presenta de una manera teórica. Para llegar a este punto han sido necesarias varias fases, todas ellas imprescindibles para conseguir un resultado como mínimo aceptable, que se han dilatado en el tiempo durante 10 semanas. Las 5 primeras semanas fueron dedicadas exclusivamente al estudio de la teoría de series temporales, consulta de libros, repaso de apuntes, uso de las técnicas necesarias para el análisis, así como al uso de programas necesarios para realizar el estudio (E-Views, Statgraphics) y dominio de los mismos. Tras esta primera fase, vital para entender la asignatura y aquello que pretendíamos hacer, nos encontramos ya en disposición de emprender un análisis más o menos serio y riguroso (todo lo serio y riguroso que nos permiten nuestros conocimientos en esta materia) de una serie temporal real. Aquí llega la segunda fase, la elección de la serie. Esto nos resulta bastante fácil ya que existe una serie temporal que llama nuestra atención, la serie anual de las manchas solares. Las manchas solares son regiones oscuras de dimensiones muy variadas compuestas por un núcleo central llamado sombra, rodeado de amplias fajas llamadas penumbras, que aparecen a veces formando agrupaciones que pueden llegar a alcanzar varios centenares de miles de kilómetros de longitud, siendo visibles en tal caso a simple vista desde la tierra. Se tiene registro de este tipo de actividad solar desde el siglo XVIII, y lo que se mide es el número medio de manchas anuales. El siguiente paso es por tanto, buscar la serie, lo que nos lleva cerca de una semana. Tras localizar la serie en diversas fuentes que no nos satisfacen, por poseer poca cantidad de observaciones, damos con la serie en la página web del IAAT, Instituto para la Astronomía y la Astrofísica de Tübingen (Alemania), (http://astro.uni-tuebingen.de) en donde encontramos un acceso mediante ftp a un archivo con los datos que pretendemos obtener (ftp.ngdc.noaa.gov). Conseguido esto comienza la tercera y última fase del estudio, que nos ocupará durante cuatro semanas y servirá para poner en práctica todo aquello que hemos visto y leído en los libros de series temporales. El análisis de la serie se hará siguiendo la metodología Box-Jenkins, cuyo libro se convierte en el principal instrumento de consulta a la hora de resolver cualquier duda que se nos plantea por el camino. Los pasos a seguir a partir de ahora serán los siguientes:

 

 2. DATOS

Los datos corresponden al periodo 1700-1997 y muestran la media anual de manchas solares observadas, pero una primera mirada al documento nos indica que a partir de 1944 el método de recogida es distinto a como se venía haciendo hasta ese año. Hasta 1944 la media anual se obtiene como la media de las medias mensuales, mientras que desde 1945 la media se calcula como la media de las medias diarias. Esta falta de homogeneidad en el método de recogida nos lleva a desechar las últimas 53 observaciones, ya que la variabilidad es mucho mayor, y esta variabilidad no es debida al comportamiento de la serie sino a la manera de obtener los datos. De manera que para nuestro estudio nos quedamos con los datos observados para el periodo 1700-1944, de los cuales guardaremos los 44 últimos para, una vez ajustado un modelo a la serie, comprobar el comportamiento del mismo a la hora de predecir, es decir, los últimos datos nos servirán para hacer un diagnóstico del modelo.

Si quieres los datos en formato *.txt pulsa AQUÍ para bajártelos.

El primer paso será el análisis gráfico y exploratorio de la serie.

 

3. ANALISIS GRÁFICO Y EXPLORATORIO

En este punto analizaremos el gráfico de la serie así como su función de autocorrelación y de autocorrelación parcial con el fin de determinar si la serie es estacionaria, transformarla si no lo es, y una vez estacionarizada, identificar el modelo ARMA, y los órdenes p y q de dicho modelo.

Una serie estacionaria es aquella que es estable en la media y en la varianza a lo largo del tiempo (y en su estructura probabilística). Otra herramienta para ver si la serie es estacionaria o no es la función de autocorrelación, la cuál debe tener un rápido decrecimiento a cero. Veamos los gráficos de la serie y de la función de autocorrelación (ACF).

 

 

El gráfico de la serie nos muestra que la varianza es aproximadamente constante para todo el intervalo, así como la media, que medida en dos intervalos distintos, es prácticamente igual. Esto nos hace pensar que la serie es estacionaria. Si miramos la ACF observamos un decrecimiento hacia cero. A partir del retardo 11 las correlaciones caen por debajo de las bandas ± 2s , de manera que no son significativas. Si bien la estacionariedad de la serie no es del todo obvia, un análisis gráfico de la primera y segunda diferencia no nos deja clara la necesidad de diferenciar la serie, algo que ya pensábamos a la vista de los gráficos anteriores. En cualquier caso, nuestras dudas se despejan al realizar el contraste de Dickey-Fuller, que deja claro que no es necesario diferenciar la serie (el p-valor es 0.000, t = -5.085). Trabajaremos pues con la serie original. Siguiendo la metodología Box-Jenkins, el siguiente paso será la identificación del modelo.

 

4. IDENTIFICACIÓN DEL MODELO

 

Las principales herramientas que usaremos para tratar de identificar el modelo serán la función de autocorrelación (ACF) y la función de autocorrelación parcial (PACF). El modelo parece que no va a ser un MA(q), ya que como hemos visto, la ACF no se hace cero a partir de un retardo (característica de los modelos MA), sino que decrece a cero. Además debido a la forma sinusoidal de la ACF podemos adelantar que el polinomio característico tendrá raíces complejas. Veamos pues si es un proceso autoregresivo o un modelo mixto ARMA, para ello utilizaremos la función de autocorrelación parcial.

 

A la vista de este gráfico y del de la ACF, podemos identificar claramente el modelo como un proceso autoregresivo, ya que la función de autocorrelación decae a cero, mientras que la función de autocorrelación parcial se hace significativamente cero a partir de un cierto retardo. Identificado el modelo como AR, queda por determinar el orden del modelo. A la vista del gráfico el modelo es un AR(2) o quizá un AR(8) con varios coeficientes igual a cero, de manera que estimaremos ambos modelos y decidiremos cuál es el válido sobre la base de ciertos criterios como el AIC o el criterio de Schwarz (BIC).

 5. ESTIMACIÓN DE LOS PARAMETROS

 

El modelo ha sido identificado como un proceso autoregresivo de orden p. El modelo se escribe:

 

Xt = m + f 1Xt-1 + f 2Xt-2 +...+ f pXt-p + e t

 

El siguiente paso es estimar los parámetros del modelo, estos parámetros son:

 

La media del proceso, los parámetros f i y la varianza del término de error s 2.

 

La estimación de los parámetros se hará por el método de máxima verosimilitud, que coincide con los obtenidos por el método de mínimos cuadrados correspondientes a la regresión:

 

Xt = m + f 1Xt-1 + f 2Xt-2 +...+ f pXt-p + e t

 

Estimamos primero el modelo AR(2). A continuación mostramos la salida de E-Views (Comando: LS SUNSPOT C AR(1) AR(2))

 

LS // Variable Dependiente SUNSPOT

Muestra (ajustada): 1702 1900

Convergencia encontrada tras 3 iteraciones (d = 0.001)

Variable Coeficiente Error Estadístico t p-valor

C 44.21745 3.420850 12.92587 0.0000

AR(1) 1.370045 0.052539 26.07649 0.0000

AR(2) -0.677409 0.052484 -12.90703 0.0000

R-cuadrado 0.819615

R-cuadrado ajustado 0.817775

Akaike info criterion (AIC) 5.408591

Schwarz criterion (BIC) 5.458239

Estadístico F 445.2835

p-valor (Estadístico F) 0.000000

 La variable C corresponde a la media del proceso, y es incluida para evitar problemas de mala especificación y para que se cumplan las hipótesis básicas con las que trabajamos como S ei = 0, pero la estimación de la media m se hará utilizando la media muestral.

Los estadísticos de significatividad individual (t) y global (F) nos llevan a rechazar la hipótesis nula de que los parámetros son cero, es decir los parámetros estimados son significativos y explican el 81% de la variabilidad de los datos, lo que no parece un mal ajuste, además el R-cuadrado y el R-cuadrado ajustado son muy parecidos. De todas maneras estimaremos también el modelo AR(8) que como ya vimos a partir del gráfico de la PACF podría ser un modelo adecuado.

 

La salida de E-Views es la siguiente:

(Comando LS SUNSPOT C AR(1) AR(2)... AR(7) AR(8))

 

LS // Variable Dependiente SUNSPOT

Muestra (ajustada): 1708 1900

Convergencia encontrada tras 3 iteraciones (d = 0.001)

Variable Coeficiente Error Estadístico t p-valor

C 45.43502 5.284901 8.597138 0.0000

AR(1) 1.307208 0.071934 18.17232 0.0000

AR(2) -0.625843 0.118738 -5.270767 0.0000

AR(3) 0.004597 0.125553 0.036610 0.9708

AR(4) 0.095333 0.124681 0.764611 0.4455

AR(5) -0.138716 0.124646 -1.112875 0.2672

AR(6) 0.083003 0.125109 0.663447 0.5079

AR(7) -0.134280 0.117367 -1.144109 0.2541

AR(8) 0.214381 0.070940 3.022010 0.0029

R-cuadrado 0.842221

R-cuadrado(ajustado) 0.835362

Akaike info criterion (AIC) 5.358438

Schwarz criterion (BIC) 5.510584

Estadístico F 122.7739

p-valor (Estadístico F) 0.000000

 

Al igual que antes, la constante (media del proceso), y los dos primeros retardos aparecen como significativos. Para el resto de retardos, hasta el 7, claramente no podemos rechazar la hipótesis nula de que sus coeficientes son cero. Y en cuanto al retardo 8, para un a = 0.01, debemos aceptar que es un parámetro significativo, esto ya lo habíamos podido comprobar al ver el gráfico de la función de autocorrelación parcial. El R-cuadrado aumenta en un 3% pero esto es debido únicamente a la inclusión de nuevas variables, que aunque no sean relevantes, si disminuyen la variabilidad. También vemos un aumento en la diferencia entre el R-cuadrado y el R-cuadrado ajustado, claro síntoma de que en el modelo hay variables que no deben ser incluidas. El criterio AIC es menor que en el modelo anterior, pero ya sabemos que este criterio está sesgado hacia la elección de un modelo sobreparametrizado, y aunque el criterio de Schwarz también tiende a sobreparametrizar, es asintóticamente consistente, de manera que será el criterio por el que nos guiaremos para elegir el mejor modelo posible. El BIC de este modelo es mayor que el del modelo anterior.

No teniendo suficiente evidencia para rechazar que los parámetros f i que corresponden a los retardos 3, 4, 5, 6 y 7 son cero, el siguiente paso será estimar el modelo sin estas variables. Es decir, estimaremos un modelo AR(8) restringido a que f i = 0, i= 3, 4, 5, 6, 7.

 

Este es el resultado:

(Comando LS SUNSPOT C AR(1) AR(2) AR(8))

 

LS // Variable Dependiente SUNSPOT

Muestra (ajustada): 1708 1900

Convergencia encontrada tras 3 iteraciones (d = 0.001)

Variable Coeficiente Error Estadístico t p-valor

C 45.41542 6.610059 6.870653 0.0000

AR(1) 1.336116 0.052351 25.52235 0.0000

AR(2) -0.610958 0.055234 -11.06134 0.0000

AR(8) 0.119258 0.032239 3.699220 0.0003

R-cuadrado 0.837417

R-cuadrado (ajustado) 0.834836

Akaike info criterion (AIC) 5.336622

Schwarz criterion (BIC) 5.404243

Estadístico F 324.4938

p-valor (Estadístico F) 0.000000

 

Parece este un modelo adecuado y que se ajusta bien a los datos. Tenemos un buen R-cuadrado que no difiere mucho del R-cuadrado ajustado, por lo que pensamos que el modelo esta bien especificado (no hay variables irrelevantes). Obtenemos también el menor valor del BIC hasta ahora encontrado, y todas las variables aparecen como significativas. A la vista de todo esto parece que hemos encontrado un modelo que representa bien nuestra serie, por lo que este será el modelo final con el que nos quedaremos. Resta aún por estimar la media del proceso y la varianza del término de error.

El estimador máximo-verosimil de la media es la media muestral, que en nuestro caso es = 43.9517. En cuanto al estimador de la varianza, el máximo-verosimil es:

 

2 = ; donde ei son los residuos del modelo y T es el tamaño muestral.

 En nuestro caso 2= 191.43

 El modelo estimado queda pues de la siguiente manera:

 

Xt = 43.9517 + 1.336Xt-1 - 0.61Xt-2 + 0.119Xt-8 + e t

 El siguiente paso será hacer un diagnóstico de este modelo para comprobar si realmente es válido para nuestra serie.

 

6. DIAGNÓSTICO DEL MODELO

 

En este apartado vamos a comprobar que las hipótesis básicas respecto a los residuos se cumplen. Es decir, los residuos deben tener media cero, varianza constante, falta de correlación y distribución normal. Veremos primero si el modelo esta bien especificado, y después si el modelo sirve para predecir.

 Análisis de especificación:

 1.- ¿Estimaciones estadísticamente significativas?

 

Como ya vimos en el apartado de estimación, todas las variables incluidas en el modelo son significativas. De hecho una de nuestras maneras de trabajar se ha basado en desechar aquellas variables que aparecían como no significativas. Nuestro modelo pasa esta primera prueba.

 

2.- ¿Es el modelo estacionario?

 

Para comprobarlo debemos ver si el módulo de las raíces del polinomio característico cae fuera del círculo unidad.

F (B)= 1 - 1.336B + 0.61B2 - 0.119B8

E-Views nos ofrece este cálculo:

B=0.9 B=0.76-0.56i B=0.76+0.56i B=0.17+0.72i B=0.17-0.72i

B= -0.40-0.52i B= -0.40+0.52i B= -0.63

Todas caen dentro del círculo unidad, de manera que se cumple la condición de estacionariedad, lo que nos asegura que el modelo no es explosivo y conserva su estructura probabilística a lo largo del tiempo, de manera que las predicciones que hagamos serán en principio válidas.

 

3.- Análisis de residuos.

Los residuos deben comportarse como ruido blanco gaussiano de media cero (esperamos media cero ya que el modelo estimado es un AR). Deben por tanto carecer de correlación serial, la ACF debe ser estadísticamente no significativa para cualquier retardo. Si esto no ocurriera habría que especificar un nuevo modelo en función de la estructura de los residuos. Lo mismo hay que comprobar para la PACF.

Empecemos viendo el histograma de los residuos y sus principales estadísticos.

 

Se ve claramente que los residuos siguen una distribución que es aproximadamente normal. La media de los residuos es prácticamente cero y el estadístico de Jarque-Bera nos lleva a poder concluir que los residuos siguen una distribución normal. Resta por comprobar la falta de correlación entre los residuos. Veamos primero un gráfico de los residuos para tratar de detectar algún tipo de estructura o problema.

 

 

No parece haber ningún problema, aparentemente los residuos son ruido blanco incorrelado, pero veamos el correlograma.

Los residuos están incorrelados para cualquier retardo. Los residuos de nuestro modelo cumplen con todas las hipótesis básicas realizadas respecto a los mismos. El modelo es adecuado en este sentido.

 

 4.- Análisis de estabilidad del modelo.

 

Debemos comprobar ahora que el modelo es estable, es decir que su estructura permanece constante a lo largo del tiempo. Lo que haremos será estimar los parámetros en intervalos distintos (y disjuntos) de tiempo y ver si las diferencias entre las estimaciones son significativas. El contraste será el siguiente:

H0 : el modelo es estable à Q 1= Q 2= Q 3=Q

H1 : el modelo no es estable

Definimos:

 

êt = residuos de la estimación en el intervalo [1,T]

ê1t= residuos de la estimación en el intervalo [1,T1]

ê2t= residuos de la estimación en el intervalo [T1+1,T]

Entonces consideramos:

donde K es el número de parámetros a estimar, en nuestro caso 5 (los f i , la media y la varianza de los residuos), y T es el número de datos de los que disponemos. Dividiremos pues el intervalo de tiempo en dos subintervalos, que serán: [1700, 1800) y [1800, 1900], y estimaremos el modelo en cada caso.

Para el intervalo [1700,1799], la ACF y la PACF adoptan una forma idéntica a como ya vimos para la muestra conjunta. Los retardos 1,2 y 8 aparecen como significativos, y la estimación es la que podemos ver a continuación:

LS // Variable dependiente SUN1799

Muestra (ajustada): 1708 1799

Convergencia encontrada tras 3 iteraciones (d =0.001)

Variable Coeficiente Error Estadístico t p-valor

C 47.96021 11.00214 4.359171 0.0000

AR(1) 1.301784 0.077017 16.90251 0.0000

AR(2) -0.587940 0.082260 -7.147368 0.0000

AR(8) 0.143321 0.048476 2.956501 0.0040

R-cuadrado 0.837439

R-cuadrado ajustado 0.831897

Akaike info criterion (AIC) 5.468049

Schwarz criterion (BIC) 5.577692

Estadístico F 151.1117

p-valor (Estadístico F) 0.000000

 

Lo obtenido es prácticamente igual a las estimaciones realizadas para la muestra conjunta. Veamos la estimación para el intervalo [1800, 1900]. Para este intervalo, la ACF y la PACF son exactamente iguales a las de la muestra conjunta, con una pequeña diferencia, en la PACF, el retardo 9 se sitúa a la misma altura que el retardo 8, es decir, sale de las bandas ± 2s , lo que podría indicar que este retardo pudiera ser significativo. Estimemos primero el modelo sin incluir este retardo, y más tarde veremos que pasa con el mismo.

 

LS // Variable dependiente SUN1900

Muestra (ajustada): 1808 1900

Convergencia encontrada tras 3 iteraciones (d =0.001)

Variable Coeficiente Error Estadístico t p-valor

C 43.99666 8.085021 5.441749 0.0000

AR(1) 1.367238 0.076029 17.98313 0.0000

AR(2) -0.636858 0.080031 -7.957647 0.0000

AR(8) 0.087219 0.047421 1.839263 0.0692

R-cuadrado 0.837505

R-cuadrado ajustado 0.832028

Akaike info criterion (AIC) 5.346432

Schwarz criterion (BIC) 5.455361

Estadístico F 152.9030

p-valor (Estadístico F) 0.000000

 

Las estimaciones obtenidas son semejantes a las que obtuvimos para la muestra conjunta y para el primer intervalo, con una pequeña diferencia, esta vez el retardo 8, para un a =0.05 aparece como no significativo, aunque aceptamos H0 (f 8=0) por muy poco (0.0692 frente a 0.05). Veamos que ocurre si incluimos el retardo número 9 en la estimación.

 

LS // Variable dependiente SUN1900

Muestra (ajustada): 1809 1900

Convergencia encontrada tras 3 iteraciones (d =0.001)

Variable Coeficiente Error Estadístico t p-valor

C 45.00309 8.131968 5.534095 0.0000

AR(1) 1.258235 0.081779 15.38584 0.0000

AR(2) -0.568065 0.080184 -7.084523 0.0000

AR(8) -0.118907 0.081689 -1.455608 0.1491

AR(9) 0.252726 0.082574 3.060594 0.0029

R-cuadrado 0.851713

R-cuadrado ajustado 0.844895

Akaike info criterion (AIC) 5.277173

Schwarz criterion (BIC) 5.414227

Estadístico F 124.9250

p-valor (Estadístico F) 0.000000

 

Lo que ocurre es que el retardo 8 aparece aún más claramente como no significativo mientras que el retardo 9 tiene un p-valor suficientemente pequeño como para no poder rechazar la hipótesis de que es significativo. Además la diferencia entre el R-cuadrado y el R-cuadrado ajustado aumenta, lo que puede indicar que en el modelo hay variables que son irrelevantes. Veamos lo que obtenemos si quitamos el parámetro que corresponde al retardo 8.

 

LS // Variable dependiente SUN1900

Muestra (ajustada): 1809 1900

Convergencia encontrada tras 3 iteraciones (d =0.001)

Variable Coeficiente Error Estadístico t p-valor

C 45.25531 11.27612 4.013376 0.0001

AR(1) 1.293676 0.078565 16.46634 0.0000

AR(2) -0.574754 0.080559 -7.134530 0.0000

AR(9) 0.153172 0.046563 3.289584 0.0014

R-cuadrado 0.848102

R-cuadrado ajustado 0.842923

Akaike info criterion (AIC) 5.279496

Schwarz criterion (BIC) 5.389139

Estadístico F 163.7782

p-valor (Estadístico F) 0.000000

 

A la vista de esto, lo que tenemos son dos modelos, válidos los dos, que explican nuestra serie, pero que son incompatibles, es decir, en un mismo modelo no podemos tener los retardos 8 y 9 , porque son excluyentes, o tenemos uno, o tenemos el otro pero los dos a la vez no llevan a un modelo válido. Lo primero que debemos hacer es comprobar que ocurre con estas dos variables. Para ello iremos a la serie original (a toda la muestra) y haremos un análisis de estas variables. Lo primero será hacer un gráfico. A continuación podemos ver un scatterplot de las variables sunspot8 (sunspot en su diferencia número 8) y sunspot9 (sunspot en su diferencia número 9). Este gráfico aclara todas nuestras dudas, las variables correspondientes a los retardos 8 y 9 son dependientes, con un coeficiente de correlación de 0,93. Las dos variables están explicando lo mismo de manera que una de las dos sobra. Lo que haremos será lo siguiente, dado que a partir de 1800, lo que obtenemos difiere de lo obtenido hasta entonces, veremos si en este punto hay un cambio estructural en la serie (utilizaremos el contraste de Chow), y si lo hay concluiremos que existen dos modelos diferentes que explican nuestra serie, uno hasta 1799, y otro desde 1800 hasta 1900. Veamos este contraste:

Chow Breakpoint Test: 1800

Estadístico F 0.273709 p-valor 0.894670

 

 

 

 

 

 

 

 

 

 

 

 

Al igual que para el año 1800, el contraste resulta negativo para los años 1790-1810, no encontramos ningún punto de ruptura en el que la estructura de la serie varíe. De manera que lo que haremos será concluir el contraste que comenzamos para comprobar la estabilidad del modelo. Si el modelo resulta estable, y buscando la mayor simplicidad del mismo, optaremos por quedarnos con un solo modelo, que explique la totalidad de la muestra. Los cálculos necesarios son los siguientes, han sido realizados con Microsoft Excel en lugar de E-Views ante la mejor manejabilidad del primero para este tipo de cálculos:

S = 38478.7741

S = 19987.8661

S = 17908.1222

de manera que el contraste queda como sigue:

F= 0.58746108

F~ F5,191 bajo H0 si tomamos a = 0.05, el punto que deja a su derecha una probabilidad a , para una F5,191 , es 2.2613, de manera que F < F0.05,5,191 y no hay suficiente evidencia en los datos para rechazar H0. De aquí podemos concluir que tenemos un modelo estable, y de esta manera concluimos el análisis de especificación del modelo, tenemos unos parámetros que son significativos, estacionariedad, unos residuos que se ajustan a las hipótesis realizadas sobre ellos (distribución, media cero, incorrelación...), y un modelo que es estable en el tiempo.

El siguiente paso es ver el comportamiento predictivo del modelo.

 

Comportamiento predictivo:

 

Vamos ahora a predecir con este modelo valores futuros de la muestra, y ver la calidad de esa predicciones, si estas predicciones son buenas, podremos utilizar el modelo para predecir, ya que como hemos visto en el punto anterior, el modelo esta correctamente especificado y no presenta ningún tipo de problema. Calcularemos el predictor óptimo, y con un horizonte de predicción de 44 años, obtendremos una muestra que compararemos con los datos que guardamos al principio con el fin de diagnosticar el modelo. En el gráfico siguiente podemos ver la serie real frente a la predicción obtenida por E-Views.

Vemos que el modelo ajusta peor la serie en los primeros años, pero a partir de 1920 ofrece un ajuste bastante bueno. Necesitaríamos datos posteriores a 1944 para ver el comportamiento que sigue el modelo. En cualquier caso, en el gráfico segundo podemos ver la serie real completa frente a la serie ajustada, y se comprueba que el ajuste del modelo a la serie es bastante aceptable.

Visto todo lo anterior, podemos concluir que el modelo ajustado a la serie es un modelo correcto, bien especificado y que ofrece unas predicciones que no se alejan mucho de la realidad, de manera que podemos utilizarlo para predecir valores futuros de la serie a corto plazo.

 

7.- CONCLUSION

 

El resultado final se ajusta a nuestras expectativas iniciales de ser capaces de construir un modelo adecuado que explicara la serie que habíamos elegido. Creemos haber encontrado un buen modelo, que seguramente tendrá fallos, ya que esta es nuestra primera aproximación al análisis de series temporales, pero en el que hemos podido aplicar todo aquello que habíamos estudiado previamente de una manera teórica. En cualquier caso, queda pendiente para posteriores desarrollos de este estudio aquel pequeño problema que encontramos con la dependencia entre los retardos 8 y 9. De todas maneras estamos seguros de que este análisis aquí presentado, nos podrá servir de base más adelante para acometer un estudio más riguroso y seguramente más correcto de la serie temporal que nos incumbe, y de otras series que nos pudieran interesar.

 

8.- BIBLIOGRAFÍA

 

Box G.E.P. , Jenkins G.M. ; "Time series analysis: forecasting and control",

(1976), Ed. Prentice-Hall. New Jersey.

Bray R.J. , Loughead R.E. ; "Sunspots", (1964), Ed. Dover. New York.

Brockwell P.J. , Davis R.A. ; "Time series: Theory and methods", (1991),

Ed. Springer-Verlag. New York.

Hamilton J.D. ; "Time series analysis", (1994), Ed. Princeton University Press

Peña D. ; "Estadística: Modelos y Métodos. Vol II: Modelos lineales y Series

Temporales", (1993), Ed. Alianza Universidad Textos.

 

 

Análisis multivariante | Home