In statistica descrittiva, una serie storica (o temporale) si definisce come un insieme di osservazioni ordinate rispetto al tempo, ed esprime la dinamica di un certo fenomeno nel tempo. Le serie storiche vengono studiate sia per interpretare un fenomeno, individuando componenti di trend, di ciclicità, di stagionalità e/o di accidentalità, sia per prevedere il suo andamento futuro.
Descrizione
Definizione
In generale, per serie si intende la classificazione di diverse osservazioni di un fenomeno rispetto ad un carattere qualitativo. Se tale carattere è il tempo, la serie viene detta storica o temporale.
Il fenomeno osservato, detto variabile, può essere osservato in dati istanti di tempo (variabile di stato: numero dei dipendenti di un'azienda, quotazione di chiusura di un titolo negoziato in borsa, livello di un tasso di interesse ecc.) o alla fine di periodi di lunghezza definita (variabili di flusso: vendite annuali di un'azienda, PIL trimestrale ecc.).
Indicando con il fenomeno, si indica con un'osservazione al tempo , con un intero che varia da a , dove è il numero complessivo degli intervalli o dei periodi temporali considerati. Una serie storica è così espressa e, in tal caso, ha lunghezza .
Ad esempio, se si intende rilevare il PIL trimestrale in milioni di euro a valori concatenati (anno di riferimento: 2000; dati grezzi) dal primo trimestre 1981 al secondo trimestre 2008, si hanno osservazioni, tra cui:[1]
: PIL alla fine del primo trimestre 1981 (193.505);
: PIL alla fine del quarto trimestre 1983 (215.584);
: PIL alla fine del terzo trimestre 1994 (263.660).
Ipotesi di base
Contrariamente a quanto avviene nella statistica classica, dove si suppone che osservazioni indipendenti provengano da un'unica variabile aleatoria, nelle serie storiche si suppone che esistano osservazioni provenienti da altrettante variabili aleatorie dipendenti. L'inferenza sulla serie storica si configura quindi come un procedimento che tenta di riportare la serie storica al suo processo generatore.
deterministico: se i valori della variabile possono essere esattamente determinati sulla base dei valori precedenti;
stocastico: se i valori della variabili possono essere determinati sulla base dei valori precedenti solo in misura parziale. La maggioranza delle serie storiche è di tipo stocastico e si rivela quindi impossibile elaborare previsioni prive di errore.
L'approccio classico all'analisi delle serie storiche assume un modello del tipo:
nel quale il valore del fenomeno al tempo risulta dalla composizione di una sequenza deterministica, , detta parte sistematica, e di una successione di variabili aleatorie, detta parte stocastica.
L'approccio moderno, invece, ipotizza che la parte sistematica manchi (o sia stata eliminata dai dati) e si focalizza sulla parte stocastica.
Momenti fondamentali
I momenti di una serie storica sono:
media: ;
varianza: ;
autocovarianza: .
Componenti
Componente tendenziale o trend, mostra un andamento crescente, o decrescente o costante con fluttuazione più o meno regolari. I metodi più utilizzati per determinare il trend sono il metodo dei minimi quadrati e il metodo delle medie mobili.
Componente ciclica impronta all'evento delle fluttuazioni periodiche o non periodiche attorno alla curva del trend, in momenti di quattro fasi definiti nel ciclo economico (componenti congiunturali) con durata pluriennale:
prosperità: aumento maggiore dell'aumento dell'anno precedente;
recessione: aumento minore dell'aumento dell'anno precedente;
crisi: aumento negativo maggiore dell'anno precedente;
ripresa: aumento negativo minore dell'anno precedente.
Componente stagionale che determina variazioni che avvengono negli stessi mesi in anni successivi. Questi movimenti vengono analizzati con il metodo della serie ideale di 12 mesi e il metodo della media mobile di 12 mesi.
Componente casuale o accidentale, piccole oscillazioni dovute ad eventi casuali (scioperi, elezioni, fatti importanti).
Componente occasionale, raro, dovuto a eventi bellici, importanti innovazioni tecnologiche, crisi politiche etc. Se tale movimento si smorza rapidamente e non produce variazioni al trend, quel dato statistico viene escluso e sostituito da un dato "fittizio" ottenuto tramite interpolazione. Se invece il trend rimane cambiato, si spezzano la serie in due parti e si analizzano separatamente le due parti, dette periodi osservazionali.