Analisi Panel (o Panel Analysis)

La panel analysis (o analisi panel per dirla in forma italiana) è uno degli strumenti statistici più diffusi, specialmente nell’ambito economico. Essa infatti, permette di trarre informazioni da dati panel, ossia da dataset composti da informazioni su più soggetti e per più periodi temporali (solitamente anni o mesi).

Analisi Panel: da dove cominciare

Il primo passo per eseguire un’analisi panel è quello di avere un dataset di dati panel (o panel data). Essi sono infatti dati un pò speciali, perché sono costruiti in modo da descrivere osservazioni su più soggetti per più periodi temporali, siano essi anni, mesi, giorni, …

Ad esempio, un classico panel data in Excel si presenta come una tabella come quella che trovi sotto:

idid_soggettoperiodo temporalexy
111
212….
313….….
421
522
623

Nella prima colonna, l’etichetta id, indica l’identificativo di ciascuna osservazione. Successivamente, nella seconda colonna ci sono riportati gli id per ciascuno soggetto coinvolto nell’analisi. La terza colonna riporta il periodo temporale riferito all’i-esimo soggetto. Infine le colonne 4 e 5 riportano le variabili oggetto di interesse: una dipendente (y) e, in questo caso, una indipendente (x).

Fixed o Random? Qual è la panel corretta?

Primariamente devi ricordare che non esiste un modello statico di analisi panel. Infatti, a seconda della variabilità presente nei dati, è necessario definire se il modello che spiega maggiormente le relazioni di interesse sia un modello ad effetti fissi (fixed effect) o un modello ad effetti casuali (random effects). Specificatamente, il primo modello – ossia quello ad effetti fissi – ha la capacità di analizzare i dati mantenendo costanti i periodi temporali ed i soggetti (cattura la variabilità tra soggetti). Al contrario, il modello ad effetti casuali cattura la variabilità tra periodi e soggetti.

Per scegliere il modello, è necessario, dopo aver eseguito entrambe le modalità di panel, porre un test statistico: il test di Hausmann. A seconda del p-value del test e dunque, del rifiuto o meno dell’ipotesi nulla, è possibile procedere alla scelta della panel adatta ai tuoi dati.



Le vostre domande più frequenti

Quale valore deve assumere il p-value del test di Hausman per applicare una panel fixed effects?

Per poter applicare una panel analysis fixed effects è necessario che il p-value del test di Hausman sia minore di 0.05

Qual è la differenza tra una panel analysis ed una regressione OLS?

Sono entrambi due strumenti econometrici per comprendere la relazione tra variabili. La regressione OLS lavora molto bene sui dati cross-sectional, ossia su quei dati per più soggetti in un solo momento temporale. La panel, viceversa, lavora bene sui dati di più soggetti per più anni, andando anche a colmare problematiche relative a variabili omesse.

Cosa sono le variabili omesse?

Le variabili omesse sono variabili che producono effetto sulla relazione di interesse tra x e y, ma che non è possibile osservare concretamente. Pertanto, la panel colma questa problematica creando un modello idoneo a catturare la variabilità determinata su soggetti e su periodi temporali anche dalle presenza di variabili omesse.

Quali sono i test post-panel?

Dipende dal modello panel. Se è un modello ad effetti fissi, il primo controllo post è quello relativo all’eteroschedasticità (test di Wald modificato per gruppi). Nel caso di panel random effects, il test più famoso è il Breusch-Pagan Lagrange Multiplier, il quale consente di valutare la convenienza tra una panel random effects ed una classica OLS.
Infine, un altro test molto utile è quello di Pesaran, il cui scopo è valutare la non correlazione tra i residui. Nel caso di panel data riferiti a periodi temporali molto lunghi, il rischio di correlazione seriale è alto.


Conclusione

In conclusione, il modello di panel analysis presenta molteplici varianti. Sfortunatamente per i neofiti, creare risultati distorti (affetti da bias) è molto facile (ed anche molto probabile). Pertanto, ogni modello statistico deve essere validato attraverso dei test. Quindi, ricorda che tutti i modelli non validati sono solo numeri, non spiegazioni realistiche ed attendibili del fenomeno studiato.

Se ad un software statistico fornisci dei numeri, il software ovviamente ti restituirà numeri. Ma chi ti dice che quei numeri rappresentano effettivamente la tua soluzione alla domanda di ricerca?


Read more: Come eseguire una buona panel analysis