Statistica inferenziale

Quando si parla di statistica inferenziale ci si riferisce a tutti quegli strumenti statistici che permettono la verifica delle ipotesi di ricerca. Il processo di statistica inferenziale prende origine dallo studio dei campioni osservati per far sì che si possano trarre delle conclusioni sulle popolazioni da cui tali campioni sono stati estratti. 

Analisi orientata ai dati e al problema

Esistono molteplici strumenti di statistica inferenziale: la scelta di quale sia il più opportuno o il più adatto spetta a colui che analizza i dati. Affinché tale scelta non sia del tutto casuale, è pertanto necessario che colui che si occupa dell’analisi dei dati abbia preventivamente studiato ed in modo approfondito quanto è oggetto di indagine, non soffermandosi unicamente sull’aspetto prettamente statistico. 

La scelta del metodo deve basarsi oltre che sulla tipologia di dato, anche sul problema al quale lo studio nel suo complesso sta cercando di trovare una soluzione. 

I tre problemi tipici dell’inferenza statistica sono:

  1. confronto tra gruppi indipendenti
  2. confronto delle risposte di un unico gruppo in condizioni differenti
  3. studio della relazione esistente tra variabili misurate su uno stesso campione.

Strumenti “classici” di statistica inferenziale

Gli strumenti statistici maggiormente diffusi per la conduzione di analisi di statistica inferenziale sono (lista non esaustiva di tutti gli strumenti):

  • distribuzione normale per le medie
  • test t
  • test U di Mann-Whitney
  • Wilcoxon’s test
  • chi-quadro
  • confronto tra due proporzioni
  • odds ratio
  • test dei segni
  • Stuart’s test
  • McNemar’s test 
  • Spearman’s correlation
  • Pearson’s correlation
  • Kendall’s correlation
  • test esatto di Fisher
  • ANOVA
  • test di Kruskal-Wallis
  • Tukey’s test
  • Dunnett’s test
  • test di Bonferroni
  • F-test con la correzione di Huynh-Feldt 
  • Durbin-Watson test
  • Kolmorogov-Smirnov test
  • Shapiro-Wilk test
  • Anderson-Darling test
  • F di Levene
  • regressione lineare
  • regressione multivariata
  • ANCOVA 
  • regressione logistica
  • Kaplan-Meier
  • regressione di Cox
  • intraclass correlation
  • cohen kappa
  • limiti di disagreement
  • MANOVA
  • Discriminat Analysis
  • e molto altro.

Importanza della scelta del test

Scegliere il test più adatto è il frutto di conoscenza ed esperienza. Molte volte la scelta del test è effettuata senza alcuna conoscenza di come il test “lavora” sui dati, in quanto ci si affida unicamente alla capacità del software di elaborare i dati e da qui ci si limita a leggere il valore di p-value. Questo approccio, oltre che completamente errato perché si utilizza uno strumento senza sapere cosa e come legge i dati, è fonte di molti bias e questi sono dannosi per l’intero mondo della ricerca scientifica se non opportunamente individuati e risolti. L’identificazione e la modalità di riduzione dei bias devono fare parte del lavoro a priori di creazione del protocollo di ricerca.

Conclusione

La matematica ci insegna che non importa quale sia la strada che conduce alla soluzione del problema: è necessario che essa sia logica ed in perfetta armonia con tutte le leggi certe ed universalmente accettate. Condurre uno studio di statistica inferenziale in un lavoro di ricerca significa salire su una giostra… a mano a mano che la potenza del test si amplia, la generalizzazione coinvolge sempre più soggetti, fino ad abbracciare l’intera popolazione.