Indice Show
Sei finalmente giunto al momento dell’elaborazione dati. Dopo tanti momenti difficili del tuo studio, hai deciso di inserire un’analisi statistica con dati sperimentali, per aumentare la qualità del tuo lavoro. Magari qualcuno che ti consiglia, ad esempio un relatore, ti ha appena detto: “Mi raccomando inserisci un’analisi statistica ben fatta!”. Boom! Le tue sicurezze hanno subito un momento di arresto ed il cuore un battito in meno. Il tuo primo pensiero è stato: “Statistica? Analisi? E come si fa? Io che speravo di aver abbandonato la statistica (per non parlare della matematica!) per sempre, adesso devo cimentarmi di nuovo?”. E quindi eccoti qui a cercare: Come elaborare analisi statistiche partendo da zero?
Si dice che “la calma è la virtù dei forti” e questo post ti servirà per capire quale può essere la tua strada. Una serie di consigli che ti porteranno a capire come affrontare l’analisi statistica dei dati sperimentali e a capire se puoi fare da solo o necessiti di un supporto. Facciamo un po’ di chiarezza.
Introduzione
Prima di decidere la direzione da prendere, chiariamo a cosa servono le analisi statistiche. Lo scopo di ogni studio statistico è di provare sperimentalmente che un’ipotesi scientifica è vera. Ecco perché si parla spesso di analisi statistica per dati sperimentali. Che tu ti occupi di medicina o di economia, la prima domanda a cui devi rispondere è: “Cosa voglio provare con il mio studio?”.
Ogni analisi statistica deve avere uno scopo. Molte persone con cui vengo in contatto, esordiscono con una tipica frase: “Con il mio studio non è che rivoluziono la scienza!”. Ed io rispondo: “Forse (e sottolineo forse) il tuo studio non rivoluzionerà la scienza, ma sicuramente non è questa una buona scusa per fare qualcosa in modo errato!”.
Un cattivo uso della statistica porta a lavori di ricerca condotti male, e fare ricerca in modo errato non è etico. Esatto, hai capito bene: risultati fuorvianti o utilizzo di risorse (umane, economiche e di tempo) per studi condotti male non è etico. E questo non è solo il mio parere, ma anche quello di due grandi esperti di statistica, ossia Altman e Bland.
A dispetto delle apparenze, qualsiasi studio scientifico ha un suo procedimento da seguire sia che tu voglia rivoluzionare la scienza sia che tu non lo voglia. Il modello di verifica di un’ipotesi di ricerca poggia sempre sul famoso e rigoroso metodo scientifico e la statistica rientra a pieno titolo nel procedimento inventato nel 1600 da Galileo. Quindi, prima di tutto, impostiamo il metodo.
Logica di un’analisi statistica dall’inizio alla fine
Step 1: Individuiamo la meta
Il primo passo di una buona analisi statistica è dunque quello di stabilire dove vuoi andare. Come pioniere della scienza, stabilisci la tua meta. Individua lo scopo della tua rispondendo alla domanda: “Cosa voglio dimostrare?”. Non aver paura di osare: la scienza è il campo di azione dei temerari. Più difficile sarà la domanda, più interessante sarà il cammino per rispondere. Non avere paura.
Definita la domanda, si passa alla fase successiva: “Come si dimostra?”. Per dirla alla Dante “Or incomincian le dolenti note a farmisi sentire”.
Prima di procedere con un esempio, lascia che spieghi un passaggio rilevante. Molto spesso quando si considerano i problemi statistici si pensa all’analisi dati come ad un problema unicamente di calcolo. Secondo questa versione dei fatti nessuno statistico sarebbe mai necessario: basta dotarsi del miglior software di calcolo e se proprio si vuole “strafare” ci si accompagna al migliore informatico, ed il gioco è fatto. La statistica non è rispondere a come fare operativamente qualcosa (i software in giro anche gratuiti calcolano la media meglio di chiunque altro). L’analisi dati consiste nel definire cosa fare, perché farlo e, ciliegina sulla torta, interpretare quanto si è fatto.
Come individuare la meta
Ma niente timore: esiste un metodo semplice ed efficace per definire la strada. Concentrati sulla domanda principale e da qui comincia a porre una serie di “sotto-domande”.
Ad esempio, supponiamo che la nostra domanda di ricerca principale sia: “Qual è l’incidenza della pubblicità sui consumatori?”.
Per dimostrare che la pubblicità ha un forte impatto sui consumatori, cominciamo a costruire delle sotto domande, via via sempre più complesse.
- Chi è il consumatore?
- Cosa si intende con la parola pubblicità?
- Incidenza è sinonimo di influenza?
- Qual è il tipo di pubblicità che voglio indagare?
- Esistono delle categorie di consumatori che sono più esposte alla pubblicità?
- Il consumatore è più esposto se vede un messaggio pubblicitario o se sente un annuncio pubblicitario?
- E ….
Come vedi, le domande posso presentarsi via via sempre più articolate. Come già detto, sperimenta senza paura.
Step 2: Ci sono domande e domande
Adesso che le domande sono poste e forse hai anche una prima idea di come rispondere, è giunta l’ora di individuare quali domande hanno bisogno di un’analisi statistica dei dati. Infatti, definire se la domanda “cos’è la pubblicità” non ha bisogno di analisi statistiche di corredo, la domanda “cos’è la pubblicità per il consumatore” può necessitare di una spiegazione statistica.
Step 3: Dalle domande alle risposte
Create le domande a cui vuoi rispondere, bisogna trovare i numeri. Presupposto per creare un’ottima elaborazione dati è avere un ottimo dataset (per imparare a crearlo clicca qui) e prima ancora hai bisogno dei dati, che puoi raccogliere o tramite questionario, dalle cartelle cliniche dei pazienti o osservando un fenomeno, oppure scaricando i dati da un database esistente (vedi quanto accade in econometria). A questo punto, pronto il dataset si parte con l’elaborazione dati.
Step 4: La parola ai dati
I dati che siano tanti o poco contengono informazioni. Il primo passo è quello di scoprire chi sono.
Per dare avvio alla tua elaborazione analisi dati, rispondi ad alcune domande, come le seguenti:
- “Da chi è composto il mio campione?”
- “Qual è il valore medio di una specifica variabile?” (ad esempio, l’età)
- “Quali sono i valori massimo e minimo che una variabile assume?”
- “Qual è la distanza tra la media e il valore massimo o minimo?”
- “Quanti soggetti hanno una determinata caratteristica?”
Associare a domande di questo tipo una risposta numerica, ti consentirà di scrivere tutte le statistiche descrittive del tuo campione.
Per presentare queste statistiche, ti basta ricordare che se lavori con variabili qualitative (tipo genere, professione, etc…), allora hai bisogno di costruire delle tabelle di frequenza, ossia delle tabelle che ti dicano, ad esempio, quanti maschi e femmine costituiscono il tuo campione. Puoi costruire dei grafici oppure delle tabelle: l’importante è che i risultati numerici si comprendano bene.
Se lavori con variabili quantitative (tipo età, reddito, etc…), allora hai bisogno di calcolare la media (ed attenzione alla sua corretta lettura), la deviazione standard, il massimo ed il minimo o il range interquartile. Qui è sempre meglio creare delle tabelle: mi raccomando che siano compatte, i relatori ed i reviewers non amano le tabelle infinite.
Step 5: Dalla fotografia dei dati alla previsione
Ultimo step dell’analisi statistica dei dati è quello di estrarre delle informazioni generali. È fondamentale fare la “fotografia” del proprio campione, ma uno studio finalizzato unicamente a mostrare quello che credono, pensano e fanno 100 soggetti specifici, non è proprio un’analisi dati che interessa tutti. La tua analisi statistica dei dati sperimentali deve essere capace di eseguire delle previsioni. In altri termini, essa deve aiutarti a generalizzare un determinato comportamento alla popolazione.
In questa fase hai pertanto bisogno di qualche strumento di analisi inferenziale (vedi approfondimento statistica descrittiva e inferenziale). La statistica ha un’ampia gamma di possibilità: dai test delle differenze allo studio delle relazioni. Si tratta di strumenti statistici che ti permettono di ampliare le tue conclusioni. Ogni test ha una sua complessità in termini di implementazione e di valutazione. Infatti, ciascuno di essi si applica con specifiche condizioni che, se non rispettate, invalidano i risultati.
Interpretare i risultati
Step 6: Adesso tocca a te
Scelto lo strumento o gli strumenti di indagine della tua analisi statistica dei dati si passa ad interpretare i risultati. La lettura dei risultati ed i relativi commenti, oltre ad essere di tipo statistico, devono essere rivolti al tuo ambito di indagine. Discutere i risultati significa porli a confronto della letteratura di riferimento, anche quando non concorda con te. Un’analisi statistica non finalizzata a riportare il problema nel suo originario campo di indagine è un puro percorso di esercizio statistico, non un’elaborazione dati.
Per tale ragione è necessario che i calcoli siano eseguiti con consapevolezza critica, sapendo cosa significa il risultato statistico e quale sia il metodo con cui è stato determinato.
Chi elabora i dati è chiamato a lavorare su due piani di lavoro: quello dello statistico e quello del ricercatore. Conoscenze statistiche poco accurate portano a risultati errati (e ciò, come detto, non è etico). Ma svolgere unicamente il calcolo senza immergersi nello specifico campo, significa privare i numeri del loro poter più stupefacente: interpretare la realtà!