Indice Show
Il coefficiente di variazione è una misura di variabilità. Il suo utilizzo è fondamentale quando si vuole comparare la variabilità di due o più insieme di dati, o di due o più variabili. Sebbene sia una misura di dispersione meno nota di deviazione standard o varianza, il coefficiente di variazione trova applicazione in molteplici studi, specialmente in quei lavori in cui si vuole comprendere la variabilità tra unità di misura diverse, campioni o variabili differenti.
Come calcolare il coefficiente di variazione
Il coefficiente di variazione, indicato con CV, è una misura relativa espressa in percentuale e non nell’unità di misura dei dati. Il suo obiettivo è di calcolare la dispersione di una variabile combinando media e deviazione standard eliminando dal risultato il “peso” dell’unità di misura.
Non essendoci alcun coinvolgimento probabilistico, il coefficiente di variazione rientra nelle misure di dispersione della statistica descrittiva. Pertanto esso può essere presentato nei risultati degli studi con dignità pari a media, mediana, deviazione standard e range interquartile.
Definizione
In termini formali, il coefficiente di variazione è dato dal prodotto della divisione tra deviazione standard (o scarto quadratico medio) e valore assoluto della media aritmetica, per 100%. In formule si ha:
CV = (deviazione standard/|media|)* 100%
Come puoi facilmente notare, il risultato di tale formula è sempre un numero privo di unità di misura ed idoneo ad esprimere la dispersione dei dati rispetto alla media.
NOTA BENE: Alcuni manuali presentano la formula del coefficiente di variazione senza inserire il 100%, come riportato nella definizione appena vista. Dunque, entrambe le formulazioni sono corrette. Senza calcolo del 100%, il risultato del CV è espresso come proporzione e non come percentuale.
Esempio: come fare per calcolare il CV
Prima di procedere sui vantaggi del CV, ti faccio un esempio di calcolo. Supponi di dover confrontare i dati delle due variabili riportate nella seguente tabella 1.
variabile 1 | variabile 2 |
---|---|
5 | 20 |
2 | 7 |
4 | 13 |
8 | 16 |
7 | 15 |
6 | 10 |
3 | 12 |
9 | 2 |
3 | 14 |
5 minuti 5 minuti
Per determinare il coefficiente di variazione procedi secondo i seguenti passaggi. Si tratta di passaggi molto semplici e che puoi pertanto replicare in totale autonomia su qualsiasi dataset.
- Calcolare media e deviazione standard di entrambe le variabili
La variabile 1 ha media 5.22 e deviazione standard 2.44. La variabile 2 ha media 12.11 e deviazione standard 5.28.
- Applicare la formula del coefficiente di variazione
Utilizzando la formula vista in definizione si ha che:
CVvariabile 1 = (2.44/|5.22|)*100% = 46.69%
CVvariabile 2 = (5.28/|12.11|)*100% = 43.58% - Cosa affermiamo dai risultati?
Possiamo dire che, nonostante i valori di media e deviazione standard delle due variabili sono tra loro rispettivamente diversi, le deviazioni standard delle due variabili differiscono rispetto alla media in modo abbastanza similare (47% e 44%).
Quando si utilizza il coefficiente di variazione?
Il coefficiente di variazione è utilizzato principalmente per comparare. Tali comparazioni possono essere eseguite con tre differenti obiettivi:
- determinare la variabilità tra differenti campioni, ognuno dei quali caratterizzato da specifiche medie aritmetiche e deviazione standard
- identificare la variabilità di due o più variabili con diverse unità di misura e diverse metodologie di calcolo
- calcolare la variabilità in misure ripetute su stessi soggetti da uno o più osservatori.
Svantaggi del CV
Il coefficiente di variazione subisce enormemente le variazioni di media e deviazione standard. Sebbene ciò sia efficace nella determinazione della variabilità, diviene enormemente problematico quando la media si avvicina a zero. Questo approssimarsi del valore della media a zero, effetto ad esempio derivato da valori negativi e positivi di una variabile, porta ad un’inflazione del coefficiente, rendendolo di fatto inutilizzabile.
Conclusione
Il coefficiente di variazione è uno strumento di calcolo utilissimo in molteplici applicazioni in quanto permette di determinare la dispersione dei dati e di comparare tale dispersione tra variabili o tra dataset. Questo significa che diverse dimensioni del campione e differenti valori di media e deviazione standard possono essere sintetizzati da attraverso un’opportuna statistica descrittiva.
Quando penso al coefficiente di variazione penso alla favola di La Fontaine del Topo e dell’Elefante. Esso consente di comparare topolini ed elefanti, ma attenzione a non fare nella lettura dei risultati, la fine del topo di La Fontaine.
I topolini non diverranno mai elefanti, e gli elefanti non si rimpiccioliranno mai in topolini. La storia della rana e del bue insegna!
Per chi avesse curiosità sulla fine del Topo, ecco la favola dal libro Ottavo delle Favole di La Fontaine
La vanità, ch’è tutto un mal francese,
fa ch’ogni sciocco e stupido borghese,
un grand’uomo si creda in quel paese.
Vani son gli Spagnoli e tuttavia,
per quanto grande il lor difetto sia,
è più che scipitezza una pazzia.
L’esempio che vi conto vi dimostra
la boria nostra, la qual su per giù
non vale men di un’altra e non di più.
Un Topolin piccino
vide un grosso Elefante gigantesco,
e rise di quel grande baldacchino
pesante ed arabesco,
con tre piani di sopra e una sultana
seduta in mezzo di beltà sovrana,
con cani e gatti e pappagalli suoi,
e con tutta una casa che in viaggio
andava ad un lontan pellegrinaggio.
Rideva il Topolin perché la gente
stesse a guardar quel coso stravagante,
più che animale, macchina ambulante.
– Bel merito, – dicea, – d’esser sì grosso,
come se il bello fosse in un colosso…
O gente sciocca, ov’è la meraviglia
che ai ragazzetti fa levar le ciglia?
Così piccino come son, un grano
non valgo men di questo pastricciano -.
E stava per aggiungere di più
il Topo vanerello.
Quand’ecco sul più bello
un gatto salta giù
e fric… in un istante
mostrò che un Topo è men che un Elefante.