Regressione e correlazione: quando l’amore coinvolge le variabili.

Cosa c’entrano i due termini statistici maggiormente diffusi e l’amore? In questo articolo, giocando con un paragone sentimentale, andremo a capire cosa distingue una regressione lineare da una correlazione. Questi due concetti statistici sono infatti legati dall’idea della relazione. E, osando un po’, possiamo proprio affermare che si tratta di una pseudo “relazione sentimentale” tra variabili. Scopriamo insieme perché.

L’amore e la matematica: un legame infinito.

Da sempre c’è una profonda attrazione tra la matematica e il tema dell’amore. Cercare equazioni perfette è uno dei temi che appassiona sia coloro che amano la matematica sia coloro che dicono di non capirla. Infatti, se da un lato l’equazione matematica spaventa, dall’altro pensare alla matematica come la possibile soluzione del grande tema umano dell’amore, appassiona.

Gli stessi matematici sono attratti dal tema dell’amore. Oltre che alle vicende sentimentali più o meno fortunate, il legame tra un matematico e la sua materia è un’intensa storia d’amore. Valentina D’Urbano nel romanzo “Il rumore dei tuoi passi” scrive: “Io non avevo mai odiato nessuno come odiavo lui in quel momento. E non avevo mai amato nessuno come sentivo di amare lui in quell’istante”.

Quale migliore descrizione è possibile aggiungere circa il rapporto tra un matematico e la sua matematica? L’attività di ricerca della soluzione matematica è uno dei più intensi rapporti di amore e di odio. Il momento in cui non si trova la soluzione è il momento dell’ira. E molti matematici si allontanano dal problema. Ma appena lontani, la loro mente torna con insistenza a pensare ad una soluzione!

Nel film “The Beautiful Mind”, il protagonista (John Forbes Nash jr, interpretato da Russell Crowe) afferma: “È soltanto nelle misteriose equazioni dell’amore che si può trovare ogni ragione logica. Io sono qui grazie a te. Tu sei la ragione per cui io esisto. Tu sei tutte le mie ragioni.” Ecco che ancora una volta l’amore è connesso con il concetto di equazione. Allora proviamo a capire l’equazione più usata in statistica: la regressione lineare!

Correlazione e regressione: quando i legami acquistano significatività.

Sulla scorta di spunti amorosi di poeti, scrittori e matematici, proverò a fornire una semplice spiegazione delle relazioni tra variabili, cercando di dissipare una delle maggiori confusioni degli statistici “neofiti” su regressione lineare e correlazione.

Regressione lineare.

La regressione lineare – vera e propria equazione matematica – è una relazione tra due variabili, caratterizzata dall’univocità della direzione. Poiché questa equazione discende dalla più famosa funzione lineare (quella che se disegnata in un grafico ci fornisce una retta), essa è composta da almeno due elementi essenziali: la X (variabile indipendente) e la Y (variabile dipendente). Ad ogni cambiamento della X si osserva un cambiamento della Y. Ed essendo un’equazione lineare – cioè di primo grado – il legame tra X e Y è proporzionale. Nella regressione tale relazione non è sempre presente: esiste solo quando la X influenza la Y.

La regressione in termini amorosi

Per rendere il discorso “meno matematico”, la regressione lineare è come un modello matematico che può spiegare la relazione tra due persone, quando la si osserva da un solo punto di vista. Ad esempio, se un soggetto che chiamiamo X (come la variabile indipendente) crede di amare Y (come la variabile indipendente) immensamente, si aspetta che l’amato Y percepisca il suo sentimento in uguale misura, in modo direttamente proporzionale a quel sentimento che lo stesso X sta provando. Questa in statistica si chiama ipotesi di ricerca.

La regressione lineare è dunque lo strumento statistico più idoneo per verificare una tale ipotesi. Quando la regressione è significativa (test di vario genere sono verificati), allora la relazione è confermata. Nei casi in cui il sentimento provato da X non viene percepito da Y in eguale misura, ma anzi viene sminuito del suo valore, allora la relazione che ne viene fuori è inversamente proporzionale. In questo caso, l’ipotesi di ricerca è verifica nel senso inverso ed ha ancora significatività statistica.

Se, ultimo caso, il sentimento provato da X non viene in alcun modo percepito da Y o viene recepito in misura ridotta (il classico caso in cui ci si innamora di una persona che non ricambia il sentimento provato dall’amante), allora la regressione non conferma l’ipotesi ed anzi potrebbe risultare statisticamente inutile.

Quando la regressione è significativa, la statistica ci consente di affermare che il rapporto tra le due variabili non è casuale, ma è determinato da un trend specifico che afferma che la variazione della Y è determinata dal comportamento della X.

Correlazione.

Molto spesso la parola “regressione” viene erroneamente confusa con quella di “correlazione”. Il termine “correlazione” significa relazione reciproca o, in termini amorosi, intima corrispondenza tra due variabili. In particolare, la correlazione ci consente di capire l’intensità del legame e di avere una visione più ampia della relazione che stiamo indagando. Infatti grazie alla correlazione, non solo abbiamo maggiori informazioni sulla forza del legame, ma anche di comprendere che un legame non è una corrispondenza univoca, ma biunivoca, in cui i soggetti interessati sono ugualmente coinvolti, anche se con diverse quantità numeriche.

In altri termini, la correlazione ci fa capire non solo che X ama Y, ma che al contempo anche Y ama X.

Tutto ciò in termine statistici comporta che la creazione di una relazione univoca tra due variabili deve essere valutata in modo attento. Pensare che X ama Y è forse la relazione univoca. Ma come essere sicuri che non sia l’esatto contrario, cioè che Y ama X? Oppure che entrambe le relazioni sono vere e dunque l’effetto che noi percepiamo è dovuto alla reciproca influenza? In questo caso, è utile affiancare l’analisi con strumenti più avanzati della semplice regressione, quali ad esempio il metodo delle equazioni simultanee.

Conclusione.

Come puoi osservare, anche la statistica, e di riflesso la matematica ad essa sottesa, vive delle stesse problematicità di cui vive ognuno di noi sul tema dell’amore. Lo studio delle relazioni tra variabili e sulla forza del loro legame rispecchia in pieno un famoso parere di Albert Einstein sull’amore, in cui la precarietà del legame e la reciprocità della conoscenza sono gli ingredienti fondamentali di ogni sana relazione d’amore (e statistica).

L’amore è sapere tutto su qualcuno, e avere la voglia di essere ancora con lui più che con ogni altra persona, … è la fiducia di dirgli tutto su voi stessi, compreso le cose che ci potrebbero far vergognare. L’amore è sentirsi a proprio agio e al sicuro con qualcuno, ma ancor di più è sentirti cedere le gambe quando quel qualcuno entra in una stanza e ti sorride. (Albert Einstein)


Previous Article

Lungo il sentiero del White Rabbit: alla scoperta statistica di New York.

Next Article

Tutti i grandi sono stati piccoli. Vale anche per i piccoli campioni statistici?

Related Posts