Il modello di Cox: come interpretarlo correttamente

Calcolare la sopravvivenza, ossia il tempo intercorso tra un dato evento ed uno specifico outcome, è uno dei principali compiti della statistica medica. Per portare a termine tale analisi, è necessario essere in grado di sviluppare un modello statistico affidabile, capace di tenere conto della situazione concreta in cui il ricercatore può venirsi a trovare. Il modello, forse più noto nell’ambito dell’analisi di sopravvivenza, è il modello di Cox, noto anche come regressione di Cox o modello di rischio proporzionale.

Concetto di sopravvivenza in statistica

Quando si sente parlare di sopravvivenza, nell’uso comune della parola si intende sempre riferirsi al concetto di morte. Tuttavia tale approccio è “statisticamente” errato. La sopravvivenza, o meglio l’analisi di sopravvivenza, concerne un qualunque evento che accade come conseguenza di un precedente evento. Ti faccio degli esempi. Nell’ambito oncologico, il termine sopravvivenza, oltre ad essere legato all’evento “morte”, è altresì connesso all’evento metastasi o all’evento recidiva. Nell’ambito degli studi sull’allattamento al seno, l’analisi di sopravvivenza è usata per determinare la durata dell’allattamento al seno e il momento più idoneo per il passaggio all’allattamento artificiale. Infine, negli studi relativi alla sterilità, le analisi di sopravvivenza sono relative al tempo intercorso tra il trattamento ed in concepimento. Come puoi quindi notare tu stesso, il termine “sopravvivenza” in statistica assume connotati anche positivi, come quelli legati al concetto di nascita.

Modello di Cox

Il modello di Cox, così chiamato dal nome del suo inventore (Cox appunto), ha come obiettivo quello misurare la probabilità che un evento (ad esempio una recidiva) si verifichi a partire da un determinato antecedente. Ad esempio, si immagini di voler misurare il rischio di metastasi di una specifica forma tumorale conoscendo la data della diagnosi, la successiva data di rilevazione della metastasi e alcune caratteristiche del paziente. In casi del genere, la regressione di Cox può aiutare a determinare la probabilità di verificarsi dell’evento in presenza di determinati fattori di rischio, definiti statisticamente con il termine di “covariate” o come fattori prognostici.

L’importanza dell’analisi di sopravvivenza

Al momento dell’esecuzione dell’analisi statistica i pazienti non sono “perfettamente” comparabili in termini di probabilità: alcuni di essi potrebbero avere un tempo di osservazione molto breve, perché sono stati arruolati di recente, altri possono non aver sviluppato metastasi, altri sono usciti dallo studio perché magari trasferiti in altra struttura, altri sono morti… e così via. Questa situazione mette il ricercatore di fronte al problema di come trattare i dati censored, i pazienti esclusi, e così via.

Similmente, quando si osserva un evento, sono presenti più fattori (leggi sempre “covariate“) che incidono sulla probabilità di verifica di un evento (età, sesso, etnia, …); ciò significa che è necessario procedere con un modello multivariato, simile alla regressione lineare.

L’innovazione della regressione di Cox nell’analisi di sopravvivenza

Il grande vantaggio del modello di Cox è dato dalla possibilità di tenere conto di due situazioni facilmente riscontrabili nella vita quotidiana del ricercatore, ossia dati censored e più covariate. Elemento fondamentale della regressione di Cox è il tempo.

La formulazione matematica del modello è la seguente:

h(t) = h0(t) . eb1x1+b2x2+…+bkxk

in cui h(t) è la funzione di rischio (meglio nota nella sua formulazione inglese di “hazard function”), h0(t) è la funzione di rischio quando tutte le covariate hanno valore zero ed x1, x2, …, xk sono appunto, le covariate.

Hazard Ratio

Uno degli output più importanti del modello di Cox, oltre ovviamente ai coefficienti delle covariate, è l’Hazard Ratio (HR). Si parla di “ratio” perchè si tratta del rapporto tra h(t) e h0(t).

In termini molto semplici, l’Hazard Ratio misura il rischio relativo del verificarsi di un evento ad un generico istante temporale t. Ciononostante, la sua interpretazione deve essere eseguita con molta cautela. Un HR = 2, non significa che l’evento avverrà più rapidamente, ma significa che il rischio è doppio rispetto alla baseline.

Particolarità del modello di Cox

Il modello di Cox è semi-parametrico in quanto non richiede una particolare assunzione per la variabile “tempo”, ma richiede che le covariate siano parametriche.

Il modello richiede inoltre che i fattori prognostici abbiano un’influenza significativa sull’outcome.

Nel caso di comparazione dei gruppi è sempre necessario valutare la comparabilità degli stessi alla baseline.

L’ampiezza del campione nell’analisi di sopravvivenza

Ricordando che il modello di Cox è valido per grandi campioni, la regola del pollice in questo caso ci consiglia di tenere una proporzione 1:20, ossia 20 pazienti per ogni covariata. Metodi formali di determinazione del campione sono disponibili anche per questa tipologia di analisi di sopravvivenza.

Conclusione

Il modello di Cox è uno strumento valido ed efficientissimo nello sviluppo delle analisi di sopravvivenza e per la valutazione dell’impatto dei fattori prognostici su un specifico outcome. La determinazione della probabilità di verificarsi di un evento consente di poter condurre ricerche molto performanti in vari ambiti della medicina.


Le vostre domande

Cosa succede se non sono pratico del modello?

La regressione di Cox è una delle applicazioni statistiche ad alto rischio bias. Mancanza di controlli preventivi (quali mancanza di comparazione dei gruppi alla baseline) e campioni inappropriati possono portare a risultati fortemente distorti. Inoltre, la mancanza di una corretta impostazione metodologica dello studio può condurre a risultati non idonei a rappresentare il fenomeno di interesse. Il modello di Cox stima in modo probabilistico quando si potrebbe realizzare un evento dato il verificarsi di una particolare condizione. Se si pensa all’evento morte, il modello di Cox sarebbe completamente inutile nel caso in cui si volesse prevedere quando un individuo muore (ci chiamiamo “mortali” proprio perché siamo tutti soggetti all’evento morte). La regressione di Cox punta a determinare, dato un evento, e.g. l’insorgenza di una malattia, la probabilità di morte di un individuo data la presenza della specifica patologia e particolari fattori prognostici.

Previous Article

Come trovare i dati econometrici

Next Article

Dimensione del campione: informazioni preliminari

Related Posts