Miscellanea
Lunedì, 26 Maggio 2025

Il confronto delle mediane è un metodo affidabile per quantificare il beneficio di un trattamento?

A cura di Massimo Di Maio

Un Viewpoint recentemente pubblicato da Tito Fojo su JAMA Oncology evidenzia quanto il semplice dato relativo alla mediana possa “falsare” il confronto fra i trattamenti in uno studio randomizzato. Gli autori citano alcuni esempi tratti da studi recenti. Neanche l’hazard ratio, ovviamente, rappresenta un metodo perfetto per sintetizzare i risultati.

Fojo T, Bates S. Skimming the Median and the Problem of Exaggerated Survival Gains. JAMA Oncol. Published online May 22, 2025. doi:10.1001/jamaoncol.2025.0035

Da alcuni anni si discutono i limiti e i vantaggi delle diverse modalità di presentazione dei risultati degli studi clinici randomizzati, in particolare dei risultati degli endpoint di tempo all’evento, come la sopravvivenza globale o la sopravvivenza libera da progressione.

Il metodo di Kaplan Meier è universalmente accettato come modalità di presentazione dei risultati, che consente al lettore di avere un’informazione grafica sull’andamento nel tempo della sopravvivenza nei 2 gruppi. I risultati vengono spesso sintetizzati con le mediane e con l’hazard ratio.

Si è già discusso in questi anni che il confronto delle mediane da sole può falsare l’interpretazione del reale beneficio, sia in positivo sia in negativo (in quest’ultimo caso, quando i due bracci differiscono poco per il valore mediano ma un trattamento è nettamente migliore dell’altro, ad esempio, in termini di probabilità di sopravvivenza a un tempo definito (ad esempio a 1 anno, a 2 anni, a 3 anni etc.). Tale considerazione è stata spesso enfatizzata commentando i risultati degli studi di immunoterapia, spesso caratterizzati da una differenza in mediana “contenuta” e una più evidente separazione tra i bracci in termini di chance di beneficio a lungo termine.

Anche l’hazard ratio è stato spesso criticata, sia perché tecnicamente non è una sintesi affidabile del rapporto di efficacia tra i 2 bracci quando l’andamento relativo delle curve non è costante nel tempo (violando quindi l’assunto di proporzionalità) sia perché spesso la sua descrizione si presta a un equivoco: quando diciamo “riduzione del rischio di morte” non commentiamo in realtà una vera riduzione del rischio di morte (i pazienti moriranno lo stesso), ma semplicemente il rapporto delle velocità con cui gli eventi si verificano nei due bracci.

In questo scenario di critica metodologica alla modalità di comunicazione dei risultati, si inserisce il Viewpoint pubblicato a maggio 2025 da Tito Fojo su JAMA Oncology.

Gli autori commentano il concetto di “skimming the median”, un concetto che in italiano possiamo tradurre con “forzatura nell’interpretazione della mediana”, che porta a una comunicazione distorta della dimensione del vantaggio a favore del braccio vincente.

A corredo della loro critica, gli autori portano 3 esempi di studi recentemente pubblicati.

Il primo esempio portato dagli autori di come la “forzatura” della mediana possa sovrastimare i vantaggi in termini di sopravvivenza è lo studio CheckMate067, che ha riportato, nei pazienti con melanoma avanzato, un raddoppio della sopravvivenza globale (se espressa in termini di mediana): 72,1 mesi con nivolumab/ipilimumab rispetto a 36,9 mesi con nivolumab in monoterapia.

Tuttavia, l’hazard ratio (HR) definisce un vantaggio molto più “contenuto”: 0,84 (intervallo di confidenza al 95% 0,67-1,04. Quando le curve tendono ad appiattirsi, se questo appiattimento capita intorno al 50%, possono trascorrere molti mesi tra i momenti in cui le due curve superano la soglia del 50%, anche se i valori a tempi definiti sono separati da pochi punti percentuali. In altre parole, dicono gli autori, sarebbe una forzatura dire che l’aggiunta di ipilimumab ha raddoppiato la sopravvivenza globale.

Altri 2 esempi sono elencati e commentati nel Viewpoint:

Uno è lo studio ADRIATIC che testava il trattamento immunoterapico di consolidamento con durvalumab dopo il trattamento chemio-radioterapico nel microcitoma polmonare avanzato. Gli autori dello studio hanno enfatizzato la differenza di 22 mesi tra le mediane, ma si tratta di un “artefatto” determinato dalla forma delle curve e dall’appiattimento, rispettivamente sopra e sotto la mediana. Lo studio è chiaramente positivo, ma quantificare il vantaggio in 22 mesi (corretto tecnicamente in quanto le mediane sono ovviamente corrette nel calcolo) sovrastima la dimensione del beneficio in chi ascolta i risultati.

L’ultimo esempio è quello dello studio ESOPEC, che aveva confrontato, nei pazienti con tumore dell’esofago, il trattamento neoadiuvante con FLOT rispetto al trattamento chemioradioterapico secondo schema CROSS. Anche questo studio è chiaramente positivo a vantaggio del FLOT, ma la differenza tra le mediane (29 mesi) sovrastima la differenza complessiva tra le due curve.

Gli autori hanno scelto tre esempi di studi positivi, nei quali l’oggetto della critica non è la definizione di positività dello studio, ma la modalità di comunicazione della dimensione del beneficio.

Nei tre casi, a causa dell’appiattimento delle curve di Kaplan Meier per valori vicini al 50%, la differenza tra la mediana del braccio sperimentale e la mediana del braccio standard è molto alta, più della differenza espressa in termini di hazard ratio o della differenza in termini di chance di sopravvivenza a tempi defiiniti.

Le considerazioni di Tito Fojo ci ricordano che, quando commentiamo i risultati di sopravvivenza, probabilmente bisogna integrare più parametri di “sintesi” dei risultati. Sicuramente la differenza tra le mediane da sola non è sempre una sintesi corretta dell’efficacia relativa dei due trattamenti confrontati.