Qual è il rischio reale di malattia linfonodale ≥pN2 in una paziente con carcinoma mammario cN0 sottoposta a chirurgia upfront, con 1-3 linfonodi sentinella positivi? La domanda è cruciale, poiché le implicazioni terapeutiche — inclusa l’indicazione ad abemaciclib, alla chemioterapia o alla radioterapia nodale — dipendono fortemente dal burden linfonodale patologico. Tuttavia, l’identificazione accurata di ≥4 linfonodi positivi senza ricorrere sistematicamente a dissezione ascellare completa rimane una sfida clinica. Questo studio propone un approccio di intelligenza artificiale basato su XGBoost per stimare il rischio di malattia ≥pN2 partendo da dati clinico-patologici di routine. Il modello sarà sufficientemente robusto da rimpiazzare la chirurgia invasiva? Sarà in grado di guidare il clinico nelle decisioni ad alto impatto terapeutico, evitando morbidità inutile? I risultati dell’algoritmo, messi alla prova su due coorti distinte, promettono di sorprendere… ma anche di far riflettere.
Wanis KN, et al. Predicting pathologic ≥N2 disease in women with breast cancer. NPJ Breast Cancer 2025;11(1):46. doi: 10.1038/s41523-025-00757-4.
Questo studio si è posto l’obiettivo di sviluppare un modello predittivo in grado di stimare il rischio che una donna con carcinoma mammario inizialmente senza segni clinici di coinvolgimento linfonodale (cioè cN0), ma con 1-3 linfonodi sentinella positivi alla biopsia, presenti in realtà una malattia più avanzata a livello linfonodale, definita come “≥pN2” (cioè con almeno quattro linfonodi ascellari metastatici). Questo è un aspetto importante perché la presenza di ≥4 linfonodi coinvolti può influenzare le decisioni terapeutiche, come l’indicazione alla chemioterapia, all’aggiunta di inibitori CDK4/6 come l’abemaciclib o alla radioterapia nodale estesa.
Per creare il modello, i ricercatori hanno utilizzato i dati di 587 pazienti seguite presso il MD Anderson Cancer Center tra il 1993 e il 2007. Tutte queste pazienti erano state operate con chirurgia primaria (quindi senza terapia neoadiuvante), avevano una malattia T1-T3 e presentavano da 1 a 3 linfonodi sentinella positivi alla biopsia. Tra queste, 415 pazienti (circa il 71%) avevano effettuato una dissezione ascellare completa, che ha consentito di verificare se vi fosse malattia ≥pN2. In effetti, 64 donne (15.4%) presentavano almeno quattro linfonodi metastatici.
I ricercatori hanno diviso il campione in due parti: l’80% è stato utilizzato per addestrare un algoritmo di machine learning (basato sul metodo XGBoost), mentre il 20% restante è servito per testare l’accuratezza del modello su dati mai visti prima.
Le variabili utilizzate per la predizione includevano età, stato menopausale, dimensione del tumore, tipo istologico, grado, stato dei recettori (estrogeni, progesterone, HER2), presenza di invasione linfovascolare, numero di linfonodi asportati, e quanti di questi erano positivi.
In una seconda fase, il modello è stato validato esternamente utilizzando un enorme database nazionale americano — il National Cancer Database (NCDB) — che raccoglie informazioni cliniche e patologiche da oltre 1500 centri oncologici negli Stati Uniti. Qui sono stati identificati 37.352 casi analoghi (carcinoma T1-T3, cN0, 1-3 linfonodi sentinella positivi, operati tra il 2018 e il 2020). Tuttavia, in questo periodo storico, la dissezione ascellare completa era eseguita in modo molto più selettivo, per cui i confronti devono tenere conto di questa differenza nei criteri clinici.
Nel gruppo di test interno (cioè all’interno del MD Anderson), l’algoritmo ha mostrato ottima capacità discriminativa, con un’area sotto la curva ROC (AUC) pari a 0.87, e un errore medio di predizione (Brier score) pari a 0.073. Per confronto, un modello più semplice, basato sulla regressione logistica tradizionale, ha ottenuto un AUC leggermente inferiore (0.80) e un Brier score di 0.084. Questi dati indicano che l’algoritmo predittivo è in grado di distinguere bene tra le pazienti con e senza malattia linfonodale ≥pN2.
Nel database nazionale NCDB, dove il contesto clinico era più recente e selettivo, il modello ha mantenuto comunque una buona performance con AUC pari a 0.78 e Brier score di 0.16.
I fattori che hanno pesato di più nella predizione del modello sono stati: il numero di linfonodi sentinella positivi, il numero totale di linfonodi sentinella asportati, la dimensione del tumore e la presenza di invasione linfovascolare.
In particolare, tra le pazienti con un solo linfonodo positivo, solo il 6.2% ha presentato ≥pN2 alla dissezione completa. Al contrario, se i linfonodi positivi erano tre, il rischio di malattia estesa saliva al 48.4%. Inoltre, più alto era il numero di linfonodi negativi asportati, più basso era il rischio residuo di malattia ≥pN2. Per esempio, tra le pazienti con 1 linfonodo positivo e almeno 2 linfonodi negativi asportati, solo il 2.2% aveva una malattia ≥pN2.
Infine, è stato costruito un modello molto semplice, basato solo sul numero di linfonodi positivi e negativi, che ha raggiunto un AUC di 0.86 — un risultato sorprendente per la sua semplicità.
Questo studio dimostra che, nei casi di carcinoma mammario con 1-3 linfonodi sentinella positivi, è possibile stimare con buona precisione il rischio di malattia linfonodale ≥pN2 senza dover necessariamente ricorrere alla dissezione ascellare completa. L’algoritmo sviluppato — basato su metodi avanzati di apprendimento automatico — ha ottenuto risultati solidi sia all’interno del centro che lo ha sviluppato, sia quando testato su una coorte nazionale esterna.
Il dato più importante emerso è che il numero di linfonodi positivi e, soprattutto, la quantità di linfonodi negativi asportati durante la biopsia del linfonodo sentinella, sono tra i fattori più rilevanti per prevedere il rischio reale di malattia avanzata. Questo significa che, in molti casi, è possibile evitare la morbidità della dissezione completa, pur prendendo decisioni terapeutiche basate su una buona stima del burden nodale.
Il lavoro ha anche implicazioni concrete per la pratica clinica. Ad esempio, potrebbe aiutare a selezionare le pazienti che realmente necessitano di abemaciclib, o quelle che possono evitare la radioterapia nodale, riducendo così trattamenti inutili. Tuttavia, è importante sottolineare che lo sviluppo del modello si basa su dati raccolti in epoche diverse e in contesti clinici variabili. Questo comporta alcune incertezze sull’applicabilità diretta a tutte le pazienti attuali. Inoltre, anche se l’algoritmo è sofisticato, un semplice conteggio dei linfonodi positivi e negativi può fornire una stima sorprendentemente accurata.
In sintesi, questo studio rappresenta un esempio concreto di come l’intelligenza artificiale possa essere utilizzata per affinare le decisioni cliniche in oncologia, riducendo le procedure invasive senza compromettere la qualità della cura.