Il metodo IPDfromKM (reconstruct Individual Patient Data from published Kaplan-Meier survival curves) o metodo Shiny è caratterizzato da quattro fasi principali:
- ricerca bibliografica ed esame del full text degli studi inclusi;
- ricostruzione dei dati dei singoli pazienti;
- analisi statistica delle curve di sopravvivenza ricostruite;
- interpretazione dei dati di sopravvivenza.
Ricerca bibliografica ed esame del full text degli studi inclusi
La ricerca bibliografica rappresenta senza dubbio la parte più delicata di tutto il processo. Essa mira a identificare tutti gli studi randomizzati controllati (RCT) che propongono un trattamento per il setting terapeutico oggetto dell’analisi comparativa indiretta. È sempre preferibile che il percorso di selezione degli studi sia condotto secondo l’approccio PRISMA (Preferred Reporting Items for Systemic Review and Meta-Analyses) [1], scandagliando le principali banche dati come: Cochrane Library, Pubmed, ClinicalTrials.gov e i siti Web dell’Agenzia europea per i medicinali (EMA) e della Food and Drug Administration (FDA) statunitense.
L’analisi dovrebbe quindi essere condotta attraverso l’utilizzo di specifiche “parole chiave” e di criteri di inclusione ben definiti, considerando infine, gli studi che riportano un end-point time-to-event, come la PFS o l’OS (rispettivamente, Progression Free Survival e la Overall Survival), e ne pubblicano la relativa curva di Kaplan-Meier (KM). Nello specifico, per essere confrontabili gli studi devono includere pazienti con caratteristiche simili in termini di tipologia di tumore (sede, istologia, stadio, caratteristiche molecolari) e di linea di trattamento, devono riportare i risultati utilizzando lo stesso end-point (es. PFS o OS)[2]. Devono inoltre essere disponibili le curve di KM relative all’end-point selezionato per l’analisi, il numero totale di pazienti arruolati e il numero di eventi occorsi dall’inizio dello studio all’ultimo time-point di follow-up.
Va sottolineato che l’informazione relativa al numero di pazienti arruolati è di solito reperibile con facilità negli articoli scientifici. Diversamente, quando manca, si può tentare di ricostruirla con alcuni metodi che costituiscono un elemento di maggiore complessità che esula dall’obiettivo di questo contributo introduttivo.
Ricostruzione dei dati dei singoli pazienti
Per l’analisi delle curve, ciascun braccio di trattamento degli studi selezionati, viene prima digitalizzato utilizzando software di digitalizzazione pubblicamente accessibili sul web: Webplotdigitizer (versione 4.5 online; url https://apps.automeris.io/wpd/), DigitizeIt (http://www.digitizeit.de/), ScanIt (AmsterCHEM – ScanIt), Plot Digitizer (http://plotdigitizer.sourceforge.net/) e lo stesso digitalizzatore di IPDfromKM. Questi digitalizzatori permettono la trasformazione di ogni curva del grafico di sopravvivenza KM in un insieme di coordinate x-y di circa 100 coppie di punti.
Successivamente, i dati ottenuti vengono caricati nella “Reconstruct individual patient data from Kaplan-Meier survival curve” del software Shiny (version: 1.2.2.0 online; last update: 22 Marzo 2022); inserendo contestualmente il numero totale di pazienti, il numero totale di eventi segnalati (l’inserimento di questo dato migliora la precisione dell’analisi), e l’intervallo tra i time-point di follow-up. Questo ulteriore passaggio permette l’interpretazione da parte dell’AI delle coordinate x-y e la conversione delle stesse in un archivio paziente (https://www.trialdesign.org/one-page-shell.html# IPDfromKM[3]).
L’applicazione genera così una serie di dati di singoli pazienti quanti sono i gruppi di pazienti arruolati utilizzando l’algoritmo iKM modificato descritto in Liu et al., 2021. [3] Nello specifico, ogni paziente “ricostruito” è associato, rispettivamente, alle tre seguenti informazioni:
- data[1] di arruolamento;
- data dell’ultima osservazione al follow-up;
- esito del paziente alla data1 dell’ultima osservazione del paziente stesso (ad es.: vivo, morto oppure censorizzato).
Analisi statistica delle curve di sopravvivenza ricostruite
Infine, i dati ricostruiti dei pazienti vengono aggregati sulla base del tipo di trattamento e trattati come se appartenessero a bracci diversi di un unico studio. Questo permette di visualizzare i dati in un unico grafico KM dove ogni opzione terapeutica sarà un braccio di trattamento
Per i confronti di efficacia tra i vari gruppi si effettua una statistica di sopravvivenza standard (Cox statistics for time-to-event end-points; package “survival”; R-platform, 2020, https://www.R-project.org/), utilizzando come parametro l’Hazard Ratio (HR) con intervallo di confidenza al 95% [CI] oppure determinando le mediane della PFS o dell’OS considerate (con IC al 95%) e confrontandole attraverso il Log-Rank test. [4,5]
Un ultimo importante vantaggio di questa tecnica è dato dalle tempistiche di elaborazione dei dati. Infatti, per la digitalizzazione e la successiva ricostruzione di ogni singola curva il tempo richiesto è di circa 15 minuti.
Interpretazione dei dati di sopravvivenza
Il “metodo Shiny” può facilitare notevolmente i confronti indiretti sui dati di sopravvivenza e rappresenta anche un approccio innovativo, semplice e robusto proprio per ricostruire i dati individuali dei pazienti necessari per generare nuove evidenze, ad esempio valutando l’efficacia di un trattamento attraverso il mean restricted survival time (RMST). Le numerose informazioni contenute nelle curve KM vengono così interpretate mettendole a disposizione di un qualsiasi ricercatore opportunamente formato/informato nell’utilizzo di questa metodica rivoluzionaria.
Dal momento che una delle criticità del metodo Shiny è la possibile eterogeneità dei pazienti arruolati nei diversi studi, è utile eseguire una valutazione dell’eterogeneità separata in cui tutti i gruppi di controllo degli studi inclusi vengono confrontati tra loro in modo da poter stimare la variabilità statistica complessiva di questi set di dati. A tale scopo, proponiamo di utilizzare il likelihood ratio test; questo test ha una validità generale nella meta-analisi e può essere utilizzato come strumento per valutare l’omogeneità/eterogeneità tra gli studi. [6]
Bibliografia
- Shamseer L, Moher D, Clarke M, Ghersi D, Liberati A, Petticrew M, et al. PRISMA-P Group. Preferred reporting items for systematic review and meta-analysis protocols (PRISMA-P) 2015: elaboration and explanation. BMJ. 2015;350:g7647.
- ESTAR. [Internet]. 2022 Jan. [updated 2022 Jan; cited 2022 Apr 24] Available from: https://www.estar.toscana.it/wp-content/uploads/2022/02/e3m44-gennaio-2022.pdf
- Liu N, Zhou Y, Lee JJ. IPDfromKM: reconstruct individual patient data from published Kaplan-Meier survival curves. BMC Med Res Methodol. 2021;21(1):111.
- Messori A, Baldo P, Cancanelli L, Chiumente M, Damuzzo V, Di Spazio L, et al. Newly introduced anti-cancer drugs: description of an original evidence-based approach that indirectly compares multiple treatments sharing the same clinical indication and published in different studies (preprint). Open Science Framework, url https://osf.io/u6bt2/ (access 24 February 2022).
- Messori A. Synthetizing published evidence on survival by reconstruction of patient-level data and generation of a multi-trial Kaplan-Meier curve. Cureus 2021;13(11):e19422, url https://www.ncbi.nlm.nih.gov/pmc/articles/P MC8578838/
- Messori A. Indirect comparison of survival data based on the Shiny method: the role of control groups in the assessment of heterogeneity, 01 September 2022, PREPRINT (Version 1) available at Research Square [https://doi.org/10.21203/rs.3.rs-2006322/v1]
[1] Risulta importante sottolineare che per il computo del tempo trascorso per ogni paziente, si assume che il tempo 0 sia la data di arruolamento e il tempo “x” sia il tempo trascorso dal tempo 0 (calcolato per tutti i pazienti, i quali vengono forzatamente sincronizzati in base a questo presupposto). Per generare una curva di KM deve prima essere eseguita una fase di “re-impostazione dell’archivio” in cui ogni data di arruolamento di ogni paziente viene forzatamente collocata al “tempo 0” e ogni data di uscita di ogni paziente dallo studio viene ri-espressa come tempo trascorso dal tempo 0. Questa “re-impostazione” dell’archivio (o meglio delle date dell’archivio) riflette un passaggio imprescindibile e che per chiarezza non abbiamo voluto esplicitare.