L’utilizzo dei real world data (RWD) rappresenta oggi uno degli strumenti più potenti per la valutazione della trasferibilità delle evidenze scientifiche nella pratica clinica. Negli ultimi anni, sono stati sviluppati diversi strumenti e reti, con l’obiettivo di armonizzare i dati clinici raccolti, al fine di poterli utilizzare per scopi di ricerca.

Oggi, lo sviluppo e la diffusione di questi strumenti (ad es. I2b2 – Informatics for Integrating Biology & the Bedside) che consentono l’acquisizione e l’armonizzazione delle informazioni derivanti dalle cartelle cliniche elettroniche (diagnosi, terapie, procedure ecc.) apre la prospettiva alla creazione di sistemi automatici e di reti estese in grado di raccogliere grandi quantità di informazioni attraverso fonti diverse.
La Società Italiana di Reumatologia (SIR) con il Progetto REWIND (REal World evidence IN rheumatic Diseases) vuole fornire dati preliminari sulla fattibilità della creazione di un network per la sorveglianza dell’impatto delle malattie reumatologiche sull’assistenza sanitaria e sulla trasferibilità nella pratica clinica di nuovi interventi sanitari, siano essi farmacologici o organizzativi.
Nei centri coinvolti nel progetto, utilizzando il sistema i2b2, è stato creato un progetto “verticale” di Reumatologia finalizzato a sostenere i quesiti di ricerca sulle RMD (Rheumatic and Musculoskeletal Diseases).
Il progetto “verticale” contiene i dati integrati nel progetto orizzontale del centro ma limitati ai pazienti con diagnosi RMD, in particolare:

  • Flusso SDO;
  • Terapie farmacologiche somministrate e consegnate;
  • Esami di laboratorio;
  • Visite ambulatoriali con rispettivi referti;

Per il progetto è stata creata anche una pipeline che estrae le informazioni dai referti ambulatoriali reumatologici usando un algoritmo che utilizza tecniche di NLP (Natural Language Processing). L’algoritmo sfrutta un’ontologia riferita alle patologie reumatologiche, contenente tutte le informazioni specifiche da estrarre, creata insieme ai ricercatori della SIR. Lo schema seguente mostra le fasi di implementazione della pipeline NLP.

La fase iniziale coinvolge il training del modello utilizzando un’ontologia e espressioni regolari per estrarre informazioni dai referti. Questi referti sono successivamente valutati da un clinico per correggere eventuali errori, aggiornando così il modello. La seconda fase implica la validazione del modello su ulteriori referti, seguita da una revisione clinica. Se l’accuratezza supera il 90%, il modello è pronto per la produzione; altrimenti, si procede con ulteriori iterazioni di training e validazione.
Sono quindi stati realizzati diversi indicatori durante le tre fasi del progetto che hanno permesso ai ricercatori della SIR di effettuare l’attività di monitoraggio sui tre centri coinvolti:

  • Fase 1: indicatori su caratteristiche della malattia, qualità delle cure e modelli di trattamenti
  • Fase 2: indicatori su cura, performance di cura e farmacovigilanza
  • Fase 3: indicatori su procedure/interventi complessi, Pathway mining e efficacia comparativa di farmaci