:: Medicina


Dati, Informazioni e Basi di dati per la Medicina e la Sanità

Prof. Francesco Pinciroli - Prof. Stefano Bonacina

3 - Ritorni all'utente
Classi di interrogazione - Per parole chiave
Durante l'ultimo decennio alla maggior parte di noi è diventato familiare compiere ricerche in Internet mediante l'uso di parole-chiave - per lo più impiegate una alla volta, - e motori di ricerca. Se, in un dato ospedale, vogliamo elencare tutte le cartelle cliniche dove quelle parole-chiave sono contenute, il metodo ha successo. Esempi pratici sono elencati di seguito: tutti i pazienti che hanno ricevuto uno specifico farmaco; tutti i farmaci presi da uno specifico paziente; tutti i medici in carico ad uno specifico dipartimento; e così via. In aggiunta, se, nel compiere una ricerca nella letteratura medica, probabilmente usando PubMed [23], vogliamo avere elencati tutti gli articoli di rivista dove la parola-chiave è presente, - potrebbe essere solamente nell'abstract, potrebbe essere all'interno del testo dell'articolo- il metodo ha successo ancora. Certamente, la lista di risultati includerà anche quei pazienti (o quegli articoli di rivista) dove quella parola-chiave è preceduta da "assenza di", o è seguita da "non presente". Ma, quando interroghiamo un database ospedaliero, non vogliamo che questo succeda. Vogliamo una più elevata efficacia. Tuttavia, dobbiamo ammettere che il programma di interrogazione è molto semplice. Dobbiamo anche ammettere che alcuni rischi di malinteso sono indesiderati.

Per intervallo
In Medicina, per la maggior parte delle quantità misurabili, la conoscenza acquisita nel passato ci consente di definire intervalli di normalità. Di fronte al risultato di un test di laboratorio per un dato paziente, vogliamo conoscere se il risultato è normale (fisiologico) oppure no. Per effettuare una interrogazione di questo tipo anche l'organizzazione dei dati consentita da un foglio di calcolo elettronico può generalmente essere sufficiente. Interrogazioni un poco più complesse sono del tipo: "Vogliamo conoscere se il paziente ha avuto febbre mentre era ricoverato in ospedale".
Una più alta complessità hanno le interrogazioni come: "Selezionare i pazienti che, dopo aver preso un certo farmaco in una certa quantità, hanno avuto il trattamento con quel farmaco interrotto per effetti collaterali indesiderati, e dopo minimo cinque giorni il periodo di wash-out, il paziente è passato al trattamento con questo altro farmaco, e ciò fu fatto senza avere che il paziente mostrasse alcun effetto collaterale per un minimo di trattamento lungo tre mesi con il nuovo farmaco, a medio o più alto dosaggio".
Per concetti
Nel fare un'interrogazione, "cardiopatia" può essere giusto una parola-chiave. Un risultato può essere il numero di volte in cui questa parola è presente nel testo. Ma noi possiamo usare "cardiopatie" per interrogare qualcosa d'altro. Vogliamo dire che possiamo cercare la lista di nomi specifici di tutte le patologie cardiache. La operatività di fare ciò è lontana dal contare quante volte una parola appare in un dato testo. Ora la operatività inizia con il cercare un dizionario medico. Frequentemente sarà un dizionario strutturato. Un possibile esempio può essere la parte di terminologia del Unified Medical Language System (UMLS). Poi il dizionario dovrebbe essere consultato. La consultazione deve essere fatta in accordo con i criteri di strutturazione del dizionario. Tutti nomi delle cardiopatie dovrebbero essere elencati, e i sinonimi dovrebbero essere propriamente trattati. I risultati dovrebbero accordarsi con anche con i livelli di granularità richiesti dall'utente. Una ricerca come quella appena descritta è spesso detta "un'interrogazione per concetti".

Interrogazioni semantiche per database di bio-immagini.
Il Visible Human Dataset (VHD) [24] è una collezione di immagini da sezioni orizzontali esaustive di due corpi umani, uno maschile e uno femminile. Il corpo dell'uomo è stato sezionato una volta ogni millimetro. Questo ha portato alla serie di 1870 fotografie digitali. Il corpo della donna, sezionato tre volte per ogni millimetro, ha portato alla serie di 5100 fotografie digitali. Fotografie in tali quantità non sono adeguate per essere gestite manualmente. Interrogazioni come: "Per le immagini provenienti da tutte le sezioni dove il fegato è presente, dammi tutti i dati relativi al solo fegato", dovrebbero essere considerate interrogazioni assai naturali anche dalle matricole universitarie. Ma l'architettura software per effettuare una tale interrogazione è molto peculiare. La visualizzazione seriale dei file grezzi contenenti le immagini del VHD, la selezione di quelle di loro dove il fegato è presente, il contornamento del fegato su ciascuna delle immagini selezionate, la validazione dell'azione di contornamento, il salvataggio dei dati originali del VHD appartenenti al contorno, la loro memorizzazione in un nuovo database, chiamato "fegato VHD", la scelta di un corpus di conoscenza anatomica (e.g. il tesauro del Unified Medical Language System), e parecchi altri aspetti da curare: tutti questi sono tra i maggiori passi da compiere con qualsiasi sistema che esegua interrogazioni semantiche di database di bio-immagini [25].

4 - Alcuni maggiori database
Per avere una visione generale di cosa sta accadendo nel campo dei "Database per la Medicina e la Sanità", ogni cittadino può effettuare qualche ricerca in Internet, sommaria o affinata che possa essere. Sappiamo che i risultati saranno parzialmente dipendenti dal motore di ricerca utilizzato. Anche chi è medico compirebbe sostanzialmente le medesime azioni di ricerca, ma ha il vantaggio di possedere già la conoscenza professionale per dare o non dare ascolto a parecchi dei risultati apparsi fra l'enorme numero di quelli elencati dal motore di ricerca. I criteri generali di fiducia dei professionisti possono essere relativi al segmento di attività a cui i risultati possono essere associati. Esempi di segmenti di attività possono essere produzione ed uso per la parte di mercato, istruzione per la parte di conoscenza, governo per la parte di legislazione, progressi per la parte di ricerca (Fig. 6).

 

 

Criteri specifici di fiducia dei professionisti sono relativi a obiettivi più focalizzati. Esempi sono il nome di un sistema di gestione di basi di dati - database management system (DBMS) -, il nome di una malattia, il nome di un dizionario medico, il nome di un farmaco, nomi di sintomi, segni, valori normali di una data misurazione, il costo dei trattamenti medici, tabelle di sopravvivenza, errori medici, complicazioni post-chirurgiche, diritti del paziente, sicurezza dei dati, elettrocardiogrammi, immagini di risonanza magnetica, riservatezza della cartella clinica, DNA micro-array, e così via. Vogliamo dire che, per il momento, ricercando "database medici e sanitari" il numero di ritrovamenti (risultati) è vicino a cento migliaia per "database medici" e dell'ordine di parecchie migliaia per "database sanitari". Una visione dettagliata e abbastanza approfondita della attuale situazione nel campo dei "Database per la Medicina e la Sanità" emerge dal libro "Elementi di Informatica BioMedica" [26], che dedica molte pagine all'argomento.
In particolare vi sono capitoli dedicati alle banche di terminologie mediche, alle banche di bibliografie mediche, alle banche di biosegnali, alle banche di bioimmagini, alle banche genomiche.
Ciascuno tema è affrontato per rispondere alle esigenze dell'utente fruitore di tali risorse, rendendolo consapevole di quegli aspetti di costruzione e di gestione che maggiormente determinano le prestazioni di utente, a volte rendendole più a portata di mano, altre volte - purtroppo - rimanendo lontane dal consentire un buon successo al proposito. Per ciascuna delle banche dati indicate sono presentati gli aspetti caratteristici, le differenti tipologie esistenti (ad esempio banche genomiche primarie, banche genomiche derivate), i problemi da affrontare per una efficace realizzazione e un loro allestimento che si riveli utile per l'uso nell'ambiente ospedaliero. Dove possibile il libro include alcune confronti.
Ne e' esempio quello tra le banche di bioimmagini digitali. Alcune caratteristiche dello storico Visible Human Dataset - realizzato oltre dieci anni fa e ampiamente conosciuto - risultano molto migliorate nelle più recenti banche di bioimmagini del Visible Korean Human e del Chinese Visible Human, che hanno tratto vantaggio dalla evoluzione tecnologica dei sistemi di acquisizione manifestatasi negli ultimi anni.

Prof. Francesco Pinciroli
Professor of Medical Informatics and Health Information System at the Politecnico of Milano - Italy
Prof. Stefano Bonacina
Department of Bioingegneria, Politecnico di Milano -Italy

Versione stampabile

1-2-3-4-5-6
:: Archivio
 
:: Primo Piano
  Editoriale
Genina Iacobone
Informatica Medica
Dati, Informazioni e basi di dati per la Medicina e la Sanità
Francesco Pinciroli
Stefano Bonacina
Terapia del dolore
La scoperta del sistema endocannabinoide
Rosanna Cerbo
Nuove discipline
Dall'approccio riduzionistico a quello olistico nello studio dei sistemi biologici: la metabolimica
Filippo Conti
Comunicato stampa
Politica Sanitaria
La Cina è vicina
Amedeo Pavone
Palestra universitaria
La Formazione in Sanità
Leva strategica per lo sviluppo
Clementina Fittante

Bioeconomia
Aereoporto di Firenze S.p.A.
Un insuccesso annunciato

Cremonini S.p.A.
Una crescita fondata sui debiti

Mondo TV S.p.A.
Cartoni "agitati"

Risiko
Banche in movimento

Evasione culturali
Henry de Monfreid
Stenio Solinas

Archeologia
Alessandro Magno
Aristide Malnati

Teatro
Teatro e poesia del dissenso di Evtushenko
Franco Manzoni

Arte
Anna Maria Benedetti Porpora
Carlo Franza