3 - Ritorni all'utente
Classi di interrogazione - Per parole chiave
Durante l'ultimo decennio alla maggior parte
di noi è diventato familiare compiere ricerche
in Internet mediante l'uso di parole-chiave - per
lo più impiegate una alla volta, - e motori
di ricerca. Se, in un dato ospedale, vogliamo elencare
tutte le cartelle cliniche dove quelle parole-chiave
sono contenute, il metodo ha successo. Esempi pratici
sono elencati di seguito: tutti i pazienti che hanno
ricevuto uno specifico farmaco; tutti i farmaci presi
da uno specifico paziente; tutti i medici in carico
ad uno specifico dipartimento; e così via.
In aggiunta, se, nel compiere una ricerca nella letteratura
medica, probabilmente usando PubMed [23], vogliamo
avere elencati tutti gli articoli di rivista dove
la parola-chiave è presente, - potrebbe essere
solamente nell'abstract, potrebbe essere all'interno
del testo dell'articolo- il metodo ha successo ancora.
Certamente, la lista di risultati includerà
anche quei pazienti (o quegli articoli di rivista)
dove quella parola-chiave è preceduta da "assenza
di", o è seguita da "non presente".
Ma, quando interroghiamo un database ospedaliero,
non vogliamo che questo succeda. Vogliamo una più
elevata efficacia. Tuttavia, dobbiamo ammettere che
il programma di interrogazione è molto semplice.
Dobbiamo anche ammettere che alcuni rischi di malinteso
sono indesiderati.
Per intervallo
In Medicina, per la maggior parte delle quantità
misurabili, la conoscenza acquisita nel passato ci
consente di definire intervalli di normalità.
Di fronte al risultato di un test di laboratorio per
un dato paziente, vogliamo conoscere se il risultato
è normale (fisiologico) oppure no. Per effettuare
una interrogazione di questo tipo anche l'organizzazione
dei dati consentita da un foglio di calcolo elettronico
può generalmente essere sufficiente. Interrogazioni
un poco più complesse sono del tipo: "Vogliamo
conoscere se il paziente ha avuto febbre mentre era
ricoverato in ospedale".
Una più alta complessità hanno le interrogazioni
come: "Selezionare i pazienti che, dopo aver
preso un certo farmaco in una certa quantità,
hanno avuto il trattamento con quel farmaco interrotto
per effetti collaterali indesiderati, e dopo minimo
cinque giorni il periodo di wash-out, il paziente
è passato al trattamento con questo altro farmaco,
e ciò fu fatto senza avere che il paziente
mostrasse alcun effetto collaterale per un minimo
di trattamento lungo tre mesi con il nuovo farmaco,
a medio o più alto dosaggio".
Per concetti
Nel fare un'interrogazione, "cardiopatia"
può essere giusto una parola-chiave. Un risultato
può essere il numero di volte in cui questa
parola è presente nel testo. Ma noi possiamo
usare "cardiopatie" per interrogare qualcosa
d'altro. Vogliamo dire che possiamo cercare la lista
di nomi specifici di tutte le patologie cardiache.
La operatività di fare ciò è
lontana dal contare quante volte una parola appare
in un dato testo. Ora la operatività inizia
con il cercare un dizionario medico. Frequentemente
sarà un dizionario strutturato. Un possibile
esempio può essere la parte di terminologia
del Unified Medical Language System (UMLS). Poi il
dizionario dovrebbe essere consultato. La consultazione
deve essere fatta in accordo con i criteri di strutturazione
del dizionario. Tutti nomi delle cardiopatie dovrebbero
essere elencati, e i sinonimi dovrebbero essere propriamente
trattati. I risultati dovrebbero accordarsi con anche
con i livelli di granularità richiesti dall'utente.
Una ricerca come quella appena descritta è
spesso detta "un'interrogazione per concetti".
Interrogazioni semantiche per database di bio-immagini.
Il Visible Human Dataset (VHD) [24] è una collezione
di immagini da sezioni orizzontali esaustive di due
corpi umani, uno maschile e uno femminile. Il corpo
dell'uomo è stato sezionato una volta ogni
millimetro. Questo ha portato alla serie di 1870 fotografie
digitali. Il corpo della donna, sezionato tre volte
per ogni millimetro, ha portato alla serie di 5100
fotografie digitali. Fotografie in tali quantità
non sono adeguate per essere gestite manualmente.
Interrogazioni come: "Per le immagini provenienti
da tutte le sezioni dove il fegato è presente,
dammi tutti i dati relativi al solo fegato",
dovrebbero essere considerate interrogazioni assai
naturali anche dalle matricole universitarie. Ma l'architettura
software per effettuare una tale interrogazione è
molto peculiare. La visualizzazione seriale dei file
grezzi contenenti le immagini del VHD, la selezione
di quelle di loro dove il fegato è presente,
il contornamento del fegato su ciascuna delle immagini
selezionate, la validazione dell'azione di contornamento,
il salvataggio dei dati originali del VHD appartenenti
al contorno, la loro memorizzazione in un nuovo database,
chiamato "fegato VHD", la scelta di un corpus
di conoscenza anatomica (e.g. il tesauro del Unified
Medical Language System), e parecchi altri aspetti
da curare: tutti questi sono tra i maggiori passi
da compiere con qualsiasi sistema che esegua interrogazioni
semantiche di database di bio-immagini [25].
4 - Alcuni maggiori database
Per avere una visione generale di cosa sta accadendo
nel campo dei "Database per la Medicina e la
Sanità", ogni cittadino può effettuare
qualche ricerca in Internet, sommaria o affinata che
possa essere. Sappiamo che i risultati saranno parzialmente
dipendenti dal motore di ricerca utilizzato. Anche
chi è medico compirebbe sostanzialmente le
medesime azioni di ricerca, ma ha il vantaggio di
possedere già la conoscenza professionale per
dare o non dare ascolto a parecchi dei risultati apparsi
fra l'enorme numero di quelli elencati dal motore
di ricerca. I criteri generali di fiducia dei professionisti
possono essere relativi al segmento di attività
a cui i risultati possono essere associati. Esempi
di segmenti di attività possono essere produzione
ed uso per la parte di mercato, istruzione per la
parte di conoscenza, governo per la parte di legislazione,
progressi per la parte di ricerca (Fig. 6).

Criteri specifici di fiducia dei professionisti sono
relativi a obiettivi più focalizzati. Esempi
sono il nome di un sistema di gestione di basi di
dati - database management system (DBMS) -, il nome
di una malattia, il nome di un dizionario medico,
il nome di un farmaco, nomi di sintomi, segni, valori
normali di una data misurazione, il costo dei trattamenti
medici, tabelle di sopravvivenza, errori medici, complicazioni
post-chirurgiche, diritti del paziente, sicurezza
dei dati, elettrocardiogrammi, immagini di risonanza
magnetica, riservatezza della cartella clinica, DNA
micro-array, e così via. Vogliamo dire che,
per il momento, ricercando "database medici e
sanitari" il numero di ritrovamenti (risultati)
è vicino a cento migliaia per "database
medici" e dell'ordine di parecchie migliaia per
"database sanitari". Una visione dettagliata
e abbastanza approfondita della attuale situazione
nel campo dei "Database per la Medicina e la
Sanità" emerge dal libro "Elementi
di Informatica BioMedica" [26], che dedica molte
pagine all'argomento.
In particolare vi sono capitoli dedicati alle banche
di terminologie mediche, alle banche di bibliografie
mediche, alle banche di biosegnali, alle banche di
bioimmagini, alle banche genomiche.
Ciascuno tema è affrontato per rispondere alle
esigenze dell'utente fruitore di tali risorse, rendendolo
consapevole di quegli aspetti di costruzione e di
gestione che maggiormente determinano le prestazioni
di utente, a volte rendendole più a portata
di mano, altre volte - purtroppo - rimanendo lontane
dal consentire un buon successo al proposito. Per
ciascuna delle banche dati indicate sono presentati
gli aspetti caratteristici, le differenti tipologie
esistenti (ad esempio banche genomiche primarie, banche
genomiche derivate), i problemi da affrontare per
una efficace realizzazione e un loro allestimento
che si riveli utile per l'uso nell'ambiente ospedaliero.
Dove possibile il libro include alcune confronti.
Ne e' esempio quello tra le banche di bioimmagini
digitali. Alcune caratteristiche dello storico Visible
Human Dataset - realizzato oltre dieci anni fa e ampiamente
conosciuto - risultano molto migliorate nelle più
recenti banche di bioimmagini del Visible Korean Human
e del Chinese Visible Human, che hanno tratto vantaggio
dalla evoluzione tecnologica dei sistemi di acquisizione
manifestatasi negli ultimi anni.
Prof. Francesco Pinciroli
Professor of Medical Informatics and Health Information
System at the Politecnico of Milano - Italy
Prof. Stefano Bonacina
Department of Bioingegneria, Politecnico
di Milano -Italy
Versione
stampabile