Desarrollada por un equipo del Instituto VRAIN de la UPV y ValgrAI, representa un avance crucial hacia el aprovechamiento completo de los Registros Electrónicos de Salud (EHRs), impulsa la medicina personalizada y permite estudios epidemiológicos más amplios y diversos
València, 24 de enero de 2025. Un equipo del Instituto Universitario Valenciano de Investigación en Inteligencia Artificial (VRAIN) de la Universitat Politècnica de València (UPV) y la Escuela Valenciana de Posgrado y Red de Investigación en Inteligencia Artificial (ValgrAI) ha desarrollado una innovadora metodología que convierte el texto de historias y anotaciones clínicas en datos comprensibles para los computadores, haciéndolos aprovechables para la investigación médica. Esta información tiene el potencial de transformar la investigación médica y posibilitar nuevos tratamientos, un mejor entendimiento de los efectos secundarios y estrategias más efectivas de prevención.
El equipo liderado por VRAIN y ValgrAI está formado por Lluís F. Hurtado, María José Castro-Bleda y Encarna Segarra, junto a Luis Marco Ruiz del University Hospital North Norway, Aurelia Bustos Moreno de MedBravo, y Juan Francisco Vallalta de la compañía Lãberit.
La metodología que han desarrollado combina dos ramas de la inteligencia artificial: el procesamiento del lenguaje natural (NLP) y los datos enlazados (Linked Data). A partir de ellas, transforma el texto clínico en conjuntos de datos valiosos y consultables, facilitando así la investigación clínica.
Informes de radiología
El equipo ha procesado informes de radiología en español utilizando modelos de lenguaje preentrenados (RoBERTa), etiquetando el texto libre con terminologías biomédicas asociadas a los Conceptos Únicos del Sistema Unificado de Lenguaje Médico (UMLS). Posteriormente, estos conceptos se mapearon a expresiones lógicas en una base de datos de grafos, lo que permite a los computadores entender y procesar consultas complejas para localizar datos valiosos que, de otro modo, al ser texto libre, no podrían analizarse para identificar hallazgos clínicos de interés.
Información clínica para la investigación
Las implicaciones de este desarrollo son muy significativas para los sistemas de salud que gestionan grandes bases de datos distribuidas. Y son de especial utilidad en sistemas regionales y nacionales de salud que buscan reutilizar datos de registros y cohortes diversas, para así avanzar hacia uno de los objetivos clave del Espacio Europeo de Datos que es el uso secundario de información clínica para la investigación biomédica.
Tal y como explica el investigador de VRAIN de la UPV que lidera este estudio, Lluís F. Hurtado, “el enfoque que hemos desarrollado cierra la brecha entre los datos no estructurados y los mecanismos de consulta estructurados. De este modo, permite a los investigadores crear bases de conocimiento escalables e interoperables directamente desde texto clínico”.
Y añade que “representa un avance crucial hacia el aprovechamiento completo de los datos en texto libre de los Registros Electrónicos de Salud (EHRs), impulsa la medicina personalizada y permite estudios epidemiológicos más amplios”.
Sobre VRAIN
El Instituto Universitario Valenciano de Investigación en Inteligencia Artificial – Valencian Research Institute for Artificial Intelligence- (VRAIN) de la UPV está integrado por ocho grupos de investigación que cuentan con más de 30 años de experiencia en diferentes líneas de investigación en IA.
El proceso de creación de VRAIN comenzó en 2019, fruto de la unión de seis grupos investigadores. En 2020, se fusionó con el Centro de Investigación en Métodos de Producción de Software PROS y en 2021 se constituyó finalmente como Instituto Universitario de Investigación con la aprobación de la Generalitat Valenciana.
En la actualidad, cuenta con más de 178 investigadores divididos en nueve áreas de investigación. Estas nueve áreas sobre las que gira su actividad investigadora hacen que sus desarrollos se apliquen a un gran número de sectores estratégicos como salud, movilidad, ciencias de la tierra, ciudades inteligentes, educación, redes sociales, agricultura, industria, privacidad/seguridad, robots autónomos, servicios y energía, y sostenibilidad ambiental entre otros.
Estas actividades han sido financiadas por más de 135 proyectos obtenidos mediante financiación competitiva, principalmente de la Unión Europea, pero también del Plan Nacional de Investigación, el Plan Valenciano de Investigación y Proyectos de Transferencia de Tecnología.
Referencia
Luís-F. Hurtado, Luis Marco-Ruiz, Encarna Segarra, Maria Jose Castro-Bleda, Aurelia Bustos-Moreno, Maria de la Iglesia-Vayá, Juan Francisco Vallalta-Rueda, Leveraging Transformers-based models and linked data for deep phenotyping in radiology, Computer Methods and Programs in Biomedicine, Volume 260, 2025, 108567, ISSN 0169-2607, https://doi.org/10.1016/j.cmpb.2024.108567