COVID-KG usa IA para escanear miles de estudios para responder las preguntas de los médicos sobre el coronavirus


El número de estudios sobre COVID-19 ha aumentado significativamente desde que comenzó la pandemia, de alrededor de 20,000 a principios de marzo a más de 30,000 a fines de junio. Para ayudar a los médicos a digerir la gran cantidad de conocimiento biomédico en la literatura, los investigadores de Columbia, Brandeis, DARPA, UCLA y UIUC desarrollaron un marco – COVID-KG para "diagrama de conocimiento" – que se basa en preguntas naturales para responder preguntas Lenguaje de drogas y más.

El gran volumen de investigación de COVID-19 hace que sea difícil separar el trigo de la paja. Se ha publicado cierta información falsa en las redes sociales y en lugares de publicación como revistas. Muchos resultados sobre el virus de diferentes laboratorios y fuentes son redundantes, complementarios o incluso contradictorios.

COVID-KG tiene como objetivo resolver el desafío mediante la lectura de documentos para crear gráficos de conocimiento multimedia que consisten en nodos y bordes. Los nodos representan entidades y conceptos extraídos del texto y las imágenes del papel, mientras que los bordes representan relaciones en las que están involucradas estas entidades.

COVID-KG recoge tipos de entidad, incluidos genes, enfermedades, productos químicos y organismos. Relaciones como mecanismos, terapias y formas de expresión aumentadas; y eventos como la expresión génica, transcripción y localización. También se basa en entidades derivadas de un conjunto de datos de código abierto diseñado para estudios COVID-19 que incluyen tipos de entidades como coronavirus, proteínas virales, evolución, materiales y respuestas inmunes.

VB Transform 2020 en línea – 15.-17. Julio . Únase a los principales líderes de IA: regístrese para la transmisión en vivo gratuita.

COVID-KG extrae información visual de imágenes de figuras (por ejemplo, imágenes microscópicas, curvas de dosis-respuesta y diagramas relacionales) para enriquecer el diagrama de conocimiento. Después de reconocer y aislar figuras de cada documento con texto en su leyenda o contexto de referencia, utiliza Computer Vision para identificar y separar áreas no superpuestas y para reconocer las estructuras moleculares en cada figura.

COVID-KG ofrece visualizaciones semánticas como nubes de día y mapas de calor, con los cuales los investigadores pueden ver relaciones seleccionadas de cientos o miles de artículos de un vistazo. Esto a su vez permite identificar las relaciones que generalmente se pasan por alto al buscar palabras clave o simples anuncios de nube de palabras o mapas de calor.

En un estudio de caso, los investigadores le hicieron a COVID-KG una serie de 11 preguntas, que normalmente se respondieron en un informe sobre la reutilización de medicamentos, como "¿Se ha identificado el medicamento mediante verificación manual o de cálculo?" y "¿Ha demostrado el medicamento evidencia de toxicidad sistémica?" Con tres medicamentos propuestos por los biólogos de DARPA (benazepril, losartán y amodiaquin) como su objetivo, utilizaron COVID-KG para construir una base de conocimiento de 25,534 artículos revisados ​​por pares.

Dada la pregunta "¿Cuál es la clase de drogas y qué es? ¿está aprobado actualmente para tratamiento? "Para Benazepril, COVID-KG respondió:

 COVID-KG

El equipo informó que, según los médicos y estudiantes de medicina que revisaron los resultados, COVID-KG respondió fueron "informativos, válidos y sólidos". En el futuro, los coautores planean expandir el sistema para automatizar la creación de nuevas hipótesis mediante la predicción de nuevos enlaces. También esperan crear un espacio semántico común para la literatura y utilizarlo para Mejore la base de conocimiento de medios cruzados, la inferencia y la transferencia de COVID-KG.

“Con COVID-KG, los investigadores y los médicos pueden obtener información confiable y no confiable, respuestas triviales de la literatura científica, por lo tanto, concentrarse en pruebas de hipótesis más importantes y priorizar las medidas de análisis para posibles direcciones de exploración ", escribieron los coautores." En nuestro trabajo en curso, tenemos creamos una nueva ontología que incluye 77 subtipos de entidades y 58 subtipos de eventos, y estamos utilizando esta nueva ontología para reconstruir un sistema neuronal … común y consistente ”.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *