Nvidia y Harvard están desarrollando una herramienta de inteligencia artificial que acelera el análisis del genoma


Asista a Transform 2021 para conocer los temas clave en IA y datos empresariales. Aprende más.


Los investigadores que trabajan con Nvidia y Harvard detallaron hoy AtacWorks, un conjunto de herramientas de aprendizaje automático diseñado para reducir el costo y el tiempo de los experimentos unicelulares y poco frecuentes. En un estudio publicado en la revista Comunicación de la naturalezaLos coautores demostraron que AtacWorks puede realizar análisis de un genoma completo en solo media hora, en comparación con los métodos convencionales que toman varias horas.

La mayoría de las células del cuerpo llevan una copia completa del ADN de una persona con miles de millones de pares de bases en el núcleo. Sin embargo, una sola célula solo extrae la parte de los componentes genéticos que necesita para funcionar, y los tipos de células, como el hígado, la sangre o las células de la piel, utilizan diferentes genes. Las regiones de ADN que determinan la función de una célula son más o menos accesibles, mientras que el resto está protegido por proteínas.

AtacWorks, disponible a través del concentrador NGC de Nvidia para software optimizado para GPU, funciona con ATAC-seq, un método para encontrar áreas abiertas en el genoma en células desarrollado por el profesor de Harvard Jason Buenrostro, uno de los coautores del artículo. ATAC-seq mide la intensidad de una señal en cualquier punto del genoma. Los picos en la señal corresponden a regiones de ADN, por lo que cuantas menos células estén disponibles, más fuertes serán los datos, lo que dificulta identificar qué áreas del ADN son accesibles.

ATAC-seq generalmente requiere decenas de miles de células para obtener una señal limpia. Según los coautores, la aplicación de AtacWorks conduce a la misma calidad de resultados con solo diez celdas.

AtacWorks se entrenó en pares etiquetados de registros ATAC-seq coincidentes, uno de alta calidad y otro ruidoso. Con una copia reducida de los datos, el modelo aprendió a predecir una versión precisa y de alta calidad e identificar picos en la señal. Usando AtacWorks, los investigadores encontraron que podían detectar cromatina accesible, un complejo de ADN y proteína cuya función principal es empaquetar moléculas largas en estructuras más compactas, en una secuencia ruidosa de 1 millón de lecturas, casi tan bien como los métodos tradicionales con una limpieza. récord de 50 millones de lecturas.

AtacWorks podría permitir a los científicos realizar investigaciones utilizando menos células, reduciendo el costo de la recolección y secuenciación de muestras. El análisis también podría ser más rápido y económico. AtacWorks se ejecutó en las GPU Nvidia Tensor Core y tardó menos de 30 minutos en inferir un genoma. Este proceso tomaría 15 horas en un sistema con 32 núcleos de CPU.

Haciendo Comunicación de la naturaleza En este artículo, los investigadores de Harvard aplicaron AtacWorks a un conjunto de datos de células madre que producen glóbulos rojos y blancos, subtipos raros que los métodos tradicionales no han podido estudiar. Usando un conjunto de muestra de solo 50 células, el equipo usó AtacWorks para identificar diferentes regiones de ADN asociadas con células que se convierten en glóbulos blancos y secuencias separadas que se correlacionan con glóbulos rojos.

«En el caso de tipos de células muy raras, no es posible examinar las diferencias en su ADN utilizando los métodos existentes», dijo la investigadora de Nvidia Avantika Lal, primera autora del artículo. «AtacWorks no solo puede ayudar a reducir el costo de recopilar datos sobre la accesibilidad de la cromatina, sino que también puede abrir nuevas vías para el descubrimiento y el diagnóstico de fármacos».

VentureBeat

La misión de VentureBeat es ser una plaza de la ciudad digital para que los responsables de la toma de decisiones tecnológicas obtengan conocimientos sobre la tecnología y las transacciones transformadoras. Nuestro sitio web proporciona información importante sobre tecnologías y estrategias de datos para ayudarlo a administrar su negocio. Te invitamos a convertirte en miembro de nuestra comunidad y acceder a:

  • información actual sobre los temas de su interés
  • nuestros boletines
  • contenido privado de líderes de opinión y acceso con descuento a nuestros valiosos eventos como Transform
  • Funciones de red y más

conviértete en miembro

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *