Google Research está cambiando el juego de las imágenes médicas con el aprendizaje auto supervisado


El aprendizaje profundo es muy prometedor en la atención médica, en particular en las imágenes médicas, donde se puede utilizar para mejorar la velocidad y la precisión del diagnóstico de las afecciones del paciente. Pero también encuentra una barrera seria: la falta de datos de entrenamiento etiquetados.

En el contexto médico, los datos de entrenamiento están asociados con altos costos, lo que hace que el uso del aprendizaje profundo sea muy difícil para muchas aplicaciones.

Para superar este obstáculo, los científicos han explorado varias soluciones con diversos grados de éxito. En un nuevo artículo, los investigadores de inteligencia artificial de Google proponen una nueva técnica que utiliza el aprendizaje auto supervisado para entrenar modelos de aprendizaje profundo para imágenes médicas. Los resultados iniciales muestran que la tecnología puede reducir la necesidad de datos anotados y mejorar el rendimiento de los modelos de aprendizaje profundo en aplicaciones médicas.

Entrenamiento previo supervisado

Las redes neuronales convolucionales han demostrado ser muy eficientes en tareas de visión por computadora. Google es una de varias organizaciones que exploran su uso en imágenes médicas. En los últimos años, la división de investigación de la compañía ha desarrollado varios modelos de imágenes médicas en áreas como oftalmología, dermatología, mamografía y patología.

«Aplicar el aprendizaje profundo a la salud es muy emocionante, pero sigue siendo un desafío, ya que se necesitan modelos de DL robustos y de alta precisión en un área como la atención médica», dijo Shekoofeh Azizi, residente de inteligencia artificial en Google Research y autor principal del artículo autocontrolado. .

Uno de los mayores desafíos del aprendizaje profundo es la necesidad de grandes cantidades de datos anotados. Las grandes redes neuronales requieren millones de ejemplos etiquetados para lograr una precisión óptima. En las instalaciones médicas, el etiquetado de datos es una tarea complicada y costosa.

«Adquirir estas ‘etiquetas’ en instalaciones médicas es un desafío por una variedad de razones: puede llevar mucho tiempo y ser costoso para los profesionales clínicos, y los datos deben cumplir con los requisitos de protección de datos relevantes antes de ser compartidos», dijo Azizi.

Los ejemplos de algunas afecciones son pocos y distantes entre sí, y otras, como la detección del cáncer de mama, pueden tardar muchos años en mostrar resultados clínicos después de que se toma una imagen médica.

Los requisitos de datos de las aplicaciones de imágenes médicas complican aún más los cambios de distribución entre los datos de entrenamiento y los entornos operativos, como

La formación previa supervisada es una forma popular de abordar la falta de datos médicos. En este enfoque, una red de convolución neuronal se entrena primero en un conjunto de datos con imágenes etiquetadas, como ImageNet. En esta fase, los parámetros de las capas del modelo se corresponden con los patrones generales que se encuentran en todo tipo de imágenes. El modelo de aprendizaje profundo entrenado se puede refinar en un conjunto limitado de ejemplos etiquetados para la tarea de destino.

Varios estudios han demostrado que la formación previa supervisada es útil en aplicaciones como las imágenes médicas donde los datos etiquetados son escasos. Pero incluso la formación previa supervisada tiene sus límites.

“El paradigma habitual para entrenar modelos de imágenes médicas es el aprendizaje por transferencia, en el que los modelos se entrenan previamente con aprendizaje supervisado en ImageNet. Sin embargo, existe un gran cambio de dominio entre las imágenes naturales en ImageNet y las imágenes médicas, y la investigación previa ha demostrado que tal entrenamiento previo supervisado en ImageNet puede no ser óptimo para desarrollar modelos de imágenes médicas «, dijo Azizi.

Entrenamiento previo autocontrolado

El aprendizaje autónomo se ha convertido en los últimos años en un área de investigación muy prometedora. Con el aprendizaje auto supervisado, los modelos de aprendizaje profundo aprenden las representaciones de los datos de entrenamiento sin la necesidad de etiquetas. Cuando se hace correctamente, el aprendizaje auto-supervisado puede ser de gran beneficio en áreas donde los datos etiquetados son escasos y los datos no etiquetados abundan.

Fuera del campo de la medicina, Google ha desarrollado varias técnicas de aprendizaje auto-supervisadas para entrenar redes neuronales para tareas de visión por computadora. Estos incluyen el Marco simple para el aprendizaje contrastante (SimCLR), que se presentó en la conferencia ICML 2020. El aprendizaje contrastante utiliza diferentes cultivos y variaciones de la misma imagen para entrenar una red neuronal hasta que aprende representaciones que son resistentes al cambio.

En su nuevo trabajo, el equipo de investigación de Google utilizó una variación del marco de trabajo SimCLR llamado aprendizaje contrastante de instancias múltiples (MICLe) que aprende representaciones más sólidas mediante el uso de múltiples imágenes del mismo estado. Este suele ser el caso de los registros médicos que tienen varias imágenes del mismo paciente, aunque es posible que las imágenes no se anoten para el aprendizaje supervisado.

“Los datos sin etiquetar suelen estar disponibles en abundancia en varios campos médicos. Una diferencia importante es que utilizamos múltiples vistas de la patología subyacente que se encuentran comúnmente en conjuntos de datos de imágenes médicas para crear pares de imágenes para el aprendizaje contrastante auto-supervisado ”, dijo Azizi.

Cuando un modelo de aprendizaje profundo auto-supervisado se entrena con diferentes ángulos de visión del mismo objetivo, aprende más representaciones que son más robustas a los cambios en el ángulo de visión, las condiciones de las imágenes y otros factores que podrían afectar negativamente su rendimiento.

Poner todo junto

El marco de aprendizaje auto-supervisado utilizado por los investigadores de Google constaba de tres pasos. Primero, la red neuronal objetivo se entrenó con SimCLR utilizando ejemplos del conjunto de datos de ImageNet. A continuación, el modelo se entrenó más con MICLe en un conjunto de datos médicos con múltiples imágenes para cada paciente. Finalmente, utilizando un conjunto limitado de imágenes anotadas, el modelo se ajusta para la aplicación de destino.

Los investigadores probaron el andamio en dos tareas de interpretación dermatológica y de rayos X de tórax. En comparación con el entrenamiento previo supervisado, el método auto-supervisado ofrece una mejora significativa en la precisión, la eficiencia del etiquetado y la generalización de los modelos de imágenes médicas fuera de distribución, lo que es especialmente importante para las aplicaciones clínicas. Además, se requieren muchos menos datos etiquetados.

«Con la ayuda del aprendizaje auto-supervisado, estamos demostrando que podemos reducir significativamente la necesidad de costosos datos anotados para crear modelos para clasificar imágenes médicas», dijo Azizi. En la tarea de dermatología en particular, pudieron entrenar las redes neuronales para que coincidieran con el rendimiento del modelo base, utilizando solo una quinta parte de los datos anotados.

“Con suerte, esto dará lugar a un ahorro significativo de tiempo y costes en el desarrollo de modelos de IA médica. Esperamos que esta metodología estimule la investigación de nuevas aplicaciones de atención médica en las que la captura de datos anotados es un desafío ”, dijo Azizi.

Ben Dickson es ingeniero de software y fundador de TechTalks. Escribe sobre tecnología, economía y política.

Esta historia apareció originalmente en Bdtechtalks.com. Copyright 2021

VentureBeat

La misión de VentureBeat es ser un mercado digital para que los responsables de la toma de decisiones tecnológicas obtengan conocimientos sobre tecnologías y transacciones transformadoras. Nuestro sitio web proporciona información esencial sobre tecnologías y estrategias de datos para ayudarlo a administrar su organización. Lo invitamos a convertirse en miembro de nuestra comunidad para obtener acceso:

  • información actualizada sobre los temas de su interés
  • nuestros boletines
  • contenido de liderazgo intelectual cerrado y acceso con descuento a nuestros valiosos eventos, como Transformar 2021: Aprende más
  • Funciones de red y más

conviértete en miembro

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *