OpenAI apoyado por Elon Musk muestra el generador de imágenes Dall-E según GPT-3


El fundador de SpaceX, Elon Musk, asiste a una conferencia de prensa posterior al lanzamiento después del lanzamiento del cohete SpaceX Falcon 9 desde el Centro Espacial Kennedy en Cabo Cañaveral, Florida, en un vuelo de prueba sin tornillos a la Estación Espacial Internacional en la nave espacial Crew Dragon el 2 de marzo de 2019. .

Mike Blake | Reuters

Los sillones con forma de aguacates y rábanos baby daikon con tutús se encuentran entre las imágenes extravagantes creadas con el nuevo software de OpenAI, un laboratorio de inteligencia artificial respaldado por Elon Musk en San Francisco.

OpenAI entrenó el software conocido como Dall-E para generar imágenes a partir de leyendas de texto breves. Específicamente, utilizó un conjunto de datos de 12 mil millones de imágenes y sus leyendas que se encuentran en Internet.

El laboratorio dijo que Dall-E, un acrónimo del artista surrealista español Salvador Dali y Wall-E, un pequeño robot animado de la película de Pixar del mismo nombre, aprendió a crear imágenes para una variedad de conceptos.

OpenAI mostró algunos de los resultados en una publicación de blog publicada el martes. «Encontramos eso [Dall-E] tiene una serie de capacidades, incluida la creación de versiones antropomorfizadas de animales y objetos, la combinación plausible de conceptos no relacionados, la representación de texto y la aplicación de transformaciones a imágenes existentes «, escribió la compañía.

Dall-E se basa en una red neuronal, un sistema informático inspirado vagamente en el cerebro humano que puede reconocer patrones e identificar relaciones entre grandes cantidades de datos.

Si bien las redes neuronales han generado imágenes y videos anteriormente, Dall-E es inusual ya que se basa en la entrada de texto, mientras que los demás no.

Los videos e imágenes sintéticos se han vuelto más complejos en los últimos años, ya que se ha vuelto difícil para los humanos distinguir entre lo real y lo generado por computadora. Por ejemplo, las redes generales de adversario (GAN), que utilizan dos redes neuronales, se han utilizado para crear videos falsos de políticos.

OpenAI reconoció que Dall-E tiene «el potencial de impactos sociales amplios y significativos» y planea analizar cómo modelos como Dall-E «se relacionan con problemas sociales como el impacto económico en ciertos procesos de trabajo y ocupaciones, y el potencial de sesgo. los resultados del modelo y los desafíos éticos a largo plazo que plantea esta tecnología «.

Sucesor de GPT-3

Dall-E llega solo unos meses después de que OpenAI anunciara que habían construido un generador de texto llamado GPT-3 (preentrenamiento generativo), que también es compatible con una red neuronal.

La herramienta de generación de voz puede producir texto similar a un humano si es necesario. Se hizo relativamente famoso por ser un programa de inteligencia artificial cuando la gente se dio cuenta de que podía escribir sus propios poemas, artículos de noticias e historias cortas.

«Dall-E es un sistema Text2Image que se basa en GPT-3, pero está entrenado en texto e imágenes», dijo Mark Riedl, profesor asociado de la Escuela de Computación Interactiva de Georgia Tech, a CNBC.

«Text2image no es nuevo, pero la demostración de Dall-E es notable por producir ilustraciones que son mucho más coherentes que otros sistemas Text2Image que he visto a lo largo de los años».

OpenAI ha competido con empresas como DeepMind y Facebook AI Research Group para desarrollar algoritmos de propósito general que pueden realizar una amplia gama de tareas a nivel humano y más allá.

Los investigadores han desarrollado IA que pueden jugar juegos complejos como el ajedrez y el juego de mesa chino Go, traducir un idioma humano a otro y detectar tumores en una mamografía. Sin embargo, lograr que un sistema de inteligencia artificial muestre «creatividad» real es un gran desafío en la industria.

Riedl dijo que los resultados de Dall-E mostraron que había aprendido a mezclar conceptos de manera coherente, y agregó que «la capacidad de mezclar conceptos de manera coherente se considera una forma clave de creatividad en los seres humanos».

«Desde el punto de vista de la creatividad, este es un gran paso adelante», agregó Riedl. «Si bien no hay mucho acuerdo sobre lo que significa que un sistema de IA ‘comprenda’ algo, la capacidad de usar conceptos de nuevas formas es una parte importante de la creatividad y la inteligencia».

Neil Lawrence, ex director de aprendizaje automático en Amazon Cambridge, dijo a CNBC que Dall-E se ve «muy impresionante».

Lawrence, que ahora es profesor de aprendizaje automático en la Universidad de Cambridge, lo describió como «una demostración inspiradora de la capacidad de estos modelos para almacenar y generalizar información sobre nuestro mundo de formas que las personas encuentran muy naturales».

Dijo: «Asumo que habrá todo tipo de usos de este tipo de tecnología que ni siquiera puedo imaginar. Pero también es interesante ser otra tecnología alucinante que resuelva los problemas que tenemos. no han resuelto «. Incluso sé que lo teníamos. «

«No mejora el estado de la IA»

Sin embargo, no todo el mundo está tan impresionado con Dall-E.

Gary Marcus, un emprendedor que vendió una startup de aprendizaje automático a Uber por una suma no revelada en 2016, le dijo a CNBC que era interesante pero que «no avanzó en el estado de la IA».

También señaló que no es de fuentes abiertas y la compañía aún no ha publicado ningún artículo sobre la investigación.

Marcus cuestionó anteriormente si algunas de las investigaciones publicadas en los últimos años por el laboratorio DeepMind del competidor deberían clasificarse como «avances».

OpenAI fue fundada como una organización sin fines de lucro con un compromiso de mil millones de dólares por parte de un grupo de fundadores, incluido Elon Musk, director ejecutivo de Tesla. En febrero de 2018, Musk dejó la junta de OpenAI, pero continúa donando y asesorando a la organización.

OpenAI se convirtió en lucrativo en 2019, recaudando $ 1 mil millones adicionales de Microsoft para financiar su investigación. GPT-3 será el primer producto comercial de OpenAI y Reddit se registró como uno de los primeros clientes.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *