La IA ha resuelto un acertijo matemático clave para comprender nuestro mundo


A menos que sea físico o ingeniero, no hay muchas razones para que sepa sobre ecuaciones diferenciales parciales. Lo sé. Después de pensar en ellos durante años mientras estudiaba ingeniería mecánica, no los he usado en el mundo real desde entonces.

Las ecuaciones diferenciales parciales o PDE también son mágicas. Son una categoría de ecuaciones matemáticas que son realmente buenas para describir cambios en el espacio y el tiempo y, por lo tanto, muy útiles para describir los fenómenos físicos en nuestro universo. Se pueden usar para modelar cualquier cosa, desde órbitas planetarias hasta tectónica de placas y turbulencias de aire que interrumpen un vuelo, lo que a su vez nos permite hacer cosas prácticas como predecir la actividad sísmica y diseñar aviones seguros.

El problema es que las PDE son notoriamente difíciles de resolver. Y aquí el significado de «resolver» quizás se ilustra mejor con un ejemplo. Por ejemplo, supongamos que está intentando simular turbulencias de aire para probar un nuevo diseño de aeronave. Existe una PDE muy conocida llamada Navier-Stokes que describe el movimiento de un líquido. Al «resolver» Navier-Stokes, puede tomar una instantánea del movimiento del aire (también conocido como condiciones del viento) en cualquier momento y modelar cómo continuará moviéndose o cómo se ha movido antes.

Estos cálculos son muy complejos y computacionalmente intensivos, razón por la cual las disciplinas que usan muchas PDE a menudo dependen de supercomputadoras para hacer los cálculos. Es por esta razón que el campo de la IA se ha interesado particularmente en estas ecuaciones. Si pudiéramos utilizar el aprendizaje profundo para acelerar el proceso de resolución, podría ser muy beneficioso para la investigación científica y la tecnología.

Ahora, los investigadores de Caltech han introducido una nueva técnica de aprendizaje profundo para resolver PDE que es mucho más precisa que los métodos de aprendizaje profundo desarrollados anteriormente. También es mucho más generalizable y capaz de resolver familias enteras de PDE, como la ecuación de Navier-Stokes para cualquier tipo de fluido, sin necesidad de reentrenamiento. Después de todo, es 1000 veces más rápido que las fórmulas matemáticas tradicionales, lo que aliviaría nuestra dependencia de las supercomputadoras y aumentaría nuestra potencia informática para modelar problemas aún mayores. Así es. Dale.

Hora del martillo

Antes de entrar en cómo los investigadores hicieron esto, primero evaluemos los resultados. En el GIF de abajo puedes ver una demostración impresionante. La primera columna muestra dos instantáneas del movimiento de un líquido. El segundo muestra cómo el líquido siguió moviéndose en la vida real. y el tercero muestra cómo la red neuronal predijo que el líquido se movería. Básicamente se ve igual que el segundo.

Se recibe el papel muchos rumores en twitter, e incluso una llamada del rapero MC Hammer. De Verdad.

Bien, volvamos a cómo lo hicieron.

Si la función encaja

Lo primero que hay que entender aquí es que las redes neuronales son básicamente aproximadores funcionales. (¿Decir qué?) Cuando entrena con un conjunto de entradas y salidas emparejadas, en realidad está calculando la función o una serie de operaciones matemáticas que se mezclan entre sí. Recuerda construir un detector de gatos. Entrena la red neuronal alimentándola con muchas imágenes de gatos y cosas que no son gatos (las entradas) y etiquetando cada grupo con un 1 y un 0 (las salidas), respectivamente. Luego, la red neuronal busca la mejor función que pueda convertir cada imagen de un gato en un 1 y cada imagen de todo lo demás en un 0. Para que pueda ver una nueva imagen y decirte si es un gato o no. Utiliza la función que encontró para calcular la respuesta, y si el entrenamiento fue bueno, será correcto la mayor parte del tiempo.

Convenientemente, este proceso de aproximación funcional es lo que necesitamos para resolver un PDE. En última instancia, intentamos encontrar una función que describa mejor, por ejemplo, el movimiento de las partículas de aire a través del espacio y el tiempo físicos.

Aquí está la esencia del artículo. Las redes neuronales generalmente están entrenadas para aproximar funciones entre entradas y salidas que se definen en el espacio euclidiano, su gráfico clásico con ejes x, y y z. Esta vez, sin embargo, los investigadores decidieron definir las entradas y salidas en el espacio de Fourier, un tipo especial de diagrama utilizado para trazar las frecuencias de onda. La intuición que han extraído del trabajo en otras áreas es que algo como el movimiento del aire en realidad puede describirse como una combinación de frecuencias de onda, dice Anima Anandkumar, profesora de Caltech que, junto con sus colegas, Los profesores Andrew Stuart y Kaushik, Bhattacharya supervisaron la investigación. La dirección general del viento en el nivel macro es como una baja frecuencia con ondas muy largas y letárgicas, mientras que los pequeños remolinos que se forman en el nivel micro son como frecuencias altas con ondas muy cortas y rápidas.

¿Por qué es tan importante? Porque es mucho más fácil aproximar una función de Fourier en el espacio de Fourier que discutir con PDE en el espacio euclidiano, lo que simplifica enormemente el trabajo de la red neuronal. Ganancias importantes en precisión y eficiencia: además de su enorme ventaja de velocidad sobre los métodos tradicionales, su técnica logra una tasa de error un 30% menor al resolver Navier-Stokes que los métodos de aprendizaje profundo anteriores.

Todo es extremadamente inteligente y también hace que el método sea generalizable. Los métodos de aprendizaje profundo anteriores debían entrenarse por separado para cada tipo de líquido, mientras que esto solo tenía que entrenarse una vez para manejarlos todos, como confirmaron los experimentos de los investigadores. Si bien todavía no han intentado extender esto a otros ejemplos, también debería poder manejar cualquier composición de la tierra en la resolución de PDE relacionadas con la actividad sísmica o cualquier tipo de material en la resolución de PDE relacionadas con la conductividad térmica.

Super simulación

Los profesores y sus estudiantes de doctorado hicieron esta investigación no solo por diversión teórica. Quieren llevar la IA a disciplinas más científicas. A través de conversaciones con varios empleados de los campos de la ciencia del clima, la sismología y la ciencia de los materiales, Anandkumar primero decidió abordar el desafío del PDE con sus colegas y estudiantes. Ahora están trabajando para poner en práctica su método con otros investigadores de Caltech y el Laboratorio Nacional Lawrence Berkeley.

Un tema de investigación que interesa especialmente a Anandkumar: el cambio climático. Navier-Stokes no solo es bueno para modelar turbulencias de aire. También se utiliza para modelar patrones climáticos. “Los pronósticos meteorológicos buenos y detallados a escala global son un problema tan desafiante”, dice, “e incluso en las supercomputadoras más grandes no podemos hacer eso a escala global hoy en día. Si podemos utilizar estos métodos para acelerar todo el proceso, sería enormemente poderoso. «

También hay muchos, muchos otros usos, agrega. «Con eso en mente, el cielo es el límite, ya que tenemos una forma común de acelerar todas estas aplicaciones».



Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *