ProBeat: Comparta sus conjuntos de datos con la comunidad de investigación de IA y benefíciese de las ventajas


Esta semana presentamos cómo Duolingo usa la inteligencia artificial en cada parte de su aplicación, incluidas historias, consejos inteligentes, podcasts, informes e incluso notificaciones. La historia se basa en entrevistas con el director ejecutivo Luis von Ahn y el director de investigación Burr Settles, quienes se unieron a la empresa en 2013 como el primer empleado de inteligencia artificial de la empresa (Duolingo se fundó en 2012). Si bien esta historia cubre específicamente la IA en Duolingo, que creo que es relevante para cualquier startup que busque invertir en IA desde el principio, quería publicar el final de mi entrevista con Burr para obtener información aún más completa.

Pero primero un poco de contexto desde arriba en nuestra discusión. "Estamos enfocando los proyectos de IA de tres maneras", explicó Settles. “AI para facilitar la creación de contenido de alta calidad en nuestros procesos. AI para ser más atractivo y emocionante para que la gente siga regresando. Y luego IA para crear algún tipo de modelo de conocimiento y luego personalizar la experiencia. Así que hay proyectos en marcha en las tres áreas. “

La siguiente transcripción tendrá más sentido si lee primero la historia de Duolingo. Una observación: la forma en que Settles describe cómo Duolingo publica sus registros me recuerda los primeros días en que Mozilla construyó su navegador de fábrica y cómo la revolución del código abierto que siguió afectó el desarrollo de software.

VentureBeat: ¿Qué te gustaría ver? Duolingo usa IA para el próximo: ¿cuál es el próximo gran avance?

Siedelt: Estas tres cosas en líneas generales. La IA está diseñada para mejorar el proceso de colaborar con las personas y desarrollar un buen contenido. Muy parecido al sistema interactivo que describí para Smart Tips. Como puedes imaginar, también trabajas en fonología: con qué tipo de sonidos luchan las personas, no solo con qué tipo de gramática luchan. O haga que el proyecto de priorización de informes sea irrelevante porque ahora tenemos sistemas de traducción automática en los que puede escribir y obtener todo tipo de traducciones correctas, en lugar de solo la mejor traducción posible como lo hacen la mayoría de los sistemas de traducción automática. [19659002] Los problemas en los que estamos trabajando son tan únicos que la gente en la ciencia y en otras partes de la industria no trabaja en estos problemas porque son muy específicos de Duolingo. Sin embargo, tenemos tantos datos y es tan interesante que publicamos conjuntos de datos para impulsar la comunidad de investigación y traer nuevos problemas interesantes a la comunidad de investigación. Cuando publicamos un artículo, generalmente publicamos el conjunto de datos junto con él, pero también alojamos cosas llamadas tareas compartidas. Así que acabamos de tener una tarea conjunta en 2020 relacionada con lo que estaba hablando, esto de la traducción.

Por lo general, la traducción automática solo le brinda una entrada y una salida cuando desea traducir este inglés al portugués. Pero lo que es importante para nosotros, dado que los alumnos pudieron ingresar todo tipo de cosas correctas, formalizamos una tarea y pusimos los datos a disposición de la comunidad de PNL por primera vez. Aquí hay una entrada. Y luego hay toneladas de diferentes ediciones aquí, todas las cuales son correctas. También se ponderan según su probabilidad. Por ejemplo, qué tan comunes son, qué tan fluidos son.

Creo que había una docena de equipos diferentes de todo el mundo. Aquí hay un documento general que escribimos que resume los diferentes enfoques utilizados por los diferentes equipos. Este es un proyecto en el que hemos estado trabajando internamente y hemos descubierto que, esencialmente, tener una persona trabajando en él a tiempo parcial es un problema demasiado grande. Así que hicimos una pausa y luego publicamos el conjunto de datos, lo lanzamos al aire, y mucha gente se entusiasmó con las comunidades de aprendizaje automático y parafraseo.

Y tenían algunas ideas realmente interesantes. Ahora tomemos estas ideas y luego mejoremos nuestros procesos de traducción internos basados ​​en algunas de esas ideas que podríamos haber propuesto si tuviéramos la amplitud para hacerlo. Pero fue como esta situación en la que todos ganan, con otras personas que arrojan espaguetis contra la pared. Y luego todos tenemos que aprender qué hay dentro.

Con suerte, este conjunto de datos será un punto de referencia para el aprendizaje automático dentro de 10 años, ya que es un problema nuevo en el que nadie podría trabajar.

VentureBeat: Así que volvamos a mi pregunta. ¿Cuál es la principal cosa que Duolingo quiere hacer con la IA? ¿Es solo más investigación?

Resuelve: Bueno, eso es todo y sí. Hay mucho potencial, especialmente para lenguajes de bajos recursos. Al igual que muchas IA relacionadas con el idioma, la IA solo se centra en el inglés. Queremos enseñar a los navajos lo mejor que podamos. Queremos enseñar irlandés. No hay muchos recursos para esto.

Con el fin de realizar una investigación que traspase los límites en la larga cola de los lenguajes, se están desarrollando procesos en los que la IA trabaja con los humanos para crear contenido de clase mundial. Luego, todo el comportamiento del usuario de la interacción del usuario con la aplicación se utiliza para lograr una experiencia más atractiva a través de la personalización y la creación de nuevos tipos de interfaces de usuario. Quiero decir, no puedes tener una conversación con Duolingo en este momento, pero tal vez en unos años puedas.

VentureBeat: Esa sería una propuesta de valor completamente diferente.

Se resuelve: Sí, tratamos de traspasar los límites para acercarnos lo más posible a la experiencia de un maestro individual. No para reemplazar a los maestros de clase, solo porque todos en el mundo, independientemente de su estatus socioeconómico, merecen ese tipo de experiencia, creo. La curva de oferta-demanda no está diseñada para esto. Entonces, la IA es la mejor manera de hacerlo. Ese es nuestro objetivo.

VentureBeat: Hablamos mucho sobre cómo Duolingo usa la IA para mejorar la aplicación. ¿Qué hay de ayudar a la empresa a generar ingresos, obtener suscripciones premium de Duolingo, etc.?

Asentamientos: Es curioso que haya algunos proyectos en marcha allí. Sin embargo, yo diría que el 90% de los proyectos de IA que hacemos en la empresa están orientados a enseñar o evaluar mejor el lenguaje. Y creo que se debe a este valor fundamental de que, si concretamos estas cosas, el resto del negocio seguirá su ejemplo. Pero si no entendemos estas cosas, a largo plazo no importa cuántos ingresos estemos obteniendo este año si no enseñamos mejor el próximo año que este año.

VentureBeat: Estoy de acuerdo con sus prioridades, pero como no hemos hablado de ese 10%, ¿cómo usa la IA para mejorar las ventas, si es que lo hace?

Facturación: Cosas que básicamente afectan a todas las demás startups Por ejemplo, el mundo trata de predecir a los usuarios si los usuarios cumplirán o no con sus suscripciones. Si se renuevan o no cuando llegue el momento. Intentar optimizar, al igual que usamos el aprendizaje automático para elegir qué notificación enviar, se basa en ambos factores, como esta compensación entre notificaciones que parecen funcionar bien, pero también en cosas que ha visto recientemente, por lo que no le importan. volverse insensible. Por lo tanto, estamos aplicando algunas de estas técnicas al flujo de compra de suscripciones. Todas esas cosas bastante aburridas sobre las que puedes leer en casi todos los blogs de empresas. Nosotros también hacemos estas cosas.

VentureBeat: Muchas gracias por su tiempo.

Se instala: Es un placer.

ProBeat es una columna en la que Emil regaña por todo lo que se le cruza esta semana.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *