Ciencia de datos en un mundo posterior a COVID


Únase a Transform 2021 del 12 al 16 de julio. Regístrese para el evento de IA del año.


A menudo me preguntan sobre el estado de la ciencia de datos y dónde nos encontramos ahora desde una perspectiva de madurez. La respuesta es bastante interesante, especialmente ahora que hace más de un año, COVID-19 inutilizó la mayoría de los modelos de ciencia de datos, al menos temporalmente.

COVID obligó a las empresas a dar un salto de modelo completo para adaptarse al cambio dramático en la vida diaria. Los modelos tuvieron que volver a capacitarse y volver a implementarse rápidamente para darle sentido a un mundo que cambió de la noche a la mañana. Muchas empresas chocaron contra una pared, pero otras pudieron crear nuevos procesos de ciencia de datos que podrían entrar en producción mucho más rápido y más fácilmente que antes. Desde esta perspectiva, los procesos de ciencia de datos se han vuelto más flexibles.

Ahora hay un nuevo desafío: la vida después de la pandemia. Gente de todo el mundo cree que el fin de la pandemia está a la vista. Sin embargo, es muy poco probable que todos volvamos mágicamente a nuestros comportamientos y rutinas previas a la pandemia. En cambio, tenemos un período de transición que requerirá un cambio largo y lento para establecer una línea de base o nuevas normas. Durante esta transición, nuestros modelos de datos requieren un monitoreo casi constante, a diferencia del COVID que se muestra en el salto al por mayor. Los científicos de datos nunca se han encontrado con nada que debamos esperar en los próximos meses.

Incline la balanza

Cuando se nos pregunta qué es lo que más extrañamos de la vida antes de la pandemia, muchos de nosotros decimos cosas como viajar, salir a comer, tal vez ir de compras. Existe una enorme demanda reprimida por todo lo que se ha perdido.

Hay un gran grupo de personas que no se ven afectadas económicamente por la pandemia. Dado que no han podido perseguir sus intereses habituales, es probable que tengan bastante dinero en efectivo a su disposición. Sin embargo, es poco probable que los modelos actuales de ciencia de datos que miden el gasto en ingresos disponibles estén preparados para un aumento que probablemente supere al gasto antes de la pandemia.

Los modelos de precios están diseñados para optimizar cuánto están dispuestas a pagar las personas por ciertos tipos de viajes, estadías en hoteles, comidas, bienes, etc. Las aerolíneas son un buen ejemplo. Antes de COVID-19, los motores de predicción de precios de los reactores asumieron todo tipo de optimizaciones. Habían incorporado la estacionalidad, así como ciertos períodos, como viajes de vacaciones o vacaciones de primavera, lo que hizo que los precios subieran aún más. Construyeron diferentes clases de tarifas y más. Implementaron esquemas de optimización muy sofisticados, a menudo creados manualmente, que eran bastante precisos hasta que la pandemia los hizo estallar.

Pero para una vida después de COVID, las aerolíneas deben mirar más allá de las categorías habituales para satisfacer la intensa demanda de viajes de los consumidores. En lugar de volver a sus viejos modelos, haga preguntas como: «¿Puedo obtener más dinero en ciertos tipos de viajes y aún así vender el avión?» Si las aerolíneas utilizan modelos con regularidad para responder estas y otras preguntas, los precios de ciertos itinerarios subirán. Pasará algún tiempo antes de que veamos que los consumidores comiencen a regular sus gastos nuevamente. En cierto momento, la gente se queda sin dinero. Lo que realmente necesitamos son modelos que reconozcan cuándo ocurren tales cambios y que se adapten continuamente.

Por otro lado, hay otro segmento de la población que tiene (y sigue teniendo) dificultades económicas como resultado de la pandemia. No pueden volverse locos con sus gastos porque les queda poco o nada para gastar. Quizás todavía tengan que encontrar trabajo. Esto también está teniendo un impacto negativo en la economía, ya que millones de personas intentan volver a donde estaban antes de COVID. Las personas que anteriormente hubieran desempeñado un papel importante en los modelos económicos se eliminan efectivamente de la ecuación por el momento.

Deriva del modelo

COVID fue una gran explosión que cambió las cosas. Eso fue fácil de detectar, pero este extraño momento que ahora vamos a navegar, hacia una nueva normalidad, será mucho más difícil de interpretar. Es un caso de cambio de modelo en el que la realidad está cambiando lentamente.

Si las empresas simplemente comienzan a implementar sus modelos anteriores a COVID nuevamente o se apegan a lo que desarrollaron durante la pandemia, sus modelos no les darán las respuestas correctas. Por ejemplo, muchos empleados están listos para regresar a la oficina, pero aún pueden optar por trabajar desde casa unos días a la semana. Esta decisión aparentemente pequeña afecta a todo, desde los patrones de tráfico (menos automóviles en la carretera en las horas pico) hasta el uso de agua y electricidad (las personas se duchan en diferentes momentos y usan más electricidad para alimentar sus oficinas en el hogar). Luego están las ventas de restaurantes y supermercados: con menos empleados en la oficina, los almuerzos de catering y las comidas pre-pandémicas con compañeros de trabajo están cayendo, mientras que las ventas de comestibles tienen que cortar el almuerzo en casa. Y aquí solo estamos viendo los efectos de un solo comportamiento (transición al trabajo parcial desde casa). Piense en el impacto de los cambios en todos los demás comportamientos que ocurrieron durante la pandemia.

La lenta marcha a la normalidad

Para crear un entorno en el que se pueda afrontar este desafío sin precedentes, las empresas deben reunir a equipos completos de ciencia de datos, no solo a ingenieros de aprendizaje automático. La ciencia de datos no se trata solo de entrenar un nuevo modelo de inteligencia artificial o aprendizaje automático. También se trata de analizar diferentes tipos de datos, así como nuevas fuentes de datos. Y significa invitar a los gerentes y otros empleados a unirse al proceso. Cada participante juega un papel debido a la mecánica involucrada.

Estos equipos deben abordar los patrones que surgen en las regiones que se han reabierto después de COVID. ¿Está todo funcionando a plena capacidad? ¿Cómo está yendo? Hay muchos datos que se pueden usar, pero vienen en partes. Cuando combinamos estos conocimientos con lo que vimos antes y durante COVID para volver a entrenar nuestros modelos y hacer nuevas preguntas, estamos ante una ciencia de datos extremadamente valiosa con modelos mixtos que dan cuenta de las variaciones en las prácticas y actividades.

Es imperativo que los equipos monitoreen constantemente los modelos, lo que están haciendo, cómo funcionan, para ver cuándo ya no coinciden con la realidad. Esto va mucho más allá de las pruebas A / B clásicas y también incluye modelos Challenger y mezcla de modelos pre-COVID con modelos más nuevos. Pruebe otras hipótesis y agregue nuevas suposiciones. Las organizaciones pueden sorprenderse al ver lo que de repente funciona mucho mejor que antes, y luego ver que esos supuestos del modelo finalmente fallan nuevamente.

Las organizaciones deben prepararse para tener una capacidad de ciencia de datos flexible que pueda crear, actualizar e implementar modelos continuamente para representar una realidad en constante evolución.

Michael Berthold es CEO y cofundador de KNIME, una empresa de análisis de datos de código abierto. Tiene más de 25 años de experiencia en ciencia de datos, trabaja en el campo académico, más recientemente como profesor titular en la Universidad de Konstanz (Alemania) y anteriormente en la Universidad de California en Berkeley y Carnegie Mellon, así como en la industria en la red neuronal de Intel. Grupo, Utopía y Tripos. Michael ha publicado numerosas publicaciones sobre análisis de datos, aprendizaje automático e inteligencia artificial. Sigue a Michael en Gorjeo, LinkedIn y el blog KNIME.

VentureBeat

La misión de VentureBeat es ser una plaza de la ciudad digital para que los responsables de la toma de decisiones tecnológicas obtengan conocimientos sobre tecnología y transacciones transformadoras. Nuestro sitio web proporciona información importante sobre tecnologías y estrategias de datos para ayudarlo a administrar su negocio. Te invitamos a convertirte en miembro de nuestra comunidad y acceder a:

  • información actual sobre los temas de su interés
  • nuestros boletines
  • contenido privado de líderes de opinión y acceso con descuento a nuestros valiosos eventos, como Transformar 2021: Aprende más
  • Funciones de red y más

conviértete en miembro



Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *