Se acerca la descentralización de big data, ¿estás listo?


Asista a Transform 2021 para conocer los temas clave en IA y datos empresariales. Aprende más.


El paso a la computación en la nube es uno de los cambios tecnológicos más importantes de nuestra generación. Al mismo tiempo, el impulso de una década para centralizar el almacenamiento de datos en un solo almacén está terminando, ya que descargar todo en un «lago de datos» ha causado más daño que bien.

Para algunas aplicaciones, la centralización de datos a través de soluciones de almacenamiento en la nube como Amazon S3 y Snowflake funciona hasta cierto punto (ver: OPI de Snowflake). Al mismo tiempo, varios factores principales conducen a una mayor descentralización de los datos. Aquí hay tres de los más grandes.

Los datos de los clientes son escasos y están creciendo todo el tiempo

Las plataformas publicitarias más importantes han intercambiado datos de rendimiento y de clientes cada vez menos detallados a lo largo de los años. Recientemente hablé con un gerente de Procter & Gamble por teléfono y se quejaron de que, incluso con sus gastos, Google y Facebook esperan que «alquilen» datos en lugar de poseerlos. Por lo tanto, un especialista en marketing no puede simplemente construir un enorme almacén de datos, como en los viejos tiempos, poner todo en él y ejecutar un análisis. Dado que Google y Facebook se han apoderado del mercado publicitario, los especialistas en marketing solo obtienen datos a nivel de cohorte, lo que hace imposible el análisis en un repositorio central (esto tiene implicaciones interesantes para el gasto y los precios de marketing, pero esa es otra publicación). Parece que esta tendencia no se detendrá pronto, ya que medidas como prohibir las cookies de terceros y la prohibición de Apple de IDFA solo están consolidando más poder en Google, Facebook y algo en Apple.

La escasez de datos ha existido durante mucho tiempo, especialmente en el sector minorista / consumidor. Los minoristas que comparten lo menos posible con las marcas con las que trabajan han sido una fuente constante de fricciones. Por ejemplo, las empresas farmacéuticas no tienen conocimiento de dónde se recetan y venden sus medicamentos. Mientras tanto, proveedores como CVS y Walgreens están vendiendo sus datos de prescripción a IQVIA, que a su vez los alquila a las compañías farmacéuticas. ¡Están alquilando literalmente sus propios datos!

Ha empeorado con el comercio electrónico, ya que Amazon no comparte datos con sus vendedores. Como resultado, estas marcas ahora reciben incluso menos datos de los que solían recibir de las tiendas físicas. Es por eso que las marcas tradicionales han buscado adquirir marcas directas al consumidor (piense en Walmart y Jet.com, por ejemplo): tienen datos directos sobre los usuarios finales.

La transmisión de datos está muy regulada

A medida que las medidas internacionales de protección de datos como GDPR y CCPA y otras regulaciones se vuelven más estrictas, las leyes que rigen el tráfico interno e interempresarial se están examinando más de cerca. Hasta ahora, las empresas han «resuelto» este problema al exigir a sus proveedores de software que asuman todo el riesgo monetario de violar las regulaciones. Mi empresa ha renunciado a algunas oportunidades de inversión en nuevas empresas de software porque han estado demasiado expuestas en ese frente, y espero que haya empresas de tecnología que posteriormente fracasarán debido a riesgos regulatorios.

En última instancia, creo que esto cambiará la forma en que funcionan estas empresas. El primer cambio que probablemente veremos es el paso de las herramientas de datos SaaS a las herramientas autohospedadas en nubes privadas virtuales, lo que ya está ocurriendo en las finanzas. Cualquier gran empresa es una brecha de seguridad lejos de enloquecer y meterlo todo dentro. Entre otras cosas, esto ha creado la necesidad de una nueva generación de herramientas como OneTrust y BigID.

Los clientes quieren proveedores en la misma nube

Por ejemplo, suponga que un minorista como Macy’s quiere que un proveedor de SaaS ejecute su aplicación y almacene sus datos en Azure o en la VPC de Google. En este caso, el proveedor de SaaS tiene que pensar en la partición de datos y la ejecución de software en varias nubes y, a veces, incluso en varias zonas de la misma nube. Los minoristas tampoco suelen querer que sus datos estén en AWS, ya que todos compiten con Amazon. Por lo tanto, una empresa de SaaS que se ejecute en AWS debe encontrar una forma de almacenar los datos de ese minorista en Microsoft o Google Cloud, o reescribir todo su software para que se ejecute en varias nubes. A veces, estos datos deben estar en una zona geográfica particular o una zona de disponibilidad de un proveedor de nube para poder integrarse con otros datos o servicios en la misma zona.

Fuera del comercio minorista, esto tiene un impacto en la publicidad, aunque en mucha menor medida. Sin embargo, si un cliente está en una nube en particular, al menos espera que el proveedor al menos se integre en esa nube. Si el cliente ejecuta sus bases de datos en Azure, GCP o AWS, el proveedor debe hacer lo mismo si se van a exportar los datos.

Otro problema es la ubicación de los datos. Por ejemplo, suponga que una gran empresa almacena sus datos en la región de la costa oeste de AWS o Snowflake y utiliza software de Salesforce u otro proveedor de SaaS. Si este proveedor de SaaS comparte datos con otro socio / proveedor de SaaS, ambas empresas de SaaS deben descubrir cómo mover o replicar datos de una región a otra.

mirando hacia el futuro

Los crecientes movimientos ortogonales hacia la descentralización de datos y la migración de datos en la nube continuarán produciendo herramientas de datos útiles y rentables, especialmente con el auge de la profesión de la ciencia de datos.

Las organizaciones que proporcionan aplicaciones, herramientas de transporte de datos y los propios datos verán una demanda real en el futuro. La variedad de datos ahora es mayor que la escala de datos. Nadie tiene un anillo decodificador de datos. Además de construir cualquiera de estos datos, la transición a datos descentralizados resultará en la necesidad de soluciones de gestión de datos en áreas como supervivencia de datos, residencia de datos, control de acceso, enmascaramiento de datos, cifrado, gestión de identidades y mucho más.

Alex Rosen es cofundador y socio gerente de Ridge Ventures. Ha estado en el espacio del capital de riesgo durante más de 20 años y ha contado 15 salidas valoradas en más de $ 20 mil millones.

VentureBeat

La misión de VentureBeat es ser una plaza de la ciudad digital para que los responsables de la toma de decisiones tecnológicas obtengan conocimientos sobre la tecnología y las transacciones transformadoras. Nuestro sitio web proporciona información importante sobre tecnologías y estrategias de datos para ayudarlo a administrar su negocio. Te invitamos a convertirte en miembro de nuestra comunidad y acceder a:

  • información actual sobre los temas de su interés
  • nuestros boletines
  • contenido privado de líderes de opinión y acceso con descuento a nuestros valiosos eventos, como Transformar 2021: Aprende más
  • Funciones de red y más

conviértete en miembro



Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *