Los procesos ETL tradicionales están bloqueando la expansión digital: es hora de una alternativa

Regresemos a 1989 cuando Internet le sucedió al usuario de computadora común. Entonces, los procesos de datos eran secuenciales, estáticos e inflexibles en el verdadero sentido. La integración en esa época fue una revolución, mientras que ETL (extraer, transformar y cargar) fue la tecnología contemporánea más allá del alcance de una empresa promedio.

Avance rápido hasta la actualidad, Internet tiene miles de millones de usuarios que producen un volumen inimaginable de datos en todo momento. Es una reencarnación en paisajes de sistemas más nuevos y todo bajo demanda. Como muchos procesos de esa época, el ETL tradicional destinado a entornos locales ya no funciona. A pesar de la evolución a lo largo de los años, los procesos ETL tradicionales han perdido la carrera hacia la locura llamada big data.

Según Gartner, solo el 20% de la información analítica generará resultados comerciales clave. Como se especula, los datos inexactos e insuficientes es una de las principales razones aquí.

Desventajas del ETL tradicional

ETL tradicional tiene las siguientes desventajas:

  • Dado que el requisito empresarial de cada transformación es único, los ingenieros de datos tienen que trabajar en programas y scripts codificados a medida. Como era de esperar, les obliga a desarrollar habilidades especializadas e intransferibles. Esto hace que la gestión del código base sea un asunto complicado.
  • ETL viene adjunto con costos generales continuos. Exige ciclos prolongados de reingeniería por parte de ingenieros de datos dedicados.
  • En ETL, los científicos de datos reciben los conjuntos de datos solo después de que los ingenieros los transforman y refinan. No solo hace que el proceso sea rígido, sino que también limita la agilidad de los resultados.
  • Inicialmente, ETL estaba destinado a sesiones periódicas de procesamiento por lotes. No es compatible con la transmisión de datos continua y automatizada. Además, su rendimiento de procesamiento, ingestión e integración de datos es insuficiente en tiempo real.

Ahora, además de todo lo anterior, el cambio revolucionario en el panorama empresarial de las instalaciones a la nube también cambió las tendencias de integración de datos. Esto llevó a un aumento explosivo en el volumen de datos producidos y consumidos en tiempo real.

Inicialmente, el procesos de preparación de datos fueron diseñados para el modelo de almacén en el que las corrientes se diseñaron estratégicamente de forma sistemática. Eso no encaja en la configuración contemporánea en la que todo está alojado en un entorno de nube.

Copyright © 2021 IDG Communications, Inc.

Related Stories