Saltar al contenido principal

Amazon Redshift

Qué es

Un servicio de almacén de datos en la nube completamente administrado y a escala de petabytes.

Para qué sirve

Almacenar y analizar grandes volúmenes de datos estructurados y semiestructurados para inteligencia empresarial, informes y análisis de big data.

Casos de uso

  • Almacenamiento de datos para inteligencia empresarial e informes
  • Análisis de datos de ventas, marketing y clientes
  • Análisis de rendimiento de aplicaciones e infraestructura
  • Previsión y planificación financiera
  • Análisis de datos de seguridad y cumplimiento

Puntos clave

  • Completamente administrado: AWS gestiona la infraestructura, copias de seguridad, parches y escalado
  • Columnar: Almacenamiento de datos en formato columnar para optimizar el rendimiento de consultas analíticas
  • Procesamiento Masivamente Paralelo (MPP): Distribuye y ejecuta consultas en múltiples nodos para un procesamiento rápido
  • Escalabilidad: Permite escalar el clúster para satisfacer las necesidades de almacenamiento y computación
  • Integración: Se integra con herramientas de BI, servicios AWS como S3, Kinesis, EMR y herramientas ETL

Comparación con Amazon Athena

  • Amazon Redshift: Un almacén de datos tradicional, ideal para datos estructurados que requieren consultas complejas y transformaciones frecuentes. Requiere aprovisionamiento de clúster (aunque existe la opción Serverless).
  • Amazon Athena: Un servicio de consulta interactiva sin servidor para datos en S3, ideal para análisis ad-hoc y exploración de datos sin la necesidad de cargar los datos en un almacén de datos.