Amazon Redshift
Qué es
Un servicio de almacén de datos en la nube completamente administrado y a escala de petabytes.
Para qué sirve
Almacenar y analizar grandes volúmenes de datos estructurados y semiestructurados para inteligencia empresarial, informes y análisis de big data.
Casos de uso
- Almacenamiento de datos para inteligencia empresarial e informes
- Análisis de datos de ventas, marketing y clientes
- Análisis de rendimiento de aplicaciones e infraestructura
- Previsión y planificación financiera
- Análisis de datos de seguridad y cumplimiento
Puntos clave
- Completamente administrado: AWS gestiona la infraestructura, copias de seguridad, parches y escalado
- Columnar: Almacenamiento de datos en formato columnar para optimizar el rendimiento de consultas analíticas
- Procesamiento Masivamente Paralelo (MPP): Distribuye y ejecuta consultas en múltiples nodos para un procesamiento rápido
- Escalabilidad: Permite escalar el clúster para satisfacer las necesidades de almacenamiento y computación
- Integración: Se integra con herramientas de BI, servicios AWS como S3, Kinesis, EMR y herramientas ETL
Comparación con Amazon Athena
- Amazon Redshift: Un almacén de datos tradicional, ideal para datos estructurados que requieren consultas complejas y transformaciones frecuentes. Requiere aprovisionamiento de clúster (aunque existe la opción Serverless).
- Amazon Athena: Un servicio de consulta interactiva sin servidor para datos en S3, ideal para análisis ad-hoc y exploración de datos sin la necesidad de cargar los datos en un almacén de datos.