Pular para o conteúdo principal

Amazon Athena

O que é

Serviço de consultas interativas sem servidor que permite analisar dados diretamente no Amazon S3 usando SQL padrão.

Para que serve

Ideal para análise de dados ad-hoc e exploração de dados em data lakes sem a necessidade de gerenciar infraestrutura.

Casos de uso

  • Análise de logs (ex: logs de servidor web no S3)
  • Exploração de dados ad-hoc (ex: analisar novos conjuntos de dados no S3)
  • Consulta a data lakes (ex: consultar dados de transações de clientes no S3)
  • Relatórios de inteligência de negócios (integrado com ferramentas de BI como Amazon QuickSight)

Principais pontos

  • Sem servidor: Não há infraestrutura para gerenciar
  • Pagamento por consulta: Você paga apenas pelos dados verificados pelas suas consultas
  • SQL padrão: Utiliza SQL ANSI padrão, facilitando o uso para quem já conhece SQL
  • Integração com S3: Consulta dados diretamente no Amazon S3, suportando diversos formatos (CSV, JSON, Parquet)
  • Integração com AWS Glue: Utiliza o Glue Data Catalog para metadados

Comparativo com Amazon Redshift

  • Athena: Focado em análises ad-hoc em dados no S3, sem servidor, pagamento por consulta. Melhor para cargas de trabalho intermitentes ou variáveis.
  • Redshift: Data warehouse totalmente gerenciado, ideal para análises e relatórios complexos e em grande escala, com dados estruturados que exigem consultas e transformações frequentes. Pagamento baseado no tamanho e uso do cluster. Alto desempenho para consultas complexas.