Pular para o conteúdo principal

Amazon Polly

O que é

Um serviço de texto para fala (Text-to-Speech - TTS) que converte texto em fala realista.

Para que serve

Desenvolver aplicações que falam, permitindo criar conteúdo de áudio para uma variedade de casos de uso.

Casos de uso

  • Aplicações de voz interativas (ex: assistentes virtuais, IVRs)
  • Criação de conteúdo de áudio para e-learning, audiolivros e podcasts
  • Narração de vídeos e apresentações
  • Aplicações para pessoas com deficiência visual
  • Jogos e aplicações de entretenimento

Principais pontos

  • Fala realista: Utiliza tecnologias de deep learning para produzir vozes que soam como humanas
  • Várias vozes e idiomas: Suporta dezenas de vozes em vários idiomas
  • SSML (Speech Synthesis Markup Language): Permite controlar aspectos da fala, como volume, tom, velocidade e ênfase
  • Lexicons: Permite personalizar a pronúncia de palavras específicas
  • Stream de áudio: Converte texto em um stream de áudio em tempo real
  • Pagamento por uso: Você paga por caractere convertido em fala

Comparativo

  • Amazon Polly: Oferece uma solução escalável e econômica para gerar fala, sem a necessidade de contratar dubladores ou gerenciar estúdios de gravação. Permite atualizações rápidas e consistentes do conteúdo de áudio.
  • Gravação de voz humana: Pode oferecer uma qualidade de voz mais natural e nuances emocionais, mas é mais cara, demorada e menos flexível para atualizações de conteúdo.