Amazon Polly
O que é
Um serviço de texto para fala (Text-to-Speech - TTS) que converte texto em fala realista.
Para que serve
Desenvolver aplicações que falam, permitindo criar conteúdo de áudio para uma variedade de casos de uso.
Casos de uso
- Aplicações de voz interativas (ex: assistentes virtuais, IVRs)
- Criação de conteúdo de áudio para e-learning, audiolivros e podcasts
- Narração de vídeos e apresentações
- Aplicações para pessoas com deficiência visual
- Jogos e aplicações de entretenimento
Principais pontos
- Fala realista: Utiliza tecnologias de deep learning para produzir vozes que soam como humanas
- Várias vozes e idiomas: Suporta dezenas de vozes em vários idiomas
- SSML (Speech Synthesis Markup Language): Permite controlar aspectos da fala, como volume, tom, velocidade e ênfase
- Lexicons: Permite personalizar a pronúncia de palavras específicas
- Stream de áudio: Converte texto em um stream de áudio em tempo real
- Pagamento por uso: Você paga por caractere convertido em fala
Comparativo
- Amazon Polly: Oferece uma solução escalável e econômica para gerar fala, sem a necessidade de contratar dubladores ou gerenciar estúdios de gravação. Permite atualizações rápidas e consistentes do conteúdo de áudio.
- Gravação de voz humana: Pode oferecer uma qualidade de voz mais natural e nuances emocionais, mas é mais cara, demorada e menos flexível para atualizações de conteúdo.