Amazon Polly

O que é

Um serviço de texto para fala (Text-to-Speech - TTS) que converte texto em fala realista.

Desenvolver aplicações que falam, permitindo criar conteúdo de áudio para uma variedade de casos de uso.

Fala realista: Utiliza tecnologias de deep learning para produzir vozes que soam como humanas
Várias vozes e idiomas: Suporta dezenas de vozes em vários idiomas
SSML (Speech Synthesis Markup Language): Permite controlar aspectos da fala, como volume, tom, velocidade e ênfase
Lexicons: Permite personalizar a pronúncia de palavras específicas
Stream de áudio: Converte texto em um stream de áudio em tempo real
Pagamento por uso: Você paga por caractere convertido em fala

Amazon Polly: Oferece uma solução escalável e econômica para gerar fala, sem a necessidade de contratar dubladores ou gerenciar estúdios de gravação. Permite atualizações rápidas e consistentes do conteúdo de áudio.
Gravação de voz humana: Pode oferecer uma qualidade de voz mais natural e nuances emocionais, mas é mais cara, demorada e menos flexível para atualizações de conteúdo.