Transcrição de áudio gratuita no seu browser
Corre o VoxScriber Nano open-source no seu browser — IA local, até 10 min por ficheiro, precisão básica (~85%). Para uso profissional, conheça o Premium.
A transcrição corre no seu browser (IA local). Pode optar por partilhar o resultado connosco (opcional, com consentimento) para melhorar o serviço. Limite: 10 min por ficheiro, precisão ~85%.
Gratuito vs Premium — veja a diferença
| Gratuito (browser) | Premium (nuvem) | |
|---|---|---|
| Limite por ficheiro | 10 min | 10 horas |
| Precisão | ~85% | >95% |
| Diarização (quem falou) | ❌ | ✅ |
| Timestamps por palavra | ❌ | ✅ |
| Suporte a vídeo (MP4/MOV) | ❌ | ✅ |
| Formatos de exportação | TXT, SRT, VTT | DOCX, PDF, JSON… |
| Velocidade (1h de áudio) | ~2 min / 1h | ~2 min / 1h |
| Privacidade | 100% local | ☁️ + 🔒 |
IA local
Transcrição feita no seu browser. Partilha com os nossos servidores é opcional (requer consentimento).
Rápido e local
Processamento direto no browser, sem filas de espera.
99 idiomas
Deteta automaticamente o idioma do áudio.
Sem registo
Comece imediatamente, sem criar conta.
Como funciona
Carregue ou grave o áudio
Arraste um ficheiro MP3, WAV, M4A, OGG ou use o microfone diretamente.
O modelo corre no seu dispositivo
O Whisper AI é descarregado uma vez e fica em cache. Sem espera na próxima vez.
Copie ou descarregue o texto
Resultado no ecrã em segundos. Descarregue em .txt ou copie com um clique.
Quão precisa é a transcrição no browser?
A transcrição no browser executa o modelo Whisper da OpenAI diretamente no seu dispositivo usando WebAssembly. Oferecemos três tamanhos de modelo, e a precisão depende de qual escolher:
- Nano (~40MB) — O predefinido. Cerca de 85% de precisão em discurso claro. Ideal para notas rápidas, mensagens de voz e rascunhos. O único modelo que funciona no iOS.
- Mini (~150MB) — Aproximadamente 90% de precisão. Um bom meio-termo se o seu dispositivo tiver 4GB+ de RAM e precisar de uma saída mais limpa.
- Plus (~500MB) — A opção local mais precisa, aproximando-se de 93% em áudio claro. Mais lento para descarregar e executar; ideal em computadores de mesa com 8GB+ de RAM.
O que reduz a precisão de qualquer modelo local: ruído de fundo, várias pessoas a falar ao mesmo tempo, sotaques carregados e gravações de baixa taxa de bits, como notas de voz comprimidas. Se precisar de precisão profissional acima de 95%, timestamps ao nível da palavra ou etiquetas de orador, isso requer modelos na cloud — veja a comparação acima.
Transcrição no browser vs cloud: qual precisa?
A transcrição no browser é a ferramenta certa quando a privacidade é o mais importante ou o áudio é curto: nada é carregado, não há nada para apagar depois e não custa nada. A contrapartida é a velocidade e precisão — o seu CPU processa aproximadamente uma hora de áudio em vinte minutos, e o modelo local ignora etiquetas de orador e temporização ao nível da palavra.
A transcrição na cloud é a ferramenta certa quando está a trabalhar: reuniões, entrevistas, palestras, gravações legais. GPUs dedicadas transformam uma hora de áudio em texto em cerca de dois minutos com mais de 95% de precisão, etiquetam até 30 oradores diferentes, aceitam ficheiros até 10 horas e exportam para DOCX, PDF e JSON além dos formatos de legenda.
Uma regra prática: se se sentir confortável em ler a gravação em voz alta num café, a velocidade e precisão da cloud vencem. Se o áudio for sensível — uma consulta médica, uma reunião confidencial, uma nota de voz privada — a ferramenta do browser mantém tudo na sua máquina e ainda lhe dá uma transcrição utilizável em minutos. Muitos dos nossos utilizadores combinam ambas: notas privadas rápidas no browser, trabalho profissional na cloud.
Ver planos Premium →Formatos de áudio suportados
Carregue MP3, WAV, M4A, OGG, OPUS, FLAC ou WEBM — qualquer coisa que o seu browser consiga descodificar. Fontes comuns funcionam de imediato: notas de voz do WhatsApp (OPUS), memorandos de voz do iPhone (M4A), ficheiros do gravador Android, gravações do Zoom (M4A/MP4), mensagens de voz do Telegram (OGG) e ficheiros de podcast (MP3). Contentores de vídeo como MP4 e MOV são descodificados para a sua faixa de áudio quando o browser suporta o codec. Se um ficheiro não carregar, a causa habitual é um codec incomum dentro de um contentor comum — convertê-lo para MP3 primeiro resolve em quase todos os casos.
Precisa de um formato diferente primeiro? Use os nossos conversores gratuitos: conversor de áudio gratuito MP3 / WAV / OGG / AAC
Precisa de mais? Conheça o Premium
Para uso profissional — diarização, áudios longos, análise por IA e exportação em todos os formatos.
Diarização de locutores
Identifica automaticamente quem está a falar em cada trecho. Ideal para reuniões, entrevistas e podcasts.
Áudios até 10 horas
O modelo local suporta até 10 min. Com o Premium, transcreva ficheiros até 10 horas.
Resumo, sentimento e tópicos
A IA analisa o conteúdo e gera resumo executivo, análise de sentimento e extração de tópicos.
Exportação completa
Exporte em SRT, VTT, DOCX, JSON e PDF — ideal para legendas, documentos e automatizações.
Perguntas frequentes
Transcrição gratuita em 20 idiomas
O Whisper suporta 99 idiomas com deteção automática, e mantemos uma página dedicada para cada um dos 20 idiomas mais solicitados, com notas sobre como o modelo lida com esse idioma específico. Escolha o seu abaixo — o transcritor pré-seleciona o idioma certo para melhor precisão.