100% gratuito · Sem registo · 99 idiomas

Transcrição de áudio gratuita no seu browser

Corre o VoxScriber Nano open-source no seu browser — IA local, até 10 min por ficheiro, precisão básica (~85%). Para uso profissional, conheça o Premium.

🔒 IA local💰 100% gratuito📝 10 min por ficheiro

A transcrição corre no seu browser (IA local). Pode optar por partilhar o resultado connosco (opcional, com consentimento) para melhorar o serviço. Limite: 10 min por ficheiro, precisão ~85%.

Ver Premium

Gratuito vs Premium — veja a diferença

Gratuito (browser)Premium (nuvem)
Limite por ficheiro10 min10 horas
Precisão~85%>95%
Diarização (quem falou)
Timestamps por palavra
Suporte a vídeo (MP4/MOV)
Formatos de exportaçãoTXT, SRT, VTTDOCX, PDF, JSON…
Velocidade (1h de áudio)~2 min / 1h~2 min / 1h
Privacidade100% local☁️ + 🔒
🔒

IA local

Transcrição feita no seu browser. Partilha com os nossos servidores é opcional (requer consentimento).

Rápido e local

Processamento direto no browser, sem filas de espera.

🌍

99 idiomas

Deteta automaticamente o idioma do áudio.

💻

Sem registo

Comece imediatamente, sem criar conta.

Como funciona

1

Carregue ou grave o áudio

Arraste um ficheiro MP3, WAV, M4A, OGG ou use o microfone diretamente.

2

O modelo corre no seu dispositivo

O Whisper AI é descarregado uma vez e fica em cache. Sem espera na próxima vez.

3

Copie ou descarregue o texto

Resultado no ecrã em segundos. Descarregue em .txt ou copie com um clique.

Quão precisa é a transcrição no browser?

A transcrição no browser executa o modelo Whisper da OpenAI diretamente no seu dispositivo usando WebAssembly. Oferecemos três tamanhos de modelo, e a precisão depende de qual escolher:

  • Nano (~40MB)O predefinido. Cerca de 85% de precisão em discurso claro. Ideal para notas rápidas, mensagens de voz e rascunhos. O único modelo que funciona no iOS.
  • Mini (~150MB)Aproximadamente 90% de precisão. Um bom meio-termo se o seu dispositivo tiver 4GB+ de RAM e precisar de uma saída mais limpa.
  • Plus (~500MB)A opção local mais precisa, aproximando-se de 93% em áudio claro. Mais lento para descarregar e executar; ideal em computadores de mesa com 8GB+ de RAM.

O que reduz a precisão de qualquer modelo local: ruído de fundo, várias pessoas a falar ao mesmo tempo, sotaques carregados e gravações de baixa taxa de bits, como notas de voz comprimidas. Se precisar de precisão profissional acima de 95%, timestamps ao nível da palavra ou etiquetas de orador, isso requer modelos na cloud — veja a comparação acima.

Transcrição no browser vs cloud: qual precisa?

A transcrição no browser é a ferramenta certa quando a privacidade é o mais importante ou o áudio é curto: nada é carregado, não há nada para apagar depois e não custa nada. A contrapartida é a velocidade e precisão — o seu CPU processa aproximadamente uma hora de áudio em vinte minutos, e o modelo local ignora etiquetas de orador e temporização ao nível da palavra.

A transcrição na cloud é a ferramenta certa quando está a trabalhar: reuniões, entrevistas, palestras, gravações legais. GPUs dedicadas transformam uma hora de áudio em texto em cerca de dois minutos com mais de 95% de precisão, etiquetam até 30 oradores diferentes, aceitam ficheiros até 10 horas e exportam para DOCX, PDF e JSON além dos formatos de legenda.

Uma regra prática: se se sentir confortável em ler a gravação em voz alta num café, a velocidade e precisão da cloud vencem. Se o áudio for sensível — uma consulta médica, uma reunião confidencial, uma nota de voz privada — a ferramenta do browser mantém tudo na sua máquina e ainda lhe dá uma transcrição utilizável em minutos. Muitos dos nossos utilizadores combinam ambas: notas privadas rápidas no browser, trabalho profissional na cloud.

Ver planos Premium

Formatos de áudio suportados

Carregue MP3, WAV, M4A, OGG, OPUS, FLAC ou WEBM — qualquer coisa que o seu browser consiga descodificar. Fontes comuns funcionam de imediato: notas de voz do WhatsApp (OPUS), memorandos de voz do iPhone (M4A), ficheiros do gravador Android, gravações do Zoom (M4A/MP4), mensagens de voz do Telegram (OGG) e ficheiros de podcast (MP3). Contentores de vídeo como MP4 e MOV são descodificados para a sua faixa de áudio quando o browser suporta o codec. Se um ficheiro não carregar, a causa habitual é um codec incomum dentro de um contentor comum — convertê-lo para MP3 primeiro resolve em quase todos os casos.

Precisa de um formato diferente primeiro? Use os nossos conversores gratuitos: conversor de áudio gratuito MP3 / WAV / OGG / AAC

🚀 Premium

Precisa de mais? Conheça o Premium

Para uso profissional — diarização, áudios longos, análise por IA e exportação em todos os formatos.

🎭

Diarização de locutores

Identifica automaticamente quem está a falar em cada trecho. Ideal para reuniões, entrevistas e podcasts.

⏱️

Áudios até 10 horas

O modelo local suporta até 10 min. Com o Premium, transcreva ficheiros até 10 horas.

🧠

Resumo, sentimento e tópicos

A IA analisa o conteúdo e gera resumo executivo, análise de sentimento e extração de tópicos.

📄

Exportação completa

Exporte em SRT, VTT, DOCX, JSON e PDF — ideal para legendas, documentos e automatizações.

Ver planos Premium

Perguntas frequentes

Transcrição gratuita em 20 idiomas

O Whisper suporta 99 idiomas com deteção automática, e mantemos uma página dedicada para cada um dos 20 idiomas mais solicitados, com notas sobre como o modelo lida com esse idioma específico. Escolha o seu abaixo — o transcritor pré-seleciona o idioma certo para melhor precisão.