Transcribe audio. Nada sale de tu pestaña.

Suelta un archivo de audio. Whisper corre en tu dispositivo — el modelo se descarga una vez, se cachea para siempre y la inferencia ocurre localmente con WebGPU cuando está disponible. Exporta como TXT, SRT, VTT o JSON.

100% local Sin subir Sin registro Alternativa WASM

Suelta un archivo de audio o haz clic para elegir MP3 · WAV · M4A · FLAC · OGG · WebM · MP4 — hasta ~30 min con el modelo tiny

Modelo

¿Qué tan privado es esto, en serio?

El modelo Whisper se descarga del CDN de HuggingFace la primera vez que transcribes. Después se cachea en IndexedDB del navegador — las próximas transcripciones cargan al instante y funcionan sin conexión. El archivo de audio lo decodifica el navegador, va al modelo que corre en tu pestaña y no se envía a ningún sitio.

En Apple Silicon con Chrome o Safari Tech Preview, la aceleración WebGPU corre a ~0,3–0,5× tiempo real con el modelo Tiny. Sin WebGPU, la alternativa WASM corre a ~1,5–3× tiempo real (más lento que la reproducción pero igual menos de un minuto para un clip de 5 minutos).

¿Lo quieres como app de Mac, no como pestaña?

Vext corre Whisper de forma nativa en Apple Silicon — ~5–10× más rápido que WASM en navegador, sin esperar la descarga del modelo. Además transcribe reuniones en vivo, baja el audio del sistema y escribe directamente en cualquier app. $49 una sola vez, todo local.

Prueba Vext — $49