Transcribe audio. Nada sale de tu pestaña.
Suelta un archivo de audio. Whisper corre en tu dispositivo — el modelo se descarga una vez, se cachea para siempre y la inferencia ocurre localmente con WebGPU cuando está disponible. Exporta como TXT, SRT, VTT o JSON.
¿Qué tan privado es esto, en serio?
El modelo Whisper se descarga del CDN de HuggingFace la primera vez que transcribes. Después se cachea en IndexedDB del navegador — las próximas transcripciones cargan al instante y funcionan sin conexión. El archivo de audio lo decodifica el navegador, va al modelo que corre en tu pestaña y no se envía a ningún sitio.
En Apple Silicon con Chrome o Safari Tech Preview, la aceleración WebGPU corre a ~0,3–0,5× tiempo real con el modelo Tiny. Sin WebGPU, la alternativa WASM corre a ~1,5–3× tiempo real (más lento que la reproducción pero igual menos de un minuto para un clip de 5 minutos).
¿Lo quieres como app de Mac, no como pestaña?
Vext corre Whisper de forma nativa en Apple Silicon — ~5–10× más rápido que WASM en navegador, sin esperar la descarga del modelo. Además transcribe reuniones en vivo, baja el audio del sistema y escribe directamente en cualquier app. $49 una sola vez, todo local.