Audio transkribieren. Nichts verlässt deinen Tab.
Audiodatei hineinziehen. Whisper läuft auf deinem Gerät — das Modell wird einmal heruntergeladen, dauerhaft zwischengespeichert, und die Inferenz erfolgt lokal mit WebGPU, wenn verfügbar. Export als TXT, SRT, VTT oder JSON.
Wie privat ist das wirklich?
Das Whisper-Modell wird beim ersten Transkribieren vom CDN von HuggingFace heruntergeladen. Danach wird es in der IndexedDB deines Browsers zwischengespeichert — alle weiteren Transkriptionen laden sofort und funktionieren offline. Deine Audiodatei wird vom Browser dekodiert, an das im Tab laufende Modell übergeben und nirgendwo hingesendet.
Auf Apple Silicon mit Chrome oder Safari Tech Preview läuft die WebGPU-Beschleunigung mit ~0,3–0,5× Echtzeit beim Tiny-Modell. Ohne WebGPU läuft der WASM-Fallback mit ~1,5–3× Echtzeit (langsamer als die Wiedergabe, aber immer noch unter einer Minute für einen 5-Minuten-Clip).
Lieber als Mac-App statt als Tab?
Vext führt Whisper nativ auf Apple Silicon aus — ~5–10× schneller als Browser-WASM, ohne Wartezeit beim Modell-Download. Außerdem transkribiert es Meetings live, dämpft den Systemton und tippt direkt in jede App. $49 einmalig, alles lokal.