Расшифровка аудио. Ничего не уходит с вашей вкладки.

Бросьте сюда аудиофайл. Whisper работает на вашем устройстве — модель скачивается один раз, кэшируется навсегда, инференс происходит локально через WebGPU, когда он доступен. Экспорт в TXT, SRT, VTT или JSON.

100% локально Без загрузки Без регистрации Запасной WASM

Бросьте аудиофайл или нажмите, чтобы выбрать MP3 · WAV · M4A · FLAC · OGG · WebM · MP4 — до ~30 минут для модели tiny

Модель

Насколько это приватно на самом деле?

Модель Whisper скачивается с CDN HuggingFace при первой расшифровке. Дальше она кэшируется в IndexedDB браузера — последующие расшифровки загружаются мгновенно и работают офлайн. Ваш аудиофайл декодирует браузер, передаёт модели в вашей вкладке и никуда не отправляет.

На Apple Silicon с Chrome или Safari Tech Preview ускорение WebGPU работает на скорости ~0,3–0,5× от реального времени для модели Tiny. Без WebGPU запасной WASM работает на ~1,5–3× реального времени (медленнее воспроизведения, но всё ещё меньше минуты на 5-минутный ролик).

Хочется как Mac-приложение, а не вкладка?

Vext запускает Whisper нативно на Apple Silicon — в ~5–10 раз быстрее, чем WASM в браузере, без ожидания загрузки модели. Плюс: расшифровывает встречи вживую, заглушает системный звук и печатает прямо в любое приложение. $49 один раз, всё локально.

Попробовать Vext — $49