← Все инструменты

Расшифровка аудио. Ничего не уходит с вашей вкладки.

Бросьте сюда аудиофайл. Whisper работает на вашем устройстве — модель скачивается один раз, кэшируется навсегда, инференс происходит локально через WebGPU, когда он доступен. Экспорт в TXT, SRT, VTT или JSON.

100% локально Без загрузки Без регистрации Запасной WASM

Насколько это приватно на самом деле?

Модель Whisper скачивается с CDN HuggingFace при первой расшифровке. Дальше она кэшируется в IndexedDB браузера — последующие расшифровки загружаются мгновенно и работают офлайн. Ваш аудиофайл декодирует браузер, передаёт модели в вашей вкладке и никуда не отправляет.

На Apple Silicon с Chrome или Safari Tech Preview ускорение WebGPU работает на скорости ~0,3–0,5× от реального времени для модели Tiny. Без WebGPU запасной WASM работает на ~1,5–3× реального времени (медленнее воспроизведения, но всё ещё меньше минуты на 5-минутный ролик).

Хочется как Mac-приложение, а не вкладка?

Vext запускает Whisper нативно на Apple Silicon — в ~5–10 раз быстрее, чем WASM в браузере, без ожидания загрузки модели. Плюс: расшифровывает встречи вживую, заглушает системный звук и печатает прямо в любое приложение. $49 один раз, всё локально.

Попробовать Vext — $49