Superwhisper и Vext — два локальных приложения диктовки для Mac, о которых сейчас чаще всего спрашивают. Оба выполняют распознавание речи целиком на вашем Mac, оба продаются разовой покупкой без подписок, оба ориентированы на людей, которым нужна качественная диктовка без облака.

Они делают разные ставки. Вот какие именно — и как выбрать между ними.

Раскрытие: мы делаем Vext. Мы постараемся честно оценить сильные стороны Superwhisper — делать вид, что их нет, не поможет никому, кто это читает.

Сходу

Superwhisper Vext
Цена $249 навсегда $49 навсегда (текущая мажорная версия)
Бесплатный пробный период Да 100 диктовок, 50 заметок, 10 встреч
Платформа Mac (macOS 13+) Mac (macOS 14+), только Apple Silicon
Речевой движок Whisper (несколько размеров) Parakeet по умолчанию, Whisper опционально
Обработка Локальная Локальная
Очистка текста Промпты по режимам Enhance (один проход LLM)
Транскрипция встреч Нет Да
Живой перевод Нет Да
Метки спикеров Нет Да (в встречах)
Режимы / контексты Да (глубокие) Три фиксированных режима
Кроссплатформенность Нет Нет

В чём каждое из них сильнее

Superwhisper — лучший инструмент именно для диктовки. Система режимов — то, что его выделяет. Вы задаёте разные промпты для разных контекстов письма — почта, код, неформальный чат, технический текст — и переключаетесь между ними горячей клавишей. У каждого режима свой промпт для LLM, который формирует поведение очистки. Если ваш день состоит из частой смены контекста («написать сообщение в Slack», «набросать письмо», «оставить комментарий к коду», «суммаризировать для руководства»), режимы Superwhisper подходят под эту задачу лучше, чем что-либо ещё.

Полировка самого опыта диктовки — интерфейс, работа с курсором, редкие краевые случаи — отличная. Годы фокуса на одной вещи заметны.

Vext — инструмент с более широким охватом. Диктовка — один из трёх режимов. Два других — встречи (запись + транскрипция + суммаризация, с метками спикеров) и заметки (быстрые голосовые заметки, хранящиеся локально). Плюс функции, которых у Superwhisper нет: живой перевод, захват скриншотов во время диктовки, YOLO Mode для AI-инструментов, диктовка без рук, приглушение системного звука.

Если вам нужна только диктовка — Superwhisper побеждает за счёт фокуса. Если вам нужна диктовка плюс встречи плюс перевод в одном приложении — Vext именно для этого и создавался.

Где они пересекаются

Базовый опыт диктовки действительно похож:

  • Удерживаете горячую клавишу, говорите, отпускаете — текст появляется в курсоре
  • Локальный Whisper или Parakeet делает распознавание речи
  • Локальный LLM убирает слова-паразиты и правит структуру
  • Аудио никогда не покидает ваш Mac
  • Разовая покупка, без подписки

Если всё, что вам нужно — базовый процесс диктовки, оба приложения будут ощущаться похоже. Разница — в том, как каждое из них работает на краях.

Скорость и точность

Оба приложения используют одни и те же базовые модели (варианты Whisper, Parakeet), поэтому точность транскрипции ограничена моделью, а не приложением. Где они расходятся:

Движок по умолчанию. Superwhisper по умолчанию использует вариант Whisper (выбираете при настройке). Vext по умолчанию использует Parakeet для английской диктовки — он быстрее (~150× реального времени на M2) и не уступает Whisper Small/Medium по точности на чистом английском. Для неанглийского Vext переключается на Whisper. Superwhisper работает на Whisper во всех случаях.

Задержка до первого токена. Parakeet стримит токены прямо во время речи; Whisper ждёт 30-секундное окно. Для коротких диктовок Parakeet ощущается мгновенно (~80 мс до первого токена на M2). Whisper Small — ~350 мс, Medium — ~700 мс, Large-v3 — ~1.4 с. Если задержка важна и вы в основном диктуете на английском, Vext выигрывает по умолчанию. Оба приложения позволяют выбрать движок для каждой задачи, так что это настраивается.

Качество очистки. Специфичные для режимов промпты Superwhisper дают лучше настроенный результат при переключении контекстов — режим «небрежное сообщение в Slack» читается иначе, чем режим «формальное письмо». Enhance в Vext — один универсальный промпт с возможностью кастомизации. Для повседневной диктовки оба подходят. Для тех, кому действительно важен тон, соответствующий месту назначения, система режимов Superwhisper — правильный ответ.

Транскрипция встреч

Vext записывает встречи (микрофон + системный звук одновременно) и создаёт транскрипты с метками спикеров, скриншотами и AI-суммаризацией. Работает с Zoom, Meet, FaceTime — с чем угодно, что воспроизводит звук на вашем Mac.

Superwhisper не работает с встречами. Вам придётся дополнить его отдельным инструментом для встреч (Granola, MacWhisper для записи и последующей обработки файлов и т.д.).

Если вы регулярно проводите встречи и хотите одно приложение для всего, что связано с голосом, — это самое большое различие между двумя продуктами.

Перевод

Vext: говорите на любом языке, получаете текст на целевом. Задаёте целевой язык в настройках, диктуете на исходном, получаете переведённый текст в курсоре. Полезно, если вы читаете на неродном языке, а пишете на английском (или наоборот), или для международной работы.

В Superwhisper есть перевод через встроенный режим перевода OpenAI Whisper (только аудио → английский), а не полноценная двунаправленная языковая пара.

Если перевод — реальная рабочая потребность, Vext для этого создан. Если вы всегда работаете на одном языке, это не имеет значения.

Цены

Superwhisper стоит $249 навсегда. Vext — $49 за текущую мажорную версию, с мажорными обновлениями за 50% для существующих пользователей (то есть примерно $24.50 за следующую мажорную).

Картина на пять лет:

  • Superwhisper: $249 один раз
  • Vext: ~$49 + ~$25 + ~$25 = примерно $100 за пять лет (в зависимости от того, сколько мажорных версий выйдет)

В любом случае оба радикально дешевле, чем Wispr Flow за $15/месяц ($900 за пять лет).

Разрыв в $200 между ценой Superwhisper и Vext покрывает более долгую историю Superwhisper и глубину проработки опыта диктовки. Стоит ли этот разрыв того — зависит от того, как часто вы диктуете и насколько вы цените систему режимов.

Требования к оборудованию и ОС

Superwhisper: macOS 13+, Intel или Apple Silicon, но Apple Silicon настоятельно рекомендуется.

Vext: macOS 14+, только Apple Silicon (M1–M4). Intel Mac не поддерживаются.

Если вы на Intel, Superwhisper — единственный из двух, который работает.

Рабочие процессы для каждого

Superwhisper подходит, если:

  • Вы часто диктуете с разными тональностями для разных адресатов
  • Вам нужен самый отполированный инструмент, сфокусированный на диктовке
  • Вы на Intel Mac или старой macOS
  • Вас устраивает дополнять его отдельными инструментами для встреч/перевода/заметок

Vext подходит, если:

  • Вам нужна диктовка + встречи + перевод в одном приложении
  • Вы много пишете в AI-инструменты (YOLO Mode, захват скриншотов)
  • Вы на Apple Silicon с macOS 14+
  • Более низкая цена имеет значение
  • Вы работаете на нескольких языках

Где оба — не лучший выбор

Если вам нужна кроссплатформенность (Windows + Mac), ни один не подойдёт. Wispr Flow — облачный вариант для этого.

Если вам нужен open-source, ни один не подходит — оба с закрытым исходным кодом. VoiceInk — вариант здесь.

Если вам нужна самая точная транскрипция файлов с пакетной обработкой записей, ни один для этого не создан. MacWhisper Pro — правильный выбор.

Если вы диктуете лишь изредка и ваши потребности базовые — Apple Dictation бесплатна и достаточно хороша. Ни одно платное приложение не нужно.

Честный итог

Superwhisper более отполирован как приложение чисто для диктовки. Система режимов реально имеет значение, если ваш рабочий процесс выглядит как постоянное переключение между стилями тона. Цена отражает этот фокус.

Vext шире — те же принципы локальности, в четыре раза дешевле за мажорную версию, но с транскрипцией встреч, переводом, захватом скриншотов, YOLO Mode и диктовкой без рук в дополнение к обычной диктовке. Компромисс за эту широту — меньшая глубина в каждой отдельной функции.

У обоих есть пробные периоды. Самый быстрый способ решить — использовать каждый по одному дню на вашей реальной работе. Правильный ответ — тот, с которым вы перестанете бороться первым.