Полное руководство по Vext: голос в текст для Mac

Удерживайте горячую клавишу. Говорите. Текст появляется у курсора. Это Vext — приложение голос-в-текст, работающее полностью на вашем Mac. Без облака. Без аккаунта. Без подписки.

Это руководство покрывает всё: установку, настройку горячих клавиш, три режима (диктовка, встречи, заметки), Enhance, живой перевод и любые другие функции.

Установка

Установка через Homebrew:

brew install muvon/tap/vext

Или скачайте напрямую с getvext.app. Аккаунт не нужен — устанавливайте и сразу пользуйтесь.

Требования: macOS 14 Sonoma или новее, Apple Silicon (M1–M4).

Ваша первая диктовка

Запустите Vext из «Программ»
Удерживайте горячую клавишу
Говорите
Отпустите — текст появится у курсора

Три шага. Без логина. Текст идёт туда, где был курсор, когда вы начали говорить.

Три режима

У Vext три режима под разные сценарии.

Диктовка

Главный сценарий. Удержите горячую клавишу, говорите, отпустите — текст появится у курсора. Работает в любом текстовом поле и любом приложении: браузеры, редакторы, терминалы, чат, почта, заметки.

Диктовка — самый быстрый способ занести слова в компьютер. Говорите вы со скоростью 130–150 слов в минуту. Печатаете — 40–60. Сообщение в 100 слов: 40 секунд голосом, почти две минуты печатью.

Встречи

Записывайте встречи с идентификацией говорящих. Vext одновременно захватывает микрофон и системное аудио, поэтому работает с Zoom, Google Meet, FaceTime и любым другим видеозвонком.

По окончании встречи вы получаете:

Полную расшифровку с метками спикеров и таймстампами
Резюме на ИИ с ключевыми моментами и задачами
Скриншоты, снятые во время разговора

Заметки

Быстрые голосовые мемо одним нажатием клавиши. Скажите мысль, Vext расшифрует, прогонит через Enhance и сохранит локально.

Заметки идут через тот же конвейер, что и диктовка — очистка, перевод, вся цепочка. Разница лишь в том, что они сохраняются в Vext, а не вставляются у курсора.

Заметки удобны для фиксации идей посреди задачи без переключения приложений, быстрых напоминаний и сохранения контекста, который понадобится позже.

Хэндс-фри диктовка

Стандартная диктовка требует удержания клавиши. В режиме хэндс-фри всё иначе — нажали один раз для старта, нажали снова для остановки. Удерживать не нужно.

Удобно для длинных фрагментов, когда руки заняты или вы ходите и думаете вслух. Клавиша работает как переключатель, а не как push-to-talk.

Enhance

Enhance — это пост-обработка на ИИ, которая запускается над расшифровкой перед попаданием в буфер обмена. Она убирает слова-паразиты, чинит структуру предложений и сглаживает шероховатости разговорной речи — не меняя того, что вы сказали.

До Enhance:

«Ну вот в общем я думал что нам стоит э наверное вынести API-эндпоинт checkout в отдельный сервис потому что он стал как бы медленным»

После Enhance:

«Нам стоит вынести API-эндпоинт checkout в отдельный сервис — он стал медленным.»

Смысл сохранён. Тон сохранён. Enhance просто убирает шум.

Исходная расшифровка всегда хранится рядом с улучшенной версией. Оригинал не теряется.

Живой перевод

Задайте целевой язык в Vext и говорите на любом языке. Текст, появляющийся у курсора, уже переведён.

Когда Enhance тоже включён, очистка и перевод происходят за один проход. Вы говорите сбивчивым французским, у курсора оказывается чистый английский.

Vext поддерживает перевод между любой парой из 99+ языков, которые понимают модели Whisper.

Скриншоты

Во время записи встречи можно захватить любую область экрана. Выделите регион — скриншот автоматически прикрепится к расшифровке.

Удобно для слайдов презентации, фрагментов кода, обсуждаемых дизайнов. Несколько снимков за сессию, все сохраняются вместе с расшифровкой.

Авто-приглушение звука

Когда начинается запись, Vext автоматически приглушает системный звук, чтобы голос звучал чисто. Отпустили клавишу — громкость возвращается.

Это не даёт системному звуку мешать расшифровке — будь то музыка, видео или звонок.

Режим YOLO

Включите YOLO — и Vext автоматически нажимает Return после вставки расшифровки. Сказали, отпустили — промпт уже отправлен.

Сделано под ИИ-инструменты вроде Claude Code, ChatGPT и Cursor. Вместо «надиктовал — пересмотрел — поправил — нажал Enter» — просто говорите, и оно идёт. LLM-ы лучше большинства людей справляются с неидеальной речью.

Движки расшифровки

В комплекте Vext несколько движков речи-в-текст:

Движок	Тип	Скорость
Parakeet	Локальный	150x real-time
Apple Dictation	Локальный	25x real-time
OpenAI-совместимый	API	Зависит

По умолчанию — Parakeet. Он работает полностью на GPU Apple Silicon и расшифровывает на 150x real-time — 60-секундная запись обрабатывается меньше чем за полсекунды.

Движки ИИ-обработки

Enhance, перевод и саммари работают на локальных LLM:

Модель	Тип	Размер
Gemma 3 4B	Локальная (по умолчанию)	2.8 GB
Qwen 3 4B	Локальная	3.2 GB
LLaMA 3.2 3B	Локальная	2.4 GB
Gemma 3 1B	Локальная	0.8 GB
Phi-3.5 Mini	Локальная	2.8 GB
OpenAI-совместимая	API	—

Все локальные модели работают на GPU вашего Mac. Интернет не нужен.

Приватность

Ваш голос не покидает Mac. Никакой облачной обработки, аккаунта, телеметрии, аналитики. Аудио обрабатывается на устройстве и не хранится после расшифровки.

Если вы выбираете API-движок (OpenAI-совместимый), аудио уходит к этому провайдеру — но это опционально и выключено по умолчанию.

Цены

В Vext есть бесплатный пробный режим: 100 диктовок, 50 заметок и 10 записей встреч. Без карты, без аккаунта.

Когда будете готовы, разблокируйте безлимит за $49 — разовый платёж из приложения. Бесплатные обновления в пределах вашей версии. Крупные новые версии — со скидкой 50% для существующих владельцев.

Как начать

Установите через brew install muvon/tap/vext или скачайте с getvext.app
Запустите приложение и удерживайте горячую клавишу
Начинайте говорить

Переход с клавиатуры на голос ощущается странно минут 30. Потом печать промптов начинает казаться медленным способом.