Удерживайте горячую клавишу. Говорите. Текст появляется у курсора. Это Vext — приложение голос-в-текст, работающее полностью на вашем Mac. Без облака. Без аккаунта. Без подписки.
Это руководство покрывает всё: установку, настройку горячих клавиш, три режима (диктовка, встречи, заметки), Enhance, живой перевод и любые другие функции.
Установка
Установка через Homebrew:
brew install muvon/tap/vext
Или скачайте напрямую с getvext.app. Аккаунт не нужен — устанавливайте и сразу пользуйтесь.
Требования: macOS 14 Sonoma или новее, Apple Silicon (M1–M4).
Ваша первая диктовка
- Запустите Vext из «Программ»
- Удерживайте горячую клавишу
- Говорите
- Отпустите — текст появится у курсора
Три шага. Без логина. Текст идёт туда, где был курсор, когда вы начали говорить.
Три режима
У Vext три режима под разные сценарии.
Диктовка
Главный сценарий. Удержите горячую клавишу, говорите, отпустите — текст появится у курсора. Работает в любом текстовом поле и любом приложении: браузеры, редакторы, терминалы, чат, почта, заметки.
Диктовка — самый быстрый способ занести слова в компьютер. Говорите вы со скоростью 130–150 слов в минуту. Печатаете — 40–60. Сообщение в 100 слов: 40 секунд голосом, почти две минуты печатью.
Встречи
Записывайте встречи с идентификацией говорящих. Vext одновременно захватывает микрофон и системное аудио, поэтому работает с Zoom, Google Meet, FaceTime и любым другим видеозвонком.
По окончании встречи вы получаете:
- Полную расшифровку с метками спикеров и таймстампами
- Резюме на ИИ с ключевыми моментами и задачами
- Скриншоты, снятые во время разговора
Заметки
Быстрые голосовые мемо одним нажатием клавиши. Скажите мысль, Vext расшифрует, прогонит через Enhance и сохранит локально.
Заметки идут через тот же конвейер, что и диктовка — очистка, перевод, вся цепочка. Разница лишь в том, что они сохраняются в Vext, а не вставляются у курсора.
Заметки удобны для фиксации идей посреди задачи без переключения приложений, быстрых напоминаний и сохранения контекста, который понадобится позже.
Хэндс-фри диктовка
Стандартная диктовка требует удержания клавиши. В режиме хэндс-фри всё иначе — нажали один раз для старта, нажали снова для остановки. Удерживать не нужно.
Удобно для длинных фрагментов, когда руки заняты или вы ходите и думаете вслух. Клавиша работает как переключатель, а не как push-to-talk.
Enhance
Enhance — это пост-обработка на ИИ, которая запускается над расшифровкой перед попаданием в буфер обмена. Она убирает слова-паразиты, чинит структуру предложений и сглаживает шероховатости разговорной речи — не меняя того, что вы сказали.
До Enhance:
«Ну вот в общем я думал что нам стоит э наверное вынести API-эндпоинт checkout в отдельный сервис потому что он стал как бы медленным»
После Enhance:
«Нам стоит вынести API-эндпоинт checkout в отдельный сервис — он стал медленным.»
Смысл сохранён. Тон сохранён. Enhance просто убирает шум.
Исходная расшифровка всегда хранится рядом с улучшенной версией. Оригинал не теряется.
Живой перевод
Задайте целевой язык в Vext и говорите на любом языке. Текст, появляющийся у курсора, уже переведён.
Когда Enhance тоже включён, очистка и перевод происходят за один проход. Вы говорите сбивчивым французским, у курсора оказывается чистый английский.
Vext поддерживает перевод между любой парой из 99+ языков, которые понимают модели Whisper.
Скриншоты
Во время записи встречи можно захватить любую область экрана. Выделите регион — скриншот автоматически прикрепится к расшифровке.
Удобно для слайдов презентации, фрагментов кода, обсуждаемых дизайнов. Несколько снимков за сессию, все сохраняются вместе с расшифровкой.
Авто-приглушение звука
Когда начинается запись, Vext автоматически приглушает системный звук, чтобы голос звучал чисто. Отпустили клавишу — громкость возвращается.
Это не даёт системному звуку мешать расшифровке — будь то музыка, видео или звонок.
Режим YOLO
Включите YOLO — и Vext автоматически нажимает Return после вставки расшифровки. Сказали, отпустили — промпт уже отправлен.
Сделано под ИИ-инструменты вроде Claude Code, ChatGPT и Cursor. Вместо «надиктовал — пересмотрел — поправил — нажал Enter» — просто говорите, и оно идёт. LLM-ы лучше большинства людей справляются с неидеальной речью.
Движки расшифровки
В комплекте Vext несколько движков речи-в-текст:
| Движок | Тип | Скорость |
|---|---|---|
| Parakeet | Локальный | 150x real-time |
| Apple Dictation | Локальный | 25x real-time |
| OpenAI-совместимый | API | Зависит |
По умолчанию — Parakeet. Он работает полностью на GPU Apple Silicon и расшифровывает на 150x real-time — 60-секундная запись обрабатывается меньше чем за полсекунды.
Движки ИИ-обработки
Enhance, перевод и саммари работают на локальных LLM:
| Модель | Тип | Размер |
|---|---|---|
| Gemma 3 4B | Локальная (по умолчанию) | 2.8 GB |
| Qwen 3 4B | Локальная | 3.2 GB |
| LLaMA 3.2 3B | Локальная | 2.4 GB |
| Gemma 3 1B | Локальная | 0.8 GB |
| Phi-3.5 Mini | Локальная | 2.8 GB |
| OpenAI-совместимая | API | — |
Все локальные модели работают на GPU вашего Mac. Интернет не нужен.
Приватность
Ваш голос не покидает Mac. Никакой облачной обработки, аккаунта, телеметрии, аналитики. Аудио обрабатывается на устройстве и не хранится после расшифровки.
Если вы выбираете API-движок (OpenAI-совместимый), аудио уходит к этому провайдеру — но это опционально и выключено по умолчанию.
Цены
В Vext есть бесплатный пробный режим: 100 диктовок, 50 заметок и 10 записей встреч. Без карты, без аккаунта.
Когда будете готовы, разблокируйте безлимит за $49 — разовый платёж из приложения. Бесплатные обновления в пределах вашей версии. Крупные новые версии — со скидкой 50% для существующих владельцев.
Как начать
- Установите через
brew install muvon/tap/vextили скачайте с getvext.app - Запустите приложение и удерживайте горячую клавишу
- Начинайте говорить
Переход с клавиатуры на голос ощущается странно минут 30. Потом печать промптов начинает казаться медленным способом.