macOS Tahoe заменила старый движок распознавания речи на foundation-модель Apple, которая работает прямо на чипе Apple Silicon. Если вы разработчик и большую часть дня проводите в редакторе или терминале, это имеет значение.

Что изменилось в macOS Tahoe

Новый движок диктовки — заметный апгрейд:

  • Лучше общая точность — улучшено для обычной речи и распространённых техтерминов вроде «React», «API» или «TypeScript»
  • Полностью на устройстве — аудио остаётся на Mac, без сети
  • Меньшая задержка — без похода до сервера и обратно
  • Умная пунктуация — модель выводит знаки по ритму речи
  • Бесплатно — поставляется с ОС, улучшается с поколениями железа

Настройка встроенной диктовки

Шаг 1: Включить диктовку

  1. Откройте Системные настройки
  2. Кликните Клавиатура в боковой панели
  3. Прокрутите до Диктовка и включите
  4. Включите Автопунктуацию

Шаг 2: Выберите горячую клавишу

В Системных настройках > Клавиатура > Диктовка выберите шорткат. «Дважды Control» — хороший вариант: быстро и не конфликтует с шорткатами IDE.

Шаг 3: Начните говорить

  1. Кликните в любое текстовое поле — VS Code, Terminal, браузер, Slack
  2. Нажмите горячую клавишу
  3. Говорите естественно — текст появляется
  4. Нажмите клавишу снова или кликните «Готово»

Голос в рабочих процессах разработки

Диктовка промптов ИИ-инструментам

Голосовой ввод позволяет более длинные и подробные промпты. Промпт в 200 слов диктуется за ~30 секунд — становится практично включать полный контекст, ограничения и требования вместо сжатия всего в одно предложение.

Сообщения в Slack и документация

Объясняющие сообщения, где важна ясность, а не краткость. Вместо того чтобы две минуты печатать абзац в Slack, скажите его за 20 секунд.

Комментарии к code review

Диктовка помогает чётче изложить причину предлагаемых изменений. «Думаю, стоит вынести эту валидацию на сервисный слой, потому что сейчас она дублируется в трёх контроллерах» — проще сказать, чем напечатать.

Фиксация идей без потери контекста

Когда вы глубоко в коде и вдруг возникает идея для другой части системы — продиктуйте быструю заметку вместо смены контекста.

Советы из ежедневной практики

  • Говорите как обычно. Foundation-модель обучена на естественной речи. Чрезмерная артикуляция снижает точность.
  • Добавляйте сложные слова в «Замены текста». Названия продуктов и библиотек можно заранее замапить через Системные настройки > Клавиатура > Замены текста.
  • Не смотрите, как появляются слова. Отображение в реальном времени вызывает сомнения и ломает поток.
  • В шумных местах используйте гарнитуру. Встроенный микрофон ноутбука ловит шум, который снижает точность.

Где встроенная диктовка уступает

Встроенный движок хорош для общего, но разработчики быстро упираются в его границы:

  • Программистский словарь — имена библиотек, CLI-команды и жаргон регулярно искажаются
  • Без пост-обработки — вывод нельзя переоформить или почистить
  • Без истории расшифровок — нет логов для поиска
  • Только короткие фрагменты — не предназначен для встреч и долгих сессий
  • Без перевода — только один язык

Дальше встроенной диктовки — с Vext

Vext закрывает каждый из этих пунктов:

Более быстрая расшифровка

Vext использует Parakeet через CoreML — 150x real-time на Apple Silicon, 60-секундная запись обрабатывается меньше чем за полсекунды. Встроенная диктовка Apple — около 25x real-time.

Enhance

Пост-обработка на ИИ: убирает слова-паразиты, чинит структуру и сглаживает речь до уровня выверенного текста. Работает локально на Mac через модели вроде Gemma 3 4B.

Живой перевод

Говорите на любом языке, получайте текст на целевом. Вместе с Enhance очистка и перевод происходят за один проход.

Расшифровка встреч

Запись полноценных встреч с идентификацией спикеров, ИИ-резюме и скриншотами. Работает с Zoom, Google Meet, FaceTime и любым источником аудио.

Голосовые заметки

Быстрые мемо локально в приложении. Тот же конвейер, что и диктовка — только сохраняется, а не вставляется у курсора.

Режим YOLO

Авто-отправка промптов ИИ-инструментам. Сказали, отпустили — промпт уже выполняется в Claude Code или ChatGPT.

Три движка расшифровки

Выбирайте Parakeet (быстрее всех, локально), Apple Dictation (встроенный) или OpenAI-совместимые API. Меняйте под задачу.

Как начать с Vext

brew install muvon/tap/vext

Пробный режим: 100 диктовок, 50 заметок, 10 записей встреч. Без аккаунта.

Встроенная диктовка macOS — нормальная отправная точка. Когда упрётесь в её пределы (а в разработке упрётесь), подхватит Vext.