Большинство приложений диктовки для Mac по умолчанию работают в режиме push-to-talk: удерживаете горячую клавишу, говорите, отпускаете. Это удобно для коротких реплик — сообщение в Slack, промпт для AI, фраза в документе.

И плохо работает для всего, что длиннее. Через две минуты диктовки абзаца палец сводит. Вы забываете, что удерживаете клавишу, и случайно начинаете печатать буквы. Вторая рука нужна на трекпаде, чтобы переключить приложение, — и вот вы уже акробат. Решение — диктовка без рук: нажали один раз, чтобы начать, нажали один раз, чтобы остановить. Говорите сколько угодно, делайте руками что-то ещё, завершайте сессию, когда закончите.

Что на самом деле означает «без рук»

Два типа триггеров диктовки:

Push-to-talk (удержание). Нажимаете и удерживаете клавишу (обычно Shift, Fn или right-Command). Говорите, пока удерживаете. Отпускаете, чтобы остановить. Поведение по умолчанию в большинстве приложений диктовки для Mac.

Без рук (переключение). Нажимаете клавишу один раз, чтобы начать запись. Нажимаете ещё раз, чтобы остановить. Удерживать не нужно.

Терминология немного перегружена — «без рук» иногда означает голосовую активацию по словам-триггерам вроде «Hey Siri». Для приложений диктовки это обычно означает поведение с переключением, описанное выше. Ваши руки свободны во время сессии, но вы всё же касаетесь клавиатуры один раз в начале и один раз в конце.

Полностью бесконтактная версия (голосовое слово-триггер, вообще без нажатия клавиш) редко встречается в продуктивных приложениях диктовки — и не зря: ложные срабатывания случаются слишком легко. Произнесённое вслух «start dictation» сработает каждый раз, когда вы скажете «давайте запустим функцию диктовки» на встрече.

Когда push-to-talk проигрывает

Пять сценариев, где переключение лучше удержания:

Длинные фрагменты. Диктуете письмо на 500 слов, запись в дневнике, итоги встречи. Удерживать клавишу четыре минуты неудобно, и контакт становится нестабильным. Переключение комфортно сколь угодно долго.

Размеренная речь. Вы хотите сделать паузу и подумать посреди фразы, а затем продолжить. С push-to-talk вы либо продолжаете удерживать (что вынуждает к непрерывному дублю), либо отпускаете и начинаете заново (что часто сбивает позицию курсора или разбивает запись на две вставки). Переключение позволяет делать паузы любой длины — запись продолжается через тишину.

Многозадачность руками. Переключение приложений посреди диктовки, прокрутка документа, который вы описываете, перетаскивание окна — всё, что требует мыши. С диктовкой без рук ваши руки полностью свободны.

Добавление скриншотов. Хороший пример — функция захвата скриншота во время диктовки в Vext: вы включаете диктовку, начинаете говорить, выделяете область экрана для захвата прямо по ходу, заканчиваете мысль, выключаете диктовку. Скриншот вставляется рядом с транскриптом. С push-to-talk вам понадобилась бы третья рука.

Перемещение по комнате. Беспроводной микрофон, AirPods, диктовка в масштабе комнаты. Нельзя удерживать клавишу на ноутбуке, рядом с которым вас нет. Переключение для этого работает; push-to-talk — нет.

Когда push-to-talk выигрывает

Push-to-talk по-прежнему остаётся правильным выбором по умолчанию для большинства пользователей в большинстве случаев. Короткие реплики — фразы, промпты для AI, быстрые сообщения — не требуют режима переключения. Удерживаемая клавиша — более чёткий сигнал «я сейчас записываю», и это важно, когда вы чередуете диктовку и набор текста в одном потоке работы. И нет риска того сбоя, который есть у диктовки без рук: включил, отвлёкся и записал три минуты окружающего разговора, который не собирался записывать. Push-to-talk физически на это не способен.

Для частой и короткой диктовки push-to-talk вполне подходит. Для длинных текстов или работы с занятыми руками побеждает диктовка без рук.

Приложения, поддерживающие диктовку без рук на Mac

Apple Dictation. Да, переключение — поведение по умолчанию. Нажимаете горячую клавишу (по умолчанию control дважды), чтобы начать, нажимаете ещё раз или жмёте Done, чтобы остановить. Ограничено довольно короткими сессиями, после чего останавливается автоматически.

Vext. Оба режима. Push-to-talk — режим по умолчанию для диктовки. Диктовка без рук — отдельное переключение, доступное через Settings > Hotkeys или через выделенную горячую клавишу для режима без рук. В приложении Vext также есть переключатель режима без рук в строке меню, так что вы можете менять режимы, не покидая документ, в котором находитесь.

Superwhisper. По умолчанию push-to-talk; диктовка без рук доступна как настройка.

Wispr Flow. Оба режима, переключаются на лету.

MacWhisper. Ориентирован на файлы; живая диктовка в версии Pro поддерживает оба режима.

VoiceInk. В основном push-to-talk; поведение переключения зависит от сборки, которую вы используете.

Большинство современных приложений диктовки для Mac поддерживают оба режима. Вопрос в том, насколько легко в них переключаться, а не в том, поддерживается ли вообще диктовка без рук.

Настройка диктовки без рук в Vext

Вот настройка в Vext:

  1. Установите: brew install muvon/tap/vext
  2. Предоставьте разрешение Accessibility, когда появится запрос
  3. Откройте Settings > Hotkeys
  4. Найдите пункт Hands-free dictation
  5. Назначьте горячую клавишу — рекомендуем что-то отличное от клавиши push-to-talk, чтобы можно было использовать оба режима. Хорошо подходят F19, right-option или сочетание с hyper-клавишей
  6. По желанию включите Enhance для очистки текста (рекомендуется для длинных сессий — диктовка без рук по своей природе сбивчива, поэтому очистка важнее)

После настройки порядок действий такой:

  1. Кликните в любое текстовое поле, где должен появиться текст
  2. Нажмите горячую клавишу режима без рук — Vext покажет индикатор записи
  3. Говорите. Делайте паузы. Переключайте приложения. Выделяйте область для скриншота. Что угодно.
  4. Нажмите горячую клавишу ещё раз, чтобы остановить
  5. Очищенный текст вставляется в позицию курсора

Именно шаг Enhance делает диктовку без рук по-настоящему пригодной к использованию. Без него пятиминутный поток мыслей превращается в пятиминутный транскрипт ваших «эм» и «ну». С ним тот же ввод превращается в связный абзац или два.

Применение для доступности

Диктовка без рук важнее всего для пользователей, которые не могут надёжно удерживать клавишу, — при повторяющихся травмах от перенапряжения, треморе рук, частичном параличе, с протезами, в период восстановления после операции. Для таких пользователей это не функция для продвинутых — это разница между комфортным использованием Mac и его отсутствием.

Несколько замечаний по части доступности:

Встроенные средства macOS — это базовый минимум. Voice Control от Apple (отдельный от Dictation, находится в System Settings > Accessibility > Voice Control) — полноценное управление Mac голосом без рук. В сочетании с Apple Dictation он покрывает базовые потребности в доступности бесплатно. Для некоторых пользователей этого достаточно.

Сторонние приложения добавляют очистку и контекст. Voice Control транскрибирует буквально. Тем, кто хочет, чтобы продиктованный текст читался гладко без ручной правки, стороннее приложение с очисткой (Vext, Superwhisper и т. д.) экономит время и снижает нагрузку на редактирование.

Альтернативы горячим клавишам. Ножные педали работают с большинством приложений диктовки, если назначить нажатие педали на горячую клавишу. Это частый вариант для пользователей с ограничениями подвижности рук.

Если вы настраиваете диктовку именно по причинам доступности, проверьте, поддерживает ли приложение:

  • Удержание и отпускание с любым порогом (некоторые пользователи могут удерживать 5 секунд, а не 1)
  • Режим переключения
  • Настраиваемые горячие клавиши, включая нестандартные клавиши (F19, ножные педали)
  • Визуальные индикаторы состояния записи (некоторые приложения показывают лишь маленький значок — крупные индикаторы помогают)

Рабочий процесс, который стоит попробовать

Тем, кто пишет длинные тексты — посты в блог, дневники, письма, планы проектов, исследовательские заметки, — попробуйте такой подход в течение недели:

  1. Сядьте с открытым документом
  2. Включите режим без рук
  3. Проговорите то, что хотите сказать, от начала до конца
  4. Не редактируйте во время речи. Не пытайтесь сразу сделать гладко. Просто выгрузите мысли наружу.
  5. Выключите режим
  6. Прочитайте, что получилось. Отредактируйте по необходимости.

Результат не будет вашим готовым текстом. Это будет первый черновик, на набор которого вам обычно потребовался бы час. Вы получите его за пять минут.

Настоящее письмо происходит на этапе редактуры. Но вы пропустили самую трудную часть — извлечение мыслей из головы, — проговорив их вместо борьбы с клавиатурой.

Что диктовка без рук не исправляет

Это всё ещё диктовка. Вы по-прежнему не сможете толком диктовать код. Вам по-прежнему нужна очистка, чтобы текст читался как настоящее письмо. Вам по-прежнему нужен микрофон, который улавливает ваш голос без чрезмерного шума помещения.

Диктовка без рук — просто правильный стиль ввода для длинных текстов, а не волшебство. Если ваша текущая настройка диктовки кажется ограниченной потому, что вы делаете только короткие реплики, переход на режим без рук мало что изменит. Если она кажется ограниченной потому, что у вас сводит руки, вы отвлекаетесь, удерживая клавишу, или хотите делать что-то ещё посреди диктовки, — диктовка без рук станет ключом к свободе.