Если вы много пользуетесь ChatGPT, печатать промпты надоедает. Голос быстрее для всего длиннее пары фраз — большинство говорит со скоростью 130–150 слов в минуту и печатает 40–60. Экономия суммируется, если вы пишете в ChatGPT весь день.

Есть три способа голосового ввода в ChatGPT на Mac, и они не эквивалентны. Что каждый делает хорошо.

Вариант 1: Встроенный голосовой режим OpenAI

ChatGPT.com и десктопное приложение имеют встроенные голосовые режимы. Нажимаете иконку микрофона, говорите, оно расшифровывает плюс выполняет промпт.

Где хорошо:

  • Нулевая настройка. Уже там.
  • Тесно интегрировано с ChatGPT — голос на вход, голос на выход, если хотите.
  • Бесплатный тариф юзабелен, на Plus — advanced voice.

Где не очень:

  • Привязано к ChatGPT. Не поможет с Claude, Gemini, Cursor, терминалом — где угодно ещё.
  • Аудио уходит на серверы OpenAI. Если вы что-то чувствительное обсуждаете — учитывайте.
  • Стандартный voice норм, advanced — хорош, но лимитирован на Plus.
  • Сценарий рассчитан на разговор. Если хочется надиктовать длинный структурированный промпт и отредактировать перед отправкой, разговорный режим мешает.

Лучше всего для: Случайных пользователей ChatGPT, которым нужен голос для редких вопросов и не критично, что работает только внутри ChatGPT.

Вариант 2: Диктовка в браузере (Chrome / Web Speech API)

В Chrome встроен голосовой ввод через Web Speech API. Расширения добавляют его в любые поля. У Google Docs — свой.

Где хорошо:

  • Работает в любом текстовом поле браузера, включая поле промпта ChatGPT.
  • Бесплатно.

Где не очень:

  • Точность так себе на техтерминах.
  • Аудио уходит к Google — тот же компромисс приватности, что и облачная диктовка.
  • Не работает вне браузера. В терминал или Cursor — увы.
  • Браузерные «прибамбасы». UX разрешений микрофона на macOS грубоват.

Лучше всего для: Тех, кто использует ChatGPT только в браузере и без техлексики в промптах.

Вариант 3: Системное голос-в-текст на Mac

Отдельное приложение слушает горячую клавишу, расшифровывает речь и вставляет результат туда, где курсор — ChatGPT, Claude, Cursor, редактор, Slack, куда угодно. Большинство гонит распознавание локально на Mac.

Где хорошо:

  • Работает в каждом приложении, не только ChatGPT.
  • Локальная обработка — аудио не покидает Mac (зависит от приложения).
  • Точность по техлексике лучше браузерной диктовки.
  • Единый сценарий для ChatGPT, Claude, Cursor, терминала, почты — всего.
  • Часто есть ИИ-очистка — паразиты и фальстарты убираются до попадания в промпт.

Где не очень:

  • Разовый платёж или подписка, зависит от приложения.
  • Локальные требуют Apple Silicon.
  • Первоначальная загрузка модели (600 MB до 3 GB).

Лучше всего для: Тех, кто пишет ИИ-инструментам через разные приложения и хочет один стиль работы.

Настройка системной диктовки для ChatGPT

Поток с большинством локальных Mac-приложений:

  1. Откройте ChatGPT (или Claude, Cursor — куда хотите промптить).
  2. Кликните в поле ввода.
  3. Удерживайте горячую клавишу (обычно fn или right-shift).
  4. Скажите промпт.
  5. Отпустите клавишу.
  6. Очищенный текст появляется у курсора.
  7. Нажмите Enter, чтобы отправить.

Шаг очистки — то, что делает голосовые промпты реально хорошими. Сырая расшифровка даёт «окей короче я хочу чтобы ты эм написал мне python-функцию которая ну берёт список и возвращает сумму но только чётных чисел». Очистка превращает это в «Напиши python-функцию, которая берёт список и возвращает сумму только чётных чисел».

Второй промпт даёт лучший результат. Слова-паразиты и фальстарты сбивают модели — это шум и для LLM, и для человека.

Приложения на Mac

  • Vext — $49 разово, полностью локально, есть ИИ-очистка. YOLO-режим авто-отправляет промпты в ИИ-инструменты без Enter.
  • Superwhisper — $249 разово, фокус на диктовке с режимными промптами.
  • Wispr Flow — $15/мес, кроссплатформа, облако.
  • MacWhisper Pro — €64 разово, файлы-сначала, но и живая диктовка.
  • VoiceInk — open-source, дешевле.

Для ChatGPT конкретно важно: умеет ли приложение авто-отправлять. YOLO-режим Vext умеет — сказали, отпустили, и результат уже впечатан и Enter нажат. По-настоящему «без рук».

Без авто-отправки — экономите печать, но Enter всё равно жать.

Почему голосовые промпты дают лучший результат

Три причины, по которым перешедшие не возвращаются:

Промпты длиннее, усилий меньше. При печати вы коротите промпты — печать дороже. С голосом они становятся естественно длиннее: больше контекста, деталей, инструкций. LLM хорошо отвечают на конкретные и подробные.

Более естественный язык. Голосовые промпты звучат как разговор с человеком. Напечатанные — часто как команды. Естественные дают более выверенные ответы, особенно на нюансированных задачах.

Идеи фиксируются быстрее. Когда мысли идут быстро, печать отстаёт. Голос успевает. Не теряете нить, пока пальцы догоняют.

Минус — голосовые промпты могут расплываться. Шаг очистки в хороших приложениях это чинит: убирает паразитов, подтягивает структуру, сохраняет смысл. Без очистки либо правите вручную (теряя смысл подхода), либо отправляете сыроваты.

Голос + скриншоты

Для кодинга «звезда» — голос плюс скриншот. Видите что-то в IDE, делаете снимок, голосом задаёте промпт — всё уходит в Claude или GPT.

Хэндс-фри Vext позволяет, удерживая клавишу диктовки, выделить область экрана — скриншот попадает в активное приложение вместе с расшифровкой. Для кодинга с ИИ — поток, реально успевающий за мыслью.

Как выбрать

Если только ChatGPT и только в браузере — встроенного голоса OpenAI достаточно.

Если несколько ИИ-инструментов (ChatGPT, Claude, Cursor, Copilot Chat, Gemini) — системное локальное приложение окупится за неделю.

Если в миксе ещё и Windows — мультиплатформенность Wispr Flow может оправдать подписку.

Для большинства маководов, ежедневно работающих с ИИ, разовая локальная вроде Vext или Superwhisper — правильный ответ. Настройка раз, оплата раз, поток работает везде, где пишете.

Когда привыкаете говорить промпты, печатать их начинает казаться медленным способом.