Если вы много пользуетесь ChatGPT, печатать промпты надоедает. Голос быстрее для всего длиннее пары фраз — большинство говорит со скоростью 130–150 слов в минуту и печатает 40–60. Экономия суммируется, если вы пишете в ChatGPT весь день.
Есть три способа голосового ввода в ChatGPT на Mac, и они не эквивалентны. Что каждый делает хорошо.
Вариант 1: Встроенный голосовой режим OpenAI
ChatGPT.com и десктопное приложение имеют встроенные голосовые режимы. Нажимаете иконку микрофона, говорите, оно расшифровывает плюс выполняет промпт.
Где хорошо:
- Нулевая настройка. Уже там.
- Тесно интегрировано с ChatGPT — голос на вход, голос на выход, если хотите.
- Бесплатный тариф юзабелен, на Plus — advanced voice.
Где не очень:
- Привязано к ChatGPT. Не поможет с Claude, Gemini, Cursor, терминалом — где угодно ещё.
- Аудио уходит на серверы OpenAI. Если вы что-то чувствительное обсуждаете — учитывайте.
- Стандартный voice норм, advanced — хорош, но лимитирован на Plus.
- Сценарий рассчитан на разговор. Если хочется надиктовать длинный структурированный промпт и отредактировать перед отправкой, разговорный режим мешает.
Лучше всего для: Случайных пользователей ChatGPT, которым нужен голос для редких вопросов и не критично, что работает только внутри ChatGPT.
Вариант 2: Диктовка в браузере (Chrome / Web Speech API)
В Chrome встроен голосовой ввод через Web Speech API. Расширения добавляют его в любые поля. У Google Docs — свой.
Где хорошо:
- Работает в любом текстовом поле браузера, включая поле промпта ChatGPT.
- Бесплатно.
Где не очень:
- Точность так себе на техтерминах.
- Аудио уходит к Google — тот же компромисс приватности, что и облачная диктовка.
- Не работает вне браузера. В терминал или Cursor — увы.
- Браузерные «прибамбасы». UX разрешений микрофона на macOS грубоват.
Лучше всего для: Тех, кто использует ChatGPT только в браузере и без техлексики в промптах.
Вариант 3: Системное голос-в-текст на Mac
Отдельное приложение слушает горячую клавишу, расшифровывает речь и вставляет результат туда, где курсор — ChatGPT, Claude, Cursor, редактор, Slack, куда угодно. Большинство гонит распознавание локально на Mac.
Где хорошо:
- Работает в каждом приложении, не только ChatGPT.
- Локальная обработка — аудио не покидает Mac (зависит от приложения).
- Точность по техлексике лучше браузерной диктовки.
- Единый сценарий для ChatGPT, Claude, Cursor, терминала, почты — всего.
- Часто есть ИИ-очистка — паразиты и фальстарты убираются до попадания в промпт.
Где не очень:
- Разовый платёж или подписка, зависит от приложения.
- Локальные требуют Apple Silicon.
- Первоначальная загрузка модели (600 MB до 3 GB).
Лучше всего для: Тех, кто пишет ИИ-инструментам через разные приложения и хочет один стиль работы.
Настройка системной диктовки для ChatGPT
Поток с большинством локальных Mac-приложений:
- Откройте ChatGPT (или Claude, Cursor — куда хотите промптить).
- Кликните в поле ввода.
- Удерживайте горячую клавишу (обычно fn или right-shift).
- Скажите промпт.
- Отпустите клавишу.
- Очищенный текст появляется у курсора.
- Нажмите Enter, чтобы отправить.
Шаг очистки — то, что делает голосовые промпты реально хорошими. Сырая расшифровка даёт «окей короче я хочу чтобы ты эм написал мне python-функцию которая ну берёт список и возвращает сумму но только чётных чисел». Очистка превращает это в «Напиши python-функцию, которая берёт список и возвращает сумму только чётных чисел».
Второй промпт даёт лучший результат. Слова-паразиты и фальстарты сбивают модели — это шум и для LLM, и для человека.
Приложения на Mac
- Vext — $49 разово, полностью локально, есть ИИ-очистка. YOLO-режим авто-отправляет промпты в ИИ-инструменты без Enter.
- Superwhisper — $249 разово, фокус на диктовке с режимными промптами.
- Wispr Flow — $15/мес, кроссплатформа, облако.
- MacWhisper Pro — €64 разово, файлы-сначала, но и живая диктовка.
- VoiceInk — open-source, дешевле.
Для ChatGPT конкретно важно: умеет ли приложение авто-отправлять. YOLO-режим Vext умеет — сказали, отпустили, и результат уже впечатан и Enter нажат. По-настоящему «без рук».
Без авто-отправки — экономите печать, но Enter всё равно жать.
Почему голосовые промпты дают лучший результат
Три причины, по которым перешедшие не возвращаются:
Промпты длиннее, усилий меньше. При печати вы коротите промпты — печать дороже. С голосом они становятся естественно длиннее: больше контекста, деталей, инструкций. LLM хорошо отвечают на конкретные и подробные.
Более естественный язык. Голосовые промпты звучат как разговор с человеком. Напечатанные — часто как команды. Естественные дают более выверенные ответы, особенно на нюансированных задачах.
Идеи фиксируются быстрее. Когда мысли идут быстро, печать отстаёт. Голос успевает. Не теряете нить, пока пальцы догоняют.
Минус — голосовые промпты могут расплываться. Шаг очистки в хороших приложениях это чинит: убирает паразитов, подтягивает структуру, сохраняет смысл. Без очистки либо правите вручную (теряя смысл подхода), либо отправляете сыроваты.
Голос + скриншоты
Для кодинга «звезда» — голос плюс скриншот. Видите что-то в IDE, делаете снимок, голосом задаёте промпт — всё уходит в Claude или GPT.
Хэндс-фри Vext позволяет, удерживая клавишу диктовки, выделить область экрана — скриншот попадает в активное приложение вместе с расшифровкой. Для кодинга с ИИ — поток, реально успевающий за мыслью.
Как выбрать
Если только ChatGPT и только в браузере — встроенного голоса OpenAI достаточно.
Если несколько ИИ-инструментов (ChatGPT, Claude, Cursor, Copilot Chat, Gemini) — системное локальное приложение окупится за неделю.
Если в миксе ещё и Windows — мультиплатформенность Wispr Flow может оправдать подписку.
Для большинства маководов, ежедневно работающих с ИИ, разовая локальная вроде Vext или Superwhisper — правильный ответ. Настройка раз, оплата раз, поток работает везде, где пишете.
Когда привыкаете говорить промпты, печатать их начинает казаться медленным способом.