В 2026 голос-в-текст на Mac делится на три категории: встроенная диктовка Apple, облачные сервисы и локальные приложения, гоняющие модели на вашем железе. Каждая делает свои компромиссы между приватностью, скоростью, точностью и ценой. Это гид по тому, что стоит брать.

Встроенная диктовка Apple

macOS Tahoe поставляется с on-device foundation-моделью для диктовки. Бесплатно, приватно и без настройки сложнее, чем включение в Системных настройках.

Плюсы:

  • Бесплатно — в составе macOS
  • Полностью на устройстве — аудио не покидает Mac
  • Работает в любом текстовом поле
  • Приемлемая точность для общей речи
  • Авто-пунктуация по ритму

Минусы:

  • Слабо с техническим словарём — имена библиотек, CLI и жаргон ломаются
  • Без пост-обработки — что сказано, то и получили, со словами-паразитами
  • Без истории расшифровки
  • Без расшифровки встреч и идентификации спикеров
  • Без перевода
  • Только короткие фрагменты — не для долгих записей

Лучше всего для: Бытовой диктовки в повседневных приложениях. Быстрые сообщения, заметки, короткий ввод, где точность по спецтерминам не важна.

Облачные сервисы

Сервисы вроде Otter.ai, Rev и Whisper API отправляют аудио на удалённые серверы. Кто-то даёт real-time, кто-то — batch.

Плюсы:

  • Высокая точность, особенно на доменной речи
  • Расшифровка встреч с идентификацией
  • Поисковые архивы расшифровок
  • Командные функции
  • Часто — ИИ-резюме

Минусы:

  • Аудио уходит и хранится на сторонних серверах
  • Требуется интернет
  • Подписка — обычно $10–30/мес ($120–360/год)
  • Сетевые задержки
  • Привязка к вендору для истории

Лучше всего для: Команд, которым нужна общая расшифровка, совместные конспекты или отраслевая точность, и которые согласны на облако.

Локальные приложения на Apple Silicon

Mac Apple Silicon (M1 и новее) имеют нейронные движки, способные крутить модели речи и LLM локально. Всё считается на устройстве.

Плюсы:

  • Полностью приватно — аудио остаётся на Mac
  • Без интернета
  • Без подписки (обычно разовая покупка)
  • Быстро — нет сетевой задержки
  • Работает офлайн (рейсы, изолированные сети)

Минусы:

  • Нужен Mac на Apple Silicon
  • Первоначальная загрузка модели (~600 MB–3 GB)
  • Точность зависит от модели и железа
  • Экосистема меньше облачных сервисов

Лучше всего для: Разработчиков, ценящих приватность, и всех, кому нужна быстрая, приватная расшифровка без подписки.

Сравнение возможностей

Функция Apple Dictation Облако Локально
Приватность На устройстве В облаке На устройстве
Нужен интернет Нет Да Нет
Точность (общая) Хорошая Очень хорошая Очень хорошая
Точность (тех.) Слабая Хорошая Хорошая
Расшифровка встреч Нет Да Да
Идентификация спикеров Нет Да Да
ИИ-очистка Нет Иногда Да
Перевод Нет Иногда Да
История Нет Да Да
Цена Бесплатно $10–30/мес $0–99 разово

На что смотреть

Если выбираете локальное, важно:

Движок расшифровки. Модель речи-в-текст определяет точность и скорость. NVIDIA Parakeet и OpenAI Whisper — лидеры открытых моделей. Parakeet, как правило, быстрее на Apple Silicon. Ищите приложения с CoreML или Metal-ускорением, а не CPU-only.

Пост-обработка. Сырая расшифровка содержит слова-паразиты, фальстарты и затянутые предложения. Хорошие локальные приложения добавляют ИИ-очистку, которая делает речь читаемым текстом без изменения смысла.

Интеграция в рабочий поток. Лучший инструмент подходит под ваш стиль. Для разработчиков — терминал, редакторы, ИИ-инструменты. Ищите системные горячие клавиши, вставку у курсора и совместимость с вашими приложениями.

Поддержка встреч. Если нужны встречи, проверьте двойной захват (микрофон + системное аудио), метки спикеров и экспорт. Не все локальные приложения это умеют — у многих только диктовка.

Форматы экспорта. TXT и Markdown — базовое. Для субтитров — SRT и VTT. Некоторые поддерживают PDF и DOCX.

Vext

Vext — локальное приложение голос-в-текст для macOS с Apple Silicon. Использует Parakeet (150x real-time) и локальные LLM для очистки, перевода и саммари встреч.

Ключевые функции:

  • Три режима: диктовка (вставка у курсора), встречи (метки + резюме), заметки (в приложении)
  • Enhance — ИИ-очистка слов-паразитов и структуры
  • Живой перевод на 99+ языков
  • YOLO Mode — авто-отправка промптов ИИ-инструментам
  • Захват скриншотов во встречах
  • Экспорт в TXT, Markdown, SRT, VTT

Цена: Пробный режим (100 диктовок, 50 заметок, 10 встреч). Разовый платёж $49 для разблокировки.

Требования: macOS 14+, Apple Silicon.

brew install muvon/tap/vext

Итог

Если важна приватность и у вас Apple Silicon, локальные приложения теперь конкурируют с облаком по точности и значительно быстрее за счёт нулевой сетевой задержки. Компромисс — нужен относительно новый Mac и место под модели.

Apple Dictation — отличная отправная точка для бытового использования. Облачные сервисы выигрывают для командной работы и узкоотраслевых словарей. Локальные приложения вроде Vext — посередине: приватные, быстрые и достаточно функциональные для ежедневной профессиональной работы.