В 2026 голос-в-текст на Mac делится на три категории: встроенная диктовка Apple, облачные сервисы и локальные приложения, гоняющие модели на вашем железе. Каждая делает свои компромиссы между приватностью, скоростью, точностью и ценой. Это гид по тому, что стоит брать.
Встроенная диктовка Apple
macOS Tahoe поставляется с on-device foundation-моделью для диктовки. Бесплатно, приватно и без настройки сложнее, чем включение в Системных настройках.
Плюсы:
- Бесплатно — в составе macOS
- Полностью на устройстве — аудио не покидает Mac
- Работает в любом текстовом поле
- Приемлемая точность для общей речи
- Авто-пунктуация по ритму
Минусы:
- Слабо с техническим словарём — имена библиотек, CLI и жаргон ломаются
- Без пост-обработки — что сказано, то и получили, со словами-паразитами
- Без истории расшифровки
- Без расшифровки встреч и идентификации спикеров
- Без перевода
- Только короткие фрагменты — не для долгих записей
Лучше всего для: Бытовой диктовки в повседневных приложениях. Быстрые сообщения, заметки, короткий ввод, где точность по спецтерминам не важна.
Облачные сервисы
Сервисы вроде Otter.ai, Rev и Whisper API отправляют аудио на удалённые серверы. Кто-то даёт real-time, кто-то — batch.
Плюсы:
- Высокая точность, особенно на доменной речи
- Расшифровка встреч с идентификацией
- Поисковые архивы расшифровок
- Командные функции
- Часто — ИИ-резюме
Минусы:
- Аудио уходит и хранится на сторонних серверах
- Требуется интернет
- Подписка — обычно $10–30/мес ($120–360/год)
- Сетевые задержки
- Привязка к вендору для истории
Лучше всего для: Команд, которым нужна общая расшифровка, совместные конспекты или отраслевая точность, и которые согласны на облако.
Локальные приложения на Apple Silicon
Mac Apple Silicon (M1 и новее) имеют нейронные движки, способные крутить модели речи и LLM локально. Всё считается на устройстве.
Плюсы:
- Полностью приватно — аудио остаётся на Mac
- Без интернета
- Без подписки (обычно разовая покупка)
- Быстро — нет сетевой задержки
- Работает офлайн (рейсы, изолированные сети)
Минусы:
- Нужен Mac на Apple Silicon
- Первоначальная загрузка модели (~600 MB–3 GB)
- Точность зависит от модели и железа
- Экосистема меньше облачных сервисов
Лучше всего для: Разработчиков, ценящих приватность, и всех, кому нужна быстрая, приватная расшифровка без подписки.
Сравнение возможностей
| Функция | Apple Dictation | Облако | Локально |
|---|---|---|---|
| Приватность | На устройстве | В облаке | На устройстве |
| Нужен интернет | Нет | Да | Нет |
| Точность (общая) | Хорошая | Очень хорошая | Очень хорошая |
| Точность (тех.) | Слабая | Хорошая | Хорошая |
| Расшифровка встреч | Нет | Да | Да |
| Идентификация спикеров | Нет | Да | Да |
| ИИ-очистка | Нет | Иногда | Да |
| Перевод | Нет | Иногда | Да |
| История | Нет | Да | Да |
| Цена | Бесплатно | $10–30/мес | $0–99 разово |
На что смотреть
Если выбираете локальное, важно:
Движок расшифровки. Модель речи-в-текст определяет точность и скорость. NVIDIA Parakeet и OpenAI Whisper — лидеры открытых моделей. Parakeet, как правило, быстрее на Apple Silicon. Ищите приложения с CoreML или Metal-ускорением, а не CPU-only.
Пост-обработка. Сырая расшифровка содержит слова-паразиты, фальстарты и затянутые предложения. Хорошие локальные приложения добавляют ИИ-очистку, которая делает речь читаемым текстом без изменения смысла.
Интеграция в рабочий поток. Лучший инструмент подходит под ваш стиль. Для разработчиков — терминал, редакторы, ИИ-инструменты. Ищите системные горячие клавиши, вставку у курсора и совместимость с вашими приложениями.
Поддержка встреч. Если нужны встречи, проверьте двойной захват (микрофон + системное аудио), метки спикеров и экспорт. Не все локальные приложения это умеют — у многих только диктовка.
Форматы экспорта. TXT и Markdown — базовое. Для субтитров — SRT и VTT. Некоторые поддерживают PDF и DOCX.
Vext
Vext — локальное приложение голос-в-текст для macOS с Apple Silicon. Использует Parakeet (150x real-time) и локальные LLM для очистки, перевода и саммари встреч.
Ключевые функции:
- Три режима: диктовка (вставка у курсора), встречи (метки + резюме), заметки (в приложении)
- Enhance — ИИ-очистка слов-паразитов и структуры
- Живой перевод на 99+ языков
- YOLO Mode — авто-отправка промптов ИИ-инструментам
- Захват скриншотов во встречах
- Экспорт в TXT, Markdown, SRT, VTT
Цена: Пробный режим (100 диктовок, 50 заметок, 10 встреч). Разовый платёж $49 для разблокировки.
Требования: macOS 14+, Apple Silicon.
brew install muvon/tap/vext
Итог
Если важна приватность и у вас Apple Silicon, локальные приложения теперь конкурируют с облаком по точности и значительно быстрее за счёт нулевой сетевой задержки. Компромисс — нужен относительно новый Mac и место под модели.
Apple Dictation — отличная отправная точка для бытового использования. Облачные сервисы выигрывают для командной работы и узкоотраслевых словарей. Локальные приложения вроде Vext — посередине: приватные, быстрые и достаточно функциональные для ежедневной профессиональной работы.