La Dictación integrada de Apple recibió una actualización silenciosa en macOS Tahoe. El nuevo modelo fundacional on-device es rápido, preciso con el habla cotidiana y viene gratis con tu sistema operativo. Para mucha gente eso cierra el tema — no necesitan nada más.
Para otras personas deja de ser suficiente en una semana. Aquí está dónde está la línea y qué hacer cuando la cruzas.
Lo que Apple Dictation hace bien
Tres cosas, principalmente:
Ya está en tu Mac. Sin descargas, sin cuenta, sin danza de permisos. Configuración del Sistema > Teclado > Dictado, actívalo, elige un atajo, listo.
Es on-device. El audio no sale de tu máquina en la variante on-device. La historia de privacidad de Apple aquí es real — no hay ida y vuelta a la nube y ninguna grabación se almacena en ningún lugar después de la transcripción.
La precisión con el inglés conversacional es buena. Mejor que el motor anterior. Mejor de lo que la mayoría recuerda que era la dictación en macOS. La puntuación inferida por el ritmo funciona la mayor parte del tiempo. Los términos técnicos comunes ("React", "TypeScript", "API") salen correctos.
Para escribir rápido un mensaje de Slack, dictar una nota breve o responder un email con una sola frase, Apple Dictation es suficiente. Muchos usuarios nunca necesitan ir más allá.
Dónde falla
Mira lo que pasa cuando lo forzas:
Vocabulario técnico. Nombres de librerías, nombres de funciones, comandos CLI, rutas de archivos. "kubectl get pods" se convierte en "cube control get pods". "useEffect" se convierte en "you sufficed". "src/components/auth/AuthGuard" se convierte en... algo. Si tu trabajo implica nombres técnicos específicos, pasas más tiempo corrigiendo transcripciones de lo que ahorras dictando.
Limpieza de muletillas. Apple Dictation transcribe exactamente lo que dijiste, incluyendo "eh", "mm", "o sea básicamente", falsos arranques y oraciones incompletas. El lenguaje hablado es más desordenado que el escrito. Sin una pasada de limpieza, el texto dictado se lee como la transcripción de alguien pensando en voz alta — porque es exactamente eso.
Pasajes largos. Apple Dictation está diseñado para ráfagas cortas. No hay historial de transcripciones, no hay forma de capturar más de unas pocas frases con claridad, no hay notas a las que volver. Si quieres dictar un documento de 300 palabras, lo haces en fragmentos de 30 segundos que luego unes.
Reuniones. Apple Dictation no es una herramienta para reuniones. Solo captura desde una fuente de entrada a la vez, no tiene etiquetas de hablante, no resume. Si quieres transcripción de reuniones, este no es el producto adecuado.
Traducción. Inglés entra, inglés sale. Sin flujo multilingüe.
Ergonomía del atajo. El activador de doble toque rápido está bien para uso ocasional, es incómodo para uso frecuente. No hay opción de pulsar-para-hablar o mantener-para-dictar, ni anulaciones por aplicación.
Una prueba que te dice en qué grupo estás
Prueba esto durante un día: usa Apple Dictation para todo lo que escribas que tenga más de una frase. Slack, email, notas, comentarios en código, prompts de IA.
Al final del día habrás:
a) Notado que funcionó sorprendentemente bien — sigue usándolo. b) Notado que sigues peleando con los términos técnicos, o que la falta de limpieza hace que tus mensajes suenen raro, o que desearías poder dictar pasajes más largos.
Si es (b), estás en el grupo que necesita más de lo que Apple ofrece.
Lo que Vext añade y por qué
Vext es una app de dictación para Mac de $49 pago único que nosotros desarrollamos. Usa el mismo principio on-device de Apple — nada sale de tu Mac — pero resuelve las limitaciones específicas mencionadas arriba.
Estas son las diferencias concretas:
Motor de voz. Vext usa por defecto NVIDIA Parakeet vía CoreML. En M2 corre a alrededor de 150x en tiempo real y maneja el vocabulario técnico mejor que el modelo fundacional de Apple, especialmente para términos relacionados con código. También puedes elegir Whisper Small/Medium/Large para mayor precisión con audio ruidoso o contenido multilingüe. Apple Dictation usa el modelo fundacional de Apple sin posibilidad de elección.
Enhance (limpieza con LLM). Vext ejecuta un LLM local pequeño (por defecto Gemma 3 4B, alrededor de 2.8 GB) sobre la transcripción antes de pegarla. Las muletillas desaparecen. La estructura de las frases se ajusta. El significado se preserva. La transcripción original se guarda si la quieres. Apple Dictation no tiene nada equivalente.
Opciones de atajo. Mantener-para-hablar, activación manos libres, umbral configurable. Apple Dictation te da un solo estilo de activación.
Modo reunión. Captura micrófono + audio del sistema simultáneamente, añade etiquetas de hablante mediante diarización local, ejecuta un resumen a través del LLM. Funciona con Zoom, Meet, FaceTime — cualquier cosa que produzca audio en tu Mac.
Traducción. Habla en cualquiera de los 99+ idiomas, obtén texto en tu idioma de destino. Con Enhance activado, la limpieza y la traducción ocurren en un solo paso.
YOLO Mode. Auto-envío después de pegar. Diseñado específicamente para herramientas de código con IA.
Captura de pantalla durante la dictación. Selecciona arrastrando una región de la pantalla mientras hablas; la imagen se pega junto con la transcripción. Útil para usar con herramientas de IA sobre algo visible en pantalla.
El argumento honesto para quedarse con Apple Dictation
Si tu uso se ve así, no te molestes con nada más:
- Mensajes cortos unas pocas veces por hora
- Vocabulario general en inglés
- Un dispositivo, un flujo de trabajo
- No te molesta el activador de doble toque
- No haces reuniones
El modelo fundacional on-device es genuinamente bueno ahora. Apple entregó una mejora real y para uso casual es suficiente.
El argumento honesto para cambiar
Si tu uso se ve así, ahorrarás tiempo real:
- Múltiples dictaciones por hora, incluyendo pasajes más largos
- Vocabulario técnico con regularidad (código, nombres de librerías, comandos CLI)
- Quieres limpieza para que tu texto dictado se lea como texto escrito
- Haces reuniones y quieres transcripciones de ellas
- Trabajas en más de un idioma
- Escribes mucho a herramientas de IA
Para ese perfil, la math de una app de dictación local de pago se amortiza en un par de semanas. La fricción que crea Apple Dictation por caso de uso es pequeña, pero se acumula.
La coexistencia es válida
Esta no es una recomendación de "cambia completamente". Mucha gente usa ambas: Apple Dictation para mensajes rápidos puntuales donde el activador de doble toque es conveniente, Vext (o Superwhisper, o la app local que sea) para el trabajo de formato largo donde la limpieza y la precisión importan.
La versión gratuita de Vext te da 100 dictaciones, 50 notas y 10 reuniones antes de pedirte $49. Es suficiente para ver en qué lado de la línea cae tu uso.
Lo que macOS probablemente lanzará después
Apple está yendo hacia algún lugar específico. El modelo fundacional on-device en Tahoe es una actualización significativa. Las versiones futuras probablemente traerán mejor limpieza, mayor contexto y posiblemente un modo de reunión en Notas. La brecha entre lo integrado y las apps locales de pago se reducirá.
Pero se reducirá despacio. Apple no va a lanzar un Vext o Superwhisper función por función en el corto plazo — añadirá el 80% más común y dejará la cola larga a terceros. Si estás en la cola larga (desarrolladores, usuarios multilingües, flujos de trabajo con muchas reuniones), las apps de terceros siguen siendo relevantes en el futuro previsible.
Para el resto: Apple Dictation está bien. Si nunca lo has probado en Tahoe, pruébalo. Puede que no necesites nada más.