Mantén un atajo. Habla. El texto aparece en el cursor. Eso es Vext — una app de voz a texto que funciona íntegramente en tu Mac. Sin nube. Sin cuenta. Sin suscripción.
Esta guía cubre todo: instalación, configuración del atajo, los tres modos (dictado, reuniones, notas), Enhance, traducción en vivo y todas las demás funciones.
Instalación
Instala con Homebrew:
brew install muvon/tap/vext
O descárgalo directamente desde getvext.app. No se requiere cuenta — instala y empieza a usarlo al instante.
Requisitos: macOS 14 Sonoma o posterior, Apple Silicon (M1–M4).
Tu primer dictado
- Abre Vext desde Aplicaciones
- Mantén pulsado tu atajo
- Habla
- Suelta — el texto aparece en el cursor
Tres pasos. Sin login. El texto va a donde estaba tu cursor cuando empezaste a hablar.
Tres modos
Vext tiene tres modos para distintos flujos de trabajo.
Dictado
La experiencia central. Mantén un atajo, habla, suelta — el texto aparece en el cursor. Funciona en cualquier campo de texto y cualquier app: navegadores, editores, terminales, chat, correo, notas.
El dictado es la forma más rápida de meter palabras en una computadora. Hablas a 130–150 palabras por minuto. Escribes a 40–60. Un mensaje de 100 palabras tarda unos 40 segundos dictado. Escrito, casi dos minutos.
Reuniones
Graba reuniones con identificación de hablantes. Vext captura tu micrófono y el audio del sistema al mismo tiempo, así que funciona con Zoom, Google Meet, FaceTime y cualquier otra videollamada.
Al terminar la reunión obtienes:
- Una transcripción completa con etiquetas de hablantes y marcas de tiempo
- Un resumen generado por IA con puntos clave y acciones
- Cualquier captura que hayas tomado durante la llamada
Notas
Notas de voz rápidas con una sola tecla. Di lo que piensas y Vext lo transcribe, lo pasa por Enhance y lo guarda localmente.
Las notas pasan por el mismo pipeline que el dictado — limpieza, traducción, toda la cadena. La diferencia es que las notas se guardan en Vext en vez de pegarse en el cursor.
Usa las notas para capturar ideas en medio de una tarea sin cambiar de app, anotar recordatorios rápidos o guardar contexto que necesitarás más tarde.
Dictado manos libres
El dictado estándar requiere mantener una tecla. El modo manos libres cambia esto — pulsa una vez para empezar, pulsa otra vez para parar. Sin mantener pulsado.
Es útil para pasajes largos, cuando tienes las manos ocupadas o cuando estás caminando y pensando en voz alta. La tecla actúa como un interruptor en lugar de un push-to-talk.
Enhance
Enhance es post-procesado con IA que se ejecuta sobre tu transcripción antes de llegar al portapapeles. Quita muletillas, arregla la estructura de las oraciones y suaviza los bordes ásperos del lenguaje hablado — sin cambiar lo que dijiste.
Antes de Enhance:
"O sea básicamente lo que estaba pensando es que eh deberíamos probablemente este mover el endpoint de la API a un servicio aparte porque se está poniendo como lento"
Después de Enhance:
"Deberíamos mover el endpoint de la API a un servicio aparte porque se está poniendo lento."
El significado se mantiene. El tono se mantiene. Enhance solo elimina el ruido.
La transcripción cruda siempre se guarda junto a la versión mejorada. Nunca pierdes el original.
Traducción en vivo
Configura un idioma de destino en Vext y habla en cualquier idioma. El texto que aparece en el cursor ya está traducido.
Cuando Enhance también está activado, limpieza y traducción ocurren en una sola pasada. Hablas un francés desordenado y aparece inglés limpio en el cursor.
Vext soporta traducción entre cualquier par de los más de 99 idiomas que entienden los modelos Whisper.
Captura de pantalla
Durante una grabación de reunión puedes capturar cualquier área de tu pantalla. Arrastra para seleccionar una región y la captura se adjunta automáticamente a tu transcripción.
Útil para capturar diapositivas durante una presentación, código que alguien está mostrando o un diseño en discusión. Múltiples capturas por sesión, todas guardadas junto a la transcripción.
Atenuación de audio
Cuando empiezas a grabar, Vext atenúa automáticamente el audio del sistema para que tu voz se oiga clara. Sueltas la tecla y el volumen vuelve.
Esto evita que el audio del ordenador interfiera con la transcripción — ya sea música, vídeo o una llamada.
Modo YOLO
Activa el modo YOLO y Vext pulsa Enter automáticamente después de pegar tu transcripción. Habla, suelta y tu prompt ya está enviado.
Está pensado para herramientas de IA como Claude Code, ChatGPT y Cursor. En lugar de dictar un prompt, revisarlo, editarlo y pulsar Enter — solo hablas y va. Los LLMs manejan el lenguaje imperfecto mejor de lo que la mayoría espera.
Motores de transcripción
Vext incluye varios motores de voz a texto:
| Motor | Tipo | Velocidad |
|---|---|---|
| Parakeet | Local | 150x tiempo real |
| Apple Dictation | Local | 25x tiempo real |
| Compatible OpenAI | API | Varía |
Parakeet es el predeterminado. Se ejecuta enteramente en la GPU de Apple Silicon y transcribe a 150x tiempo real — una grabación de 60 segundos se procesa en menos de medio segundo.
Motores de procesamiento IA
Enhance, traducción y resumen están impulsados por LLMs locales:
| Modelo | Tipo | Tamaño |
|---|---|---|
| Gemma 3 4B | Local (por defecto) | 2.8 GB |
| Qwen 3 4B | Local | 3.2 GB |
| LLaMA 3.2 3B | Local | 2.4 GB |
| Gemma 3 1B | Local | 0.8 GB |
| Phi-3.5 Mini | Local | 2.8 GB |
| Compatible OpenAI | API | — |
Todos los modelos locales se ejecutan en la GPU de tu Mac. No se requiere conexión a internet.
Privacidad
Tu voz nunca sale de tu Mac. No hay procesamiento en la nube, ni cuenta, ni telemetría, ni analíticas. El audio se procesa en el dispositivo y nunca se almacena tras la transcripción.
Si usas un motor basado en API (compatible con OpenAI), tu audio se envía a ese proveedor — pero es opcional y está desactivado por defecto.
Precios
Vext incluye prueba gratuita: 100 dictados, 50 notas y 10 grabaciones de reuniones. Sin tarjeta de crédito, sin cuenta.
Cuando estés listo, desbloquea uso ilimitado por $49 — pago único desde la propia app. Actualizaciones gratuitas dentro de tu versión. Las versiones mayores nuevas están al 50% de descuento para usuarios existentes.
Cómo empezar
- Instala con
brew install muvon/tap/vexto descarga desde getvext.app - Abre la app y mantén pulsado tu atajo
- Empieza a hablar
El paso de teclado a voz se siente extraño unos 30 minutos. Después, escribir empieza a sentirse como la forma lenta.