Mantén un atajo. Habla. El texto aparece en el cursor. Eso es Vext — una app de voz a texto que funciona íntegramente en tu Mac. Sin nube. Sin cuenta. Sin suscripción.

Esta guía cubre todo: instalación, configuración del atajo, los tres modos (dictado, reuniones, notas), Enhance, traducción en vivo y todas las demás funciones.

Instalación

Instala con Homebrew:

brew install muvon/tap/vext

O descárgalo directamente desde getvext.app. No se requiere cuenta — instala y empieza a usarlo al instante.

Requisitos: macOS 14 Sonoma o posterior, Apple Silicon (M1–M4).

Tu primer dictado

  1. Abre Vext desde Aplicaciones
  2. Mantén pulsado tu atajo
  3. Habla
  4. Suelta — el texto aparece en el cursor

Tres pasos. Sin login. El texto va a donde estaba tu cursor cuando empezaste a hablar.

Tres modos

Vext tiene tres modos para distintos flujos de trabajo.

Dictado

La experiencia central. Mantén un atajo, habla, suelta — el texto aparece en el cursor. Funciona en cualquier campo de texto y cualquier app: navegadores, editores, terminales, chat, correo, notas.

El dictado es la forma más rápida de meter palabras en una computadora. Hablas a 130–150 palabras por minuto. Escribes a 40–60. Un mensaje de 100 palabras tarda unos 40 segundos dictado. Escrito, casi dos minutos.

Reuniones

Graba reuniones con identificación de hablantes. Vext captura tu micrófono y el audio del sistema al mismo tiempo, así que funciona con Zoom, Google Meet, FaceTime y cualquier otra videollamada.

Al terminar la reunión obtienes:

  • Una transcripción completa con etiquetas de hablantes y marcas de tiempo
  • Un resumen generado por IA con puntos clave y acciones
  • Cualquier captura que hayas tomado durante la llamada

Notas

Notas de voz rápidas con una sola tecla. Di lo que piensas y Vext lo transcribe, lo pasa por Enhance y lo guarda localmente.

Las notas pasan por el mismo pipeline que el dictado — limpieza, traducción, toda la cadena. La diferencia es que las notas se guardan en Vext en vez de pegarse en el cursor.

Usa las notas para capturar ideas en medio de una tarea sin cambiar de app, anotar recordatorios rápidos o guardar contexto que necesitarás más tarde.

Dictado manos libres

El dictado estándar requiere mantener una tecla. El modo manos libres cambia esto — pulsa una vez para empezar, pulsa otra vez para parar. Sin mantener pulsado.

Es útil para pasajes largos, cuando tienes las manos ocupadas o cuando estás caminando y pensando en voz alta. La tecla actúa como un interruptor en lugar de un push-to-talk.

Enhance

Enhance es post-procesado con IA que se ejecuta sobre tu transcripción antes de llegar al portapapeles. Quita muletillas, arregla la estructura de las oraciones y suaviza los bordes ásperos del lenguaje hablado — sin cambiar lo que dijiste.

Antes de Enhance:

"O sea básicamente lo que estaba pensando es que eh deberíamos probablemente este mover el endpoint de la API a un servicio aparte porque se está poniendo como lento"

Después de Enhance:

"Deberíamos mover el endpoint de la API a un servicio aparte porque se está poniendo lento."

El significado se mantiene. El tono se mantiene. Enhance solo elimina el ruido.

La transcripción cruda siempre se guarda junto a la versión mejorada. Nunca pierdes el original.

Traducción en vivo

Configura un idioma de destino en Vext y habla en cualquier idioma. El texto que aparece en el cursor ya está traducido.

Cuando Enhance también está activado, limpieza y traducción ocurren en una sola pasada. Hablas un francés desordenado y aparece inglés limpio en el cursor.

Vext soporta traducción entre cualquier par de los más de 99 idiomas que entienden los modelos Whisper.

Captura de pantalla

Durante una grabación de reunión puedes capturar cualquier área de tu pantalla. Arrastra para seleccionar una región y la captura se adjunta automáticamente a tu transcripción.

Útil para capturar diapositivas durante una presentación, código que alguien está mostrando o un diseño en discusión. Múltiples capturas por sesión, todas guardadas junto a la transcripción.

Atenuación de audio

Cuando empiezas a grabar, Vext atenúa automáticamente el audio del sistema para que tu voz se oiga clara. Sueltas la tecla y el volumen vuelve.

Esto evita que el audio del ordenador interfiera con la transcripción — ya sea música, vídeo o una llamada.

Modo YOLO

Activa el modo YOLO y Vext pulsa Enter automáticamente después de pegar tu transcripción. Habla, suelta y tu prompt ya está enviado.

Está pensado para herramientas de IA como Claude Code, ChatGPT y Cursor. En lugar de dictar un prompt, revisarlo, editarlo y pulsar Enter — solo hablas y va. Los LLMs manejan el lenguaje imperfecto mejor de lo que la mayoría espera.

Motores de transcripción

Vext incluye varios motores de voz a texto:

Motor Tipo Velocidad
Parakeet Local 150x tiempo real
Apple Dictation Local 25x tiempo real
Compatible OpenAI API Varía

Parakeet es el predeterminado. Se ejecuta enteramente en la GPU de Apple Silicon y transcribe a 150x tiempo real — una grabación de 60 segundos se procesa en menos de medio segundo.

Motores de procesamiento IA

Enhance, traducción y resumen están impulsados por LLMs locales:

Modelo Tipo Tamaño
Gemma 3 4B Local (por defecto) 2.8 GB
Qwen 3 4B Local 3.2 GB
LLaMA 3.2 3B Local 2.4 GB
Gemma 3 1B Local 0.8 GB
Phi-3.5 Mini Local 2.8 GB
Compatible OpenAI API

Todos los modelos locales se ejecutan en la GPU de tu Mac. No se requiere conexión a internet.

Privacidad

Tu voz nunca sale de tu Mac. No hay procesamiento en la nube, ni cuenta, ni telemetría, ni analíticas. El audio se procesa en el dispositivo y nunca se almacena tras la transcripción.

Si usas un motor basado en API (compatible con OpenAI), tu audio se envía a ese proveedor — pero es opcional y está desactivado por defecto.

Precios

Vext incluye prueba gratuita: 100 dictados, 50 notas y 10 grabaciones de reuniones. Sin tarjeta de crédito, sin cuenta.

Cuando estés listo, desbloquea uso ilimitado por $49 — pago único desde la propia app. Actualizaciones gratuitas dentro de tu versión. Las versiones mayores nuevas están al 50% de descuento para usuarios existentes.

Cómo empezar

  1. Instala con brew install muvon/tap/vext o descarga desde getvext.app
  2. Abre la app y mantén pulsado tu atajo
  3. Empieza a hablar

El paso de teclado a voz se siente extraño unos 30 minutos. Después, escribir empieza a sentirse como la forma lenta.