Los usuarios de Obsidian suelen ser personas que piensan escribiendo. El vault es una extensión de cómo procesas el mundo — reuniones, ideas, investigación, notas diarias, planes de proyectos. La voz encaja en este patrón de forma inusualmente natural, porque la fricción de teclear mata los pensamientos que de otro modo capturarías.

Esta es una guía para dictar en Obsidian en Mac, las opciones que funcionan y los patrones de flujo de trabajo que realmente valen la pena.

Por qué la voz y la toma de notas combinan tan bien

Cuando tecleas un pensamiento, normalmente lo acortas. Comprimes hasta el punto esencial, pierdes la textura, pierdes la cadena de razonamiento que te llevó ahí. Dos semanas después lees la nota y no tienes idea de por qué la escribiste.

Cuando hablas un pensamiento, la textura sobrevive. Dices cosas como "Creo que el problema es X, pero no estoy seguro porque Y, y la manera de comprobarlo sería Z." Ese es el tipo de nota que sigue siendo útil meses después. No puedes teclearla fácilmente porque teclear es demasiado lento para seguir la cadena de razonamiento. Hablar iguala la velocidad.

Para Obsidian específicamente — que recompensa capturar la versión desordenada primero y refinarla después mediante el enlazado y la revisión — la voz elimina el cuello de botella en la captura.

Qué puede significar "dictar en Obsidian"

Tres cosas diferentes:

Dictación inline mientras editas una nota. Tu cursor está en una nota, presionas un hotkey, hablas, aparecen palabras en el cursor. Igual que dictar en cualquier otro campo de texto. Este es el caso más común.

Notas de voz que se convierten en notas de Obsidian. Grabas audio fuera de Obsidian (en una app de dictación o grabadora de voz), y la transcripción cae en una nueva nota en tu vault. Mejor para capturas largas o reuniones.

Captura en móvil que sincroniza. Hablas en iPhone, la nota termina en el mismo vault. Flujo diferente, normalmente necesita iCloud o Obsidian Sync.

Este post es principalmente sobre las dos primeras en Mac. El móvil es un problema distinto.

Opción 1: Apple Dictation

Gratis, incluido en macOS. Haz clic en cualquier nota de Obsidian, presiona tu hotkey de Apple Dictation (por defecto es presionar Control dos veces, configurable en Configuración del Sistema > Teclado > Dictado), habla y vuelve a presionarlo para parar.

Donde funciona:

  • Captura rápida en una nota diaria
  • Añadir un párrafo a una nota de reunión
  • Frases cortas en listas de viñetas
  • Rellenar campos de plantillas

Donde no funciona:

  • Términos técnicos de PARA, PKM, second-brain — "Zettelkasten" rara vez se transcribe correctamente. Nombres de librerías, software, jerga — mal.
  • Palabras de relleno. "Eh", "um" y falsos arranques van directamente a la nota. O los editas a mano o vives con notas que parecen una transcripción.
  • Pasajes largos. Apple Dictation está hecho para ráfagas cortas. Para un vaciado mental de 5 minutos, vas a pelear con él.
  • Enlazado. "Abrir corchete corchete Proyecto X cerrar corchete corchete" no es una forma divertida de crear un wikilink.

Para uso ligero — salpimentar voz en notas escritas — funciona. Para tomar notas con voz como método principal, no escala.

Opción 2: Una app local de dictación para Mac

Aquí es donde el flujo de trabajo pasa de "voz ocasional" a "la voz es el método principal de captura".

Apps locales como Vext, Superwhisper, MacWhisper Pro y VoiceInk ejecutan el reconocimiento de voz en tu Mac (Whisper o Parakeet) y pegan en tu cursor. Las diferencias relevantes para Obsidian:

Mejor vocabulario técnico. Whisper Medium y Parakeet manejan "Zettelkasten", "Andy Matuschak", "Obsidian", "Logseq", "PARA" y nombres de software notablemente mejor que el modelo base de Apple.

Limpieza. Enhance de Vext y los prompts de modos de Superwhisper eliminan palabras de relleno y ajustan la estructura de las frases antes de que el texto llegue a Obsidian. Tus notas se leen como prosa escrita, no como una transcripción.

Dictación larga. Mantener-para-hablar funciona para 30 segundos. El modo manos libres (activar y desactivar) funciona para 5 minutos. Un vaciado mental o nota de flujo de consciencia no es una pelea.

Privacidad. El audio se queda en tu Mac. Para quienes sus notas contienen pensamiento sensible — estrategias de trabajo, reflexión personal, borradores — esto importa más que, digamos, dictar un mensaje de Slack.

Configurar Vext para Obsidian

El flujo de trabajo es idéntico al de cualquier otro campo de texto, pero algunos ajustes ayudan:

  1. Instalar: brew install muvon/tap/vext
  2. Abrir Configuración > Modos
  3. Para el modo de dictación, activar Enhance con el modelo Gemma 3 4B por defecto — la limpieza es lo que hace legibles las notas habladas
  4. Desactivar YOLO Mode para Obsidian — no quieres Enter automático dentro de una nota; eso crea saltos de línea accidentales
  5. Elegir un hotkey que no entre en conflicto con los atajos de Obsidian (el Shift por defecto suele funcionar; la app distingue un toque corto de una pulsación larga)

Abre Obsidian, haz clic en una nota, mantén el hotkey, habla, suelta. El texto limpio aparece en el cursor.

Para dictación más larga:

  • Usa el modo manos libres (presiona una vez para empezar, otra vez para parar) para vaciados mentales, notas diarias o sesiones de captura total
  • Combínalo con Enhance — la limpieza captura el divague que produce el modo manos libres

Opción 3: Notas de voz como notas independientes de Obsidian

Algunos flujos de trabajo se sirven mejor con captura de audio completa y una transcripción que aterriza en una nueva nota. Ejemplos:

  • Grabar una reunión e importar la transcripción a una carpeta del proyecto
  • Hablar sobre un problema durante 10 minutos caminando y obtener el resultado como nota
  • Capturar una llamada telefónica (con consentimiento) para referencia posterior

Herramientas que hacen esto bien en Mac:

El modo de notas de Vext. Presiona un hotkey, habla todo lo que quieras, suelta. La grabación se transcribe, se limpia vía Enhance y se guarda en Vext. Puedes luego arrastrar el texto a Obsidian o copiarlo en una nueva nota. El audio también se conserva si quieres consultarlo después.

MacWhisper. Suelta un archivo de audio, obtén una transcripción. Bueno para procesar a posteriori memorándums de voz.

Solo Memos de Voz de Apple + transcripción manual. Gratis, feo. Funciona en un apuro.

Para el flujo de "la transcripción se convierte en nota", la fricción está en si la transcripción cae automáticamente en tu vault o si tienes que copiar y pegar. Ninguna de las apps locales de dictación para Mac se integra directamente con el vault de Obsidian todavía, así que es un paso de copiar-pegar de todas formas. (Si conectas un plugin de la comunidad o una regla de Hazel, puedes automatizarlo — pero eso es su propio proyecto de configuración.)

Patrones que funcionan

Algunos flujos de trabajo en los que hemos visto que la gente se asienta:

Nota diaria con párrafos de voz. Abre la nota diaria por la mañana, dicta la reflexión de ayer. Dicta una entrada de estado a mediodía. La nota se hace más rica que si teclearas todo.

Captura primero con voz, refinamiento tecleado. Habla el primer borrador desordenado. Léelo. Edita. El primer borrador son 60 segundos, la edición 2 minutos. El tiempo total iguala teclear, pero el pensamiento capturado es más rico.

Nota de reunión con resumen de voz. Teclea la agenda y los puntos de acción durante la llamada. Después, dicta el resumen — "Lo que realmente decidimos fue..." — en un solo bloque.

Notas caminando. Modo manos libres + AirPods + hotspot del teléfono te deja dictar en Obsidian mientras caminas. Vuelves con una nota en lugar de una idea a medio recordar.

Donde falla

Algunos límites honestos:

La sintaxis de Markdown no dicta bien. Puedes entrenarte para decir "abrir corchete corchete" para wikilinks, pero es fricción. La mayoría de la gente dicta la prosa y teclea el markdown por separado. Enhance de Vext puede convertir "enlace a Proyecto X" en [[Proyecto X]] si lo configuras en el prompt, pero el patrón más fiable es: dictar texto, teclear los enlaces.

Bloques de código y contenido técnico. Dictar código es mala idea. Dictar explicaciones de código está bien.

Vaults multilingües. Si escribes notas en varios idiomas, Apple Dictation te va a dar guerra. Las apps basadas en Whisper lo manejan mejor, incluso en modo de un solo paso vía funciones de traducción.

iCloud y sincronización. Si tu vault está en iCloud y dictas en Mac, la nota a veces no sincroniza con iPhone durante unos minutos. No es específico de la voz, pero vale saberlo.

Elegir una opción

Árbol de decisión:

  • Uso ligero, dictación ocasional: Apple Dictation. Gratis, ya está ahí.
  • Notas de voz como método principal, pago único por la calidad: Vext ($49), Superwhisper ($249) o MacWhisper Pro (€64).
  • Solo open-source: VoiceInk.
  • Capturar contenido hablado largo como notas independientes: El modo de notas de Vext, o MacWhisper para transcripción a posteriori de memorándums de voz.

Lo que cambia después de una semana de notas de voz no es la velocidad. Es el volumen. Capturas más pensamientos porque la fricción es menor. El vault se hace más rico. El volante del Zettelkasten gira más rápido porque tienes más átomos para enlazar.

Ese es el beneficio real. La velocidad es incidental.