Obsidian-Nutzer sind meistens Menschen, die durch Schreiben denken. Der Vault ist eine Erweiterung davon, wie du die Welt verarbeitest — Meetings, Ideen, Recherchen, tägliche Notizen, Projektpläne. Sprache passt zu diesem Muster ungewöhnlich gut, weil die Reibung des Tippens genau die Gedanken tötet, die du sonst festhalten würdest.
Dies ist ein Leitfaden zum Diktieren in Obsidian auf dem Mac, zu den Optionen, die funktionieren, und zu den Workflow-Mustern, die sich wirklich auszahlen.
Warum Sprache und Notizenmachen so gut zusammenpassen
Wenn du einen Gedanken tippst, kürzst du ihn meistens. Du komprimierst ihn auf den Kern, verlierst die Textur, verlierst die Gedankenkette, die dich dorthin geführt hat. Zwei Wochen später liest du die Notiz und weißt nicht mehr, warum du sie geschrieben hast.
Wenn du einen Gedanken aussprichst, überlebt die Textur. Du sagst Dinge wie „Ich glaube, das Problem ist X, aber ich bin nicht sicher, weil Y, und der Weg, es zu testen, wäre Z." Das ist die Art von Notiz, die noch Monate später nützlich ist. Du kannst sie nicht leicht tippen, weil Tippen zu langsam ist, um mit der Gedankenkette Schritt zu halten. Sprechen passt zur Geschwindigkeit.
Für Obsidian im Besonderen — das die chaotische erste Version belohnt und sie später durch Verknüpfen und erneutes Durchsehen verfeinert — beseitigt Sprache den Engpass beim Erfassen.
Was „in Obsidian diktieren" bedeuten kann
Drei verschiedene Dinge:
Inline-Diktat beim Bearbeiten einer Notiz. Der Cursor steht in einer Notiz, du drückst einen Hotkey, du redest, Wörter erscheinen am Cursor. Genauso wie das Diktieren in jedem anderen Textfeld. Das ist der häufigste Fall.
Sprachnotizen, die zu Obsidian-Notizen werden. Du nimmst Audio außerhalb von Obsidian auf (in einer Diktier-App oder einem Sprachmemo-Tool), und das Transkript landet in einer neuen Notiz in deinem Vault. Besser für längere Aufnahmen oder Meetings.
Mobile Erfassung, die synchronisiert. Du sprichst auf dem iPhone, die Notiz landet im selben Vault. Ein anderer Workflow, erfordert meistens iCloud oder Obsidian Sync.
Dieser Beitrag handelt hauptsächlich von den ersten beiden auf dem Mac. Mobile ist ein anderes Problem.
Option 1: Apple Dictation
Kostenlos, mit macOS geliefert. Klick in eine Obsidian-Notiz, drücke deinen Apple Dictation-Hotkey (Standard: Control zweimal drücken, konfigurierbar unter Systemeinstellungen > Tastatur > Diktat), rede, drücke ihn erneut zum Stoppen.
Wo es funktioniert:
- Schnelle Erfassung in einer Tagesnotiz
- Einen Absatz zu einer Meeting-Notiz hinzufügen
- Kurze Sätze in Aufzählungslisten
- Vorlagenfelder ausfüllen
Wo es nicht funktioniert:
- Fachbegriffe aus dem PARA-, PKM- und Second-Brain-Vokabular — „Zettelkasten" wird selten korrekt transkribiert. Bibliotheksnamen, Softwarenamen, Fachjargon — schlecht.
- Füllwörter. „Ähm", „äh" und Fehlstarts landen direkt in der Notiz. Du bearbeitest sie entweder manuell heraus oder lebst mit Notizen, die wie ein Transkript lesen.
- Lange Passagen. Apple Dictation ist für kurze Schübe gebaut. Bei einem 5-minütigen Braindump wirst du damit kämpfen.
- Verknüpfen. „Eckige Klammer auf eckige Klammer auf Projekt X eckige Klammer zu eckige Klammer zu" ist kein schöner Weg, einen Wikilink zu erstellen.
Für gelegentlichen Gebrauch — Sprache sporadisch in getippte Notizen einstreuen — funktioniert es. Für Voice-First-Notizenmachen skaliert es nicht.
Option 2: Eine lokale Mac-Diktier-App
Hier ändert sich der Workflow von „gelegentliche Sprache" zu „Sprache ist die primäre Erfassungsmethode".
Lokale Apps wie Vext, Superwhisper, MacWhisper Pro und VoiceInk führen die Spracherkennung auf deinem Mac aus (Whisper oder Parakeet) und fügen Text am Cursor ein. Die relevanten Unterschiede für Obsidian:
Besseres Fachvokabular. Whisper Medium und Parakeet verarbeiten „Zettelkasten", „Andy Matuschak", „Obsidian", „Logseq", „PARA" und Softwarenamen deutlich besser als Apples Foundation-Modell.
Bereinigung. Vexts Enhance und Superwhispers modusbasierte Prompts entfernen Füllwörter und straffen die Satzstruktur, bevor der Text Obsidian erreicht. Deine Notizen lesen sich wie geschriebene Prosa, nicht wie ein Transkript.
Langform-Diktat. Hold-to-Talk funktioniert für 30 Sekunden. Der Freisprechmodus (Einschalten, Ausschalten) funktioniert für 5 Minuten. Ein Braindump oder Bewusstseinsstrom-Notiz ist kein Kampf.
Datenschutz. Audio bleibt auf deinem Mac. Für Menschen, deren Notizen sensibles Denken enthalten — Arbeitsstrategien, persönliche Reflexion, Entwurfsschreiben — ist das wichtiger als zum Beispiel das Diktieren einer Slack-Nachricht.
Vext für Obsidian einrichten
Der Workflow ist identisch mit jedem anderen Textfeld, aber ein paar Einstellungen helfen:
- Installieren:
brew install muvon/tap/vext - Öffne Settings > Modes
- Aktiviere für den Diktiermodus Enhance mit dem Standard-Gemma-3-4B-Modell — die Bereinigung macht gesprochene Notizen lesbar
- Deaktiviere den YOLO Mode für Obsidian — du willst kein automatisches Enter innerhalb einer Notiz; das erzeugt unbeabsichtigte Zeilenumbrüche
- Wähle einen Hotkey, der nicht mit Obsidian-Shortcuts kollidiert (Standard Shift ist meistens in Ordnung; die App unterscheidet einen kurzen Tipp von einem Halten)
Öffne Obsidian, klicke in eine Notiz, halte den Hotkey, rede, lasse los. Bereinigter Text erscheint am Cursor.
Für längeres Diktieren:
- Verwende den Freisprechmodus (einmal drücken zum Starten, erneut drücken zum Stoppen) für Braindumps, Tagesnotizen oder Alles-erfassen-Sitzungen
- Kombiniere mit Enhance — die Bereinigung fängt das Abschweifen auf, das der Freisprechmodus produziert
Option 3: Sprachnotizen als eigenständige Obsidian-Notizen
Manche Workflows profitieren mehr von vollständiger Audio-Aufnahme, bei der ein Transkript in einer neuen Notiz landet. Beispiele:
- Ein Meeting aufnehmen und das Transkript in einen Projektordner importieren
- Ein Problem 10 Minuten lang auf einem Spaziergang durchdenken und das Ergebnis als Notiz erhalten
- Ein Telefongespräch (mit Einwilligung) für spätere Referenz aufnehmen
Tools, die das auf dem Mac gut machen:
Vexts Notizmodus. Drücke einen Hotkey, rede so lange du willst, lasse los. Die Aufnahme wird transkribiert, über Enhance bereinigt und in Vext gespeichert. Du kannst den Text dann in Obsidian ziehen oder in eine neue Notiz kopieren und einfügen. Audio wird ebenfalls aufbewahrt, falls du später darauf verweisen möchtest.
MacWhisper. Audiodatei hineinziehen, Transkript herausbekommen. Gut für die nachträgliche Verarbeitung von Sprachmemos.
Apples Voice Memos + manuelle Transkription. Kostenlos, unschön. Funktioniert im Notfall.
Beim „Transkript wird Notiz"-Workflow ist die entscheidende Frage, ob das Transkript automatisch in deinen Vault abgelegt wird oder ob du kopieren und einfügen musst. Keine der lokalen Mac-Diktier-Apps integriert sich bisher direkt mit Obsidians Vault, also ist es so oder so ein Kopieren-Einfügen-Schritt. (Wenn du ein Community-Plugin oder eine Hazel-Regel einrichtest, kannst du es automatisieren — aber das ist ein eigenes Setup-Projekt.)
Muster, die funktionieren
Ein paar Workflows, auf die wir Menschen stoßen sehen:
Tagesnotiz mit Sprachparagrafen. Öffne die Tagesnotiz morgens, diktiere die Reflexion vom Vortag. Diktiere mittags einen Statuseintrag. Die Notiz wird reicher, als sie es wäre, wenn du alles tippen würdest.
Voice-First-Erfassung, getippte Verfeinerung. Sprich den chaotischen ersten Entwurf. Lies ihn durch. Bearbeite ihn. Der erste Entwurf dauert 60 Sekunden, die Bearbeitung 2 Minuten. Die Gesamtzeit entspricht dem Tippen, aber der erfasste Gedanke ist reichhaltiger.
Meeting-Notiz mit Sprachzusammenfassung. Tippe Agenda und Aktionspunkte während des Anrufs. Nach dem Anruf diktiere die Zusammenfassung — „Was wir eigentlich entschieden haben, war ..." — in einem einzigen Block.
Spaziergangsnotizen. Freisprechmodus + AirPods + ein Phone-Hotspot ermöglicht es dir, beim Spazierengehen in Obsidian zu diktieren. Du kommst mit einer Notiz zurück statt mit einer halb erinnerten Idee.
Wo das scheitert
Ein paar ehrliche Grenzen:
Markdown-Syntax lässt sich nicht gut diktieren. Du kannst dir angewöhnen, „eckige Klammer auf eckige Klammer auf" für Wikilinks zu sagen, aber es ist Reibung. Die meisten Menschen diktieren die Prosa und tippen das Markdown separat. Vexts Enhance kann „Link zu Projekt X" in [[Projekt X]] umwandeln, wenn du danach fragst, aber das zuverlässigere Muster ist: Text diktieren, Links tippen.
Code-Blöcke und technische Inhalte. Code diktieren ist eine schlechte Idee. Erklärungen von Code diktieren ist in Ordnung.
Mehrsprachige Vaults. Wenn du Notizen in mehreren Sprachen schreibst, wird Apple Dictation mit dir kämpfen. Whisper-basierte Apps gehen damit besser um, einschließlich im Single-Pass-Modus über Übersetzungsfunktionen.
iCloud und Synchronisierungszeitpunkt. Wenn dein Vault in iCloud liegt und du auf dem Mac diktierst, synchronisiert sich die Notiz manchmal ein paar Minuten nicht auf das iPhone. Nicht sprachspezifisch, aber wissenswert.
Eine Wahl treffen
Entscheidungsbaum:
- Gelegentlicher Gebrauch, seltenes Diktieren: Apple Dictation. Kostenlos, bereits vorhanden.
- Voice-First-Notizenmachen, einmalig für die Qualität bezahlen: Vext ($49), Superwhisper ($249) oder MacWhisper Pro (€64).
- Nur Open-Source: VoiceInk.
- Längere gesprochene Inhalte als eigenständige Notizen erfassen: Vexts Notizmodus oder MacWhisper für die nachträgliche Transkription von Sprachmemos.
Was sich nach einer Woche Sprachnotizen ändert, ist nicht die Geschwindigkeit. Es ist das Volumen. Du erfasst mehr Gedanken, weil die Reibung geringer ist. Der Vault wird reicher. Das Zettelkasten-Schwungrad dreht sich schneller, weil du mehr Atome zum Verknüpfen hast.
Das ist die eigentliche Belohnung. Geschwindigkeit ist nebensächlich.