Die meisten Meetingtranskriptions-Tools senden Audio an einen Server. Das Gespräch — vertrauliche Geschäftsdiskussionen, Personalangelegenheiten, Kundengespräche — wird auf der Infrastruktur von Drittanbietern verarbeitet und gespeichert.
Wer das bedenkt, findet eine Alternative. Apple Silicon Macs können Spracherkennungsmodelle lokal ausführen, die mit Cloud-Diensten hinsichtlich der Genauigkeit mithalten. Hier ist die Anleitung zur Einrichtung lokaler Meetingtranskription auf macOS.
Was man braucht
- Apple Silicon Mac (M1, M2, M3, M4)
- macOS 14 Sonoma oder neuer
- Eine lokale Transkriptions-App (dieser Leitfaden verwendet Vext)
Wie es funktioniert
Wenn man in Vext eine Meeting-Aufnahme startet, werden zwei Audio-Streams gleichzeitig erfasst:
- Mikrofon — die eigene Stimme, aufgenommen über die Standard-AVAudioEngine
- Systemton — alle anderen im Meeting, aufgenommen über macOS Core Audio Process Tap (verfügbar ab macOS 14.2+)
Das bedeutet, Vext funktioniert mit jeder Meeting-App — Zoom, Google Meet, FaceTime, Microsoft Teams, Discord oder jeder anderen Anwendung, die Audio ausgibt. Keine Plugins, kein Bot, der dem Gespräch beitritt, keine Meeting-App-Integration erforderlich.
Wenn die Aufnahme gestoppt wird:
- Audio wird mit Voice Activity Detection (VAD) segmentiert — stille Pausen werden identifiziert, um das Audio in natürliche Sprachblöcke aufzuteilen
- Jeder Block wird lokal mit der Parakeet-Engine mit 150-facher Echtzeit transkribiert
- Sprecherbezeichnungen werden angewendet — „Ich" für Mikrofonaufnahmen, „Sie" für Systemton
- Falls Enhance aktiviert ist, wird das Transkript bereinigt und optional übersetzt
- Falls Zusammenfassen aktiviert ist, wird eine KI-Zusammenfassung mit wichtigen Punkten und Aufgaben erstellt
Alles passiert auf dem Mac. Nichts verlässt das Gerät.
Einrichtung
Schritt 1: Vext installieren
brew install muvon/tap/vext
Oder von getvext.app herunterladen. Die kostenlose Testversion enthält 10 Meeting-Aufnahmen.
Schritt 2: Berechtigungen erteilen
Beim ersten Start fordert Vext drei Berechtigungen an:
- Mikrofon — zum Aufnehmen der eigenen Stimme
- Bedienungshilfen — für das globale Hotkey-System
- Bildschirmaufnahme — von macOS für die Systemton-Aufnahme benötigt (die Process-Tap-API erfordert diese Berechtigung, auch wenn kein Bildschirminhalt aufgezeichnet wird)
Schritt 3: Aufnahme starten
Die Fn-Taste drücken, um die Meeting-Aufnahme umzuschalten. Ein pulsierender roter Punkt erscheint neben dem Cursor, und das Menüleisten-Symbol blinkt rot, um anzuzeigen, dass die Aufnahme aktiv ist.
Dem Zoom-, Meet- oder FaceTime-Anruf wie gewohnt beitreten. Vext erfasst im Hintergrund beide Seiten des Gesprächs.
Schritt 4: Stoppen und überprüfen
Fn erneut drücken, um zu stoppen. Vext verarbeitet das Audio — meist in wenigen Sekunden für ein 30-minütiges Meeting bei 150-facher Echtzeit-Transkriptionsgeschwindigkeit.
Man erhält:
- Vollständiges Transkript mit Sprecherbezeichnungen und Zeitstempeln
- KI-Zusammenfassung mit wichtigen Punkten (falls aktiviert)
- Aus der Diskussion extrahierte Aufgaben (falls aktiviert)
Screenshots während Meetings aufnehmen
Während einer Meeting-Aufnahme kann man jeden Bereich des Bildschirms aufnehmen. Einen Bereich per Drag auswählen — der Screenshot wird automatisch dem Transkript angehängt.
Das ist nützlich für:
- Folien aus einer Präsentation
- Besprochener Code oder Designs
- Diagramme auf einem gemeinsamen Whiteboard
- Jeden visuellen Kontext, der den gesprochenen Inhalt ergänzt
Mehrere Screenshots pro Meeting, alle neben dem Transkript gespeichert.
Exportoptionen
Transkripte können in verschiedenen Formaten exportiert werden:
| Format | Anwendungsfall |
|---|---|
| TXT | Einfacher Text, leicht überall einzufügen |
| Markdown | Formatiert mit Sprecherbezeichnungen und Zeitstempeln |
| SRT | Untertitel für die Videobearbeitung |
| VTT | Web-Untertitel (HTML5-Video) |
Tipps für bessere Transkriptionsqualität
Ein gutes Mikrofon verwenden. Das eingebaute Mac-Mikrofon ist in ruhigen Umgebungen ausreichend, aber ein Headset oder externes Mikrofon verbessert die Genauigkeit erheblich — besonders wenn das Meeting-Audio über Lautsprecher läuft und Rückkopplungen erzeugen könnte.
Hintergrundgeräusche reduzieren. Fenster schließen, Benachrichtigungen stummschalten und wichtige Abschnitte nicht während des Tippens aufnehmen. Das VAD-System kommt gut mit Stille zurecht, aber kontinuierliches Hintergrundrauschen verschlechtert die Transkriptionsgenauigkeit.
Ausreden lassen. Überlappende Sprache ist das schwierigste Szenario für jedes Transkriptionssystem. Wenn Sprecher klar abwechseln, verbessert sich die Genauigkeit erheblich.
Systemton-Einrichtung überprüfen. Falls Meeting-Audio nicht im Transkript erscheint, prüfen, ob die Bildschirmaufnahmeberechtigung erteilt ist und ob die Meeting-App Audio über das Standard-Systemausgabegerät ausgibt.
Datenschutzvergleich
| Aspekt | Cloud-Transkription | Lokale Transkription |
|---|---|---|
| Audio an Server gesendet | Ja | Nein |
| Bei Drittanbietern gespeichert | Üblicherweise | Nie |
| Funktioniert offline | Nein | Ja |
| Datenschutzrichtlinien Dritter | Gelten | Nicht zutreffend |
| Compliance (HIPAA usw.) | Je nach Anbieter | Eigenes Gerät, eigene Kontrolle |
Für Organisationen in regulierten Branchen — Gesundheitswesen, Recht, Finanzen — eliminiert die lokale Transkription eine ganze Kategorie von Compliance-Risiken. Die Daten verlassen das Gerät nie, sodass es keine Drittanbieter-Datenverarbeitungsvereinbarung zu verhandeln gibt.
Genauigkeit
Mit der Parakeet-Engine erreicht Vext eine Wortfehlerrate, die mit führenden Cloud-Diensten vergleichbar ist — etwa 4–5 % bei allgemeinem englischem Sprechen. Fachvokabular und nicht-englische Sprachen können je nach Quellmaterial höhere Fehlerraten aufweisen.
Für kritische Meetings, bei denen die Genauigkeit am wichtigsten ist, das Transkript nach dem Meeting überprüfen. Die Kombination aus lokaler Transkriptionsgeschwindigkeit (nahezu sofortig) und KI-Bereinigung (Enhance) macht den Überprüfungsprozess schnell — man prüft, anstatt von Grund auf zu transkribieren.
Vext herunterladen — 10 kostenlose Meeting-Aufnahmen, kein Konto, keine Kreditkarte. Funktioniert mit jeder Meeting-App auf macOS 14+.