Die meisten Übersetzungstools arbeiten mit Text: in einer Sprache einfügen, in einer anderen herauskopieren. Für geschriebene Inhalte ist das in Ordnung. Schlecht ist es in dem Moment, in dem du Übersetzung wirklich brauchst — mitten im Gedanken, beim Schreiben in einer Zweitsprache, wenn dein Kopf schneller läuft, als deine Finger darin mithalten können.
Sprachübersetzung überspringt den Zwischenschritt. Du sprichst in Sprache A, der Text erscheint an deinem Cursor in Sprache B. Kein Copy-and-paste-Umweg, kein separater Tab. In dem Moment, in dem du Übersetzung wirklich brauchst — mitten im Satz, mitten im Gedanken — ist sie schon erledigt.
In diesem Beitrag geht es darum, wie diese Pipeline auf dem Mac funktioniert, was bei der Genauigkeit realistisch ist und wo sie sich auszahlt.
So funktioniert Sprachübersetzung auf dem Mac
Die Pipeline hat zwei Stufen:
Stufe 1 — Spracherkennung. Dein gesprochenes Audio wird in Text in der Ausgangssprache transkribiert. OpenAI Whisper beherrscht über 99 Sprachen von Haus aus und läuft vollständig auf Apple Silicon.
Stufe 2 — Übersetzung. Der transkribierte Text wird in die Zielsprache übersetzt. Hier gibt es zwei Unteroptionen:
- Whispers eingebauter Übersetzungsmodus (Audio in beliebiger Sprache → englischer Text). Kostenlos, schnell, aber nur ins Englische.
- Ein separater Übersetzungsdurchlauf über ein kleines lokales LLM (Gemma, Qwen, LLaMA). Bidirektional zwischen beliebigen Sprachpaaren.
Die meisten Mac-Apps, die „Sprachübersetzung" machen, nutzen den zweiten Ansatz, weil er für jede Richtung funktioniert, nicht nur ins Englische. Du bekommst vollständige bidirektionale Übersetzung, die komplett lokal auf deinem Mac läuft.
Was „bidirektionale Übersetzung" wirklich bedeutet
Wenn du nur Spanisch nach Englisch übersetzen musst (Audio kommt rein, Text auf Englisch kommt raus), reicht Whispers Übersetzungsmodus allein. Es ist ein einziges Modell, schnell, präzise für die großen Sprachen.
Wenn du ein beliebiges Paar brauchst — Französisch nach Japanisch, Deutsch nach Koreanisch, Spanisch nach Französisch — brauchst du einen Übersetzungsdurchlauf nach der Transkription. Ein kleines lokales LLM kann das für jede der über 99 Sprachen leisten, die Whisper erkennt.
Anwendungsfälle für jede Richtung:
- Beliebige Sprache → Englisch: Du hörst nicht-englisches Meeting-Audio (ein Partnerteam in Berlin, ein Kunde in São Paulo) und willst Notizen auf Englisch diktieren. Whispers Übersetzungsmodus reicht.
- Englisch → beliebige Sprache: Du bist englischsprachig und schreibst an ein nicht-englisches Publikum. Diktiere auf Englisch, bekomme übersetzten Text. Üblich im internationalen Vertrieb, bei Support-Tickets, in der Partnerkommunikation.
- Nicht-Englisch → Nicht-Englisch: Mehrsprachige Nutzer, die über Sprachpaare hinweg schreiben. Seltener, aber real — eine mexikanische Spanischsprecherin schreibt französische E-Mails, ein Japanischsprecher schreibt koreanische Slack-Nachrichten usw.
Erwartungen an die Genauigkeit
Das Schwierigste, was man bei Übersetzung ehrlich zugeben muss: „genau" bedeutet für verschiedene Aufgaben Verschiedenes.
Für lockere Nachrichten, Zusammenfassungen und E-Mails: Lokale Sprachübersetzung ist wirklich brauchbar. Das Ergebnis ist nah genug am Muttersprachlichen, dass ein menschlicher Leser es mühelos versteht und Fehler selten bemerkt.
Für veröffentlichte Inhalte, juristische Dokumente oder alles, wo die exakte Formulierung zählt: Es ist ein Entwurf, kein Endprodukt. Du brauchst einen Muttersprachler zur Durchsicht.
Nach Sprachpaar:
- Englisch ↔ Spanisch, Französisch, Deutsch, Italienisch, Portugiesisch: Hervorragend. Whisper + ein modernes kleines LLM bringt dir ~95 %+ brauchbares Ergebnis.
- Englisch ↔ Japanisch, Koreanisch, Chinesisch: Gut für Prosa. Redewendungen und kulturell aufgeladene Formulierungen brauchen Durchsicht.
- Englisch ↔ Arabisch, Hindi, Türkisch, Russisch, Polnisch: Solide für die meisten Inhalte. Fachvokabular (juristisch, medizinisch) ist fehleranfälliger.
- Weniger verbreitete Sprachen: Unterschiedlich. Whisper Large-v3 ist das Beste für die Transkription. Die Übersetzungsqualität hängt von der Trainingsabdeckung des LLM ab.
Diese Zahlen sind grob — die tatsächliche Genauigkeit hängt von der Modellgröße, der Audioqualität und davon ab, wie technisch deine Inhalte sind. Whisper Large-v3 + ein LLM mit 4 Mrd. Parametern ist der praktische Sweet Spot auf einem 16-GB-Mac. Whisper Small + dasselbe LLM ist schneller, verliert aber 1–2 Punkte bei der Genauigkeit.
Cloud vs. lokal bei der Übersetzung
Die Cloud-Dienste (Google Translate, DeepL, OpenAIs Übersetzung, Apples Übersetzung in macOS) machen Sprachübersetzung alle gut. Die Abwägungen:
Cloud gewinnt bei:
- Bester Genauigkeit bei jedem Sprachpaar, auch bei seltenen
- Echtzeit-Übersetzung im Gesprächsmodus (die Zwei-Wege-Funktion von Google Translate)
- Kein Modell-Download
Lokal gewinnt bei:
- Datenschutz. Audio verlässt deinen Mac nicht.
- Kein Abo. Cloud-Übersetzungsdienste sind meist bis zu Grenzwerten kostenlos, danach kostenpflichtig.
- Keine Netzabhängigkeit. Funktioniert im Flugzeug, im Konferenz-WLAN, in Sicherheitsbereichen.
- Kein Kontingent, kein Rate Limit.
- Ein Workflow, der in jeder App funktioniert, statt einer Übersetzungs-App oder eines Browser-Tabs.
Speziell für Mac-Nutzer hat sich der Abstand zwischen lokaler und Cloud-Übersetzungsqualität in den letzten zwei Jahren deutlich verringert. Lokales Whisper + ein lokales 4B-LLM liefert ein Ergebnis, das DeepL nah genug kommt, dass die meisten Nutzer sie bei gängigen Sprachpaaren nicht zuverlässig unterscheiden können. Der ehrliche Abstand liegt bei Fachinhalten eher bei 5 % als bei den früheren 30 %.
Apps für Live-Sprachübersetzung auf dem Mac
Vext (einmalig 49 $) — Zielsprache in den Einstellungen festlegen, in beliebiger Sprache diktieren, übersetzten Text an deinem Cursor bekommen. Die Übersetzung läuft nach der Whisper-Transkription über ein lokales LLM. Mit aktiviertem Enhance passieren Bereinigung und Übersetzung in einem Durchlauf — du sprichst holpriges Französisch, sauberes Englisch erscheint.
Apple Übersetzen (eingebaut) — Sprachübersetzung zwischen den großen Sprachpaaren, kostenlos, auf dem Gerät. Funktioniert in der Übersetzen-App, fügt aber nicht an der Cursorposition in andere Apps ein. Für App-zu-App-Übersetzung musst du kopieren und einfügen.
MacWhisper — unterstützt Whispers Übersetzungsmodus (beliebige Sprache → Englisch). Macht keine bidirektionale oder nicht-englische Zielübersetzung in einem Durchlauf. Gut für dateibasierte Transkription mit Übersetzung.
Cloud-Abos — Wispr Flow, Otter usw. haben alle Übersetzungsfunktionen. Abobasiert, in der Cloud verarbeitet.
DeepL Desktop — Textübersetzung der Spitzenklasse. Hat auf manchen Plattformen Spracheingabe, aber das macOS-Erlebnis setzt eher auf getippte Eingabe + Sprache als Ergänzung. Kostenlose Stufe begrenzt, Pro kostet 9 $/Monat.
Einrichtung in Vext
Konkrete Einrichtung für Sprachübersetzung in Vext:
- Installieren:
brew install muvon/tap/vext - Einstellungen > Sprachen öffnen
- Ausgangssprache auf „Auto" setzen (Whisper erkennt sie) oder auf eine bestimmte Sprache festlegen für bessere Genauigkeit
- Zielsprache auf das gewünschte Ausgabeergebnis setzen
- Enhance aktivieren — damit passieren Bereinigung + Übersetzung in einem LLM-Durchlauf
- Optional: ein größeres Whisper-Modell (Large-v3) für höchste Genauigkeit bei nicht-englischem Ausgangsaudio herunterladen
Dann: in ein beliebiges Textfeld klicken, die Taste gedrückt halten, in der Ausgangssprache sprechen, loslassen. Übersetzter Text erscheint am Cursor.
Empfehlung für Nutzer, die oft das Sprachpaar wechseln: Versuche nicht, die Ausgangssprache bei jedem Diktat automatisch erkennen zu lassen — fixiere sie auf das, was du gerade benutzt, und ändere sie manuell, wenn du wechselst. Die automatische Erkennung liegt meist richtig, rät aber gelegentlich bei den ersten Wörtern falsch, und das ganze Diktat wird in der falschen Sprache transkribiert. Die 2 Sekunden, um die Ausgangssprache in den Einstellungen umzustellen, sparen den Ärger.
Workflows, in denen das etwas verändert
Support-Tickets in nicht-muttersprachlichem Englisch. Support-Mitarbeiter, deren Muttersprache nicht Englisch ist, schreiben auf Englisch oft langsamer und korrigieren mehr. In der Muttersprache sprechen und englischen Text bekommen nimmt die Schreibsteuer weg.
Teamübergreifende Kommunikation. Ein mexikanisches Engineering-Team schreibt an ein koreanisches Produktteam. Jede Seite schreibt in ihrer Muttersprache; die andere Seite liest in ihrer. Die Übersetzung passiert lokal auf jeder Seite.
Vertriebsgespräche mit nicht-muttersprachlichen Kunden. Mache während des Gesprächs Notizen in deiner Muttersprache. Exportiere sie für die Nachfassaktion in der Sprache des Kunden.
Sprachübung. Sprich in deiner Lernsprache, sieh, was herauskam, und vergleiche es mit dem, was du gemeint hast. Sprachübersetzung als Schreibhilfe für Sprachlernende — direkter als Tippen, weil du dich selbst hörst.
Reisen. Aus der Ferne aus einem Land arbeiten, dessen Sprache du nicht sprichst. Diktiere Notizen in deiner Muttersprache; bekomme sie in der Landessprache, wenn du kommunizieren musst. Oder umgekehrt.
Was es nicht ersetzt
Sprachübersetzung in einer Diktier-App ist nicht dasselbe wie:
Echtzeit-Gesprächsdolmetschen. Wenn du ein Live-Gespräch mit jemandem führen willst, der eine andere Sprache spricht, willst du den Gesprächsmodus von Google Translate oder ein Telefon mit eingebauter Funktion. Eine Diktier-App ist für Soloarbeit, nicht zum Dolmetschen.
Dokumentübersetzung. Zum Übersetzen eines vorhandenen Dokuments ist der Text-/Dateimodus von DeepL oder Google Translate effizienter. Sprache hilft nicht, wenn du den Ausgangstext schon hast.
Untertitelung. Für Videountertitel in einer anderen Sprache willst du einen dedizierten Workflow mit Whispers Übersetzungsmodus + einem Untertitel-Tool. Mit Vext per Dateiexport nach SRT möglich, aber nicht der primäre Anwendungsfall.
Eine Anmerkung zu Genauigkeit und Vertrauen
Wenn du übersetztes Diktat für etwas mit Konsequenzen nutzt — eine Kunden-E-Mail, die professionell klingen muss, einen Vertragszusatz, einen öffentlichen Beitrag — lies es vor dem Senden. Lokale Sprachübersetzung ist gut genug, dass du ihr für erste Entwürfe vertrauen kannst; sie ist nicht gut genug, dass du ihr ohne Durchsicht vertrauen solltest.
Das Muster, das funktioniert:
- In deiner Muttersprache diktieren
- Die übersetzte Ausgabe lesen
- Alles korrigieren, was schief klingt
- Senden
Dieser Korrekturschritt ist bei lockeren Inhalten selten (Slack, interne E-Mail) und wichtig bei nach außen gerichteten oder präzisen Inhalten. Die Übersetzung bringt dich zu 95 % ans Ziel; du bist die 5 %.
Für Mac-Nutzer, die mehrsprachig arbeiten, liegt der Durchbruch nicht darin, dass die Technik jetzt perfekt ist. Sondern darin, dass sie gut genug ist, dass du aufhörst, einen Übersetzungs-Tab zu öffnen.