De meeste vertaaltools werken met tekst: plak in de ene taal, kopieer in de andere. Voor geschreven content is dat prima. Het is slecht op het moment dat je vertaling echt nodig hebt — middenin een gedachte, schrijvend in een tweede taal, met je hoofd dat sneller gaat dan je vingers erin kunnen bijhouden.
Spraakvertaling slaat de tussenstap over. Je spreekt in taal A, de tekst verschijnt bij je cursor in taal B. Geen kopieer-plak-omweg, geen apart tabblad. Het moment dat je vertaling echt nodig hebt — middenin een zin, middenin een gedachte — is het al klaar.
Deze post gaat over hoe die pijplijn op de Mac werkt, wat realistisch is qua nauwkeurigheid en waar het loont.
Hoe spraakvertaling op de Mac werkt
De pijplijn heeft twee fasen:
Fase 1 — Spraakherkenning. Je gesproken audio wordt getranscribeerd naar tekst in de brontaal. OpenAI Whisper ondersteunt standaard 99+ talen en draait volledig op Apple Silicon.
Fase 2 — Vertaling. De getranscribeerde tekst wordt naar de doeltaal vertaald. Hier zijn twee subopties:
- Whispers ingebouwde vertaalmodus (audio in elke taal → Engelse tekst). Gratis, snel, maar gaat alleen naar het Engels.
- Een aparte vertaalslag via een klein lokaal LLM (Gemma, Qwen, LLaMA). Tweerichtings tussen elk talenpaar.
De meeste Mac-apps die "spraakvertaling" doen, gebruiken de tweede aanpak, omdat die voor elke richting werkt, niet alleen naar het Engels. Je krijgt volledige tweerichtingsvertaling, allemaal lokaal draaiend op je Mac.
Wat "tweerichtingsvertaling" echt betekent
Als je alleen Spaans naar Engels hoeft te vertalen (audio erin, Engelse tekst eruit), volstaat Whispers vertaalmodus op zich. Het is één model, snel, nauwkeurig voor de grote talen.
Als je elk paar nodig hebt — Frans naar Japans, Duits naar Koreaans, Spaans naar Frans — heb je een vertaalslag na de transcriptie nodig. Een klein lokaal LLM kan dit aan voor elk van de 99+ talen die Whisper herkent.
Gebruiksscenario's per richting:
- Elke taal → Engels: Je beluistert niet-Engelse vergaderaudio (een partnerteam in Berlijn, een klant in São Paulo) en wilt notities in het Engels dicteren. Whispers vertaalmodus volstaat.
- Engels → elke taal: Je bent Engelstalig en schrijft aan een niet-Engels publiek. Dicteer in het Engels, krijg vertaalde tekst. Gebruikelijk bij internationale sales, supporttickets, partnercommunicatie.
- Niet-Engels → niet-Engels: Meertalige gebruikers die over talenparen heen schrijven. Minder gangbaar maar reëel — een Mexicaans-Spaanse die Franse e-mails schrijft, een Japanstalige die Koreaanse Slack-berichten schrijft, enz.
Verwachtingen qua nauwkeurigheid
Het lastigste om eerlijk over te zijn bij vertaling is dat "nauwkeurig" voor verschillende taken iets anders betekent.
Voor informele berichten, samenvattingen en e-mails: lokale spraakvertaling is echt bruikbaar. De output zit dicht genoeg bij moedertaalniveau dat een menselijke lezer het moeiteloos begrijpt en zelden fouten opmerkt.
Voor gepubliceerde content, juridische documenten of alles waar exacte formulering telt: het is een concept, geen eindproduct. Je hebt een moedertaalspreker nodig om het na te kijken.
Per talenpaar:
- Engels ↔ Spaans, Frans, Duits, Italiaans, Portugees: Uitstekend. Whisper + een modern klein LLM levert je ~95 %+ bruikbare output.
- Engels ↔ Japans, Koreaans, Chinees: Goed voor proza. Idiomen en cultureel geladen formuleringen vragen om controle.
- Engels ↔ Arabisch, Hindi, Turks, Russisch, Pools: Degelijk voor de meeste content. Gespecialiseerd vocabulaire (juridisch, medisch) is foutgevoeliger.
- Minder gangbare talen: Wisselend. Whisper Large-v3 is het beste voor transcriptie. De vertaalkwaliteit hangt af van de trainingsdekking van het LLM.
Deze cijfers zijn ruw — de werkelijke nauwkeurigheid hangt af van de modelgrootte, de audiokwaliteit en hoe technisch je content is. Whisper Large-v3 + een LLM van 4 miljard parameters is de praktische sweet spot op een Mac van 16 GB. Whisper Small + hetzelfde LLM is sneller maar verliest 1–2 punten nauwkeurigheid.
Cloud vs. lokaal voor vertaling
De clouddiensten (Google Translate, DeepL, de vertaling van OpenAI, de vertaling van Apple in macOS) doen spraakvertaling allemaal goed. De afwegingen:
Cloud wint op:
- Beste nauwkeurigheid bij elk talenpaar, ook obscure
- Realtime vertaling in gespreksmodus (de tweerichtingsfunctie van Google Translate)
- Geen modeldownload
Lokaal wint op:
- Privacy. Audio verlaat je Mac niet.
- Geen abonnement. Cloudvertaaldiensten zijn meestal gratis tot bepaalde limieten, daarna betaald.
- Geen netwerkafhankelijkheid. Werkt in vliegtuigen, op congres-wifi, in beveiligde ruimtes.
- Geen quota of ratelimiet.
- Eén workflow die in elke app werkt in plaats van een vertaalapp of browsertabblad.
Specifiek voor Mac-gebruikers is het gat tussen de kwaliteit van lokale en cloudvertaling de afgelopen twee jaar flink kleiner geworden. Lokale Whisper + een lokaal 4B-LLM levert output die dicht genoeg bij DeepL zit dat de meeste gebruikers ze bij gangbare talenparen niet betrouwbaar uit elkaar kunnen houden. Het eerlijke gat is bij gespecialiseerde content eerder 5 % dan de 30 % die het vroeger was.
Apps die live spraakvertaling op de Mac doen
Vext (eenmalig 49 $) — stel een doeltaal in bij de instellingen, dicteer in elke taal, krijg vertaalde tekst bij je cursor. De vertaling loopt na de Whisper-transcriptie via een lokaal LLM. Met Enhance ingeschakeld gebeuren opschoning en vertaling in één slag — je spreekt rommelig Frans, er verschijnt schoon Engels.
Apple Vertalen (ingebouwd) — spraakvertaling tussen de grote talenparen, gratis, op het apparaat. Werkt in de Vertalen-app maar plakt niet bij de cursor in andere apps. Voor app-naar-app-vertaling moet je kopiëren en plakken.
MacWhisper — ondersteunt Whispers vertaalmodus (elke taal → Engels). Doet geen tweerichtings- of niet-Engelse doeltaalvertaling in één slag. Goed voor bestandsgebaseerde transcriptie met vertaling.
Cloudabonnementen — Wispr Flow, Otter, enz. hebben allemaal vertaalfuncties. Op abonnementsbasis, in de cloud verwerkt.
DeepL desktop — tekstvertaling van topniveau. Heeft op sommige platforms spraakinvoer, maar de macOS-ervaring leunt op getypte invoer + spraak als aanvulling. Gratis niveau beperkt, Pro kost 9 $/maand.
Het instellen in Vext
Specifieke instelling voor spraakvertaling in Vext:
- Installeren:
brew install muvon/tap/vext - Open Instellingen > Talen
- Zet Brontaal op "Auto" (Whisper detecteert) of zet hem vast op een specifieke taal voor betere nauwkeurigheid
- Zet Doeltaal op wat je als output wilt
- Schakel Enhance in — hiermee gebeuren opschoning + vertaling in één LLM-slag
- Optioneel: download een groter Whisper-model (Large-v3) voor de hoogste nauwkeurigheid bij niet-Engelse bronaudio
Daarna: klik in een willekeurig tekstveld, houd de sneltoets ingedrukt, spreek in de brontaal, laat los. Vertaalde tekst verschijnt bij de cursor.
Aanbeveling voor gebruikers die vaak van talenpaar wisselen: probeer de brontaal niet bij elke dictee automatisch te detecteren — zet hem vast op wat je nu gebruikt en wijzig hem handmatig wanneer je wisselt. Automatische detectie klopt meestal maar gokt af en toe verkeerd bij de eerste paar woorden, waardoor de hele dictee in de verkeerde taal wordt getranscribeerd. De 2 seconden om de brontaal in de instellingen om te zetten bespaart de wrijving.
Workflows waar dit dingen verandert
Supporttickets in niet-moedertaal Engels. Supportmedewerkers wier moedertaal geen Engels is, schrijven vaak trager en bewerken meer in het Engels. In hun moedertaal spreken en Engelse tekst krijgen haalt de schrijfbelasting weg.
Communicatie tussen teams. Een Mexicaans engineeringteam dat naar een Koreaans productteam schrijft. Elke kant schrijft in zijn moedertaal; de andere kant leest in de zijne. De vertaling gebeurt lokaal aan elk uiteinde.
Salesgesprekken met niet-moedertaalsprekende klanten. Maak tijdens het gesprek notities in je moedertaal. Exporteer ze in de taal van de klant voor de opvolging.
Taaloefening. Spreek in de taal die je leert, zie wat eruit kwam, vergelijk het met wat je bedoelde. Spraakvertaling als schrijfhulp voor taalleerders — directer dan typen omdat je jezelf hoort.
Reizen. Op afstand werken vanuit een land waar je de taal niet spreekt. Dicteer notities in je moedertaal; krijg ze in de lokale taal wanneer je moet communiceren. Of andersom.
Wat het niet vervangt
Spraakvertaling in een dicteerapp is niet hetzelfde als:
Realtime gesprekstolken. Als je een live gesprek probeert te voeren met iemand die een andere taal spreekt, wil je de gespreksmodus van Google Translate of een telefoon met dat ingebouwd. Een dicteerapp is voor solowerk, niet voor tolken.
Documentvertaling. Voor het vertalen van een bestaand document is de tekst-/bestandsmodus van DeepL of Google Translate efficiënter. Spraak helpt niet als je de brontekst al hebt.
Ondertiteling. Voor video-ondertitels in een andere taal wil je een specifieke workflow met Whispers vertaalmodus + een ondertiteltool. Mogelijk met Vext via bestandsexport naar SRT, maar niet het primaire gebruiksscenario.
Een opmerking over nauwkeurigheid en vertrouwen
Als je vertaalde dictee gebruikt voor iets met gevolgen — een klant-e-mail die professioneel moet lezen, een contractbijlage, een openbare post — lees het dan voor je verzendt. Lokale spraakvertaling is goed genoeg dat je erop kunt vertrouwen voor eerste concepten; niet goed genoeg dat je erop moet vertrouwen zonder controle.
Het patroon dat werkt:
- Dicteer in je moedertaal
- Lees de vertaalde output
- Bewerk alles wat raar klinkt
- Verzend
Die bewerkingsstap is zeldzaam voor informele content (Slack, interne e-mail) en belangrijk voor content gericht naar buiten of precieze content. De vertaling brengt je 95 % van de weg; jij bent de 5 %.
Voor Mac-gebruikers die meertalig werken, zit de doorbraak er niet in dat de technologie nu perfect is. Het is dat ze goed genoeg is dat je stopt met een vertaaltabblad openen.