Apple's ingebouwde Dictation kreeg een stille upgrade in macOS Tahoe. Het nieuwe on-device foundation model is snel, accuraat op alledaagse spraak, en gratis bij je OS. Voor veel mensen is dat het einde van het gesprek — ze hebben niets anders nodig.
Voor andere mensen is het binnen een week niet meer genoeg. Dit is waar de lijn ligt, en wat je doet als je hem overschrijdt.
Wat Apple Dictation goed doet
Drie dingen, voornamelijk:
Het zit al op je Mac. Geen download, geen account, geen permissie-dans. Systeeminstellingen > Toetsenbord > Dictation, aanzetten, sneltoets kiezen, klaar.
Het is on-device. Audio verlaat je machine niet voor de on-device variant. Apple's privacyverhaal is hier echt — er is geen cloud-round-trip en geen opname die ergens wordt opgeslagen na transcriptie.
De nauwkeurigheid op conversationeel Engels is goed. Beter dan de oude engine. Beter dan de meeste mensen zich macOS-dictaat herinneren. Interpunctie afgeleid van cadans werkt meestal. Veelgebruikte tech-termen ("React", "TypeScript", "API") komen er correct uit.
Voor het haastig versturen van een Slack-bericht, een snelle notitie dicteren, of een e-mail van één zin beantwoorden, is Apple Dictation genoeg. Veel gebruikers hoeven nooit verder te gaan dan dit.
Waar het breekt
Kijk wat er gebeurt als je het oprekt:
Technische woordenschat. Bibliotheeknamen, functienamen, CLI-commando's, bestandspaden. "kubectl get pods" wordt "cube control get pods". "useEffect" wordt "you sufficed". "src/components/auth/AuthGuard" wordt... iets. Als je werk benoemde technische dingen omvat, besteed je meer tijd aan het corrigeren van transcripten dan je bespaart met dicteren.
Opschoning van opvulwoorden. Apple Dictation transcribeert exact wat je zei, inclusief "uhm", "uh", "dus eigenlijk", valse starts en doorlopers. Spreektaal is rommeliger dan geschreven taal. Zonder opschoonstap leest gedicteerde tekst als een transcript van iemand die hardop nadenkt — want dat is precies wat het is.
Lange passages. Apple Dictation is ontworpen voor korte stoten. Er is geen transcriptgeschiedenis, geen manier om meer dan een paar zinnen netjes vast te leggen, geen notities om naar terug te keren. Als je een document van 300 woorden wilt dicteren, doe je dat in stukjes van 30 seconden die je aan elkaar plakt.
Vergaderingen. Apple Dictation is geen vergadertool. Het neemt maar van één invoerbron tegelijk op, heeft geen sprekerlabels, vat niet samen. Als je vergadertranscriptie wilt, is dit niet het juiste product.
Vertaling. Engels erin, Engels eruit. Geen meertalige flow.
Sneltoets-ergonomie. De twee-keer-snel-indrukken trigger is prima voor incidenteel gebruik, ongemakkelijk voor frequent gebruik. Er is geen push-to-talk of hold-to-dictate optie, geen per-app overrides.
Een test die je vertelt in welke groep je zit
Probeer dit één dag: gebruik Apple Dictation voor alles wat je typt en langer is dan een zin. Slack, e-mail, notities, codecommentaren, AI-prompts.
Aan het eind van de dag zul je ofwel:
a) Merken dat het verrassend goed werkte — blijf het gebruiken. b) Merken dat je blijft vechten met technische termen, of dat het gebrek aan opschoning ervoor zorgt dat je berichten vreemd klinken, of dat je wenste dat je langere passages kon dicteren.
Als (b), zit je in de groep die meer nodig heeft dan wat Apple levert.
Wat Vext toevoegt, en waarom
Vext is een $49 eenmalige Mac-dictaatapp die we bouwen. Het gebruikt hetzelfde on-device principe als Apple — niets verlaat je Mac — maar pakt de specifieke beperkingen hierboven aan.
Dit zijn de werkelijke verschillen:
Spraakengine. Vext gebruikt standaard NVIDIA Parakeet via CoreML. Op M2 draait het op ongeveer 150x realtime en handelt het technische woordenschat beter af dan Apple's foundation model, vooral voor code-aanverwante termen. Je kunt ook Whisper Small/Medium/Large kiezen voor hogere nauwkeurigheid op luidruchtige audio of meertalige content. Apple Dictation gebruikt Apple's foundation model zonder keuze.
Enhance (LLM-opschoning). Vext draait een klein lokaal LLM (standaard Gemma 3 4B, ongeveer 2,8 GB) over het transcript voor het plakken. Opvulwoorden gaan weg. Zinsstructuur wordt strakker. De betekenis blijft behouden. Het ruwe transcript wordt nog steeds opgeslagen als je dat wilt. Apple Dictation heeft hier niets gelijkwaardigs.
Sneltoets-opties. Hold-to-talk, handsfree toggle, configureerbare drempel. Apple Dictation geeft je één trigger-stijl.
Vergadermodus. Vangt microfoon + systeemaudio gelijktijdig op, voegt sprekerlabels toe via lokale diarisatie, draait een samenvattingspas door het LLM. Werkt met Zoom, Meet, FaceTime — alles wat audio op je Mac produceert.
Vertaling. Spreek een van 99+ talen, krijg tekst in je doeltaal. Met Enhance ingeschakeld gebeuren opschoning en vertaling in één pas.
YOLO-modus. Automatisch verzenden na plakken. Specifiek gebouwd voor AI-codingtools.
Schermafbeelding maken tijdens dictaat. Selecteer een schermregio door te slepen tijdens het praten, afbeelding wordt naast het transcript geplakt. Handig voor het prompten van AI-tools over iets dat zichtbaar is op het scherm.
De eerlijke reden om bij Apple Dictation te blijven
Als je gebruik er zo uitziet, doe dan geen moeite met iets anders:
- Korte berichten een paar keer per uur
- Algemene Engelse woordenschat
- Eén apparaat, één workflow
- Je vindt de twee-keer-indrukken trigger niet erg
- Je doet geen vergaderingen
Het on-device foundation model is nu echt goed. Apple heeft een echte verbetering uitgebracht, en voor casual gebruik is het genoeg.
De eerlijke reden om over te stappen
Als je gebruik er zo uitziet, bespaar je echt tijd:
- Meerdere dictaten per uur, inclusief langere passages
- Regelmatig technische woordenschat (code, bibliotheeknamen, CLI-commando's)
- Je wilt opschoning zodat je gedicteerde tekst leest als geschreven tekst
- Je hebt vergaderingen en wilt daar transcripten van
- Je werkt in meer dan één taal
- Je schrijft veel naar AI-tools
Voor dat profiel werkt de wiskunde op een betaalde lokale dictaatapp binnen een paar weken uit. De frictie die Apple Dictation per use case veroorzaakt is klein, maar telt op.
Co-existentie is prima
Dit is geen "stap volledig over"-aanbeveling. Veel mensen gebruiken beide: Apple Dictation voor eenmalige snelle berichten waarbij de twee-keer-indrukken trigger handig is, Vext (of Superwhisper, of welke lokale app dan ook) voor het langere werk waar opschoning en nauwkeurigheid ertoe doen.
De gratis versie van Vext geeft je 100 dictaten, 50 notities en 10 vergaderingen voor het om $49 vraagt. Dat is genoeg om te zien aan welke kant van de lijn jouw gebruik valt.
Wat macOS waarschijnlijk hierna brengt
Apple gaat hier ergens specifiek heen. Het on-device foundation model in Tahoe is een betekenisvolle upgrade. Toekomstige versies zullen waarschijnlijk betere opschoning, langere context, en mogelijk een vergadermodus in Notes brengen. De kloof tussen ingebouwd en betaalde lokale apps zal smaller worden.
Maar het zal langzaam smaller worden. Apple gaat niet binnenkort een feature-voor-feature Vext of Superwhisper uitbrengen — ze zullen de meest voorkomende 80% toevoegen en de long tail aan derden overlaten. Als je in de long tail zit (developers, meertalige gebruikers, vergader-zware workflows), blijven de third-party apps relevant voor de voorzienbare toekomst.
Voor iedereen anders: Apple Dictation is prima. Als je het nog niet hebt geprobeerd op Tahoe, probeer het. Je hebt misschien niets anders nodig.