Vext 1.2.0 — Jouw taal. Jouw sprekers.

Twee van de meest voorkomende verzoeken sinds de lancering van 1.0: "Kan ik Vext in het Spaans gebruiken?" en "Waarom haalt mijn vergadertranscript nog steeds sprekers door elkaar wanneer mensen door elkaar praten?"

1.2.0 beantwoordt beide.

De volledige interface is nu beschikbaar in vijf talen. En de vergaderdiarisatie-engine kreeg een fundamentele architectuurverandering — een tweede offline pas die je volledige opname opnieuw onderzoekt nadat het afgelopen is en elk sprekerlabel vanaf nul opnieuw toewijst. De resultaten zijn merkbaar beter voor snel bewegende, overlappende gesprekken.

Dit is wat er veranderde.

De interface is nu meertalig — en de website ook

Dicteren heeft altijd gewerkt in welke taal je ook spreekt — dat is Whisper die zijn werk doet. Wat niet gelokaliseerd was, was de app zelf: de zijbalk, instellingen, onboarding, menu's, permissieprompts. Alles wat je leest in plaats van zegt.

1.2.0 lost dat op. De volledige interface is nu beschikbaar in Engels, Spaans, Russisch, Hindi en Thai. De app volgt automatisch je macOS-systeemlocale, of je kunt een specifieke taal vastpinnen in Settings → General — wisselt direct, geen herstart.

De website is bijgewerkt om te matchen. Als je Vext hebt aanbevolen aan teamgenoten die niet in het Engels werken, kun je ze nu ergens heen sturen waar hun taal gesproken wordt.

Er komen meer talen aan. Dit was een fundament-release — de vertaalinfrastructuur staat nu op zijn plek, en een nieuwe taal toevoegen is een kwestie van één bestand vertalen.

Een speciaal Speakers-tabblad

Sprekermanagement is uit de vergadertranscripten gegaan en in zijn eigen sectie in de zijbalk gezet.

Het Speakers-tabblad toont iedereen die Vext per stem heeft geleerd in al je vergaderingen. Je kunt elke spreker hernoemen, kiezen uit 8 badgekleuren, of — de meest nuttige — twee entries samenvoegen tot één. Als Vext dezelfde persoon over tijd als twee verschillende sprekers heeft behandeld, kun je ze samenvouwen: het stemprofiel van hogere kwaliteit wint, en elke toekomstige vergadering herkent de samengevoegde identiteit correct.

Klik op een spreker en het rechterpaneel filtert naar alleen de vergaderingen waarin ze verschijnen. Klik op een vergaderrij om er direct heen te springen. Voor mensen die veel terugkerende vergaderingen opnemen — standups, klantgesprekken, teamreviews — maakt dit het praktisch om echt te beheren wie wie is, in plaats van dezelfde gezichten elke week opnieuw te labelen.

Twee-pas diarisatie: het ding dat vergaderingen echt fixt

De oorspronkelijke sprekerdetectie werkte in één streaming pas. Elk audiochunk werd gelabeld zodra het aankwam, één embedding per chunk. Dat is snel, maar het heeft een structurele zwakte: snelle heen-en-weer en overlappende spraak breken het. Een chunk van 30 seconden met vier sprekerwisselingen kreeg één label. Twee stemmen die vroeg in het gesprek vergelijkbaar klinken, kunnen worden samengevoegd voor de engine genoeg data heeft om ze uit elkaar te houden.

1.2.0 voegt een tweede pas toe die draait nadat de vergadering eindigt.

Zodra het voorlopige transcript is opgeslagen, gaat Vext terug over de volledige per-stream audio met een grondigere pijplijn — pyannote Community-1 voor segmentatie, WeSpeaker embeddings met overlap-frame masking, en VBx Bayesiaanse verfijning. Het onderzoekt elk chunk opnieuw en wijst het toe aan het globaal beste cluster, en schrijft vervolgens de gecorrigeerde labels terug naar het transcript. Als het een bekende spreker herkent, werkt het hun stemprofiel in de database bij zodat toekomstige vergaderingen nog beter worden.

Je doet niets. Het gecorrigeerde transcript verschijnt gewoon. De tijdelijke audioarchieven worden verwijderd zodra de verfijning klaar is.

Dit telt het meest voor precies die vergaderingen waar diarisatie vroeger mee worstelde: productreviews met snelle iteratie, klantgesprekken met drie mensen van hun kant, elke vergadering waar twee mensen vergelijkbare stemmen hebben of regelmatig door elkaar praten.

Sprekerwisselingen splitsen binnen een enkel chunk

Er is een gerelateerde verbetering aan de live opnamepas zelf.

Voorheen, als een enkele VAD-chunk meerdere sprekerwisselingen bevatte, werd het getranscribeerd als één blok onder één sprekerlabel. De offline pas zou uiteindelijk de toewijzing fixen, maar het transcript zag er verkeerd uit terwijl je nog in de vergadering zat.

1.2.0 detecteert sprekerwisselingen binnen een chunk tijdens het opnemen. Wanneer de tijdlijn twee verschillende sprekers in hetzelfde audiosegment toont, slicet Vext het bij het wisselpunt en transcribeert elke wisseling apart. Zeer korte flickers onder 300ms worden geabsorbeerd in de aangrenzende run — je wilt het transcript niet gefragmenteerd hebben op Sortformer-ruis — maar echte sprekerwisselingen verschijnen nu correct in realtime, niet pas nadat de offline pas voltooid is.

Betrouwbaarheidsverbeteringen

Een paar dingen die stilletjes kapot waren en dat nu niet meer zijn.

Sneltoetsen komen terug na slaap. De globale toetsenbord-tap kon verouderd raken na slaap, snel gebruikersswitchen, of bepaalde systeem-time-outs — die nog steeds rapporteerde als ingeschakeld maar stilletjes events liet vallen. Het herinstalleert zichzelf nu netjes bij ontwaken en monitort de gevallen waarin macOS het automatisch uitschakelt.

Echo-onderdrukking verwijderd. Vorige versies pasten Apple's VoiceProcessingIO toe op de microfooninput. Die API verandert gedeelde hardware-state en lekt AGC en ruisonderdrukking in elke andere app die dezelfde mic leest — videogesprekken, opnamesoftware, alles wat draait. Vergaderopnames vangen deelnemersaudio via een aparte systeemaudio-tap, dus de mic- en gespreksaudio zijn al fysiek gescheiden. Echo-onderdrukking was daar nooit nodig, en het verwijderen ervan stopt Vext ervan om onbedoeld je stem slechter te laten klinken in andere apps terwijl een vergadering opneemt.

Instellingen herontworpen. De instellingen-zijbalk is vervangen door een gesegmenteerde picker: General, Hotkeys, Audio & STT, Language & LLM, License, About. Schoner, en makkelijker te navigeren op kleinere schermen.

Update

brew upgrade muvon/tap/vext

Of download Vext 1.2.0 direct. Bestaande vergaderingen en sprekerprofielen worden meegenomen — de offline diarisatie-pas draait automatisch de volgende keer dat je een vergadering opent die voor deze update is opgenomen.

Als je vergaderingen met meer dan twee mensen opneemt, open na het updaten een paar oudere. De opnieuw toegewezen transcripten zijn meestal een betekenisvolle verbetering.

Download Vext 1.2.0