Cursors Composer ist der Ort, wo die meiste KI-Schwerstarbeit stattfindet — Multi-Datei-Bearbeitungen, Refactorings, Gerüste für neue Features. Es ist auch der Ort, wo das Tippen am schnellsten an Grenzen stößt. Die Prompts, die gute Bearbeitungen erzeugen, sind lang: Kontext, Einschränkungen, was geändert werden soll, was nicht, und warum. 200 Wörter zu tippen, während man bereits mitten in einer Aufgabe steckt, ist Reibung.
Dies ist ein Leitfaden zur Verwendung von Sprache speziell für Cursor — Composer, Inline-Chat und Ask-Modus — auf dem Mac.
Warum Sprache zu Cursor besser passt als zu anderen KI-Tools
Cursor nutzt den Prompt, um zu entscheiden, welche Dateien in den Kontext geladen werden. Je länger und spezifischer der Prompt, desto besser die Dateiauswahl. Ein zweileiliger getippter Prompt bekommt ein Zwei-Datei-Kontextfenster. Ein gesprochener Absatz mit Dateipfaden, Verhaltensweisen und Einschränkungen bekommt die richtigen zehn Dateien.
Der andere Grund: Composer-Prompts sind Batch-Operationen. Man beschreibt eine Arbeitseinheit, kein Gespräch. Batches profitieren von vorab geladenem Kontext. Sprache lädt von Natur aus vorab — man beginnt mit der Situation, kommt zur Anfrage, endet mit den Einschränkungen. Das ist die Form, die Cursor braucht.
Wie ein guter Cursor-Prompt gesprochen klingt
Getippt (43 Wörter):
Refactor the AuthGuard to use the new permission system. It's currently checking roles directly which won't scale.
Gesprochen (180 Wörter):
The AuthGuard component in src/components/auth/AuthGuard.tsx is currently checking user roles directly through user.role equals admin or user.role equals editor. We just shipped a new permission system in src/lib/permissions.ts that exposes hasPermission and useHasPermission. I want to refactor AuthGuard so it accepts a required permission as a prop instead of checking roles. Look at how the new permission system is used in src/components/admin/UserList.tsx for the pattern. Keep the existing API surface backward compatible by allowing either a roles prop or a permission prop — if both are passed, prefer permission. Update the three callsites in src/pages that use AuthGuard with roles to use permission instead. Don't touch the legacy admin panel under src/pages/admin-legacy — that's getting deleted next sprint and isn't worth migrating.
Cursor erledigt den zweiten in einem Durchgang. Der erste produziert ein Diff, das bei drei Dateien falsch liegt und die Callsites übersieht.
Der Unterschied liegt nicht an der eigenen Intelligenz — sondern daran, ob die Tipp-Reibung einen zur Kompression gezwungen hat.
Sprache für Cursor auf dem Mac einrichten
Cursor ist eine Electron-App, also funktioniert alles, was Text an der Cursorposition einfügt. Drei Optionen:
Apples eingebautes Diktat
Kostenlos, On-Device auf macOS Tahoe. In Systemeinstellungen > Tastatur > Diktat aktivieren. Hotkey drücken, sprechen, nochmals drücken. Funktioniert in jedem Cursor-Panel.
Schwächen: technisches Vokabular. Dateipfade, Variablennamen, Bibliotheksnamen, CLI-Befehle — Apples Diktat verhunzt all das. „src slash components slash auth guard dot tsx" wird zu etwas Unbrauchbarem. Für natürliche Sprache in Ordnung, für Code-lastige Prompts schmerzhaft.
Wispr Flow, Superwhisper oder andere Cloud/lokale Diktat-Apps
Diese führen die Spracherkennung mit besserem Umgang mit Fachvokabular durch. Sie fügen an der Cursorposition ein wie Apple Dictation, aber mit Bereinigung, höherer Genauigkeit und (je nach App) Cloud- oder lokaler Verarbeitung.
Vext mit YOLO Mode
Vext ist die Option, die wir entwickeln. Einmalig 49 $, läuft Parakeet lokal auf Apple Silicon und hat eine Funktion speziell für KI-Tools: YOLO Mode sendet den Prompt nach dem Einfügen automatisch ab. Man spricht, lässt den Hotkey los, und der Composer läuft bereits.
Das Vext-Setup für Cursor:
- Installieren:
brew install muvon/tap/vext - Barrierefreiheitsberechtigung erteilen, wenn gefragt
- Einstellungen > Modi öffnen, Enhance für Diktat aktivieren (Füllwort-Bereinigung)
- YOLO Mode aktivieren, wenn Auto-Submit gewünscht ist
- Cursor öffnen, in das Composer-Panel klicken, Hotkey gedrückt halten, sprechen
Der Enhance-Schritt ist wichtiger, als man denkt. Rohe Transkription gibt dem Composer unordentliche Eingaben, die Token kosten und die Dateiauswahl verwirren. Bereinigte Eingaben („das Problem ist..." statt „also das Problem ist irgendwie ähm...") transportieren dieselbe Absicht mit weniger Rauschen.
Wo man Sprache in Cursor einsetzt
Composer-Prompts — größter Nutzen. Multi-Datei-Bearbeitungen, bei denen Situation, Änderung und Einschränkungen beschrieben werden müssen.
Inline-Chat (Cmd+K) — funktioniert gut für mittlere Prompts. „Convert this function to use async/await, keep the error handling shape" klingt gesprochen natürlich.
Ask-Modus — gut für Erkundungsfragen. „Why are we re-rendering this component every time the user types? Trace through the props and look at any context providers it depends on."
Tab-Autocomplete — nicht der Mühe wert. Der Ablauf ist zu schnell für Sprache.
Chat-Panel für Folgeantworten — Sprache für substanzielle Antworten („look at the implementation in fooService.ts and explain why we're catching the validation error there"), tippen für kurze Antworten („yes", „try again", „different approach").
Workflows, die sich mit Sprache verändern
Der Kaltstart-Prompt
Die erste Nachricht in einer Cursor-Sitzung ist die mit dem höchsten Hebel. Cursor nutzt sie, um Kontext für das gesamte Gespräch vorzuladen. Beim Tippen komprimiert man. Mit Sprache lädt man vorab:
I'm building out the billing settings page. We're using TanStack Query for data fetching, Zustand for client state, and the design system in src/ui. The Stripe customer portal flow needs to be embedded — there's a stripeService.ts that has createPortalSession but nothing wired up to the frontend. I want a billing page at app/settings/billing that shows the current plan, has a button to open the Stripe portal in a new tab, and shows the next invoice date and amount. Use the existing card components from the design system. Don't add new dependencies.
Das gibt Cursor genug, um die gesamte Seite in einem Durchgang zu gerüsten.
Fehlerberichte an die KI
Bugs sind Erzählungen — sie passierten in Reihenfolge. Den Zeitverlauf zu sprechen ist schneller und genauer als ihn zu tippen:
The autosave feature in the document editor is sometimes saving stale content. Reproducing it is hard but I think I've got it. When the user types fast and the network request is slow, the optimistic update sets the local state to the new content, but if a previous save's response comes back after the new one, it overwrites local state with the old content. The race is somewhere in the useAutoSave hook in src/hooks/useAutoSave.ts. Look at the request ordering and fix it. Use an incrementing sequence number so out-of-order responses get dropped.
Code-Review für einen PR eines Teammitglieds
Cursors Diff-Ansicht öffnen, Kommentare über den Composer diktieren mit „hinterlasse einen Kommentar, der sagt..." — viel schneller als Review-Feedback zu tippen. Besonders gut, wenn man Begründungen artikulieren möchte, nicht nur auf Zeilen zeigen.
Häufige Fragen
Hat Cursor eingebaute Sprachunterstützung?
Nicht wirklich. Es gibt kein natives Diktat in Cursor selbst — man verlässt sich auf macOS oder eine Drittanbieter-App. Cursor ist für Sprach-Tools nur eine Electron-Textoberfläche, was tatsächlich praktisch ist, weil alles, was in eine Mac-App tippt, auch in Cursor tippt.
Verwirrt die KI nicht der umgangssprachliche Stil?
GPT-4o und Claude Sonnet verarbeiten Umgangssprache problemlos. Füllwörter und Korrekturen sind seit jeher Trainingsdaten. Das Risiko ist nicht das Verständnis — es sind verschwendete Token. Das lösen Bereinigungstools wie Vexts Enhance.
Sollte man Code diktieren?
Nein. Die natürlichsprachlichen Teile diktieren — Kontext, Absicht, Einschränkungen. Wenn tatsächlicher Code in einem Prompt enthalten sein muss, einfügen. Sprache ist für den Teil, der länger dauert zu tippen als zu denken.
Der ehrliche Kompromiss
Systemweites Diktat kostet etwas — Geld, einen Modell-Download, Barrierefreiheitsberechtigung, die ungewohnte erste Woche, in der man mit dem Computer spricht. Wispr Flow kostet 15 $/Monat und funktioniert plattformübergreifend. Vext kostet einmalig 49 $ und ist nur lokal auf Apple Silicon. Apple Dictation ist kostenlos, aber begrenzt.
Wer in Cursor lebt — also mehr Prompts daran schreibt als E-Mails — für den rechnet sich ein bezahltes Diktat-Tool nach ein paar Wochen gesparter Tipparbeit. Wer Cursor nur gelegentlich nutzt, dem reicht Apple Dictation.
In jedem Fall ist das Ergebnis dasselbe: Prompts werden länger, weil Sprechen einfacher ist als Tippen, und Cursor reagiert besser auf lange Prompts. Die Bereinigung ist das Sahnehäubchen.