Cursor का composer वह जगह है जहाँ अधिकांश AI भारी काम होता है — multi-file edits, refactors, एक नई feature का scaffolding। यह वह जगह भी है जहाँ टाइपिंग सबसे जल्दी टूटती है। अच्छे edits उत्पन्न करने वाले प्रॉम्प्ट लंबे होते हैं: संदर्भ, बाधाएँ, क्या छूना है, क्या नहीं छूना है, क्यों। पहले से एक कार्य के बीच में 200 शब्द टाइप करना घर्षण है।

यह विशेष रूप से Cursor के लिए — composer, inline chat, और ask mode — Mac पर आवाज़ का उपयोग करने के लिए एक गाइड है।

आवाज़ अन्य AI टूल्स की तुलना में Cursor के साथ बेहतर क्यों फ़िट होती है

Cursor आपके प्रॉम्प्ट का उपयोग करता है यह तय करने के लिए कि कौन सी फ़ाइलें संदर्भ में लोड करें। प्रॉम्प्ट जितना लंबा और अधिक विशिष्ट होगा, उसका फ़ाइल चयन उतना बेहतर होगा। एक दो-लाइन का टाइप किया प्रॉम्प्ट दो-फ़ाइल संदर्भ window पाता है। फ़ाइल पाथ, behaviors, और constraints के साथ एक बोला हुआ paragraph सही दस फ़ाइलें पाता है।

दूसरा कारण: composer प्रॉम्प्ट batch ऑपरेशन हैं। आप काम की एक इकाई का वर्णन कर रहे हैं, बातचीत नहीं कर रहे। Batches front-loaded संदर्भ को पसंद करते हैं। आवाज़ स्वाभाविक रूप से front-loads — आप स्थिति के साथ शुरू करते हैं, अनुरोध में आते हैं, बाधाओं के साथ समाप्त करते हैं। यह वह आकार है जो Cursor चाहता है।

एक अच्छा Cursor प्रॉम्प्ट बोला हुआ कैसा दिखता है

टाइप किया (43 शब्द):

AuthGuard को नए permission system उपयोग करने के लिए refactor करो। यह अभी roles सीधे जाँच रहा है जो scale नहीं करेगा।

बोला हुआ (180 शब्द):

src/components/auth/AuthGuard.tsx में AuthGuard component अभी user.role बराबर admin या user.role बराबर editor के माध्यम से user roles को सीधे जाँच रहा है। हमने अभी src/lib/permissions.ts में एक नया permission system shipped किया है जो hasPermission और useHasPermission expose करता है। मैं AuthGuard को refactor करना चाहता हूँ ताकि यह roles जाँचने के बजाय एक required permission को prop के रूप में स्वीकार करे। pattern के लिए src/components/admin/UserList.tsx में नया permission system कैसे उपयोग होता है देखें। roles prop या permission prop दोनों की अनुमति देकर मौजूदा API surface को backward compatible रखें — यदि दोनों pass हों, permission को preference दें। src/pages में AuthGuard को roles के साथ उपयोग करने वाले तीन callsites को permission उपयोग करने के लिए अपडेट करें। src/pages/admin-legacy में legacy admin panel को मत छुएँ — यह अगले sprint में delete हो रहा है और migrate करने योग्य नहीं है।

Cursor दूसरे को एक shot में संभाल लेता है। पहले से आपको एक diff मिलता है जो तीन फ़ाइलों पर गलत काम करता है और callsites को skip करता है।

अंतर आपके अंत में बुद्धिमत्ता नहीं है — यह है कि क्या टाइपिंग के घर्षण ने आपको दबाने के लिए मजबूर किया।

Mac पर Cursor के लिए आवाज़ सेट अप करना

Cursor एक Electron ऐप है, इसलिए कुछ भी जो कर्सर पर टेक्स्ट पेस्ट करता है काम करता है। तीन विकल्प:

Apple का बिल्ट-इन डिक्टेशन

मुफ़्त, macOS Tahoe पर ऑन-डिवाइस। System Settings > Keyboard > Dictation में सक्षम करें। अपनी हॉटकी मारें, बात करें, इसे फिर मारें। किसी भी Cursor panel में काम करता है।

जहाँ यह संघर्ष करता है: तकनीकी शब्दावली। फ़ाइल पाथ, चर नाम, library नाम, CLI commands — Apple का dictation इन सभी को बिगाड़ देता है। "src slash components slash auth guard dot tsx" किसी अनुपयोगी चीज़ में बदल जाता है। प्राकृतिक भाषा के लिए ठीक, code-heavy प्रॉम्प्ट के लिए दर्दनाक।

Wispr Flow, Superwhisper, या अन्य cloud/local डिक्टेशन ऐप्स

ये बेहतर तकनीकी शब्दावली handling के साथ स्पीच रिकग्निशन चलाते हैं। वे cursor पर Apple Dictation की तरह paste करते हैं लेकिन cleanup, लंबी सटीकता और (ऐप पर निर्भर) cloud या local प्रोसेसिंग के साथ।

YOLO Mode के साथ Vext

Vext वह विकल्प है जो हम बनाते हैं। यह $49 एक बार है, Apple Silicon पर स्थानीय रूप से Parakeet चलाता है, और AI टूल्स के लिए विशेष रूप से बनाया गया एक फ़ीचर है: YOLO Mode पेस्ट करने के बाद प्रॉम्प्ट ऑटो-सबमिट करता है। आप बात करते हैं, हॉटकी छोड़ते हैं, और composer पहले से चल रहा है।

Cursor के लिए Vext सेटअप:

  1. इंस्टॉल करें: brew install muvon/tap/vext
  2. प्रॉम्प्ट होने पर Accessibility अनुमति दें
  3. Settings > Modes खोलें, डिक्टेशन के लिए Enhance सक्षम करें (filler word cleanup)
  4. यदि आप ऑटो-सबमिट चाहते हैं तो YOLO Mode सक्षम करें
  5. Cursor खोलें, composer panel में क्लिक करें, अपनी hotkey hold करें, बात करें

Enhance चरण आपके सोचने से अधिक मायने रखता है। कच्ची ट्रांसक्रिप्शन composer को मेसी इनपुट देती है जो tokens खर्च करता है और फ़ाइल चयन को confuse करता है। साफ़ किया इनपुट ("समस्या है..." के बजाय "तो समस्या है like uh...") कम शोर के साथ वही intent पास करता है।

Cursor में आवाज़ का उपयोग कहाँ करें

Composer प्रॉम्प्ट — सबसे बड़ा payoff। Multi-file edits जहाँ आपको स्थिति, परिवर्तन, और बाधाओं का वर्णन करना है।

Inline chat (Cmd+K) — मध्यम प्रॉम्प्ट के लिए अच्छा काम करता है। "इस function को async/await उपयोग करने के लिए convert करो, error handling shape रखें" बोलकर स्वाभाविक पढ़ता है।

Ask mode — exploration सवालों के लिए अच्छा। "हम इस component को हर बार जब उपयोगकर्ता type करता है re-render क्यों कर रहे हैं? props के माध्यम से trace करें और किसी भी context providers पर देखें जिन पर यह निर्भर है।"

Tab autocomplete — परेशान मत हों। flow आवाज़ की मदद के लिए बहुत तेज़ है।

Follow-ups के लिए chat panel — सार्थक उत्तरों के लिए आवाज़ ("fooService.ts में implementation देखें और समझाएँ कि हम वहाँ validation error क्यों catch कर रहे हैं"), छोटे के लिए type ("हाँ", "फिर कोशिश करें", "अलग दृष्टिकोण")।

आवाज़ सेट होने पर बदलने वाले Workflows

Cold-start प्रॉम्प्ट

Cursor session में पहला message सबसे high-leverage है। Cursor इसे पूरी बातचीत के लिए संदर्भ seed करने के लिए उपयोग करता है। टाइप करने के साथ, आप compress करते हैं। आवाज़ के साथ, आप front-load करते हैं:

मैं billing settings page build कर रहा हूँ। हम data fetching के लिए TanStack Query, client state के लिए Zustand, और src/ui में design system का उपयोग कर रहे हैं। Stripe customer portal flow को embed करने की ज़रूरत है — एक stripeService.ts है जिसमें createPortalSession है लेकिन कुछ भी frontend से wired नहीं है। मैं app/settings/billing पर एक billing page चाहता हूँ जो वर्तमान plan दिखाए, एक button हो जो नए tab में Stripe portal खोले, और अगली invoice तिथि और amount दिखाए। design system से मौजूदा card components का उपयोग करें। कोई नई dependencies न जोड़ें।

यह Cursor को एक pass में पूरी page scaffold करने के लिए पर्याप्त देता है।

AI को bug reports

Bugs कथात्मक हैं — वे क्रम में हुए। timeline बोलना उसे type करने से तेज़ और अधिक सटीक है:

document editor में autosave feature कभी-कभी stale content save कर रही है। इसे reproduce करना कठिन है पर मुझे लगता है कि मेरे पास है। जब उपयोगकर्ता तेज़ी से type करता है और network request धीमी है, optimistic update local state को नए content पर set करता है, लेकिन यदि पिछले save की response नई के बाद वापस आती है, यह local state को पुराने content से overwrite करता है। race src/hooks/useAutoSave.ts में useAutoSave hook में कहीं है। request ordering देखें और इसे ठीक करें। एक incrementing sequence number उपयोग करें ताकि out-of-order responses drop हो जाएँ।

Teammate के PR पर code review

Cursor का diff view खोलें, "एक comment छोड़ें जो कहता है..." के साथ composer के माध्यम से अपनी comments dictate करें — review feedback type करने से बहुत तेज़। विशेष रूप से अच्छा जब आप तर्क व्यक्त करना चाहते हैं, सिर्फ़ लाइनों पर point नहीं करना।

सामान्य प्रश्न

क्या Cursor में आवाज़ बिल्ट-इन है?

वास्तव में नहीं। Cursor में स्वयं कोई native dictation नहीं — आप macOS या third-party app पर निर्भर हैं। voice tools के दृष्टिकोण से Cursor बस एक Electron text surface है, जो वास्तव में सुविधाजनक है क्योंकि कुछ भी जो Mac app में type करता है Cursor में type करता है।

क्या AI बोले गए-शैली के phrasing से confused नहीं होगा?

GPT-4o और Claude Sonnet conversational speech को बिना समस्या के संभालते हैं। Filler words और restarts हमेशा से training data में हैं। जोखिम समझ नहीं है — यह बर्बाद tokens है। यही है जो Vext के Enhance जैसे cleanup tools solve करते हैं।

क्या मुझे code dictate करना चाहिए?

नहीं। प्राकृतिक-भाषा भाग dictate करें — संदर्भ, intent, बाधाएँ। जब आपको prompt में वास्तविक code शामिल करने की आवश्यकता हो, इसे paste करें। आवाज़ उस भाग के लिए है जो सोचने से अधिक type करने में समय लेता है।

ईमानदार trade-off

System-wide dictation कुछ खर्च करती है — पैसा, एक model download, accessibility अनुमति, अपने computer से बात करने का अजीब पहला हफ़्ता। Wispr Flow $15/माह है और cross-platform काम करता है। Vext $49 एक बार है और Apple Silicon पर केवल-local है। Apple Dictation मुफ़्त है पर सीमित है।

यदि आप Cursor में रहते हैं — मतलब आप emails से अधिक prompts लिखते हैं — एक paid dictation tool बचाई गई typing के एक जोड़े सप्ताह में खुद के लिए भुगतान करता है। यदि आप केवल कभी-कभी Cursor उपयोग करते हैं, Apple Dictation पर्याप्त है।

किसी भी तरह, unlock समान है: prompts लंबे हो जाते हैं क्योंकि बोलना type करने से आसान है, और Cursor लंबे prompts के लिए बेहतर प्रतिक्रिया देता है। Cleanup gravy है।