macOS 14+ · Apple Silicon

अपने कंप्यूटर से बात करें,
टाइप मत कीजिए।

Mac के लिए वॉइस-टू-टेक्स्ट — स्मार्ट क्लीनअप, लाइव ट्रांसलेशन, मीटिंग सारांश और वॉइस नोट्स के साथ। कोई क्लाउड नहीं, कोई सब्सक्रिप्शन नहीं। आपकी आवाज़ कभी Mac से बाहर नहीं जाती।

मुफ़्त डाउनलोड

100 मुफ़्त डिक्टेशन · 50 नोट्स · 10 मीटिंग रिकॉर्डिंग · क्रेडिट कार्ड नहीं चाहिए

या इससे इंस्टॉल करें brew install muvon/tap/vext

macOS 14+ · Apple Silicon · अकाउंट की ज़रूरत नहीं

यह कैसे काम करता है

तीन कदम। कोई सेटअप नहीं। कोई अकाउंट नहीं।

1

हॉटकी दबाए रखें

अपना शॉर्टकट दबाए रखें। Vext तुरंत सुनना शुरू कर देता है।

2

सहज होकर बोलें

किसी भी ऐप में सामान्य रफ़्तार से बोलें। आपकी आवाज़ रियल-टाइम में, स्थानीय रूप से ट्रांसक्राइब होती है।

3

छोड़ते ही पेस्ट

छोड़िए। टेक्स्ट आपके कर्सर पर आ जाता है — कहीं भी आप हों। कॉपी-पेस्ट की ज़रूरत नहीं।

तीन मोड। एक ऐप।

डिक्टेट करें, मीटिंग रिकॉर्ड करें या त्वरित नोट्स पकड़ें — सब कुछ Mac पर स्थानीय रूप से।

डिक्टेशन

हॉटकी दबाएं, बोलें, छोड़ें — टेक्स्ट कर्सर पर आता है। किसी भी ऐप, किसी भी टेक्स्ट फ़ील्ड में।

मीटिंग

स्पीकर लेबल के साथ रिकॉर्ड करें, पूरा ट्रांसक्रिप्ट, स्क्रीनशॉट और AI सारांश पाएं।

नोट्स

त्वरित वॉइस रिमार्क — ट्रांसक्राइब, साफ़ और बाद के लिए ऐप में स्थानीय रूप से संग्रहीत।

जैसे चाहें बोलें।
साफ़ टेक्स्ट पाएं।

Vext आपकी बोली को अपने आप साफ़ करता है — फिलर शब्द हटाता है, संरचना सुधारता है, मतलब बरकरार रखता है। वही भाषा, वही अर्थ — बस पॉलिश। अनुवाद के साथ एक ही पास में काम करता है।

  • फिलर शब्द हटाता है (अं, यानी, मतलब, तो)
  • अर्थ बदले बिना स्पष्टता के लिए पुनर्संरचना
  • आपकी मूल भाषा और लहजा संरक्षित
  • एक ही चरण में अनुवाद के साथ मिलता है
आपने जो कहा

"तो अं मैं सोच रहा था कि हमें यानी शायद डेडलाइन को अगले शुक्रवार तक खिसकाना चाहिए क्योंकि अं टीम को इंटीग्रेशन टेस्ट खत्म करने के लिए अं थोड़ा और समय चाहिए"

जो पेस्ट होता है

"हमें डेडलाइन अगले शुक्रवार तक बढ़ानी चाहिए — टीम को इंटीग्रेशन टेस्ट पूरा करने के लिए और समय चाहिए।"

आपकी आवाज़ कभी Mac से बाहर नहीं जाती।

कोई ऑडियो अपलोड नहीं। कोई क्लाउड ट्रांसक्रिप्शन नहीं। कोई अकाउंट नहीं। यह केवल नीति नहीं — यह वास्तुकला है।

100% लोकल

Whisper सीधे Apple Silicon GPU पर चलता है। सारी प्रोसेसिंग डिवाइस पर ही रहती है।

इंटरनेट की ज़रूरत नहीं

ऑफलाइन, हवाई जहाज़ में, फ़ायरवॉल के पीछे काम करता है। कनेक्शन कभी नहीं चाहिए।

शून्य डेटा संग्रह

कोई एनालिटिक्स नहीं। कोई टेलीमेट्री नहीं। कोई अकाउंट नहीं। हम आपका ऑडियो या ट्रांसक्रिप्ट कभी नहीं देखते।

मुफ़्त आज़माएं। एक बार चुकाएं। हमेशा इस्तेमाल करें।

100 डिक्टेशन, 50 नोट्स और 10 मीटिंग रिकॉर्डिंग मुफ़्त। फिर एक कीमत, असीमित उपयोग।

सर्वोत्तम मूल्य

Vext

$49 एक बार

दूसरे साल $0

  • डिवाइस पर स्थानीय रूप से चलता है
  • अकाउंट की ज़रूरत नहीं
  • मीटिंग ट्रांसक्रिप्शन
  • जीवनभर का एक्सेस
  • वर्शन के भीतर मुफ़्त अपडेट
Vext खरीदें

क्लाउड वॉइस टूल्स

$10–30 /माह

$120–360/वर्ष

  • क्लाउड पर निर्भर
  • अकाउंट चाहिए
  • उपयोग सीमाएँ
  • सिर्फ़ सब्सक्रिप्शन
  • गोपनीयता समझौते

जब तैयार हों, ऐप से अनलॉक करें। मुफ़्त अपडेट्स शामिल। मौजूदा यूज़र को मेजर वर्शन पर 50% छूट।

Vext कैसा तुलना में है।

फ़ीचर दर फ़ीचर अग्रणी वॉइस और मीटिंग टूल्स के मुकाबले।

Vext $49 एक बारWispr Flow $12–15/moGranola $14–35/moOtter.ai $8–17/mo
डिक्टेशन (कर्सर पर पेस्ट)
मीटिंग ट्रांसक्रिप्शन
वॉइस नोट्स
स्पीकर लेबल
क्रॉस-मीटिंग वॉइस रिकग्निशनलागू नहीं
AI टेक्स्ट क्लीनअप
मीटिंग सारांश
लाइव ट्रांसलेशन
स्क्रीनशॉट कैप्चर (किसी भी मोड में)
स्क्रीनशॉट सीधे AI में
YOLO मोड (ऑटो-सबमिट)
100% लोकल / निजी
ऑफलाइन काम करता है
कॉल में कोई बॉट नहींलागू नहीं
2 साल बाद लागत$49$288–360$336–840$200–408

प्रतिस्पर्धियों का डेटा अप्रैल 2026 की सार्वजनिक वेबसाइटों से लिया गया। फ़ीचर और कीमतें बदल सकती हैं।

बिना किसी इंतज़ार के ट्रांसक्रिप्शन।

Vext रियल-टाइम में स्थानीय रूप से ट्रांसक्राइब करता है — कोई अपलोड नहीं, कोई सर्वर नहीं, कोई स्पिनर नहीं। आपके शब्द पहले से वहाँ हैं।

150x रियलटाइम

60 सेकंड का ऑडियो ~400ms में ट्रांसक्राइब। डिवाइस पर।

Parakeet लोकल
150x
Apple लोकल
25x
Gemini क्लाउड
23x
OpenAI क्लाउड
22x
AssemblyAI क्लाउड
20x
Alex 00:12

चलिए Q3 रोडमैप देखें और प्राथमिकताएँ तय करें।

Sarah 00:28

मेरे ख्याल से हमें पहले API रीडिज़ाइन पर ध्यान देना चाहिए। यह तीन और टीमों को रोक रहा है।

Alex 00:45

सहमत। क्या अगले हफ्ते के अंत तक मसौदा तैयार कर सकते हैं?

मीटिंग ट्रांसक्रिप्शन।
और उसका सारांश।

किसी भी मीटिंग को रिकॉर्ड करें — Zoom, Google Meet, FaceTime या आमने-सामने — और स्पीकर पहचान के साथ पूरा ट्रांसक्रिप्ट पाएं। Summarize चालू करें, मुख्य बिंदु और एक्शन आइटम मिलेंगे। दोनों संस्करण हमेशा सहेजे जाते हैं।

  • टाइमस्टैम्प और प्रति-स्पीकर ब्रेकडाउन
  • सिस्टम ऑडियो + माइक्रोफ़ोन कैप्चर
  • AI-संचालित मुख्य बिंदु और एक्शन आइटम
  • कच्चा ट्रांसक्रिप्ट हमेशा सुरक्षित

एक बार स्पीकर लेबल करें।
हमेशा पहचान।

Vext हर अलग आवाज़ अपने आप पहचानता है। एक बार नाम दे दीजिए — और अगली कॉल से वही व्यक्ति बिना कुछ किए पहचाना, लेबल और रंग-कोडित होगा।

  • हर रिकॉर्डिंग में स्वचालित स्पीकर पहचान
  • कस्टम नाम — आपकी लाइब्रेरी में सहेजे जाते हैं
  • भविष्य की मीटिंग में वही आवाज़ अपने आप लेबल
  • तेज़ी से ट्रांसक्रिप्ट देखने के लिए रंग-कोडित चिप्स
मीटिंग #1 स्पीकर
वे Sarah
मैं John
स्पीकर 1 Jack
मीटिंग #2 स्वतः लेबल
Sarah
John
Jack

आवाज़ + दृष्टि,
बिना हाथ लगाए।

हैंड्स-फ्री डिक्टेशन के दौरान स्क्रीन का कोई भी हिस्सा कैप्चर करें। स्क्रीनशॉट आपके ट्रांसक्राइब किए प्रॉम्प्ट के साथ पेस्ट होता है — सीधे Claude Code, Cursor या किसी भी AI टूल में। पूरी तरह हैंड्स-फ्री कोडिंग।

  • हैंड्स-फ्री डिक्टेशन या मीटिंग रिकॉर्डिंग के दौरान खींचकर कैप्चर करें
  • स्क्रीनशॉट आपके ट्रांसक्रिप्ट के साथ अपने आप पेस्ट — Claude Code, Cursor, ChatGPT
  • कीबोर्ड को छुए बिना आवाज़ + तस्वीर
Vext ऐप का स्क्रीनशॉट जो वॉइस ट्रांसक्रिप्शन इंटरफ़ेस दिखा रहा है
2 मिनट पहले

नई इंटीग्रेशन पुश करने से पहले API रेट लिमिट जांचें। Sarah ने बताया कि सैंडबॉक्स के थ्रेसहोल्ड प्रोडक्शन से अलग हैं।

18 मिनट पहले

ऑनबोर्डिंग फ़्लो में दूसरी स्क्रीन पर स्किप विकल्प चाहिए। यूज़र सोचते हैं सेटअप ज़रूरी है और छोड़ देते हैं।

1 घंटा पहले

कस्टम इम्प्लीमेंटेशन की जगह साइडबार के लिए SwiftUI NavigationSplitView आज़माएं। स्टेट रिस्टोरेशन अपने आप संभालता है।

विचार पकड़ें
खो जाने से पहले।

एक कुंजी दबाएं, जो मन में है कहें, और आगे बढ़ें। Vext ट्रांसक्राइब करता है, साफ़ करता है और आपकी नोट को स्थानीय रूप से सहेजता है — जब चाहें मिल जाएगी।

  • डिक्टेशन की तरह वही Enhance और ट्रांसलेशन पाइपलाइन
  • सभी नोट्स ऐप में स्थानीय रूप से सहेजे जाते हैं
  • ऐप बदलने की ज़रूरत नहीं — Mac पर कहीं से भी काम करता है

एक भाषा में बोलें।
दूसरी में टाइप करें।

अंग्रेज़ी में बोलें, टेक्स्ट रूसी में पाएं। या स्पेनिश में। या जापानी में। Vext आपकी आवाज़ को ट्रांसक्राइब करते समय रियल-टाइम में अनुवाद करता है — कर्सर पर जो टेक्स्ट आता है, वह पहले से ही आपकी ज़रूरत की भाषा में होता है।

  • रियल-टाइम भाषण-से-अनुवाद
  • 99+ लक्ष्य भाषाएँ
  • किसी भी स्रोत भाषा के साथ काम करता है
  • वही हॉटकी फ़्लो — बस अपनी लक्ष्य भाषा सेट करें
अंग्रेज़ी

"Let's schedule a meeting for next Tuesday to discuss the project roadmap and assign tasks to the team."

रूसी

"Давайте назначим встречу на следующий вторник, чтобы обсудить план проекта и распределить задачи в команде."

जहाँ भी आप टाइप करते हैं, काम करता है।

Vext एक सिस्टम-स्तर की सेवा है। यह किसी भी ऐप के किसी भी टेक्स्ट फ़ील्ड में काम करता है — ब्राउज़र, एडिटर, टर्मिनल, ईमेल, चैट।

AI टूल्स

Claude CodeChatGPTClaude.aiCursorCodex

ब्राउज़र

SafariChromeFirefoxArc

एडिटर

VS CodeXcodeSublime TextVim

टर्मिनल

TerminaliTerm2WarpGhostty

संचार

SlackDiscordTelegramMessages

प्रोडक्टिविटी

NotionObsidianNotesGmail

बिना हाथ लगाए।

डिक्टेशन शुरू करने के लिए एक बार कुंजी दबाएं। रोकने के लिए फिर दबाएं। दबाए रखने की ज़रूरत नहीं — जितना चाहें बोलें। लंबे पैसेज या व्यस्त हाथों के लिए बेहतरीन।

मानक कुंजी दबाएँ रखें → बोलें → छोड़ें
हैंड्स-फ्री कुंजी दबाएँ → स्वतंत्र बोलें → कुंजी दबाएँ

डिक्टेशन के बीच स्क्रीनशॉट लें — वे ट्रांसक्रिप्ट के साथ अपने आप पेस्ट होते हैं। कैसे देखें →

एक बार दबाएं
स्वतंत्र बोल रहे हैं...
फिर दबाएं

YOLO मोड।

चालू करें और Vext ट्रांसक्रिप्शन पेस्ट करने के बाद अपने आप Return दबा देता है। बोलें, छोड़ें, और आपका प्रॉम्प्ट पहले से चल रहा है।

संपादन बंद करें। पॉलिशिंग बंद करें। बस बोलें। LLM समझ लेते हैं, भले ही शब्द एकदम सही न हों।

YOLO मोड
बोलें
ट्रांसक्रिप्ट देखें
गलतियाँ ठीक करें
Return दबाएं
हो गया

ऑडियो डकिंग।

रिकॉर्डिंग शुरू होते ही Vext सिस्टम ऑडियो को अपने आप धीमा कर देता है ताकि आपकी आवाज़ साफ़ आए। हॉटकी छोड़ते ही वॉल्यूम वापस सामान्य। मैन्युअल समायोजन की ज़रूरत नहीं।

संगीत बज रहा है
रिकॉर्डिंग
फिर से शुरू

अपने इंजन चुनें।

अपने वर्कफ़्लो के लिए स्पीच और AI मॉडल चुनें। डिफ़ॉल्ट रूप से लोकल, या अपनी API कुंजी लाएं।

स्पीच-टू-टेक्स्ट

मॉडलप्रकारगतिआकार
Apple Dictation macOS में बिल्ट-इन स्पीच रिकग्निशन। कोई डाउनलोड नहीं।लोकलRealtimeBuilt-in
OpenAI-compatible कोई भी OpenAI-संगत STT एंडपॉइंट। अपनी API कुंजी लाएं।APIVaries

AI प्रोसेसिंग सुधार · अनुवाद · सारांश

मॉडलप्रकारआकार
Gemma 3 1B अत्यंत हल्का। सबसे तेज़ लोकल विकल्प, कम सटीकता।लोकल~1 GB
Qwen 3 4B मज़बूत बहुभाषी समर्थन। अनुवाद के लिए अच्छा।लोकल~2.5 GB
LLaMA 3.2 3B Meta LLaMA। मज़बूत सामान्य प्रदर्शन।लोकल~2.4 GB
Phi-3.5 Mini Microsoft Phi-3.5. कॉम्पैक्ट, मज़बूत तर्क।लोकल~2.8 GB
OpenAI-compatible कोई भी OpenAI-संगत API — GPT, Claude, Gemini या स्व-होस्टेड।API

Muvon द्वारा निर्मित।

Vext को Muvon Un Limited बनाता है — एक छोटा प्रोडक्ट स्टूडियो। हम वही टूल्स बनाते हैं जो ख़ुद हर दिन इस्तेमाल करते हैं — स्थानीय रूप से चलने के लिए डिज़ाइन, आपकी निजता का सम्मान और बिना रास्ता रोके।

प्रश्न और उत्तर।