ถอดเสียง ไม่มีอะไรออกจากแท็บคุณ
ลากไฟล์เสียงมาวาง Whisper รันบนเครื่องคุณ — โมเดลดาวน์โหลดครั้งเดียว แคชถาวร อินเฟอเรนซ์ทำในเครื่องด้วย WebGPU เมื่อมี ส่งออกเป็น TXT, SRT, VTT หรือ JSON
มันเป็นส่วนตัวจริง ๆ แค่ไหน?
โมเดล Whisper ถูกดาวน์โหลดจาก CDN ของ HuggingFace ครั้งแรกที่คุณถอดเสียง หลังจากนั้นจะถูกแคชใน IndexedDB ของเบราว์เซอร์ — ครั้งถัดไปโหลดทันทีและทำงานออฟไลน์ ไฟล์เสียงคุณถูกถอดรหัสโดยเบราว์เซอร์ ป้อนเข้าโมเดลที่รันในแท็บคุณ และไม่ส่งไปไหน
บน Apple Silicon กับ Chrome หรือ Safari Tech Preview การเร่ง WebGPU ทำงานที่ ~0.3–0.5× เรียลไทม์สำหรับโมเดล Tiny หากไม่มี WebGPU ตัวสำรอง WASM ทำงานที่ ~1.5–3× เรียลไทม์ (ช้ากว่าการเล่นแต่ยังต่ำกว่านาทีสำหรับคลิป 5 นาที)
อยากได้เป็นแอป Mac ไม่ใช่แท็บ?
Vext รัน Whisper แบบเนทีฟบน Apple Silicon — เร็วกว่า WASM ในเบราว์เซอร์ ~5–10 เท่า ไม่ต้องรอดาวน์โหลดโมเดล แถมยังถอดเสียงประชุมสด ลดเสียงระบบ และพิมพ์ลงทุกแอปได้ตรง ๆ จ่าย $49 ครั้งเดียว ในเครื่องทั้งหมด