ถอดเสียง ไม่มีอะไรออกจากแท็บคุณ

ลากไฟล์เสียงมาวาง Whisper รันบนเครื่องคุณ — โมเดลดาวน์โหลดครั้งเดียว แคชถาวร อินเฟอเรนซ์ทำในเครื่องด้วย WebGPU เมื่อมี ส่งออกเป็น TXT, SRT, VTT หรือ JSON

100% ในเครื่อง ไม่อัปโหลด ไม่ต้องสมัคร สำรองด้วย WASM

วางไฟล์เสียงที่นี่ หรือคลิกเพื่อเลือก MP3 · WAV · M4A · FLAC · OGG · WebM · MP4 — ได้ถึง ~30 นาทีสำหรับโมเดล tiny

โมเดล

มันเป็นส่วนตัวจริง ๆ แค่ไหน?

โมเดล Whisper ถูกดาวน์โหลดจาก CDN ของ HuggingFace ครั้งแรกที่คุณถอดเสียง หลังจากนั้นจะถูกแคชใน IndexedDB ของเบราว์เซอร์ — ครั้งถัดไปโหลดทันทีและทำงานออฟไลน์ ไฟล์เสียงคุณถูกถอดรหัสโดยเบราว์เซอร์ ป้อนเข้าโมเดลที่รันในแท็บคุณ และไม่ส่งไปไหน

บน Apple Silicon กับ Chrome หรือ Safari Tech Preview การเร่ง WebGPU ทำงานที่ ~0.3–0.5× เรียลไทม์สำหรับโมเดล Tiny หากไม่มี WebGPU ตัวสำรอง WASM ทำงานที่ ~1.5–3× เรียลไทม์ (ช้ากว่าการเล่นแต่ยังต่ำกว่านาทีสำหรับคลิป 5 นาที)

อยากได้เป็นแอป Mac ไม่ใช่แท็บ?

Vext รัน Whisper แบบเนทีฟบน Apple Silicon — เร็วกว่า WASM ในเบราว์เซอร์ ~5–10 เท่า ไม่ต้องรอดาวน์โหลดโมเดล แถมยังถอดเสียงประชุมสด ลดเสียงระบบ และพิมพ์ลงทุกแอปได้ตรง ๆ จ่าย $49 ครั้งเดียว ในเครื่องทั้งหมด

ลอง Vext — $49