ทุกวันนี้บอทการประชุมมีอยู่ทุกที่ — Otter, Fireflies, Granola, Read และอีกหลายสิบตัว พวกมันเข้าร่วมการประชุมในฐานะผู้เข้าร่วม บันทึกทุกอย่าง แล้วส่งบันทึกการถอดเทปให้คุณ พวกมันยังปรากฏขึ้นมาในรูปแบบ "Otter Bot กำลังบันทึก" ซึ่งดูน่าอึดอัด บางครั้งก็ขัดต่อนโยบายของบริษัท และเป็นสิ่งที่ผู้เข้าร่วมต่อต้านอย่างจริงจังมากขึ้นเรื่อย ๆ
ทางเลือกอื่นคือการถอดเทปการประชุมจากฝั่งของคุณเอง — Mac ของคุณบันทึกเสียงที่กำลังเล่นอยู่และเสียงจากไมโครโฟนของคุณ ถอดเทปแบบโลคอล และสร้างบันทึกการถอดเทปออกมาโดยไม่มีแขกคนใดอยู่ในการประชุม คู่มือนี้พูดถึงวิธีการทำสิ่งนี้สำหรับ Zoom และ Google Meet โดยเฉพาะบน Mac
ทำไมผู้คนถึงเลิกใช้บอท
มีสามเหตุผลที่ถูกหยิบยกขึ้นมาซ้ำ ๆ:
ความน่าอึดอัด บอทในการประชุมขายของ การสัมภาษณ์งาน หรือการสนทนาภายในที่อ่อนไหว สร้างบรรยากาศที่แตกต่างจากเครื่องมือถอดเทปที่เป็นมนุษย์ ลูกค้าบางรายปฏิเสธมันอย่างเด็ดขาด บางบริษัทห้ามใช้มันผ่านนโยบาย
ความเป็นส่วนตัวและถิ่นที่อยู่ของข้อมูล บอทส่งเสียงผ่านเซิร์ฟเวอร์ของบุคคลที่สาม หากการประชุมเกี่ยวข้องกับข้อมูลลูกค้า กลยุทธ์ภายใน การหารือเรื่องทรัพย์สินทางปัญญา หรืออะไรก็ตามที่อยู่ภายใต้การกำกับดูแล ทีมกฎหมายของคุณคงมีความเห็นบางอย่าง การถอดเทปแบบโลคอลหมายความว่าเสียงไม่เคยออกจาก Mac ที่อยู่ในการประชุมอยู่แล้ว
ความน่าเชื่อถือ บอทถูกเตะออกโดยเจ้าของการประชุมบางคน มันเข้าร่วมไม่ได้เมื่อมีการเข้มงวดเรื่องการยืนยันตัวตนของการประชุม บางครั้งมันก็หลุดกลางคัน เครื่องบันทึกแบบโลคอลไม่มีรูปแบบความล้มเหลวเหล่านี้ — ถ้าคุณได้ยินเสียง เครื่องบันทึกก็จับเสียงนั้นได้
ข้อเสียของการไม่ใช้บอท: คุณจะเสียฟีเจอร์แบบรวมศูนย์ที่บอทมักมีมาให้ (คลังที่ใช้ร่วมกัน การค้นหาทั่วทั้งทีม การซิงค์เข้า CRM อัตโนมัติ) สำหรับการทำงานคนเดียวและทีมเล็ก ๆ เรื่องนี้แทบไม่สำคัญ สำหรับองค์กรขนาดใหญ่ที่มีกระบวนการทำงานกับ Otter/Fireflies ที่วางไว้แล้ว ข้อแลกเปลี่ยนนี้เป็นเรื่องจริง
"การถอดเทปโดยไม่ใช้บอท" ทำงานอย่างไรจริง ๆ บน Mac
มีแหล่งเสียงสามแหล่งที่คุณอาจต้องการจับ:
- ไมโครโฟนของคุณ — เสียงของคุณเอง
- เสียงระบบ — ทุกอย่างที่ออกมาจากลำโพงของคุณ รวมถึงผู้เข้าร่วมการประชุมคนอื่น
- ทั้งสองอย่างพร้อมกัน — สิ่งที่คุณต้องการจริง ๆ สำหรับการถอดเทปการประชุม
การจับเฉพาะไมโครโฟนของคุณนั้นง่าย การจับเสียงระบบเป็นส่วนที่ยาก เพราะ macOS จงใจไม่เปิดเผยเสียงระบบให้แอปต่าง ๆ เข้าถึงด้วยเหตุผลด้านความเป็นส่วนตัว
วิธีมาตรฐานในการแก้ปัญหานี้คืออุปกรณ์เสียงเสมือน (Loopback, BlackHole, Aggregate Devices) แอปบอกข้อความ/ถอดเทปจะใช้อุปกรณ์เสมือนนี้เป็นอินพุต และคุณส่งเสียงระบบเข้าไปในอุปกรณ์เสมือนนั้น วิธีนี้ใช้ได้แต่ยุ่งยาก
แอปบอกข้อความบน Mac บางตัวจัดการเรื่องนี้ให้โดยอัตโนมัติ — พวกมันรวมการจับเสียงระบบเข้าไว้ด้วยและนำเสนอเป็นปุ่ม "บันทึกการประชุมนี้" ปุ่มเดียว นั่นคือประสบการณ์ที่คนส่วนใหญ่ต้องการจริง ๆ
หมายเหตุเฉพาะสำหรับ Zoom
Zoom มีระบบบันทึกในตัวของตัวเองที่สร้างไฟล์วิดีโอและบันทึกการถอดเทป (ใน Zoom Cloud Recording) วิธีนี้ใช้งานได้ดีและฟรีสำหรับแพ็กเกจ Zoom แบบเสียเงิน แต่มีข้อแม้:
- บันทึกการถอดเทปถูกสร้างขึ้นฝั่งเซิร์ฟเวอร์หลังจบการประชุม — ไม่ใช่แบบเรียลไทม์ ไม่ใช่แบบโลคอล
- ใช้ได้เฉพาะเจ้าของการประชุมหรือผู้ที่ได้รับมอบหมายให้บันทึกเท่านั้น
- คุณภาพการถอดเทปพอใช้ได้ ไม่ถึงกับดีเยี่ยม
- พื้นที่จัดเก็บอยู่บนคลาวด์ของ Zoom เว้นแต่คุณจะจ่ายเพิ่มสำหรับการบันทึกแบบโลคอล
ถ้าคุณเป็นเจ้าของการประชุมในแพ็กเกจแบบเสียเงินและไม่ติดที่บันทึกการถอดเทปจะอยู่บนเซิร์ฟเวอร์ของ Zoom นี่คือตัวเลือกที่มีอุปสรรคน้อยที่สุด ถ้าข้อจำกัดเหล่านั้นข้อใดข้อหนึ่งเป็นปัญหา คุณต้องใช้อย่างอื่น
หมายเหตุเฉพาะสำหรับ Google Meet
Google Meet มีการถอดเทปในตัว (เฉพาะแพ็กเกจ Workspace แบบเสียเงินเท่านั้น) และสร้าง Google Docs ที่มีบันทึกการถอดเทปหลังจบการประชุม ข้อแลกเปลี่ยนเหมือนกับ Zoom — ฝั่งเซิร์ฟเวอร์ หลังจบการประชุม อยู่บนคลาวด์ของ Google และโดยทั่วไปเปิดใช้งานได้เฉพาะเจ้าของการประชุมเท่านั้น
ถ้าคุณไม่ได้ใช้แพ็กเกจ Workspace แบบเสียเงิน คุณจะไม่มีการถอดเทปในตัวใน Meet เลย คุณต้องใช้บอทหรือไม่ก็จับเสียงจากฝั่งของคุณเอง
ตัวเลือกแบบโลคอลบน Mac สำหรับทั้ง Zoom และ Meet
แอปที่จับเสียงไมโครโฟน + เสียงระบบบน Mac และสร้างบันทึกการถอดเทป:
Vext — จ่าย $49 ครั้งเดียว โหมดการประชุมจับสตรีมเสียงทั้งสองพร้อมกัน ถอดเทปด้วย Whisper เพิ่มป้ายระบุผู้พูดผ่านการแยกแยะผู้พูด (diarization) แบบโลคอล และสร้างบทสรุปด้วย AI เมื่อจบ ใช้ได้กับ Zoom, Meet, FaceTime, Teams — ทุกอย่างที่สร้างเสียงออกมา เสียงอยู่บน Mac ของคุณ บทสรุปและบันทึกการถอดเทปถูกเก็บไว้ในแอป
MacWhisper — เวอร์ชัน Pro (€64) บันทึกและถอดเทป รวมเข้ากันได้น้อยกว่า Vext สำหรับการประชุม (ไม่มีป้ายระบุผู้พูดในตัวในบางการตั้งค่า) แต่มั่นคงสำหรับการถอดเทปจากไฟล์หากคุณบันทึกด้วยเครื่องมืออื่น
Audio Hijack + การถอดเทปอีกขั้นตอน — Audio Hijack ($64) บันทึกเสียงระบบได้อย่างสะอาด ส่งไฟล์ที่ได้เข้า MacWhisper, Whisper ของ OpenAI หรือเครื่องมือถอดเทปอื่นใด ต้องตั้งค่ามากขึ้น แต่ยืดหยุ่นมากขึ้น
Granola — เป็นโมเดลที่ต่างออกไป บันทึกจาก Mac ของคุณ แต่ส่งเสียงไปยังคลาวด์ของมันเพื่อประมวลผล UX ขัดเกลามาดี สรุปได้รวดเร็ว แต่ไม่ใช่แบบโลคอล คุ้มที่จะกล่าวถึงเพราะคนถามถึงมัน มันไม่อยู่ในกลุ่ม "ไม่มีคลาวด์" หากนั่นคือสิ่งที่คุณต้องการ
Voice Memos ในตัวของ Apple — บันทึกเฉพาะไมโครโฟน จะไม่ได้เสียงของผู้เข้าร่วมคนอื่น มีประโยชน์สำหรับการบันทึกครึ่งหนึ่งของการสนทนาที่เป็นฝั่งของคุณ หากนั่นคือสิ่งที่คุณต้องการ
เส้นแบ่งอยู่ระหว่าง "โลคอลเต็มรูปแบบ" (Vext, MacWhisper, กระบวนการแบบ Audio Hijack) กับ "คลาวด์ที่ขัดเกลา" (Granola, Otter, Fireflies) ทั้งสองแบบมีกรณีการใช้งานที่สมเหตุสมผล
การตั้งค่า Vext สำหรับ Zoom หรือ Meet
กระบวนการที่เราออกแบบมาเพื่อสิ่งนี้:
- ติดตั้ง Vext:
brew install muvon/tap/vext - เปิด Vext แล้วสลับไปที่โหมดการประชุมในแถบเมนู
- เริ่มการประชุม Zoom หรือ Meet ของคุณตามปกติ
- ใน Vext ให้คลิก Start Recording — มันจะจับเสียงไมโครโฟน + เสียงระบบของคุณ
- พูดคุยตลอดการประชุม
- หยุดการบันทึกเมื่อการประชุมจบลง
- Vext ถอดเทปแบบโลคอล (Whisper) สร้างป้ายระบุผู้พูด และสร้างบทสรุป
ไม่มีบอทเข้าร่วมการประชุม ไม่มีผู้เข้าร่วมคนอื่นนอกจากคุณที่เห็นอะไร บันทึกการถอดเทปและบทสรุปถูกเก็บไว้ใน Vext บน Mac ของคุณ
หมายเหตุเชิงปฏิบัติบางประการ:
- ครั้งแรกที่คุณบันทึก macOS จะขออนุญาตเพื่อจับเสียงระบบ ให้อนุญาต (สิ่งนี้ใช้ API จับเสียงของ macOS ไม่ใช่อุปกรณ์เสียงเสมือน — ไม่ต้องใช้ Loopback หรือ BlackHole)
- ป้ายระบุผู้พูดทำงานได้ดีที่สุดเมื่อผู้เข้าร่วมผลัดกันพูดอย่างชัดเจน เสียงพูดที่ทับซ้อนกันนั้นยากสำหรับการแยกแยะผู้พูด คุณจะได้คำพูดมาแต่ป้ายระบุอาจคลุมเครือ
- บทสรุปใช้ LLM แบบโลคอล (Gemma 3 4B โดยค่าเริ่มต้น) คุณภาพพอใช้ได้สำหรับการประชุมทั่วไป — รายการสิ่งที่ต้องทำ การตัดสินใจสำคัญ โครงร่างหัวข้อ ไม่ขัดเกลาเท่ากับ GPT-4 ที่ทำงานเดียวกัน แต่เป็นส่วนตัวและไม่มีค่าใช้จ่ายด้าน API
- ภาพหน้าจอระหว่างการประชุม: คุณสามารถลากเลือกพื้นที่หน้าจอส่วนใดก็ได้ในขณะบันทึก และภาพหน้าจอจะถูกแนบไปกับบันทึกการถอดเทปที่ไทม์สแตมป์ที่ถูกต้อง มีประโยชน์สำหรับสไลด์ โค้ดที่แสดงบนหน้าจอของเพื่อนร่วมงาน หรือการรีวิวงานออกแบบ
สิ่งที่คุณต้องยอมเสียไปเมื่อไม่ใช้บอท
พูดกันตรง ๆ:
บันทึกการถอดเทปที่ใช้ร่วมกัน Otter และ Fireflies ทำให้การแชร์บันทึกการถอดเทปกับทีมเป็นเรื่องง่ายมาก สำหรับเครื่องมือแบบโลคอล คุณส่งออกเป็น TXT/Markdown แล้ววางลงใน Slack หรืออัปโหลดไปยังไดรฟ์ที่ใช้ร่วมกัน อุปสรรคเล็กน้อยแต่มีจริง
การซิงค์เข้า CRM อัตโนมัติ Fireflies และ Granola เขียนบทสรุปบันทึกการถอดเทปลงใน Salesforce, HubSpot ฯลฯ โดยตรง เครื่องมือแบบโลคอลไม่มีการเชื่อมต่อเหล่านี้ คุณสามารถสร้างมันได้ด้วย Zapier และไฟล์ที่ส่งออก แต่นั่นเป็นโปรเจกต์หนึ่งเลย
การค้นหาทั่วทั้งทีม แพ็กเกจสำหรับทีมของ Otter มีคลังที่ใช้ร่วมกันซึ่งค้นหาได้ เครื่องมือแบบโลคอลเก็บบันทึกการถอดเทปไว้บน Mac ของคุณ — ไม่ใช่ในดัชนีที่ใช้ร่วมกันทั่วทั้งทีม
คำบรรยายแบบเรียลไทม์เพื่อการเข้าถึง บอทสร้างคำบรรยายสด ๆ ระหว่างการประชุม เครื่องมือแบบโลคอลถอดเทปหลังจบ หากผู้เข้าร่วมต้องการคำบรรยายสดเพื่อการเข้าถึง ให้ใช้คำบรรยายสดในตัวของ Zoom หรือ Meet หรือใช้ควบคู่กับเครื่องมือทำคำบรรยายแยกต่างหาก
สำหรับการทำงานคนเดียว เรื่องเหล่านี้มักไม่สำคัญ สำหรับการทำงานเป็นทีม ให้ชั่งน้ำหนักดู
สิ่งที่คุณจะได้รับ
ความเป็นส่วนตัว เป็นเรื่องจริง แบบครบวงจร เสียงไม่ออกจาก Mac ของคุณ
ไม่มีค่าสมาชิก จ่าย $49 ครั้งเดียว เทียบกับ $20+/เดือน สำหรับบริการบอท
ความน่าเชื่อถือ ไม่มีบอทให้ถูกเตะออก ไม่มีการจำกัดอัตราการเรียก API ไม่มีบริการล่มที่กระทบบันทึกการถอดเทปของคุณ
สัญญาณแห่งความไว้วางใจ ลูกค้าและพาร์ตเนอร์บางรายชอบใจอย่างจริงจังว่าไม่มีบอทอยู่ในการประชุม โดยเฉพาะอย่างยิ่งในด้านกฎหมาย การดูแลสุขภาพ การเงิน และการเจรจาที่มีการแข่งขัน
ไฟล์ที่สะอาดกว่า ไม่มีไทม์สแตมป์ "Otter Bot ได้เข้าร่วมการประชุม" มีแต่บทสนทนาเท่านั้น
แผนผังการตัดสินใจ
- ใช้ Zoom/Workspace แบบเสียเงิน เป็นเจ้าของการประชุมส่วนใหญ่ และไม่ติดเรื่องการประมวลผลฝั่งเซิร์ฟเวอร์: ใช้การถอดเทปในตัว ประหยัดเงินไป
- มีการประชุมเยอะ การแชร์ทั่วทั้งทีมสำคัญ และไม่ติดเรื่องคลาวด์: Otter, Fireflies, Granola — เลือกสักตัว
- การประชุมเกี่ยวข้องกับเนื้อหาที่อ่อนไหว อยากให้ไม่มีบอท และต้องการการตั้งค่าที่เรียบง่าย: Vext หรือ MacWhisper Pro
- เป็น power user อยากได้ความยืดหยุ่นสูงสุด: Audio Hijack + Whisper
- คุณต้องการแค่ครึ่งหนึ่งของการประชุมที่เป็นฝั่งของคุณ: Apple Voice Memos ฟรี
ในทางปฏิบัติแล้วหน้าตาเป็นอย่างไร
หนึ่งสัปดาห์โดยทั่วไปของคนที่เปลี่ยนจากบอทมาเป็นการถอดเทปการประชุมแบบโลคอล:
- ประชุม 6–10 ครั้งต่อสัปดาห์ ผสมผสานทั้งภายในและภายนอก
- Vext บันทึกทุกครั้ง บันทึกการถอดเทปถูกสร้างขึ้นโดยอัตโนมัติ
- อ่านบทสรุปคร่าว ๆ คัดลอกรายการสิ่งที่ต้องทำลงในตัวติดตามงานอะไรก็ได้
- ค้นหาบันทึกการถอดเทปเฉพาะรายการในภายหลังว่า "เราตัดสินใจอะไรเรื่องราคา"
- เวลารวมที่ใช้หลังจบการประชุม: 2 นาทีต่อการประชุม
สัปดาห์เดียวกันในเวอร์ชันที่ใช้บอทคือ: เชิญบอทเข้ามา ภาวนาให้มันเข้าร่วมได้ รับอีเมลที่มีบันทึกการถอดเทป คลิกเข้าไปที่ Otter คัดลอกรายการสิ่งที่ต้องทำ เวลารวมพอ ๆ กัน ความแตกต่างคือ ใครเห็นบอทอยู่ในการประชุม เสียงไปอยู่ที่ไหน และนโยบายถิ่นที่อยู่ของข้อมูลของทีมพอใจหรือไม่
สำหรับการใช้งานคนเดียวและทีมเล็กส่วนใหญ่ ตัวเลือกแบบโลคอลตอนนี้ดีกว่าอย่างชัดเจน สำหรับองค์กรขนาดใหญ่ การคำนวณซับซ้อนขึ้น และทั้งสองทางเลือกก็ปกป้องได้