Привести сырой транскрипт в порядок.
Вставьте стену речи без знаков препинания — автосубтитры YouTube, транскрипт встречи, дамп голосовой заметки — и получите предложения, абзацы и заглавные буквы. Всё на стороне клиента, ничего не уходит с вкладки.
Как это работает (и где не дотягивает)
Это чистая эвристика — без модели, без API, без загрузки. Чистильщик находит границы предложений по словам-маркерам («так», «вот», «ну», «короче»), порогу количества слов и существующей пунктуации. Абзацы разбиваются по маркерам смены темы или примерно каждые 5 предложений. Слова вроде «I», дни недели, названия месяцев и крупные бренды получают заглавную автоматически.
Идеально не будет — чистый JS не понимает смысл и не знает, где на самом деле кончается сложное предложение. Лучший результат: использовать как 90%-ную чистку и проглядеть один раз.
Хотите контекстную чистку, которая исправит грамматику И смысл? Именно это делает режим Enhance в Vext с локальной LLM, пока вы диктуете.
Не чистите потом. Надиктуйте правильно сразу.
Этот инструмент чинит беспорядок постфактум. Режим Enhance в Vext чинит его, пока вы говорите, через маленькую LLM на вашем Mac. Пунктуация, грамматика, слова-паразиты — уйдут до того, как текст попадёт в редактор.