这是一个视频翻译配音工具,能够将一种语言的视频翻译成目标语言的视频,并自动生成和添加相应的字幕及配音。语音识别采用的是更快 Whisper 和 OpenAI Whisper 离线模型。文字翻译支持 Microsoft、Google、百度、腾讯、Ch*tg*t、Azure、Gemini、DeepL、DeepLX 以及离线翻译OTT等多种服务。文字合成为语音的功能包括 Microsoft Edge TTS、OpenAI TTS-1、Elevenlabs TTS 自定义TTS服务器API,结合Clone-Voice 可实现原音色克隆配音。此外,还允许保留背景音乐等元素(基于 UVR5)。
优化更新如下:修复并优化了 AzureTTS 配音功能,一次可以批量合成200条字幕;优化了视频结尾部分的处理;进一步优化了字幕翻译的质量。