index-tts-lora

index-tts-lora index-tts-lora Bilibili

1 分钟阅读

index-tts-lora

index-tts-lora项目基于Bilibili的index-tts模型,专注于为单说话人和多说话人场景提供LoRA微调解决方案,旨在显著提升高质量说话人音频合成的韵律和自然度。其核心功能涵盖了音频token和说话人条件提取、训练以及推理流程。项目通过展示多语言(包括中文、英文及混合语种)的语音合成示例,验证了其在生成自然流畅语音方面的能力,并通过模型评估结果展现了其在主流TTS模型中的竞争力。