歌声专用模型 · 上传清唱/干声 → 训练 → 用于 AI 翻唱
不支持纯说话素材训「讲话音色」;请上传可哼唱、带音高的干声。 每位用户同时最多 1 个训练任务。
头像(可选)
为你的声音模型上传头像
音频文件
上传你本人或已授权的歌声干声(MP3、WAV、M4A、FLAC、ZIP 等),单次最多 10 个有效文件(ZIP 会自动解压)。
素材类型*
人声分离质量
成品歌/带伴奏素材建议选高质量;会优先使用 RoFormer 分离器,提高训练素材干净度。
训练前自检
自动素材处理
上传后:按需高质量人声分离 → 长静音裁剪 → VAD 拼接有效干声 → 去混响 + 响度归一 → 约 6 秒切片。 短数据训练会自动降低轮数上限、增加 checkpoint 试听密度。
训练档位*
按预估有效干声选择轮数;素材少时不要盲目选 320 轮。
支持的语言
暂无声音模型
上传 6-15 分钟清晰人声样本训练,或者直接导入已有的 .pth 模型