分享自己训练的音乐分轨分离模型,已上传 HuggingFace,能一行代码拉取调用
研究了几个月的 BS-RoFormer 音乐分轨分离,训练出了效果让自己都大吃一惊的模型。
模型和推理代码上传到了 HuggingFace Hub: HiDolen/Mini-BS-RoFormer-V2-46.8M · Hugging Face
关于模型
用两块 4090 在 MUSDB18-HQ 数据集上训练了两天。比同体积模型效果更好、运算量更低。
分离贝斯、鼓、其他和人声四个轨道,可以把人声以外的三轨合并起来当伴奏。适配 transformers 库,一行 Python 代码就能拉下来使用。
model = AutoModel.from_pretrained(
"HiDolen/Mini-BS-RoFormer-V2-46.8M",
trust_remote_code=True
).to("cuda") # 非常推荐用 GPU 推理,速度快得多 详细使用方式在 HuggingFace 查看。
试听
感谢佬友们的公益,跌跌撞撞 vibe 出了个试听页面: Mini-BS-RoFormer-V2
评论区(暂无评论)