研究了几个月的 BS-RoFormer 音乐分轨分离,训练出了效果让自己都大吃一惊的模型。

模型和推理代码上传到了 HuggingFace Hub: HiDolen/Mini-BS-RoFormer-V2-46.8M · Hugging Face

关于模型

用两块 4090 在 MUSDB18-HQ 数据集上训练了两天。比同体积模型效果更好、运算量更低。

分离贝斯、鼓、其他和人声四个轨道,可以把人声以外的三轨合并起来当伴奏。适配 transformers 库,一行 Python 代码就能拉下来使用。

model = AutoModel.from_pretrained(
    "HiDolen/Mini-BS-RoFormer-V2-46.8M",
    trust_remote_code=True
).to("cuda")        # 非常推荐用 GPU 推理,速度快得多 

详细使用方式在 HuggingFace 查看。

试听

感谢佬友们的公益,跌跌撞撞 vibe 出了个试听页面: Mini-BS-RoFormer-V2


📌 转载信息
原作者:
Chirp
转载时间:
2025/12/30 10:34:16