xiaohack's Blog

xiaohack博客专注前沿科技动态与实用技术干货分享，涵盖 AI 代理、大模型应用、编程工具、文档解析、SEO 实战、自动化部署等内容，提供开源项目教程、科技资讯日报、工具使用指南，助力开发者、AI 爱好者获取前沿技术与实战经验。

分享自己训练的音乐分轨分离模型，已上传 HuggingFace，能一行代码拉取调用

研究了几个月的 BS-RoFormer 音乐分轨分离，训练出了效果让自己都大吃一惊的模型。

模型和推理代码上传到了 HuggingFace Hub： HiDolen/Mini-BS-RoFormer-V2-46.8M · Hugging Face

用两块 4090 在 MUSDB18-HQ 数据集上训练了两天。比同体积模型效果更好、运算量更低。

分离贝斯、鼓、其他和人声四个轨道，可以把人声以外的三轨合并起来当伴奏。适配 transformers 库，一行 Python 代码就能拉下来使用。

model = AutoModel.from_pretrained(
    "HiDolen/Mini-BS-RoFormer-V2-46.8M",
    trust_remote_code=True
).to("cuda")        # 非常推荐用 GPU 推理，速度快得多

详细使用方式在 HuggingFace 查看。

感谢佬友们的公益，跌跌撞撞 vibe 出了个试听页面： Mini-BS-RoFormer-V2

📌 转载信息

原作者：
Chirp

转载时间：
2025/12/30 10:34:16