花時計と夢(东方同人曲伴奏)

[复制链接]
查看74 | 回复0 | 17 小时前 | 显示全部楼层 |阅读模式
本帖最后由 如月风铃 于 2025-7-4 01:01 编辑


cover.jpg
花钟与梦是Yonder Voice社团在2009年参与东方project同人创作活动,由瑶山百灵演唱的一首歌
由于找不到伴奏,我使用最新的msst人声伴奏分离模型进行分离得到音频
使用Ensemble High Instrumental Fullness (2025.06) 模型
处理音频 瑶山百霊、Yonder Voice - 花時計と夢 (花钟与梦).flac

原音频质量:从酷狗下载的无损音质36.6MB的kgma文件,经过网站的解密后转为flac格式仍保留36.6MB。我不知道为什么酷狗的加密文件大小会不变?

下面是该合奏分离模型的通用数据集测试指标
Instrum fullness:34.79
Instrum bleedless:41.47
Instrum SDR:17.69
Instrum L1Freq:40.51

可以看到,sdr>>10,fullness>>20,bleedlees>>20
从纸面数据来看说明该模型分离的伴奏已经极其接近原伴奏
实际测试的时候使用反相法处理分离的伴奏,然后叠加原曲——混音结果带有人声和少量清晰的伴奏
说明分离过程有少量能量损失或者相位偏移,但并没有引入新噪声

这个伴奏应该是ok的,但想吐槽一点:
为啥附件只支持上传小于5M的音频,比github的25M还抠门。如果引用音乐的话又需要自己注册个域名生成外链不划算
我的伴奏分离后差不多60M,就算从flac转换为mp3也有13m。更何况我并不想把一个无损格式的音频转为有损格式,那样会损失音质
现在的歌曲质量稍微好一点的不随便几十上百m吗,作为开源社区的一份子,希望帖子的运营方能够重视附件大小这个问题

回复

使用道具 举报

2

主题

2

回帖

12

积分

初出茅庐

积分
12
QQ