(资料图片)
据 Arxiv 页面显示,来自加州大学、蒙特利尔大学等多所高校的研究者近日联合发表论文,介绍了一款名为MusicLDM 的文本生成音乐模型。
该模型利用 Stable Diffusion 和 AudioLDM 架构,通过在音乐数据样本集上重新训练对比性语言-音频预训练模型(CLAP)和Hifi-GAN声码器来实现。为了解决训练数据和版权问题,研究团队提出了两种不同的混合策略:节拍同步音频混合和节拍同步潜在混合,通过重新组合训练音频或通过潜在嵌入空间来生成新的音乐。使生成的音乐更多样化,同时仍忠于相应的风格。
研究显示,MusicLDM 改善了生成音乐的质量和新颖性,以及提示文本和生成音乐之间的关联性。
关键词:
冰轮环境亮相第四届CDI开发区创新发展大会 2023·第四届 CDI开发区创新发展大会 8月3日,由商务部投资促进
中海企业将赎回全部“21中海05”并摘牌 债券规模5亿元 “21中海05”发行规模5亿元,票面利率为2 75%,期限4年,附第2年末发行
【2023重走中国西北角】昌吉:做活夜间经济 赋能经济发展新活力 7月7日至7月12日,兰州大学新闻与传播学院联合中国甘肃网推出的第十三
iPhone15被曝9月22日上市,苹果正将生成式AI引入手机平板 据彭博社资深记者马克·古尔曼最新爆料,苹果公司将在9月12日或13日举
研发费用加计扣除新规落地 重庆减免企业所得税27亿元 中新网重庆8月7日电(陈颖 梁钦卿)今年7月,研发费用税前加计扣除政
内蒙古赤峰发生交通事故,疑似三人遇难,警方:具体情况正在调查中 大象新闻记者王泽群视频报道8月7日,内蒙古赤峰发生一起交通事故,现场
湖人续约浓眉等于留住詹姆斯?美媒:两支球队仍有机会挖走老詹 随着湖人和浓眉完成3年1 86亿美元的提前续约,他的合同将持续到2027-28