直播预告 | aaai 2022论文解读:基于生成模型的语音/歌声合成与歌声美化 -凯发k8官方网
「ai drive」是由 paperweekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。
本期 ai drive,我们邀请到浙江大学计算机科学与技术学院硕士生刘静林,为大家在线解读其发表在 aaai 2022 的最新研究成果:diffsinger: singing voice synthesis via shallow diffusion mechanism。对本期主题感兴趣的小伙伴,3 月 1 日(本周二)晚 7 点,我们准时相约 paperweekly 直播间。
直播信息
在对声音频谱的建模中,非周期性的参数影响着清音、呼吸声以及浊音的自然度。但这种参数具有不确定性,简单的损失函数很难进行较好的建模。最近两年,生成式模型在声音合成领域崭露头角,本次报告将围绕生成式模型在声音合成中的应用这一话题,介绍该领域的前沿研究。同时,本次报告还会重点介绍近日热度骤增的歌声合成任务,从现代歌声合成的流水线,到现阶段歌声合成中的难点与瓶颈。最后,本次报告会介绍一类新兴任务:歌声美化。
论文标题:
diffsinger: singing voice synthesis via shallow diffusion mechanism
论文链接:
https://arxiv.org/abs/2105.02446
代码链接:
https://github.com/moonintheriver/diffsinger
本次分享的具体内容有:
生成式模型建模声音频谱的前沿研究
歌声合成任务
歌声美化任务
嘉宾介绍
刘静林 / 浙江大学硕士生
刘静林,浙江大学计算机科学与技术学院二年级研究生。2020 年于浙江大学竺可桢学院混合班(计算机科学与技术专业)本科毕业,保至本校攻读硕士研究生。研究方向为自然语言处理,包含:语音&歌声合成、机器翻译、唇语识别&合成,专注于深度生成模型在自然语言处理中的应用。在 aaai、acl、neurips 等国际人工智能顶级会议上发表论文 10 余篇。相关开源仓库收到学术界与工业界的广泛关注。
直播地址 & 交流群
本次直播将在 paperweekly 视频号和 b 站直播间进行,扫描下方海报二维码或点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 qa,在 paperweekly 微信公众号后台回复「ai drive」,即可获取入群通道。
视频号直播间:
扫描下方二维码关注 paperweekly 视频号,第一时间获取开播提醒。
b 站直播间:
https://live.bilibili.com/14884511
凯发k8官方网的合作伙伴
🔍
现在,在「知乎」也能找到我们了
进入知乎凯发k8官方网首页搜索「paperweekly」
点击「关注」订阅我们的专栏吧
·
总结
以上是凯发k8官方网为你收集整理的直播预告 | aaai 2022论文解读:基于生成模型的语音/歌声合成与歌声美化的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇:
- 下一篇: