11月26日|据路透,英伟达周一展示了一种用于生成音乐和音频的新型人工智能模型,该模型能够修改声音并生成新的声音效果,面向音乐、电影和视频游戏的制作者。该技术被称为Fugatto,是Foundational Generative Audio Transformer Opus 1的缩写。Fugatto能够根据文本描述生成音效和音乐,包括将钢琴演奏转换成人声歌唱,或改变录音的口音和情绪。该新模型是基于开源数据训练的,英伟达表示仍在讨论是否以及如何公开发布这项技术。生成式人工智能模型的创建者尚未确定如何防止发生技术滥用,例如生成错误信息或侵犯版权。OpenAI和Meta同样没有透露计划何时向公众发布其生成音频或视频的模型。
新闻来源 (不包括新闻图片): 格隆汇