11月26日|據路透,英偉達週一展示了一種用於生成音樂和音頻的新型人工智能模型,該模型能夠修改聲音並生成新的聲音效果,面向音樂、電影和視頻遊戲的製作者。該技術被稱為Fugatto,是Foundational Generative Audio Transformer Opus 1的縮寫。Fugatto能夠根據文本描述生成音效和音樂,包括將鋼琴演奏轉換成人聲歌唱,或改變錄音的口音和情緒。該新模型是基於開源數據訓練的,英偉達表示仍在討論是否以及如何公開發布這項技術。生成式人工智能模型的創建者尚未確定如何防止發生技術濫用,例如生成錯誤信息或侵犯版權。OpenAI和Meta同樣沒有透露計劃何時向公眾發佈其生成音頻或視頻的模型。
新聞來源 (不包括新聞圖片): 格隆匯