<匯港通訊> 商湯(00020)在上海世界人工智能大會(WAIC 2024)上,發布首個「可控」人物視頻生成大模型Vimi,主要面向C端用戶,支持聊天、唱歌、舞動等多種娛樂互動場景。
商湯介紹指,Vimi可穩定生成長達1分鐘的單鏡頭人物類視頻,畫面效果不會隨着時間的變化而劣化或失真。Vimi基於商湯日日新大模型,通過一張任意風格的照片就能生成和目標動作一致的人物類視頻,可通過已有人物視頻、動畫、聲音、文字等多種元素進行驅動。 (ST)
#商湯 #Vimi
新聞來源 (不包括新聞圖片): 滙港資訊