谷歌推出多模态 VLOGGER AI:让静态肖像图动起来“说话”

3 月 19 日消息,谷歌近日在 GitHub 页面发布博文,介绍了 VLOGGER AI 模型,用户只需要输入一张肖像照片和一段音频内容, 该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。 VLOGGER AI 是一种适用于虚拟肖像的多模态 Diffusion 模型,使用 ME[查看全文]
游客
验证码: 点击我更换图片
共 0 页/0条记录