2025-02-06 19:00
热度 0

字节跳动发布OmniHuman-1,可从单张照片生成逼真视频

摘要
神经日报 2月6日消息,据 Forbes 报道,TikTok 母公司字节跳动推出 AI 工具 OmniHuman-1,可从单张照片生成高度逼真的视频,包括人物说话、手势、演奏乐器等动态画面。研究论文指出,该技术在弱信号输入(如音频)下表现优异,支持任何比例的图像输入(头像、半身或全身),并生成高质量的逼真视频。在展示页面,OmniHuman-1 还复现了历史人物,如爱因斯坦在黑板前演讲的视频,呈现

神经日报 2月6日消息,据 Forbes 报道,TikTok 母公司字节跳动推出 AI 工具 OmniHuman-1,可从单张照片生成高度逼真的视频,包括人物说话、手势、演奏乐器等动态画面。

研究论文指出,该技术在弱信号输入(如音频)下表现优异,支持任何比例的图像输入(头像、半身或全身),并生成高质量的逼真视频。在展示页面,omniHUMAn-1 还复现了历史人物,如爱因斯坦在黑板前演讲的视频,呈现自然的面部表情和手势。

南加州大学传播学院教授 Freddy Tran Nager 评价该技术“非常令人印象深刻”,并表示如果用于手机等小屏幕上,效果尤为真实。

声明:文章不代表神经日报观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!当前页面地址:https://www.nervedaily.com/kuaixun/81556.html
回顶部