2025-02-06 19:00

字节跳动发布OmniHuman-1，可从单张照片生成逼真视频

摘要

神经日报 2月6日消息，据 Forbes 报道，TikTok 母公司字节跳动推出 AI 工具 OmniHuman-1，可从单张照片生成高度逼真的视频，包括人物说话、手势、演奏乐器等动态画面。研究论文指出，该技术在弱信号输入（如音频）下表现优异，支持任何比例的图像输入（头像、半身或全身），并生成高质量的逼真视频。在展示页面，OmniHuman-1 还复现了历史人物，如爱因斯坦在黑板前演讲的视频，呈现

神经日报 2月6日消息，据 Forbes 报道，TikTok 母公司字节跳动推出 AI 工具 OmniHuman-1，可从单张照片生成高度逼真的视频，包括人物说话、手势、演奏乐器等动态画面。

研究论文指出，该技术在弱信号输入（如音频）下表现优异，支持任何比例的图像输入（头像、半身或全身），并生成高质量的逼真视频。在展示页面，omni H UMAn-1 还复现了历史人物，如爱因斯坦在黑板前演讲的视频，呈现自然的面部表情和手势。

南加州大学传播学院教授 Freddy Tran Nager 评价该技术“非常令人印象深刻”，并表示如果用于手机等小屏幕上，效果尤为真实。

声明：文章不代表神经日报观点及立场，不构成本平台任何投资建议。投资决策需建立在独立思考之上，本文内容仅供参考，风险自担！当前页面地址：https://www.nervedaily.com/kuaixun/81556.html