OmniHuman1.5

video 即梦

描述

OmniHuman-1.5是字节跳动于2025年8月底发布的AI视频生成模型，为其前身OmniHuman-1的升级版本。该模型基于“全方位条件训练”理念，通过结合单张图像和音频输入生成动态视频。其具备双人音频驱动功能，支持两个数字人同时对戏，还原口型与表情，并能解析语音情绪以匹配相应的表情与肢体语言。该模型支持通过文本提示词控制视频风格和动作，实现长达一分钟以上视频的时序连贯性和角色一致性。

规格

类型视频

模型厂商即梦

模型调用ID

jimeng_realman_avatar_picture_omni_v15

上下文大小 1

最大输入长度 1

最大输出长度 1

每分钟请求数 1

每分钟token处理数 1

价格

默认

按输出收费

输出基础价格 1 / 秒