OmniHuman1.5

OmniHuman1.5

video 即梦
API文档

描述

OmniHuman-1.5是字节跳动于2025年8月底发布的AI视频生成模型,为其前身OmniHuman-1的升级版本。 该模型基于“全方位条件训练”理念,通过结合单张图像和音频输入生成动态视频。 其具备双人音频驱动功能,支持两个数字人同时对戏,还原口型与表情,并能解析语音情绪以匹配相应的表情与肢体语言。该模型支持通过文本提示词控制视频风格和动作,实现长达一分钟以上视频的时序连贯性和角色一致性。


规格

类型 视频
模型厂商 即梦
模型调用ID
jimeng_realman_avatar_picture_omni_v15
上下文大小 1
最大输入长度 1
最大输出长度 1
每分钟请求数 1
每分钟token处理数 1

价格

默认

按输出收费
输出基础价格 1 / 秒