阿里巴巴(09988)发布视频生成模型HappyHorse 1.1 对五大维度进行系统升级

智通财经APP获悉，6月22日，阿里巴巴(09988,BABA.US)正式发布视频生成模型HappyHorse 1.1。基于用户在实际创作过程中的真实需求与反馈，HappyHorse 1.1 围绕动态表现力、主体一致性、指令遵循、视觉呈现质量、音频表达能力等维度进行了系统升级，进一步提升模型在专业内容生产场景中的创作质量、可控性与应用效率。

通过强化模型对多源参考图信息的理解与融合能力，HappyHorse 1.1的多图参考生视频(R2V)能力显著提升了生成视频与参考素材之间的一致性，在商品、角色、场景等复杂创作需求下，实现更精准的视觉还原。包括商品细节与品牌元素精准保持、角色与场景灵活组合并保持主体稳定、多分镜与 N 宫格参考理解增强等。

通过强化长上下文语义理解、场景规划能力与角色关系建模，HappyHorse 1.1 显著提升了复杂 Prompt 下的指令遵循能力与镜头编排稳定性，能够更准确地理解用户创作意图，并完成多场景、多角色的连贯演绎。无论是简短描述还是复杂叙事输入，模型都能生成更加丰富、自然且符合预期的视觉表达。

据了解，HappyHorse是阿里巴巴自研的原生多模态AI视频生成大模型，采用150亿参数单流Transformer架构，将文本、图像、视频、音频统一编码，实现原生音视频同步生成。自4月27日发布以来，HappyHorse 1.0 已广泛应用于短剧制作、电商广告、品牌营销、游戏CG等核心内容生产场景。

目前，HappyHorse官网、阿里云百炼和千问云均已接入最新版本。此外，该模型全部能力同步开放API调用，面向企业级客户与开发者提供完整的集成方案。