智通财经APP获悉,6月22日,阿里巴巴(09988,BABA.US)正式发布视频生成模型HappyHorse 1.1。基于用户在实际创作过程中的真实需求与反馈,HappyHorse 1.1 围绕动态表现力、主体一致性、指令遵循、视觉呈现质量、音频表达能力等维度进行了系统升级,进一步提升模型在专业内容生产场景中的创作质量、可控性与应用效率。
通过强化模型对多源参考图信息的理解与融合能力,HappyHorse 1.1的多图参考生视频(R2V)能力显著提升了生成视频与参考素材之间的一致性,在商品、角色、场景等复杂创作需求下,实现更精准的视觉还原。包括商品细节与品牌元素精准保持、角色与场景灵活组合并保持主体稳定、多分镜与 N 宫格参考理解增强等。
通过强化长上下文语义理解、场景规划能力与角色关系建模,HappyHorse 1.1 显著提升了复杂 Prompt 下的指令遵循能力与镜头编排稳定性,能够更准确地理解用户创作意图,并完成多场景、多角色的连贯演绎。无论是简短描述还是复杂叙事输入,模型都能生成更加丰富、自然且符合预期的视觉表达。
据了解,HappyHorse是阿里巴巴自研的原生多模态AI视频生成大模型,采用150亿参数单流Transformer架构,将文本、图像、视频、音频统一编码,实现原生音视频同步生成。自4月27日发布以来,HappyHorse 1.0 已广泛应用于短剧制作、电商广告、品牌营销、游戏CG等核心内容生产场景。
目前,HappyHorse官网、阿里云百炼和千问云均已接入最新版本。此外,该模型全部能力同步开放API调用,面向企业级客户与开发者提供完整的集成方案。