4 月15 日,快手可灵AI 举行“灵感成真”2.0 模型发布会,宣布基座模型再次升级,面相全球正式发布可灵2.0 视频生成模型及可图2.0 图像生成模型。可灵AI 过去一年保持快速迭代速度,用户量迅速增长,综合实力位于全球图生视频赛道榜首。可灵AI 自2024 年6 月发布以来,已累计完成超20 次迭代。截至2025 年4月,全球用户规模突破2200 万,MAU 增长超25 倍,累计生成1.68 亿个视频及3.44 亿张图片素材。根据Artificial Analysis 的全球视频生成大模型榜单(25 年3月),快手可灵1.6pro(高品质模式)以1000 分的Arena ELO 基准测试评分登陆图生视频赛道榜首。
快手可灵始终把模型效果视为核心,全新2.0 基模质量明显提升。可灵2.0 模型有更强的语义响应能力、更优的动态质量以及更好的画面美学,其底层技术创新点在于:(1)全新设计的视频生成基础模型,包括全新设计DiT 架构使视觉和文本模态的融合更对齐、全新设计的VAE 使复杂动态场景下过渡更顺畅、首次系统性研究视频生成DiT 架构的Scaling Law;(2)全面升级训推策略,强化对复杂运动、主体交互的生成能力,以及对运镜语言、构图术语等专业表达的理解响应能力。可灵2.0内部测评,在文生视频领域和Veo2、Sora 的胜负比均达到200%以上,在图生视频领域和Veo2、Runway 的胜负比均达到180%以上,持续保持领先。可图2.0 模型在指令遵循、电影质感及艺术风格表现等方面显著提升。其底层技术创新点在于:
(1)全面升级的文本表征处理链路,提升文本图像对齐能力;(2)全面升级的数据体系和多样性,探索后训练阶段的Scaling Law;(3)全新提示词工程去噪策略,优化模型创造力和稳定性。可图2.0 内部测评,和Midjourney V7 胜负比对比达300%以上、对比Reve 达193%、对比FLUX1.1 达152%。
提出AI 视频生成全新交互理念MVL(multi-modal visual language),上线多模态编辑产品。MVL 由TXT(Pure Text,语义骨架)和MMW(Multi-modaldocumentas a Word,多模态描述词)组成,通过图片、视频、声音、运动轨迹等多种模态输入,帮助精准实现AI 创作者的创意表达。我们认为该项能力在实际工业场景运用中意义重大,能够进一步辅助AI 内容创作的降本提效。
25 年商业化情况值得期待,可灵重构广告营销、专业创作、影视、娱乐创意等多行业。目前可灵除了C 端订阅用户,B 端已与小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业建立合作关系,全球共有超1.5 万名开发者将可灵API 应用于不同的行业场景中。
我们维持此前预测,预计24-26 年公司经调整归母净利润为177/194/229 亿元。参考可比公司,维持此前给予公司25 年16xPE 估值,25 年经调整净利润194 亿元,对应合理价值为3,107 亿CNY/ 3,345 亿HKD(汇率0.929),目标价77.61 港元/股,维持“买入”评级。
风险提示 宏观消费恢复不及预期,国内商业化效率不及预期,海外业务亏损加大