全球指数

商汤-W(0020.HK):商汤发布流式多模态交互大模型「日日新5.5」 国内首次对标GPT-4O

海通证券股份有限公司2024-07-14
流式多模态交互大模型「日日新5.5」发布,国内首次对标GPT-4o。7 月5日,商汤科技在WAIC 2024 举办“大爱无疆·向新力”人工智能论坛,发布国内首个具备流式原生多模态交互能力大模型「日日新SenseNova 5.5」,综合性能较两个月前的「日日新5.0」提升30%,交互效果和多项核心指标实现对标GPT-4o。「日日新5.5」主要更新点包括:(1)6000 亿参数基模型性能全面提升。大量使用合成高阶思维链数据,提升推理思维能力,在数理逻辑、英文、指令跟随等方面能力增强明显。(2)率先推出国内首个“所见即所得”模型「日日新5o」,流式多模态交互,带来全新AI 交互模式。
(3)端侧模型全面升级,发布「日日新5.5 Lite」,相比4 月5.0 版模型精度提升10%,推理效率提升15%,首包延迟降低40%。特别是在多模态能力上,「日日新5.5」在大部分核心测试集指标上都对标甚至超过GPT-4o。
AI 大模型演进中,创新的交互模式将率先定义行业发展。通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,「日日新5o」带来了实时的流式多模态AI 交互体验。使用感受如同人类自己交流一样直接,可以直接见客户所见,理解客户所需。这种交互模式多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出。从场景理解分析、物体信息描述、书籍图文总结,甚至粗糙的简笔画、面部情绪,「日日新5o」都能精准拿捏,丝滑交互,还能言语俏皮的与人做互动。
高度关注端侧AI 和行业应用,AI 商业落地加速中。在商汤看来,要让每个人都能用上AI 大模型就必须从终端开始。「日日新5.5 Lite」端侧大语言模型「商量SenseChat Lite-5.5」各维度全面升级,是目前综合性能最好的端侧模型。同时,配合端云模式,既保障性能,又保障速度。目前,商汤「日日新」端侧模型已深入各个行业,与超过150+客户启动商业对接,覆盖智能手机、平板电脑、VR 一体机、车载电脑、智能台灯等诸多IoT 设备部署应用。
接入商汤「日日新·商量」端侧大模型,单台设备成本低至9.9 元/每年。商汤端侧大模型拥有多项优势,包括:(1)可支持。多种垂直业务方向,如写作、百科知识等不同领域优化。(2)可用性。同时支持端侧部署及云侧调用。
(3)低门槛。端侧SDK 集成简易,可支持快速部署。目前,商汤“日日新”大模型体系已经在大量应用场景和垂直行业中发挥实际价值:编程领域,通过大模型提供智能代码补全等功能,可显著提升程序员日常工作效率;医疗领域,从诊前的预问诊,到健康咨询再到诊后随访,大模型的赋能改善患者就医全流程体验;金融领域,商汤已在多模态、多场景与银行、保险、券商和资管客户展开合作;消费领域,商汤与多家国内头部厂商合作,将大模型能力转化为场景化服务,例如通过Copilot 帮助用户进行表格生成、数据分析、文案写作,提升个人生产力。此外,为帮助更多企业用户低门槛接入,商汤于近期推出“大模型0 元Go”计划。凡「日日新」新注册用户,将获得涉及调用、迁徙、训练等多项免费服务大礼包,同时免费赠送5000 万Tokens包,并派出专属搬家顾问提供从OpenAI 到「日日新」的迁移系列培训。
可控人物视频生成大模型Vimi 发布,AI+视频2C 落地加速中。根据Vimi 相机官微,商汤在WAIC 2024 上发布了首个可控人物视频生成大模型——Vimi,并入选WAIC 展览展示最高荣誉“镇馆之宝”,成为本届大会最具创新展品。
Vimi 基于商汤日日新大模型的强大能力,仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频,不仅能实现精准的人物表情控制,还可实现在半身区域内控制照片中人物的自然肢体变化。并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。Vimi 模型的优势在于其多年积累的面部跟踪技术和对人脸细节的精准控制,使得人物的表情更加鲜活。与市场上其他模型相比,Vimi 在人脸和上半身的控制上更为精准,能够生成具有高一致性和光影和谐的视频。此外,Vimi 具备极强的稳定性,尤其在长视频的情景下,能够稳定保持人物的脸部可控,可生成长达1 分钟以上的单镜头人物类视频,画面效果不会随着时间的变化而劣化或失真,真正满足娱乐互动等需要长时间稳定视频生成需求。Vimi 在人物视频场景生成中,可以做到整个的环境都跟着肢体的控制去变化,包括生成合理的头发的抖动。甚至能够模拟输入镜头角度,比如输入镜头是逐渐拉近,输出也能有自然地逐渐拉近的效果。自然流畅的头发飘动、服饰变换以及背景环境的营造,Vimi 都能一一呈现,让生成的视频更加逼真、生动。此外,它还支持光影变化的模拟,让视频中的每一个场景都充满电影级的质感。Vimi 模型特别是在长视频情景下能够稳定保持人物脸部可控。此外,Vimi 模型还能够控制镜头角度和生成合理的头发抖动效果,为视频创作者提供了更多的创作自由度。Vimi 相机是Vimi 可控人物视频大模型体系的第一款C 端产品,能够满足广大女性用户的娱乐创作需求。用户只需上传不同角度的高清人物图片,即可自动生成数字分身和不同风格的写真视频,提供唯美写真风、奇幻风等多种生成风格,让用户仿佛穿越不同次元,享受大片质感的沉浸式视觉效果。对于热衷表情包的用户来说,Vimi 相机通过单张图片即可驱动生成各种趣味的人物表情包,玩法多样,实现创作自由。我们认为,此次Vimi 的发布,推动公司在AI+视频领域进入到了新时期, Vimi 的功能进一步拓宽了AI 大模型应用的边界,为公司业务的拓展奠定了坚实基础。
「Sensechat 」发布香港本土版,AI 落地愈发瞄准细分市场。7 月,商汤「Sensechat 」手机App 及网页版向香港用户免费开放。「Sensechat 」基于商汤今年5 月推出的“商量多模态大模型粤语版”。依托商汤“日日新”出色语言和多模态能力,以及对粤语及本地文化、热点的深入理解,「Sensechat」定位为“香港用户的贴心小棉袄”,用户可以直接用最熟悉的广东话跟它聊天,直接文字或语音输入,问问题、搜东西、生成图片、写文案。从生活、学习到工作,「Sensechat」都能带来真正地道的AI 体验,连本地最新信息和社会热门话题,它都十分清楚,甚至还会灵活使用本地流行语。通过App Store 下载「Sensechat」iOS 手机App,使用香港手机号或电子邮件注册,即可随时随地免费体验最智能、快捷、地道的AI 体验,Android 版本亦即将很快推出。「Sensechat」App 支持文字或语音输入,体验方便,主要功能包括:(1)本地化体验。「Sensechat」对香港本地文化、风俗习惯和社会热门话题都有深入了解。
用户可在手机App 中以广东话混合英文与「Sensechat」自然顺畅地进行问答。(2)多模态问答。用户可直接上载文件或图片「Sensechat」就能深入分析内容,生成摘要并解答用户对文件的问题。(3)实时搜索。「Sensechat」能整合多个信息来源,让用户能快速获取最新信息,包括实时新闻、天气状况等用户亦可进行进一步搜索。(4)图像生成。
只需简单描述,「Sensechat」即可快速生成各种风格图片,让用户实时与朋友分享,或上传到自己的社交平台,让创作变得更随心随意。(5)文案撰写。无论是广告文案、商业计划书还是学术写作,用户都能通过「Sensechat」获取专业的文案建议,激发写作灵感。此外,「Sensechat」网页版拥有强大的多模态文件处理能力,和超长文本理解、思考、生成能力,支持上载最多50 个文件。无论想问生活小窍门,还是解数学题、分析图片、编写代码,「Sensechat」网页版都能轻松搞定。我们认为,「Sensechat 」香港本土版的发布,是公司在细分市场落地的重要尝试,对粤语环境的适应也从侧面凸显了公司大模型领先的技术实力,公司未来AI 商业落地值得期待。
与华为积极合作,昇腾助力商汤AI 落地。WAIC 2024 期间,昇腾人工智能产业高峰论坛2024 成功举办,聚焦大模型推理和客户伙伴优秀实践,探索加速大模型创新与应用落地之路。商汤科技联合创始人、大装置事业群总裁杨帆受邀出席并发表主题演讲《生态互联引领大模型时代创新浪潮》,分享了商汤日日新大模型体系基于昇腾AI 基础软硬件平台的全栈技术能力原生开发实践,引领大模型时代创新浪潮。原生开发作为加速AI 创新的重要引擎,正逐渐成为行业焦点。商汤科技大模型研究总监龚睿昊受邀出席“昇腾AI 伙伴原生开发成果发布”,商汤大装置将与合作伙伴一起,共同推动技术创新与产业融合发展。值得一提的是,在WAIC 2024 商汤人工智能论坛上,举办了昇腾原生模型合作签约仪式,商汤科技与华为技术有限公司签署合作协议,推动大模型的原生开发迈向新的台阶。从基础设施的构建,到大模型的突破,再到应用的繁荣,都离不开上下游生态的紧密协同。在过去一年多时间里,商汤与昇腾、昇思团队进行了紧密的合作,共同构建下一代大模型底座和大模型训练新生态。例如,商汤能够在超过三千卡的集群上,跑出行业领先的算力利用率,从而能够以性能更高、效率更高的集群能力服务下游企业。此前,商汤大装置AI 云、日日新·商量大语言模型、商汤医疗大模型“大医”均通过了与Atlas 系列服务器的相互兼容性测试,能够为客户提供更为安全、高效、可靠的人工智能全栈解决方案和应用体验。杨帆表示,“商汤的平台、算法以及行业场景的软件能力与昇腾的硬件、底层基础软件能力的深度整合,将为未来人工智能服务各个行业和产业提供更大的价值和更多样化的解决方案。”未来,商汤还将继续深化与华为的合作,打造出更加高效、低成本、低门槛的人工智能基础设施,更好地服务更多行业、更多场景,给个人消费者和企业带来更多更好的智能化服务,推动中国人工智能技术和产业的持续发展。我们认为,公司通过跟华为积极合作,获得了重要的国产算力伙伴,伴随昇腾生态的发展,商汤AI 落地也有望得到重要助力。
盈利预测与投资建议。我们认为,此次流式多模态交互大模型「日日新5.5」的发布,在国内首次实现了对标GPT-4o,这进一步彰显了商汤强大的技术能力,这也奠定了AI 商业落地的坚实基础,而Vimi 的发布,更是带动公司AI+视频业务进入新时期,伴随未来日日新模型的持续迭代,带动公司相关AI 应用的持续发展,公司全新增长空间已经打开,未来发展值得期待。我们综合各类因素,给予商汤集团2024 年16-20 倍PS,对应公司合理价值区间2.27-2.84 港元(1港元= 0.9315 人民币),给予“优于大市”评级。
风险提示。AI 商业化不及预期的风险;公司国际化拓展不及预期的风险等。

免责声明

以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。

推荐阅读

暂无数据

公司动态

    暂无数据

盘面综述

    暂无数据

IPO动态

    暂无数据

港股涨幅榜
  • 港股通
  • 红筹股
  • 国企股
  • 科技股
  • 名称/代码
  • 最新价
  • 涨跌幅

暂无数据

扫码关注

九方智投公众号

扫码关注

九方智投公众号