旷视鸿图系列是面向企业空间的数字化管理需求的业务算法一体机。以轻量化服务器 + 高性能算力模块为硬件载体,搭载轻量化应用,将算法、算力、应用,融合于一体,形成安防和通行业务闭环,从而提升企业空间的管理效率、安全性和人本体验。旷视鸿图可与旷视的边缘侧、终端侧产品进行完美配合,也可利旧客户原有的视频监控设备,为上层行业应用提供 AI 基础应用支撑。
“SenseAvatar商汤如影AI视频生成平台”依托“SenseNova商汤日日新”大模型能力,可以进行数字人形象个性化定制并呈现逼真的口型、表情和动作,同时具备AI文案生成等功能,帮助企业及个人轻松创作数字人短视频。 商汤对在“如影”平台创作的数字人进行严格的可信认证,确保其不被盗用或篡改,打造“可信数字人”,促进行业健康发展。
可控人物视频生成算法模型Vimi是可控人物视频生成AIGC产品。基于商汤日日新大模型能力,它可以通过动作视频、动画、声音、文字等多种驱动元素来驱动人物类图片,从而生成和目标动作一致的人物类视频。除了可控性外,Vimi在生成人物稳定性、生成视频时长上,也突破了其它大模型AI视频生成的限制,可以稳定的生成分钟级的单镜头人物视频。与常规图片表情控制类技术只能控制头部表情动作不同,可控人物视频生成算法模型Vimi不但可以控制人物表情,还可以控制肢体动作,并生成合理的头发、服饰、背景,并支持光影变化,是稳定的可控人物视频生成产品。
应用于3D模型生成场景,服务于企业端客户,根据输入的人体运动的图像、视频或人体骨骼模型序列,生成3D模型动作或动画格式数据,用于计算机动画制作、行为识别等。
应用于数字人视频生成场景,服务于企业端客户,根据输入的音频,生成数字人形象的视频。
应用于语音合成场景,服务于企业端客户,根据用户输入的文本信息,生成对应音频内容。应用于视频生成场景,服务于企业端客户,根据用户输入的文字或图像提示信息,生成符合用户要求的视频内容。
应用于语音生成场景,服务于企业端客户,根据输入的文本,生成特定说话人音色特征的语音。应用于数字人合成场景,服务于企业端客户,根据用户输入的文稿、录音,合成与输入内容一致的数字人说话视频。
应用于视频生成场景,服务于企业端客户,根据用户输入的文本描述和图像内容,生成与输入文本、图像的语义相一致的视频。
应用于多媒体内容生成场景,根据用户输入的文本、图像,实现文本推理、文本提示生成图像、文本提示生成视频、图像生成视频、智能图像编辑、智能视频编辑等功能。
GPU 云服务器(GPU Cloud Computing,GPU)是提供 GPU 算力的弹性计算服务,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景。阿里云作为亚太第一的云服务提供商,随时为您提供触手可得的算力,有效缓解计算压力,提升您的业务效率,助您提高企业竞争力。