寻光 - 视频创作平台
入驻时间: 2024-09-08 15:58:28
详情介绍
达摩院-视觉技术实验室,致力于多模态视觉信号的理解与生成技术的研究,当前的重点研究方向包括更加精准的图像/视频/3D内容生成,更加可控的图像/视频/3D内容编辑,更加高效的生成框架,多模态的检索增强生成,统一的多模态理解-生成框架等。团队坚持技术深度和产业落地并重,支持阿里巴巴集团内外多项业务,在电商、遥感、安防、新零售等多个领域有成功落地。
团队成员皆毕业于国内外知名高校,且获得过斯坦福大学全球top2%顶尖科学家,清华大学AMiner AI Top2000等荣誉。过去三年团队取得计算机视觉国际竞赛冠军20余项,发表计算机视觉/机器学习顶会100余篇,并曾获CVPR 2022 Best Student Paper,2022年中国测绘学会测绘科学技术一等奖等奖项。