Transwarp Hippo是一款企业级云原生分布式向量数据库,支持存储,索引以及管理海量的向量式数据集,能够高效的解决向量相似度检索以及高密度向量聚类等问题。Hippo具备高可用、高性能、易拓展等特点,支持多种向量搜索索引,支持数据分区分片、数据持久化、增量数据摄取、向量标量字段过滤混合查询等功能,能够很好的满足企业针对海量向量数据的高实时性检索等场景。
产品优势
云原生系统
Hippo 采用全面容器化部署,支持服务的弹性扩缩容;同时具备多租户和强大的资源管控能力。
分布式部署
具备分布式部署能力,满足大规模集群部署需求; 通过 Raft 算法确保数据的强一致性;同时提供故障迁移,数据修复等数据保障能力。
企业级安全
Hippo 可提供基于 SASL 的用户认证能力,以及基于 SSL/TLS 的数据加密传输。
高性能检索
Hippo 支持多进程架构与 GPU 加速,可以充分发挥并行检索能力;同时支持多类索引,满足不同业务场景;支持检索速度和内存使用的特定优化,支持寄存器级算法优化。
多模型联合分析
基于多模型统一技术架构,向量数据与关系型数据、图数据、时序数据等多种模型数据进行统一存储管理,通过统一接口实现数据跨模型联合分析。
接口多样化
提供类SQL 语法支持; 提供标准的 Python、Restful、Java API。
应用场景
文本检索
传统搜索引擎更偏向于词、句的精确查询,Hippo 通过向量引擎提供自然语言处理能力,可以更好的支持基于语义的查询分析,让查询更满足人性化的需求。
语音、图像、视频检索
通过机器学习分析,各类数据可以被抽象成高维向量特征,Hippo 则可以将所有特征构建成高效的向量索引,用户可以基于向量索引实现数据的相似性检索,可以覆盖各类 AI 场景,如人脸识别、语音识别、视频指纹等。
个性化推荐
Hippo 支持与各类深度学习平台搭建的模型进行耦合,分析、挖掘用户行为与喜好等多方面相关数据向量化存储,通过向量相似度检索,将用户可能整兴趣的信息推送给客户,做到千人千面的推荐效果。
大模型应用
Hippo 可以作为 LLM 的中间载体承载 LLM 生成的各类内容,有效扩展 LLM 的时间与空间边界,使大模型拥有“长期记忆”,并协助解决目前企业担忧的大模型泄露隐私问题。