MiniMax是国内领先的拥有文本、语音、视觉三模态融合的千亿参数语言大模型,并打通产品全链路的创业公司。通过搭建超大规模实验平台与推理平台,跑通技术与产品的迭代闭环,实现模型能力与用户交互量的极速增长。
模型层面,MiniMax下设的推理平台拥有万卡级别的跨云高效计算系统,可支持单日过亿次级的调用。MiniMax通用模型具有突破极限的模型迭代速度,全面覆盖文本、图像、声音等多种模型。MiniMax人工智能引擎的训练平台拥有极高效的千卡并行算力,稳定性已得到验证。
应用层面,MiniMax开放平台提供大模型应用的企业级解决方案,为企业和开发者提供功能丰富、高易用性的APl,最大限度降低使用者的开发复杂性,帮助使用者快速在目标场景中验证价值并生产部署。
能力
MiniMax开放平台提供标准的API接口,赋能开发者完成所在行业的AI场景创新。
文本大模型(Chat Completion v2、Chat Completion Pro)基于自然语言交互的文本生成能力接口。
Embeddings(向量化)文本转化为高维向量接口,可实现如长记忆检索、知识库检索等能力。
Retrieval(知识库)支持高效检索文档信息,准确回答专业问题,为大模型补充专业领域知识。
Finetune(微调)构造数据集对模型进行微调,解决模型仍然存在的问题。
Assistants(助手)具备多种工具链能力支持的有状态API,满足复杂数学运算、文件处理、数据分析、文档问答、调用外部API问答、实时和专业信息问答。
语音大模型(T2A v2、T2A Large v2、Voice Cloning)基于自然语言交互生成能力的文字转语音接口。
T2V (文生音色)持基于用户输入的声音性别、声音年龄、声音描述信息,来生成音色。
Music Generation(音乐生成)支持用户自定义上传参考音乐和歌词,然后生成参考音乐(干声+伴奏)和歌词的AI音乐。
MiniMax开放平台提供更多样的定制服务。
定制模型微调支持构造定制数据集对预训练模型进行微调、支持多样化微调。
云端私有化丰富交付方式。
场景与行业
MiniMax文本大模型支持包括不限于:
关键信息提取、知识问答、文本创作、文本总结、内容扩写、内容缩写、内容仿写、人设对话、作业批改、情感分析、逻辑推理、数学能力、代码能力等能力点,通过以上能力点进行组合,覆盖社交、语聊、游戏、招聘、教育、客服、办公和翻译等多种场景。
MiniMax语音大模型支持包括不限于:
文本匹配的声音、声音快速复刻、声音精品复刻的能力,并支持多语言、多性格、多场景的音色能力,在社交、播客、有声书、新闻资讯、教育、数字人等多元场景中均展现出强大的实力。