MiniMax开放平台，视频生成大模型 video- 01，多功能端到端音乐生成大模型 music-

发布时间：2024-10-22 11:00:33 浏览：139

MiniMax是国内领先的拥有文本、语音、视觉三模态融合的千亿参数语言大模型，并打通产品全链路的创业公司。通过搭建超大规模实验平台与推理平台，跑通技术与产品的迭代闭环，实现模型能力与用户交互量的极速增长。

模型层面，MiniMax下设的推理平台拥有万卡级别的跨云高效计算系统，可支持单日过亿次级的调用。MiniMax通用模型具有突破极限的模型迭代速度，全面覆盖文本、图像、声音等多种模型。MiniMax人工智能引擎的训练平台拥有极高效的千卡并行算力，稳定性已得到验证。

应用层面，MiniMax开放平台提供大模型应用的企业级解决方案，为企业和开发者提供功能丰富、高易用性的APl，最大限度降低使用者的开发复杂性，帮助使用者快速在目标场景中验证价值并生产部署。

能力

MiniMax开放平台提供标准的API接口，赋能开发者完成所在行业的AI场景创新。

文本大模型（Chat Completion v2、Chat Completion Pro）基于自然语言交互的文本生成能力接口。

Embeddings（向量化）文本转化为高维向量接口，可实现如长记忆检索、知识库检索等能力。

Retrieval（知识库）支持高效检索文档信息，准确回答专业问题，为大模型补充专业领域知识。

Finetune（微调）构造数据集对模型进行微调，解决模型仍然存在的问题。

Assistants（助手）具备多种工具链能力支持的有状态API，满足复杂数学运算、文件处理、数据分析、文档问答、调用外部API问答、实时和专业信息问答。

语音大模型（T2A v2、T2A Large v2、Voice Cloning）基于自然语言交互生成能力的文字转语音接口。

T2V （文生音色）持基于用户输入的声音性别、声音年龄、声音描述信息，来生成音色。

Music Generation（音乐生成）支持用户自定义上传参考音乐和歌词，然后生成参考音乐（干声+伴奏）和歌词的AI音乐。

MiniMax开放平台提供更多样的定制服务。

定制模型微调支持构造定制数据集对预训练模型进行微调、支持多样化微调。

云端私有化丰富交付方式。

场景与行业

MiniMax文本大模型支持包括不限于：

关键信息提取、知识问答、文本创作、文本总结、内容扩写、内容缩写、内容仿写、人设对话、作业批改、情感分析、逻辑推理、数学能力、代码能力等能力点，通过以上能力点进行组合，覆盖社交、语聊、游戏、招聘、教育、客服、办公和翻译等多种场景。

MiniMax语音大模型支持包括不限于：

文本匹配的声音、声音快速复刻、声音精品复刻的能力，并支持多语言、多性格、多场景的音色能力，在社交、播客、有声书、新闻资讯、教育、数字人等多元场景中均展现出强大的实力。

关于SoHoBlink人工智能网