MiniMax 公司介绍
MiniMax(稀宇科技)简介
MiniMax是上海稀宇科技有限公司推出的全栈式生成式AI平台,致力于通过多模态大模型技术推动智能创新。公司以“与用户共创智能”为核心理念,构建了覆盖文本、图像、音频、视频的全场景AI解决方案,并在多个领域实现国际领先的技术突破。
核心特点
全栈自研模型矩阵
- Text Model:性能比肩GPT-4o,支持复杂语义理解和创意生成。
- Image Model:超低单价生成高清写实图像,人物细节细腻(如最新发布的MCP模型)。
- Video Model:导演级视频生成工具,支持2D角色动画、电影级叙事节奏(如T2V/I2V模型)。
- Audio Model:全球首个Intrinsic Zero-Shot语音模型,支持32种语种语音合成与声音克隆,登顶国际权威评测榜(Artificial Analysis、Hugging Face TTS Arena)。
- Music Model:端到端音乐生成,覆盖作曲、编曲到演唱的全流程创作。
全球化应用与影响力
- 海螺AI视频平台:全球日生成视频量超百万条,2024年1月登顶全球AI视频访问量榜首。
- 语音技术落地:为澎湃新闻、高途教育等企业提供智能语音解决方案,并助力文旅部打造“AI+文旅产业基地”。
- 开发者生态:开放MCP平台,提供视频、图像、语音生成工具,吸引全球开发者参与创新。
跨领域合作与创新
- 联合高校、企业成立智能硬件创新联盟,探索AI硬件新方向。
- 举办全球GenAI Meetup(如旧金山站),推动产学研深度合作。
行业认可与荣誉
- 新一代语音模型Speech-02获国际双榜第一,技术实力获权威背书。
- 入选上海市首批AI创新企业名单,参与制定行业标准。
愿景
MiniMax以“让AI触手可及”为目标,通过底层技术创新与开放生态,赋能个人创作者与企业用户,推动AI技术在全球范围内的普惠化应用。
公司产品
MiniMax核心模型
MiniMax Text Model
- 全新架构,性能比肩GPT-4o,支持多语言文本生成与交互。
MiniMax M1
- MiniMax M1:全球首个多模态大模型,支持文本、语音、图像、视频多模态生成。
MiniMax Speech 02
- 国际领先的语音大模型,支持32种语种,实现零样本个性化语音生成,登顶Artificial Analysis和Hugging Face TTS Arena双榜。
MiniMax Video Model
- Director系列:导演级视频生成,精准控制镜头语言,输出电影级叙事节奏。
- T2V/I2V-01:图生视频模型,增强2D角色表现力,生成更稳定生动。
- Live Video Model:实时视频生成能力,优化动态场景适配。
MiniMax Image Model
- 新一代图片生成模型,超低单价,人物写实度高,画面细腻如真实摄影。
MiniMax Music Model
- 端到端完整音乐生成,支持多风格、多乐器端到端创作。
MiniMax MCP Server
- 多模态生成工具平台,整合视频、图像、语音、声音克隆功能,面向开发者开放。
主要应用场景
原生应用产品
- MiniMax Chat:AI智能伙伴,提供文本交互服务。
- 海螺AI视频:每日生成数百万条视频,全球访问量领先(2025年1月数据)。
- 星野:聚焦音乐与创意内容生成。
行业解决方案
- AI+文旅:联合徐汇区发布全国首个文旅MaaS服务平台,打造AI+文旅产业基地。
- AI教育:与高途合作推动AI教育创新,探索智能教学工具。
- 智能硬件生态:成立创新联盟,布局硬件集成场景。
技术合作与生态
- 与澎湃新闻达成战略合作,共建内容生成生态。
- 举办全球GenAI Meetup(如旧金山站),推动技术交流与产业融合。
技术亮点
- 多模态能力:覆盖文本、语音、图像、视频的全链条生成。
- 个性化与效率:支持零样本语音克隆、低成本高质量图片生成。
- 行业赋能:通过开放平台(MCP Server)和定制化方案,加速企业级应用落地。
SDK
兼容OpenAI API,base_url为https://api.minimaxi.com/v1,在这里 获取API Key
MiniMax Agent 使用教程
参考
MiniMax 的主页
海外版开放平台(https://www.minimaxi.com/en/platform)等,
国内版
海外版
- 聊天地址为https://chat.minimax.io/
- Agent地址为https://agent.minimax.io/