以大模型、AIGC为代表的人工智能浪潮,正在悄然改变着人们的生活及工作方式。
8月31日,“2024 MiniMax Link伙伴日”活动在上海顺利举行。本次活动以Link(连接)为主题,聚焦AI创新技术发展。活动现场,MiniMax创始人闫俊杰分享了基于MOE(混合专家模型)+ Linear Attention(线性注意力)的新一代模型技术的应用,并展示了MiniMax最新音乐模型、视频模型的研发成果。
“目前,每天MiniMax的大模型和全球终端用户进行30亿次交互。”闫俊杰分享,“这30亿次连接背后,是来自于全球各地的用户,是陪伴我们一起成长的用户。”MiniMax每日处理3万亿文本token,生成2000万张图片及合成7万小时的语音等,日均交互时长排名断层式第一。
MiniMax成立于2021年12月,自主研发了多种模态的通用大模型,包括拥有万亿参数的 MoE 文本大模型、语音大模型、图像大模型和视频大模型,并基于模型推出了多款原生应用——如生产力工具“海螺 AI”和沉浸式 AI 内容社区 “星野”,以及在全球 100 余个国家运营服务的 AI 内容社区 “Talkie”。
商业航天技术公司星河动力、聚变能源商业公司能量奇点、通用机器人研发制造公司逐际动力等多家高新技术企业,以及快递100、语忆科技、智联招聘与中软国际携企业代表汇聚于此,业界技术专家、产品大咖及相关从业者纷纷前来,共同探讨前沿科技成果与产业创新升级路径。结合主题演讲、圆桌讨论和生态伙伴对谈等形式,MiniMax全方位展示了其技术实力和发展蓝图,就大模型技术升级等议题带来了前沿技术分享,为与会嘉宾呈现了一场精彩纷呈的技术盛宴。
焕发AI的N种可能,揭秘MiniMax的技术探索
在这场属于AI人的盛会上,MiniMax创始人、CEO闫俊杰在大会上以“用技术突破回答「每日与世界的30亿次交互」”为题,分享了创业初心和MiniMax的技术研究进展。
作为中国首个研发MoE大语言模型并成功上线的AI企业,MiniMax持续在模型算法上做创新,并最新推出基于MOE+ Linear Attention的新一代模型技术。通过此新型线性模型架构,MiniMax大模型能在单位时间内更加高效地训练海量数据,极大地提升了模型的实用性和响应速度。
大会现场,闫俊杰表示,MiniMax进行了多次重大的底层技术变革。“科学技术是第一生产力,这是MiniMax坚持技术创新的最底层原因。”
相较于Dense模型,MiniMax自研MoE架构的abab 6.5s,获得了3-5倍的速度提升。而此次最新探索的Linear Attention技术解决了传统Transformer架构随输入长度增加而导致计算复杂度激增的问题,通过改变计算方式,使得模型能够处理更长的输入序列,进而提升了模型处理复杂任务的能力,并且能在单位时间内高效地训练大量数据,极大地提升了模型的实用性和响应速度。在与GPT-4o同一代模型能力对比上,处理10万token时效率可提升2-3倍,并且随着长度越长,提升越明显。
MiniMax不仅在文本处理方面有所突破,还在语音和视频模型上发布多项突破性进展。MiniMax最新上线了能够生成多种语言的语音模型,并且发布了首个能够处理复杂动态场景的视频模型。
MiniMax语音模型已实现对粤语、日语、韩语、西班牙语等多语种支持的升级,并达到了类似GPT-4o的情绪感知能力,同时拥有高精度的声音模拟和卓越的情感表达能力。此外,MiniMax还推出了首款音乐模型,该模型具备高度的艺术性和灵活性,预计能为创作者带来新的可能性与惊喜。
在视频生成方面,MiniMax交出一份令人满意的答卷。MiniMax的视频模型可以实现高质量的视频生成,在文本响应性、压缩效率、生成风格方面均有显著优势,媲美Runway和Sora。现场播放的,全部由MiniMax视频模型所创作的AI短片《魔法硬币》让参会观众赞叹不绝。目前,短片《魔法硬币》已在MiniMax官方视频号中上线。MiniMax会将视频背后应用的prompt后续公布,为大家提供一个“如何只用模型来生成高质量的视频内容”的参考。
据了解,MiniMax是在国内创业公司中唯一一家具备全模态开发能力、打通全链路并持续投入的企业。其语音模型技术已多次亮相央视,旗下产品Talkie亦在国际上表现突出,在全球知名风投机构a16z最新发布的《Top100消费级生成式AI应用》移动应用榜单中位列第22名。
凭借持续的技术探索与模型算法创新,加之全面的模态开发能力和独特的To C基因,MiniMax不仅已成为国内最接近OpenAI水平的大模型企业,同时也跻身少数几家具备研发GPT-5潜力的公司之列,并有望国内成为第一家实现类GPT-5能力的大模型公司。
着眼开放生态,MiniMax正成为最接近OpenAI的公司