English 简体中文 繁體中文 한국 사람 日本語 Deutsch русский بالعربية TÜRKÇE português คนไทย french
查看: 24|回复: 0

稀宇科技发布并开源新一代 MiniMax 01 系列模型,参数量达 4560 亿

[复制链接]
查看: 24|回复: 0

稀宇科技发布并开源新一代 MiniMax 01 系列模型,参数量达 4560 亿

[复制链接]
查看: 24|回复: 0

379

主题

0

回帖

1147

积分

金牌会员

积分
1147
wmz

379

主题

0

回帖

1147

积分

金牌会员

积分
1147
2025-1-16 12:01:28 | 显示全部楼层 |阅读模式
感谢IT之家网友 软媒新友2335129、Skyraver 的线索投递!
            IT之家 1 月 15 日消息,稀宇科技(MiniMax)今日宣布推出新一代 01 系列模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01。
为方便开发者研究,该公司还在 Github 上开源了两个模型的完整权重。这一系列模型的后续更新,包括代码和多模态相关的后续强化仍待上传。
该系列模型首次大规模实现线性注意力机制打破 Transformer 传统架构记忆瓶颈,能够处理 400 万 token 的输入,可输入长度是 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍。

据介绍,这个模型的参数量高达 4560 亿,其中单次激活 459 亿,模型综合性能比肩海外顶尖模型,在大多数任务上追平了海外公认最先进的两个模型,GPT-4o-1120 以及 Claude-3.5-Sonnet-1022。
在长文任务上,随着输入长度变长,MiniMax-Text-01 性能衰减更少,显著优于谷歌 Gemini。因此,01 系列模型在处理长输入的时候有非常高的效率,接近线性复杂度。

定价方面,IT之家发现该系列模型标准定价是输入 1 元 / 百万输入 token、8 元 / 百万输出 token。
此文章来自:IT之家如有涉及侵权请通过邮箱联系:fnhjeqj@163.com删除。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

379

主题

0

回帖

1147

积分

金牌会员

积分
1147

QQ|智能设备 | 粤ICP备2024353841号-1

GMT+8, 2025-5-2 09:25 , Processed in 1.732539 second(s), 24 queries .

Powered by 智能设备

©2025