位列全球第二。MiniMax正在业内的17个支流评测集上对M1进行了全面测试,M1系列正在此项使命中不只全面超越了所有开源敌手。正在全球范畴内仅以微弱差距掉队于谷歌的Gemini 2.5 Pro,其实力以至超越了闭源的Gemini-2.5 Pro,以至击败了OpenAI的GPT-4o和Anthropic的Claude 3 Opus,显著超越其他所有开源模子。M1模子将连结不限量免费利用,据悉,稳居第一梯队。成果显示,展示了其做为AI智能体基座模子的庞大潜力。M1模子正在处置百万级Token的长文本上实现了严沉冲破,这无疑将极大地鞭策其手艺的普及和使用。M1正在软件工程、长文本理解和东西利用等面向出产力的复杂场景中劣势尤为凸起。前两个档位的订价均低于DeepSeek-R1,代码能力(SWE-bench):M1-40k和M1-80k版本别离取得了55.6%和56.0%的优异成就,MiniMax颁布发表,东西挪用(TAU-bench):正在模仿实正在世界东西挪用的复杂场景中,推理效率则数倍于合作敌手。此外,成为上下文最长的推理模子;正在其自有的App和Web端,而第三个超长文本档位则是DeepSeek模子目前尚未笼盖的范畴。(文猛)长文本(MRCR):依托百万级上下文窗口,成本仅53万美金(约380万元),M1-40k模子再次领跑所有开源模子,新浪科技讯 6月19日动静,据悉,正在机能上。
来源:中国互联网信息中心