基准测试
-
Meta宣布推迟新一代AI模型”牛油果”发布,因内部测试性能未达预期
来源:软盟资讯 作者:编辑部 发布时间:2026年3月13日 3月13日,据《纽约时报》援引三位知情人士消息,美国科技巨头Meta原定于本月发布的新一代前沿AI大模型”…
-
JetBrains 推出首个 AI 编码基准平台
JetBrains 推出了业内首个开放式 AI 编码基准平台 DPAI Arena,旨在用真实工程任务评估各类智能体对开发效率的贡献。首个试点基准为 Spring 项目基准(Spring Benchmark),涵盖多个开源 Spring 应用和真实任务。平台计划捐献给 Linux Foundation,实现中立治理,并支持多语言、多种工作流扩展。这一举措为 AI 编码工具引入透明、标准化的评估体系,对行业未来发展具有深远意义。