【软盟资讯】中国大模型DeepSeek反超GPT,训练成本与性能双赢
近日,中国AI领域传来喜讯,杭州幻方量化公司旗下的DeepSeek-V3大模型在多项基准测试中表现卓越,成功反超GPT-4o等国外顶尖模型。DeepSeek-V3凭借671B的参数量和创新的MoE架构,实现了高效推理和经济训练。其训练成本仅为557.6万美元,远低于同类模型,性价比极高。这一成果不仅展示了中国在AI大模型领域的实力,也为全球AI技术的发展注入了新的活力。
【软盟资讯】中国大模型DeepSeek反超GPT,训练成本与性能双赢
近日,中国AI领域传来喜讯,杭州幻方量化公司旗下的DeepSeek-V3大模型在多项基准测试中表现卓越,成功反超GPT-4o等国外顶尖模型。DeepSeek-V3凭借671B的参数量和创新的MoE架构,实现了高效推理和经济训练。其训练成本仅为557.6万美元,远低于同类模型,性价比极高。这一成果不仅展示了中国在AI大模型领域的实力,也为全球AI技术的发展注入了新的活力。