国大模型DeepSeek反超GPT，是怎么做到的？

【软盟资讯】中国大模型DeepSeek反超GPT，训练成本与性能双赢

近日，中国AI领域传来喜讯，杭州幻方量化公司旗下的DeepSeek-V3大模型在多项基准测试中表现卓越，成功反超GPT-4o等国外顶尖模型。DeepSeek-V3凭借671B的参数量和创新的MoE架构，实现了高效推理和经济训练。其训练成本仅为557.6万美元，远低于同类模型，性价比极高。这一成果不仅展示了中国在AI大模型领域的实力，也为全球AI技术的发展注入了新的活力。