Llama 3.1震撼发布:4050亿参数模型全面开源

近日,全球科技巨头Meta正式发布了其最新一代的大语言模型——Llama 3.1,标志着人工智能领域又迎来了一次重大突破。尤为引人注目的是,Llama 3.1不仅性能卓越,而且Meta宣布将其4050亿参数的旗舰模型全面开源,这一举动无疑为开源AI领域注入了新的活力。

Llama 3.1的发布,无疑是对当前AI市场格局的一次重大冲击。Meta此次共推出了三个尺寸的模型版本,包括8B、70B和备受瞩目的405B。其中,405B模型以其惊人的4050亿参数规模,成为了目前全球性能最强大的开源大语言模型之一。Meta表示,该模型在常识、可引导性、数学、工具使用以及多语言翻译等一系列任务中的表现,已经能够媲美业界领先的闭源模型,如GPT-4和Claude 3.5。

Llama 3.1在训练数据和计算资源上的投入同样令人瞩目。Meta透露,该模型在超过15万亿个token的数据上进行训练,动用了超过16000块H100 GPU,这一规模在业界内堪称史无前例。为了确保训练的稳定性和模型的高性能,Meta采用了Transformer模型架构,而非流行的混合专家模型(MoE)架构。这一选择使得Llama 3.1即使在扩展到128K的上下文长度时,也能保持短上下文窗口的高质量输出,实现了“长短自如”的卓越性能。

值得注意的是,Meta在发布Llama 3.1的同时,还宣布了一系列支持开源生态的举措。Meta不仅更新了开源协议,允许开发人员使用Llama模型的输出来改进其他模型,还与多家知名企业合作,共同推动Llama生态的发展。目前,已有超过25个合作伙伴,包括AWS、英伟达、戴尔、Azure和Google Cloud等,推出了基于Llama 3.1的新服务,为开发人员提供了更加便捷和高效的模型训练和推理环境。

Meta创始人兼首席执行官马克·扎克伯格在发布会上表示:“Llama 3.1的发布,标志着我们正在迎来一个由开源引领的新时代。我们相信,开源AI将为开发者、Meta乃至整个世界带来更大的好处。通过开源,我们可以共同推动AI技术的进步,让更多的人受益于人工智能的发展。”

扎克伯格还亲自撰写了一篇长文《Open Source AI Is the Path Forward》,详细阐述了开源AI的重要性和优势。他指出,开源AI将为开发者提供更多的自由和灵活性,让他们能够根据自己的需求定制和训练模型;同时,开源AI也将促进技术创新和生态系统的发展,推动整个行业的进步。

随着Llama 3.1的正式发布和全面开源,人工智能领域的新一轮竞赛已经悄然拉开序幕。我们有理由相信,在开源精神的引领下,AI技术将迎来更加广阔的发展前景。

    关于文章版权的声明:

    https://news.softunis.com/26750.html 文章来自软盟智能资讯站

    若非本站原创的文章,特别作如下声明:

    本文刊载所有内容仅供提供信息交流和业务探讨而非提供法律建议目的使用,不代表任何监管机构的立场和观点。不承担任何由于内容的合法性及真实性所引起的争议和法律责任。

    凡注明为其他媒体来源的信息,均为转载,版权归版权所有人所有。

    如有未注明作者及出处的文章和资料等素材,请版权所有者联系我们,我们将及时补上或者删除,共同建设自媒体信息平台,感谢你的支持!

    (1)
    上一篇 2024年7月25日
    下一篇 2024年7月25日

    相关推荐

    发表回复

    登录后才能评论