💯阿里开源Qwen2大模型

type
status
date
slug
summary
tags
category
icon
password
😀
阿里昨晚开源了通义Qwen2模型,可以说是现阶段这个规模最强的开源模型。 发布后直接在 Huggingface LLM 开源模型榜单获得第一名,超过了刚发布的 Llama3 和一众开源模型。 Qwen2在代表推理能力的代码和数学以及长文本表现尤其突出。推理相关测试及大海捞针测试都取得了很好的成绩。

模型概览:

Qwen 2 模型组成包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。其中Qwen2-57B-A14B为 MoE 模型。 模型在中文、英文语料基础上,训练数据中增加了27种语言相关的高质量数据; 增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。 多个评测基准上的领先表现; 代码和数学能力显著提升;
notion image
你可以去魔搭的Open Compass竞技场体验一下:
Loading...

No results found.