阿里通义Qwen3：推理模型升级，数学与编程能力飞跃

阿里通义Qwen3：推理模型升级，数学与编程能力飞跃快讯

TechWeb.com.cn 2025-07-31 17:12

分享到：

导读

实现了数学推理和代码能力的关键性提升，阿里通义近日推出的推理模型新版本Qwen3-30B-A3B-Thinking-2507，这款名为通义Qwen3的新推理模型不仅在知识水平评测（GPQA、MMLU-Pro）上展示了明显的进步。

【TechWeb】7月31日消息，人工智能领域再掀热潮。

阿里通义近日推出的推理模型新版本Qwen3-30B-A3B-Thinking-2507，实现了数学推理和代码能力的关键性提升。根据最新报道，该模型在数学推理评测AIME25中取得了85.0分的高分，同时在代码能力测试LiveCodeBench v6中也以66.0分的成绩，显著超越了包括Gemini2.5-Flash（thinking）和旧款旗舰Qwen3-235B在内的竞争对手。

这款名为通义Qwen3的新推理模型不仅在知识水平评测（GPQA、MMLU-Pro）上展示了明显的进步，还在写作能力（WritingBench）、Agent执行能力（BFCL-v3），以及多轮对话和多语言指令处理（MultiIF）等综合能力上表现出显著优势。通过一系列的测试数据比较，Qwen3的综合性能已经超越了同类产品的标准水平。

此次模型升级的特色之一是显著增加了思考长度，这大大提升了模型在面对复杂任务时的处理能力。开发者现在可以利用这一特性，通过延长模型的思考时间，来挖掘其在逻辑推理和多步骤问题解决方面的潜力。

阿里通义已经将这一先进模型在魔搭社区和HuggingFace上开源，同时推出的Qwen Chat智能对话平台也将为用户带来更流畅和高效的交互体验。这一技术进步不仅代表了通义千问在专用推理模型领域的重要突破，也为全球开发者社区贡献了一个更加强大的AI工具。（Suky）

模型能力推理 Qwen 显著

分享到：

1.TMT观察网遵循行业规范，任何转载的稿件都会明确标注作者和来源；
2.TMT观察网的原创文章，请转载时务必注明文章作者和"来源：TMT观察网"，不尊重原创的行为TMT观察网或将追究责任；
3.作者投稿可能会经TMT观察网编辑修改或补充。