<汇港通讯> 阿里巴巴(09988.HK/BABA.US)周一正式发布千问旗舰推理模型 Qwen3-Max-Thinking,根据阿里云讯息,模型总参数量超过万亿,预训练数据量达到 36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。
在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、代理能力等19项公认基准测试中,Qwen3-Max-Thinking 整体性能可媲美 GPT-5.2-Thinking、Claude Opus 4.5 和 Gemini 3 Pro 等国际顶尖模型,标志著中国大模型从「追平」到「领先」的关键突破。
Hugging Face 数据显示,Qwen 成为全球首个衍生模式数量突破20万的开源大模型。Qwen 系列模型下载量突破10亿次,平均每天被开发者下载110万次,稳居全球开源大模型第一名。
模型采用全新的测试时扩展机制,实现推理性能大幅提升的同时更具经济性。在启用工具的 HLE (Humanity's Last Exam)评测中,千问得分58.3,大幅超过 GPT-5.2-Thinking 的45.5和 Gemini 3 Pro 的45.8,录得目前所有模型的最高分。 (BC)
#阿里巴巴 #Qwen3-Max-Thinking #GPT-5.2
新闻来源 (不包括新闻图片): 汇港资讯