阿里千问3登顶全球最强开源模型,成本仅需DeepSeek-R1三分之一

4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。千问3是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。

千问3采用混合专家(MoE)架构,总参数量235B,激活仅需22B。千问3预训练数据量达36T tokens,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中。千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,即创下所有国产模型及全球开源模型的性能新高:在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

阿里千问3登顶全球最强开源模型,成本仅需DeepSeek-R1三分之一

千问3性能图

千问3还提供了丰富的模型版本,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,每款模型均斩获同尺寸开源模型SOTA(最佳性能):千问3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升,仅激活3B就能媲美上代Qwen2.5-32B模型性能;千问3的稠密模型性能继续突破,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

同时,所有千问3模型都是混合推理模型,API可按需设置“思考预算”(即预期最大深度思考的tokens数量),进行不同程度的思考,灵活满足AI应用和不同场景对性能和成本的多样需求。比如,4B模型是手机端的绝佳尺寸;8B可在电脑和汽车端侧丝滑部署应用;32B最受企业大规模部署欢迎,有条件的开发者也可轻松上手。

阿里千问3登顶全球最强开源模型,成本仅需DeepSeek-R1三分之一

千问3开源模型家族

千问3为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。在评估模型Agent能力的BFCL评测中,千问3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型,将大幅降低Agent调用工具的门槛。同时,千问3原生支持MCP协议,并具备强大的工具调用(function calling)能力,结合封装了工具调用模板和工具调用解析器的Qwen-Agent 框架,将大大降低编码复杂性,实现高效的手机及电脑Agent操作等任务。

据了解,千问3系列模型依旧采用宽松的Apache2.0协议开源,并首次支持119多种语言,全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用,也可以通过阿里云百炼调用千问3的API服务。个人用户可立即通过通义APP直接体验千问3,夸克也即将全线接入千问3。

据悉,阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个,已超越美国Llama,成为全球第一开源模型。

文章来源于网络。发布者:读懂财经,转转请注明出处:https://www.juwfa.com/5518.html

(0)
读懂财经的头像读懂财经
上一篇 2025年4月29日 下午2:36
下一篇 2025年4月29日 下午2:37

相关推荐

  • 中俄人文交流再上新台阶

    5月7日至10日,应俄罗斯总统普京邀请,国家主席习近平对俄罗斯进行国事访问并出席纪念苏联伟大卫国战争胜利80周年庆典。 此访期间,中俄双方签署了包括《中华人民共和国和俄罗斯联邦在纪念中国人民抗日战争、苏联伟大卫国战争胜利和联合国成立80周年之际关于进一步深化中俄新时代全面战略协作伙伴关系的联合声明》(以下简称《联合声明》)在内的20多份文件,其中超过半数涉及…

    2025年5月12日
    3000
  • 一级市场,大家的账算的越来越细了

    不知道各位是否有这种感觉:现在的一级市场,大家的账算的越来越细了。投资机构与创业公司之间如此,GP与LP之间也是如此。 在不久前的“投中十问”上,这一点就表现的非常明显。从2020年开始,投中网每年都会在年度投资峰会的主论坛之外,专门邀请行业一线GP和LP机构展开“投中十问”闭门研讨会。不同于主论坛话题集中在宏观和中观的大趋势,“投中十问”话题总是非常微观和…

    2025年6月6日
    1000
  • 今年最大IPO,来了

    “宁王”正式登陆港股了。 5月20日,宁德时代在港上市。截至发稿,他们的市值超过1.35万亿港元。 此次IPO,中国石化、科威特投资局、高瓴、高毅资产、UBS资管、橡树资本、韩国未来资产、加拿大皇家银行、中国太保、泰康、博裕资本、景林、洛阳科创、中邮理财等23名基石投资者共拿出约26.28亿美元(约205.49亿港元)。 在招股期间,这家公司的公众认购倍数超…

    2025年5月20日
    1700
  • 体育巨头退市!

    资料图:2019年11月6日,在第二届进博会品质生活展区首次参加进博会的美国斯凯奇展台,观众参观该品牌与动画IP“航海王”联合推出的限量系列运动鞋。新华社记者 刘颖 摄 关税阴影下 美国鞋业巨头斯凯奇接受收购 以生产运动休闲鞋类知名的美国斯凯奇公司已同意被巴西私人投资机构3G资本公司收购,并转为非上市企业。斯凯奇等美国大型鞋类企业生产线大部分集中于亚洲,美国…

    2025年5月8日
    2500
  • 2025抖音直播行业生态大会举行,各方共论直播行业高质量发展

    4月21日,2025抖音直播行业生态大会在北京举行。本次大会以“向上向善,聚势焕新”为主题,文化和旅游部市场管理司司长侯振刚,中央网信办网络综合治理局副局长、一级巡视员李云峰,国家广播电视总局网络视听节目管理司副司长范洁等出席会议并致辞。 侯振刚表示,文化和旅游部坚持监管与培育并重,逐步建立了“直播平台、经纪机构、网络主播”一体化综合监管培育体系。网络空间是…

    2025年4月22日
    4100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信