阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
3月6日消息,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。
这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。
QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。
此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。
QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力。
其中,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。
同时,在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。
目前,QwQ-32B已在Hugging Face和ModelScope开源,大家也可通过Qwen Chat直接进行体验!
上一篇:每周上班不超44小时 真双休!专家:幸福是给员工涨工资
栏 目:资讯
本文标题:阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
本文地址:https://fushidao.cc/ruanjianxiazai/1738.html
您可能感兴趣的文章
- 03-31年轻人的第一台跑车!小跑车SC01将于4月15日上市:售价不超30万元
- 03-31美的集团回应清仓小米股票:正常投资操作
- 03-31宁德时代CTO:为了超充过多牺牲电池产品可靠性不可取
- 03-31用时216天!小鹏MONA M03第十万台下线:创新势力纯电最快生产下线纪录
- 03-31苹果新品剧透:M5芯片iPad Pro、MacBook Pro都在下半年
- 03-31明日起 北京自动驾驶应用场景向个人乘用车拓展
- 03-31雷军把SU7 Ultra的价格打下来后:网友破防
- 03-31央视入股爱奇艺原因曝光:球迷或能免费看国足vs印尼生死战
- 03-31合资家轿之王!新一代日产轩逸配置曝光:有望提供三种动力
- 03-31杨元庆自豪肯定:过去的一年 创造联想历史最佳成绩


阅读排行
推荐教程
- 05-11office2019+visio2019+project2019最新激活密钥和激活方法
- 11-29潘粤明新剧《白夜破晓》豆瓣开分仅7.0:对不起大家7年等待
- 05-11Office 2019产品密钥在哪里输入?如何关联Microsoft帐户?
- 11-29营销号编造抖音电商一年GMV超2万亿元!官方辟谣
- 05-11office 2010永久的密钥 office 2010 密钥
- 11-29美团回应骑手吐口水:虚假摆拍!已永久限制接单
- 07-04比尔盖茨最新预言:耳机和眼镜才是AI硬件重点
- 05-30如何管好微信支付的“自动续费” 官方一文看懂
- 07-0372岁刘晓庆想演《封神》里的妲己:演年轻人完全没问题
- 11-29《黑神话:悟空》百事联名可乐曝光!四妹拥有专属瓶身