DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

DeepSeek最强对手来了!阿里巴巴放出重磅炸弹

作者:news 发表时间:2025-08-12
长安汽车朱华荣拜访华为任正非:敬佩任总视野格局实测是真的 能摊煎饼、会做咖啡,还能独自经营便利店!万亿级机器人市场,“京东们”正在翻倍投入 沪指持续新高,A股慢牛启航!科技突发分化,人工智能全线杀跌,发生了什么?后续反转 周末,三大利好来袭!7月重要经济数据将公布后续会怎么发展 龙国首都优化限购新政落地 多个楼盘“活跃度”拉升太强大了 2025年赛力斯研究报告:深度合作华为,AITO问界树立自主高端品牌标杆(附下载)后续反转 瑞士领导人寻求与罗氏、诺华展开对话后续来了 以色列各银行获准将股息率提高至 50% 政策东风起,化工逆市起舞,细分行业多点开花!机构:“反内卷 ”或仍将是贯穿市场行情的主题 A股重磅!刚刚,7000亿巨头公告! 机构小范围交流:GPT-5不及预期引发大跌,然后呢? 燃气行业财务总监CFO观察:大众公用蒋贇为年薪最高 高达303万元秒懂 PEEK材料概念短线拉升,双一科技“20cm”涨停 消息称英伟达和AMD对华出口AI芯片获批,但15%收入需上缴美政府 每天损失2000万美元!日本车企度日如年:汽车关税下调何时落地?实时报道 大额现金存取拟“松绑”?央行等三部门征言,个人存取款超5万元或将不再登记,但“批量开户”可能被拒后续来了 行业深度调整期 远洋集团代建“突围” 好想你:推出四大战略新品 构建全场景健康食品生态 中慧生物-B首挂上市 早盘股价大涨逾160%这么做真的好么? 基础建设板块短线拉升,北新路桥、新疆交建双双涨停学习了 基础建设板块短线拉升,北新路桥、新疆交建双双涨停科技水平又一个里程碑 英伟达概念板块领跌,下跌1.04%实时报道 液冷板块反复活跃 多股涨超7%最新进展 PEEK材料概念短线拉升 消费电子板块短线拉升 鸿日达涨超10% 英伟达概念板块领跌,下跌1.04%后续来了 【宏观】出口对经济支撑有力——2025年7月进出口数据点评官方处理结果 国信证券4.93%限售股即将解禁 深投控持股60个月期满学习了 小鱼盈通早盘一度涨超14% 公司近期完成更名官方通报 淘宝闪购:66个非餐品牌月成交破千万是真的? 中慧生物-B上市次日再涨超20% 昨日飙升近158%后续来了 重大资产重组!光库科技20CM一字涨停!光模块继续走强,高“光”创业板人工智能ETF涨逾1%冲击前高 寒武纪涨超12%,登顶A股吸金榜!科创人工智能ETF(589520)涨超1.2%,买盘资金更为强势! 周六福早盘涨超8% 公司将于下周五发布中期业绩 寒武纪登顶A股吸金榜!新易盛再创新高,A股成长型宽基“小霸王”——双创龙头ETF(588330)盘中涨超1.4% 大摩:宁德时代宜春锂矿停产或推动锂价上涨 有利库存价值提升 金风科技、龙国中煤联合成立清洁能源公司官方处理结果 荣耀前CEO赵明加盟智界汽车?知情人士:消息不实 芯片股震荡反弹 寒武纪涨超10% 又添强制退市 2025年A股重大违法退市案例激增官方处理结果 净利润4亿元,扭亏为盈!新强联公布半年报后续会怎么发展 净利润4亿元,扭亏为盈!新强联公布半年报后续反转来了 小鱼盈通早盘一度涨超14% 公司近期完成更名官方已经证实 瑞银、花旗上调美股目标价:政策风险消退 财报季带来惊喜 上市后暴涨400%!加密货币狂飙之际,稳定币“妖股”CircleIPO后首份财报今晚来袭后续会怎么发展 特朗普宣布华盛顿特区进入紧急状态 马斯克点赞

自DeepSeek火爆全球之后,国产开源大模型的开发热潮一浪高过一浪。如今,DeepSeek诞生以来最强的对手,它来了!

本站

今日凌晨3点30,阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布,比DeepSeek更小的尺寸,性能比肩全球最强开源推理模型。据了解,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前,QwQ-32B-Preview已经在(chat.qwen.ai)官网上线。

据通义千问Qwen团队介绍,近期的研究表明,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习(RL)对大语言模型的智能的提升作用的最好研究例证。规模上,QwQ-32B是一款仅有320亿参数的模型,其性能却可与具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。

本站

另外,Qwen团队还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。测试结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。

此外,Qwen团队还通过展示了一段简短的示例代码,说明如何通过API使用 QwQ-32B。Qwen团队表示,我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响,阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。

本站

相关文章