(原标题:推理模型性能媲美DeepSeek R1!阿里巴巴股价跳空大涨)
3月6日,阿里巴巴(09988.HK)跳空高开,一度涨至7.47%,报139.6港元/股,较2月24日的高点140.9港元/股,仅有一线之隔。
阿里云官方公众号发文称,公司发布并开源全新的推理模型通义千问QwQ-32B。通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。
据阿里云介绍,在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。此次,阿里云采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。
阿里云指出,千问QwQ-32B性能比肩全球最强开源推理模型。
在一系列权威基准测试中,千问QwQ-32B 模型表现异常出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1:在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型;在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。
据证券时报报道,业内人士分析,QwQ-32B的成功表明,将强大的基础模型与大规模强化学习相结合,能够在较小的参数规模下实现卓越性能,这为未来通向通用人工智能提供了可行路径。
值得一提的是,据上海证券报报道,1月20日,DeepSeek-R1推理模型发布后火速出圈,实现了最快复现OpenAI o1推理模型。业内预计,我国头部科技公司阿里巴巴、字节跳动等有望在1到2个月内跟上R1的创新成果。
1月29日,阿里发布通义千问Qwen2.5-Max大模型。在多个基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
2月25日,通义千问官方账号Qwen在海外社交平台发布了QwQ-Max-Preview(推理模型预览版),即将发布QwQ-Max正式版本、可部署在本地的较小版本以及官方App QwQ-Max。
据了解,阿里通义团队一直坚持开源路线。从2023年至今,阿里通义团队已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,开源囊括文本生成模型、视觉理解和生成模型、语音理解和生成模型、文生图及视频模型等,覆盖从0.5B到110B等参数,实现了全模态、全尺寸大模型的开源。
长江证券研报指出,近期,阿里在AI 领域持续发力,践行了其AI 驱动战略,随着其后续投入的逐步提升,相关成果有望加速迭代,相关成果或将惠及相关产业链,加速AI应用落地,进而进一步带动算力需求的爆发。同时,随着阿里在AI 基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入,或将引领中国AI 产业加速发展。
本文综合阿里云微信公众号、证券时报、上海证券报、公开信息
(声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)