推理模型性能媲美DeepSeek R1！阿里巴巴股价跳空大涨_港股频道

（原标题：推理模型性能媲美DeepSeek R1！阿里巴巴股价跳空大涨）

3月6日，阿里巴巴（09988.HK）跳空高开，一度涨至7.47%，报139.6港元/股，较2月24日的高点140.9港元/股，仅有一线之隔。

阿里云官方公众号发文称，公司发布并开源全新的推理模型通义千问QwQ-32B。通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。

据阿里云介绍，在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。此次，阿里云采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。

阿里云指出，千问QwQ-32B性能比肩全球最强开源推理模型。

在一系列权威基准测试中，千问QwQ-32B 模型表现异常出色，几乎完全超越了OpenAI-o1-mini，比肩最强开源推理模型DeepSeek-R1：在测试数学能力的AIME24评测集上，以及评估代码能力的LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1蒸馏模型；在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。

据证券时报报道，业内人士分析，QwQ-32B的成功表明，将强大的基础模型与大规模强化学习相结合，能够在较小的参数规模下实现卓越性能，这为未来通向通用人工智能提供了可行路径。

值得一提的是，据上海证券报报道，1月20日，DeepSeek-R1推理模型发布后火速出圈，实现了最快复现OpenAI o1推理模型。业内预计，我国头部科技公司阿里巴巴、字节跳动等有望在1到2个月内跟上R1的创新成果。

1月29日，阿里发布通义千问Qwen2.5-Max大模型。在多个基准测试中，Qwen2.5-Max比肩Claude-3.5-Sonnet，并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

2月25日，通义千问官方账号Qwen在海外社交平台发布了QwQ-Max-Preview（推理模型预览版），即将发布QwQ-Max正式版本、可部署在本地的较小版本以及官方App QwQ-Max。

据了解，阿里通义团队一直坚持开源路线。从2023年至今，阿里通义团队已开源200多款模型，包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列，开源囊括文本生成模型、视觉理解和生成模型、语音理解和生成模型、文生图及视频模型等，覆盖从0.5B到110B等参数，实现了全模态、全尺寸大模型的开源。

长江证券研报指出，近期，阿里在AI 领域持续发力，践行了其AI 驱动战略，随着其后续投入的逐步提升，相关成果有望加速迭代，相关成果或将惠及相关产业链，加速AI应用落地，进而进一步带动算力需求的爆发。同时，随着阿里在AI 基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入，或将引领中国AI 产业加速发展。

本文综合阿里云微信公众号、证券时报、上海证券报、公开信息

（声明：文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。）

证券之星微信

扫描二维码

关注

证券之星微信