(原标题:港股概念追踪 | OpenAI下一代推理模型o3未来几周内推出 距离AGI时代更近一步(附概念股))
智通财经APP获悉,当地时间上周五(1月17日),OpenAI首席执行官山姆·奥特曼在社交媒体平台X发文表示,OpenAI已完成其新推理AI模型o3 mini的版本,并将在几周内推出。OpenAI去年12月底曾表示,至少在某些条件下,o3模型可以接近实现AGI(通用人工智能)。
2024年9月,OpenAI发布了o1推理AI模型,该模型通过更长时间地处理查询,能够解决更为复杂的问题。据介绍,o1模型能够在科学、编程和数学等领域处理更具挑战性的问题。与GPT等旧模型相比,o1模型不仅仅是一次简单的升级,而是标志着一个“完全不同的游戏规则”和“真正的进步”。 OpenAI研究副总裁Mark Chen去年曾指出,o1与标准 ChatGPT 有着根本的不同,因为它可以“推理”,这是人类智能的标志。
随着o1模型的推出,去年国内市场也涌现出一批新兴的大模型,如kimi的k0math、幻方量化旗下Deepseek的DeepSeek-R1-Lite和昆仑万维的“天工大模型4.0”o1版。月之暗面先后发布数学模型k0-math、升级版视觉思考模型k1,在数理化等特定能力上表现优于o1。受成本降低和模型进化的推动,AI应用也开始涌现。ChatGPT式的AI对话助手成为各家“标配”,包括字节豆包、月之暗面Kimi、腾讯元宝等。
即将发布的o3和o3 mini模型将比o1系列更加强大。OpenAI的发言人此前表示,他们在给这款新模型命名时决定跳过o2,这是“出于对英国电信公司O2的尊重”。
据悉,o3模型在ARC-AGI基准上获得了破纪录的分数。ARC-AGI由Keras之父Fran ? ois Chollet开发,主要是通过图形逻辑推理来测试模型的推理能力。以100%为最高分的ARC-AGI评估结果显示,在低计算场景中,o3得分为75.7%,而在高计算测试中,它达到了87.5%。o3的最佳成绩超过了标志着达到人类水平的门槛85%。而目o1模型的得分仅在25%到32%之间。另外,在衡量编程能力的Codeforces Elo评分中,o3取得了2727的Elo评分,而o1评分仅为1891。
国金证券认为,展望未来,随着大模型使用成本持续下降、中文语言模型能力继续提升背景下,落地应用有望加速,中国企业有文化基础、数据积累、场景理解、工程应用、客情关系等优势,有机会形成自己的产业龙头。
中信证券表示,观察2025年全球科技市场投资,从市场维度,中国科技资产相对美国资产更具投资性价比。在中国科技板块中,将中概互联网板块作为首选,关注在短期宏观复苏、政策刺激为板块带来的业绩拐点和中长期AI生态的持续繁荣为板块带来的估值重塑机会,并看好中国国产AI产业链的投资机遇。
相关概念股:
百度集团-SW(09888):在模型侧,目前文心大模型矩阵包括ERNIE 4.0 Turbo等旗舰大模型、ERNIE Speed等轻量模型,以及基于基础模型生产的系列思考模型和场景模型。根据百度披露的数据,文心大模型日均调用量超15亿,相较一年增长约30倍,用户规模达到4.3亿。在产品侧,据官方数据,截至去年9月,文小言月活跃用户达到千万级别,累计调用量超过20亿次。
阿里巴巴-SW(09988):阿里云在去年5月初发布的通义千问2.5,得分就追平GPT-4 Turbo。目前,阿里已经投资了Minimax、月之暗面、零一万物、智谱AI、百川智能等国内主流大模型创业公司。
商汤-W(00020):国内权威大模型测评机构SuperCLUE发布《中文大模型基准测评2024年度报告》,商汤“日日新”融合大模型以总分68.3的优异成绩,与 DeepSeek V3 一起并列国内榜首,成为年度第一。在近期另一个权威综合评测机构OpenCompass的多模态评测中,商汤以同一款模型同样取得了榜单第一,分数大幅领先GPT-4o。