研报下载就选股票报告网
您好,欢迎来到股票分析报告网!登录   忘记密码   注册
>> 海通证券-计算机行业跟踪周报367期:国产推理模型已达顶尖水平,OpenAI Operator发布-250126
上传日期:   2025/1/26 大小:   465KB
格式:   pdf  共3页 来源:   海通证券
评级:   优于大市 作者:   杨林,杨蒙,杨昊翊
行业名称:   计算机
下载权限:   此报告为加密报告
中国银行发布支持人工智能产业链行动方案,未来5年提供不低于1万亿元专项综合金融支持。1月23日,中国银行在京发布《支持人工智能产业链发展行动方案》(以下简称《行动方案》),中国银行董事长葛海蛟,全国政协委员、科学技术部原副部长李萌,中国移动董事长杨杰,上海人工智能实验室主任、首席科学家周伯文,科技企业代表智谱华章首席执行官张鹏出席活动并致辞;中国银行行长张辉介绍《行动方案》,副行长张小东主持活动。根据《行动方案》,中国银行计划未来五年为人工智能全产业链各类主体提供合计规模不低于1万亿元专项综合金融支持,其中股、债合计不低于3000亿元,同时建立与人工智能技术创新相适配的专项制度保障,服务产业链各环节金融需求。根据《行动方案》,中国银行将围绕赋能国家科技自立自强、服务人工智能要素供给、助推人工智能技术创新、促进人工智能场景应用等重点工作,构建全方位、多层次金融服务体系,以扎扎实实的行动,为建设现代化产业体系、加快实现高水平科技自立自强作出新的更大贡献。
  DeepSeek-R1发布,性能对标OpenAI o1正式版。1月20日,DeepSeek-R1正式发布,并同步开源模型权重。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。DeepSeek-R1遵循MITLicense,允许用户通过蒸馏技术借助R1训练其他模型。此外,DeepSeek-R1上线API,对用户开放思维链输出。DeepSeek在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,通过DeepSeek-R1的输出,蒸馏了6个小模型开源给社区,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元,在目前主流o1类推理模型中定价最低。对比来看,OpenAI o1每百万输出tokens 438元,是DeepSeek-R1的27倍以上。
   Kimi k1.5多模态思考模型发布,实现SOTA级别多模态推理和通用推理能力。1月20日,Kimi全新SOTA模型——k1.5多模态思考模型发布,从基准测试成绩看,k1.5多模态思考模型实现了SOTA(state-of-the-art,代表目前最高水平的)级别的多模态推理和通用推理能力。在short-CoT模式下,Kimi k1.5的数学、代码、视觉多模态和通用能力,大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude3.5 Sonnet的水平,领先达到550%。在long-CoT模式下,Kimi k1.5的数学、代码、多模态推理能力,也达到长思考SOTA模型OpenAI o1正式版的水平。这应该是全球范围内,OpenAI之外的公司首次实现o1正式版的多模态推理性能。2025年,Kimi会继续沿着路线图,加速升级k系列强化学习模型,带来更多模态、更多领域的能力和更强的通用能力。
  豆包大模型1.5Pro发布,全面提升多模态能力、推理能力。1月22日,豆包大模型1.5Pro版本正式发布。新模型综合能力显著增强,低训练/推理成本,高效模型结构,全面提升多模态能力、推理能力,多项公开评测基准上全球领先。豆包大模型1.5Pro在知识(MMLU_PRO、GPQA)、代码(McEval、FullStackBench)、推理(DROP)、中文(CMMLU、C-Eval)等多项公开测评基准上成绩全球领先。豆包大模型1.5Pro使用较小的激活参数进行预训练,训练成本极低,但性能不打折,采用大规模稀疏MoE架构,等效7倍激活参数的Dense模型性能,远超业内MoE架构约3倍杠杆的常规效率。基于豆包1.5基座模型,通过RL算法的突破和工程优化,在未使用其他模型数据的情况下,研发豆包深度思考模型。阶段性进展Doubao-1.5-Pro-AS1-Preview在AIME上已取得了业内领先的成绩。此外,全新的豆包实时语音模型Doubao-1.5-realtime-voice-pro,采用Speech2Speech端到端框架,表现力实现质的飞跃,真正做到会哭会笑、能说方言会唱歌。
   OpenAI发布Operator,为OpenAI第一个商用智能体。1月23日,OpenAI发布Operator,这是一款能够访问网页并为用户执行任务的智能体。Operator使用自己的浏览器,能够查看网页,并通过输入、点击和滚动等操作与网页进行交互。Operator是OpenAI首批智能体之一,这些智能体能够独立为用户工作——用户只需给它一个任务,它就会执行。用户可以要求Operator处理各种各样重复性的浏览器任务,比如填写表格、订购杂货,甚至制作表情包。它能够使用人类日常交互的相同界面和工具,这拓宽了人工智能的实用性,帮助人们在日常任务上节省时间,同时为企业开辟新的互动机会。Operator由名为Computer-Using Agent(CUA)的新模型驱动。CUA将GPT-4o的视觉能力与通过强化学习实现的高级推理能力相结合,经过训练可与图形用户界面——用户在屏幕上看到的按钮、菜单和文本字段进行交互。Operator可以通过截图“看到”浏览器内容,并通过鼠标和键盘允许的所有操作与之“交互”,使其无需定制API集成即可在
 
Copyright © 2005 - 2021 Nxny.com All Rights Reserved 备案号:蜀ICP备15031742号-1