>> 中信建投-计算机行业:国内外大模型发展情况梳理-240515
上传日期: |
2024/5/16 |
大小: |
6487KB |
格式: |
pdf 共43页 |
来源: |
中信建投 |
评级: |
-- |
作者: |
于芳博 |
行业名称: |
计算机 |
下载权限: |
此报告为加密报告 |
|
核心观点:2022年11月30日OpenAI发布ChatGPT,随即引爆社交网络,大模型行业进入加速发展阶段。国外基础模型实力强劲、不断精进,开源模型打造庞大应用生态,端侧模型小而美。国内大模型也进入加速成长期,在过去一年中取得了实质性突破。百度文心一言、讯飞星火、清华智谱ChatGLM4、商汤“日日新SenseNova5.0”整体表现逼近GPT-4,开源模型快速进步,文生视频、文生音乐等多模态也取得突破。国内大模型网页流量和应用下载量节节攀升,大模型已经成为日常生活中的重要助手。 国外大模型持续领跑,闭源、开源、端侧模型异彩纷呈。国外大模型主要分为三个层级:性能强劲的闭源模型,具备生态优势的开源模型,以及专注端侧应用的轻量模型。国外基础模型能力持续提升,闭源模型中巨头各显其才。GPT-4性能卓越,始终处于领跑地位,GPT-4o模型实现端到端信息处理,人机交互体验大幅提升;Claude 3后起之秀,整体性能十分强劲;原生多模态大模型Gemini,多模态能力、跨模态能力取得突破。开源模型领域中,LLama2模型塑造了庞大的开源模型家族,LLama3能力大幅提升;Mixtral 8x7B为开源领域引入专家混合技术,成为开源模型的重要力量。端侧应用需要在轻量参数和模型性能之间平衡,Phi-3、Gemma2实现轻量级模型的小而美。国外闭源模型有望迎来突破,我们预期GPT-5或于近期发布,性能改进超预期。 国内大模型进入性能提升的关键时期,模型应用逐步铺开。2022年11月30日OpenAI发布ChatGPT,随即引爆社交网络。国内大模型也进入加速成长期,在过去一年中取得了实质性突破。国内第一梯队的大模型整体能力目前已经逼近GPT-4,部分模型中文能力与GPT-4相差无几。百度文心大模型4.0整体性能优异,成为首个国内面向C端收费的大模型产品;科大讯飞星火大模型V3.5性能逼近GPT-4,6月27日模型即将再度更新;清华智谱ChatGLM4基础模型性能强劲,大模型生态全面对标OpenAI;商汤“日日新SenseNova5.0”大模型,其主流客观评测指标达到或超越GPT-4 Turbo。开源模型阵营中,存在通义千问、百川智能实力强劲的竞争对手。多模态模型中,国产大模型同样进展不断,国产文生视频大模型Vidu发布,对标Sora持续迭代;昆仑万维发布文生音乐大模型天工Skymusic,整体表现不输Suno。国内大模型网页流量和应用下载量节节攀升,安卓应用商店中豆包累计下载1.47亿,讯飞星火累计下载1.06亿,大模型已经成为日常生活中的重要助手。 风险提示:大模型技术发展不及预期、商业化落地不及预期、算力基础设施支持不及预期、政策监管力度不及预期、数据数量与数据质量不及预期。
|
|