3月16日,百度正式发布了文心一言,能够与人对话互动,回答问题,协助创作。我们认为:1)一些NLP人机对话中基础的问答、总结、推理、创作能力基本具备;2)部分特定场景的中文理解可能超过了GPT;3)具备了初步的数理逻辑能力;4)有特色的多模态生成能力,某几个功能点很实用。
但同时,我们认为相比GPT4功能文心一言仍有较大差距,目前水平约在GPT3左右。发布会中有部分体现大模型强大指出的核心功能尚未充分展示。包括多轮对话、代码能力、长文本理解等GPT-4具有的能力,文心一言未进行展示。同时目前文心一言仍未全面公测,企业和个人用户可以在官网申请邀请后试用。 整体来看,文心一言展示出的水平符合我们预期:即从参数量、迭代路径看,国内NLP大模型水平介于BERT和GPT-3之间,与海外差距在2-3年。2021年GPT-3推出时,代码、长文本、语境等能力也较弱。在此后1年中,OPENAI快速迭代增加了codex、RLHF等尝试,并继续优化了PPO,在2022年推出instructGPT,其后能力才出现较大提升。我们认为百度文心已经初步具备LLM底座,期待后续迭代。 技术上,我们分析了百度NLP大模型ERNIE 1.0-3.0迭代,优势总结如下:1)ERNIE 1.0到3.0完整迭代,截至3.0已是相对可用状态,3.0模型结构便于下游二次开发部署;2)强大的百度内部特色中文语料库;3)基于BERT结构基础加上了知识图谱等特色功能,在部分规则训练场景有更好可控性;4)国内领先的开源AI训练框架,较强的算力基础设施。 但同时,我们也看到现阶段ERNIE底座的一些不足:1)模型结构仍然基于BERT,但目前海外巨头主流结构转变为GPT为代表的decoder-only,未来百度是否会在模型结构上继续迭代?2)根据3月16日百度文心一言发布会,目前百度在Prompt和RLHF已经掌握方法论,但实际训练量仍然有待提升;3)百度都使用了有特色是知识图谱训练,这一方式可以有效降低训练模型所需要消耗的算力。但当大语言模型达到千亿或者更高参数级别时,似乎自然具备了知识图谱训练下的能力。4)ERNIE使用了百度内部特色中文数据,提升模型中文能力。但是百度体系内高质量语料库相比庞大的英文互联网语料库仍然不足。 相关标的:互联网行业重点关注计划国内推出类GPT产品的三六零;应用相关,重点关注海外业务占比高,有望通过AI优化运营效率和产品体验的公司,海外业务贡献较多的巨人网络(持有playtika股权)、盛天网络、汤姆猫、昆仑万维、蓝色光标、神州泰岳、恺英网络;易点天下、鸿合科技。国内未来随着大模型迭代,合作伙伴也有望受益,关注风语筑、三人行、姚记科技、华策影视、创维数字。 计算机行业:建议重点关注跨模态应用,包括多模态应用:1)文生图:虹软科技(基于stable diffusion的多种2B图像应用)、新国都、中科创达(移动端文生图工具部署);2)机器人:三花智控等;3)其他应用:润达医疗(申万医药、医疗诊断AI)、福昕软件、万兴科技;视频、图像、文本素材:大华股份(工业场景视频素材和标注),AI领军、当虹科技;视觉和跨模态算法:商汤(港股)、云从科技、科大讯飞。 风险提示:大模型技术中美仍存在差异,部分技术尚处于早期实验室阶段,存在落地风险;实体清单等可能对训练硬件产生影响。 研究报告全文:行业及产计算机业2023年03月17日行百度文心一个符合预期的起点业研究看好AIGC系列之六行业点评相关研究3月16日百度正式发布了文心一言能够与人对话互动回答问题协助创作我们跨模态更多应用场景出现中国公司认为1一些NLP人机对话中基础的问答总结推理创作能力基本具备2部得到更大机会-AIGC系列之五2023年分特定场景的中文理解可能超过了GPT3具备了初步的数理逻辑能力4有特色的多证3月13日模态生成能力某几个功能点很实用券数据局国资云AIGC中东进全研究面数字经济-计算机行业周报但同时我们认为相比GPT4功能文心一言仍有较大差距目前水平约在GPT3左右发报20230306-202303102023年3月11布会中有部分体现大模型强大指出的核心功能尚未充分展示包括多轮对话代码能力日告长文本理解等GPT-4具有的能力文心一言未进行展示同时目前文心一言仍未全面公测企业和个人用户可以在官网申请邀请后试用证券分析师整体来看文心一言展示出的水平符合我们预期即从参数量迭代路径看国内NLP洪依真A0230519060003大模型水平介于BERT和GPT-3之间与海外差距在2-3年2021年GPT-3推出时hongyzswsresearchcom林起贤A0230519060002代码长文本语境等能力也较弱在此后1年中OPENAI快速迭代增加了codexlinqxswsresearchcomRLHF等尝试并继续优化了PPO在2022年推出instructGPT其后能力才出现较大李国盛A0230521080003ligsswsresearchcom提升我们认为百度文心已经初步具备LLM底座期待后续迭代杨海燕A0230518070003yanghyswsresearchcom技术上我们分析了百度NLP大模型ERNIE10-30迭代优势总结如下1ERNIE10联系人到30完整迭代截至30已是相对可用状态30模型结构便于下游二次开发部署2洪依真强大的百度内部特色中文语料库3基于BERT结构基础加上了知识图谱等特色功能在862123297818部分规则训练场景有更好可控性4国内领先的开源AI训练框架较强的算力基础设施hongyzswsresearchcom但同时我们也看到现阶段ERNIE底座的一些不足1模型结构仍然基于BERT但目前海外巨头主流结构转变为GPT为代表的decoder-only未来百度是否会在模型结构上继续迭代2根据3月16日百度文心一言发布会目前百度在Prompt和RLHF已经掌握方法论但实际训练量仍然有待提升3百度都使用了有特色是知识图谱训练这一方式可以有效降低训练模型所需要消耗的算力但当大语言模型达到千亿或者更高参数级别时似乎自然具备了知识图谱训练下的能力4ERNIE使用了百度内部特色中文数据提升模型中文能力但是百度体系内高质量语料库相比庞大的英文互联网语料库仍然不足相关标的互联网行业重点关注计划国内推出类GPT产品的三六零应用相关重点关注海外业务占比高有望通过AI优化运营效率和产品体验的公司海外业务贡献较多的巨人网络持有playtika股权盛天网络汤姆猫昆仑万维蓝色光标神州泰岳恺英网络易点天下鸿合科技国内未来随着大模型迭代合作伙伴也有望受益关注风语筑三人行姚记科技华策影视创维数字计算机行业建议重点关注跨模态应用包括多模态应用1文生图虹软科技基于stablediffusion的多种2B图像应用新国都中科创达移动端文生图工具部署2机器人三花智控等3其他应用润达医疗申万医药医疗诊断AI福昕软件万兴科技视频图像文本素材大华股份工业场景视频素材和标注AI领军当虹科技视觉和跨模态算法商汤港股云从科技科大讯飞风险提示大模型技术中美仍存在差异部分技术尚处于早期实验室阶段存在落地风险实体清单等可能对训练硬件产生影响请务必仔细阅读正文之后的各项信息披露与声明行业点评百度文心大模型纯NLP能力国内领先跨模态也有较多布局应用场景涵盖NLP大模型CV大模型跨模态大模型生物计算大模型行业大模型API包括了1ERNIE30文本理解与创作预置作文生成文案创作情感分析等任务提示2ERNIE-ViLGAI作画大模型3PLATO大模型开放域对话服务图1百度文心大模型和多行业工具平台资料来源百度文心官网申万宏源研究1从NLP基础底座ERNIE看文心一言核心能力NLP是百度能力核心也是本次文心一言的基础目前百度已有多个针对不同任务的优化预训练模型1ERNIE30具备语言理解能力以及写小说歌词诗歌对联等文学创作能力2ERNIE30Zeus基于知识增强的千亿模型3鹏城-百度文心参数规模达到2600亿的知识增强大模型4ERNIE30-Tiny首个基于多任务知识注入的下游无关蒸馏模型图2百度NLP预训练大模型底座请务必仔细阅读正文之后的各项信息披露与声明第2页共16页简单金融成就梦想行业点评资料来源百度文心官网申万宏源研究此外百度NLP大模型有大量下游应用包括医疗金融跨语言代码搜索等领域都有布局百度NLP核心能力是ERNIE大模型类似GPT之于openAI特点是基于知识图谱强化基于中文训练另外需要关注百度在模型结构上的选择和对于是否人类反馈prompt和RLHF的选择以及百度使用的中文语料库高质量数据是否足够NLP大模型ERNIE2019年开始多轮迭代起点是2019年的10受到googleBERT的较大启发ERNIE101在2019年4月推出模型结构基于BERT模型的进一步优化在中文的NLP任务上得到了当时较好的结果ERNIE10选择的模型结构是类似BERT的encoder-onlyERNIE10类似BERT使用了多层编码器结构的transformer模型大小也与BERT相同12个编码器层768个隐单元12个注意力头12encoderlayers768hiddenunitsand12attentionheads图3ERNIE10使用了encoder-only的结构和BERT类似1ERNIEEnhancedRepresentationthroughKnowledgelntegrationgithub开源httpsgithubcomPaddlePaddleLARKtreedevelopERNIE请务必仔细阅读正文之后的各项信息披露与声明第3页共16页简单金融成就梦想行业点评资料来源申万宏源研究但这一结构区别于GPT且目前google也开始从encoder-only过渡到encoder-decoder再到decoder-only所以后续百度是否仍然沿用这一模型结构迭代值得关注1此前在2018-2021年谷歌路线为encoder-only只有编码器2或encoder-decoder编码解码器3而同一时期openai一直基于decoder-only只有解码器路线迭代自己的AGI生成式大模型2直到2021年10月Google推出FLAN1370亿参数并从此开始重新转向只有decoder-only模型还提出了ChatGPT用到的InstructionTuning概念2023年google的最新跨模态大模型palm-e在NLP部分也使用了decoder-only结构3即中间有约20个月时间google并未使用decoder-only结构部分AI学者认为这是google在AGI产品上暂时落后于openai的原因之一区别于BERT的特在在于先验知识和异构数据整合特点一ERNIE10区别于BERT在mask上采取不同做法特点是先验知识的学习在绝大多数的研究中仅仅通过上下文来预测丢失的单词并对其进行建模这些模型没有考虑句子中的先验知识如下图案例在句子哈利波特是由罗琳JKRowling创作的一系列幻想小说中哈利波特HarryPotter是小说的名字而罗琳JKRowling是作家BERT可以通过实体内部的单词搭配来预测实体HarryPotter的缺失单词而无需借助较长的上下文ERNIE则假设如果模型学习更多有关先验知识的信息则该模型可以获得更可靠的语言表示ERNIE不是直接添加知识嵌入knowledgeembedding而是隐式地学习有关知识和较长语义依赖性的信息例如实体之间的关系实体的属性和事件的类型以指导单词嵌入学习图4ERNIE10和BERT在mask时选取了不同方式22018年10月谷歌提出3亿参数的BERTBidirectionalEncoderRepresentationfromTransformers只有编码器用一种完形填空的方法其训练效果超过人类表现宣告NLP范式的改变32019年10月Google发布了统一的模型框架T5基于编码解码器的T5BERT只有编码GPT只用解码最大模型110亿参数并开放请务必仔细阅读正文之后的各项信息披露与声明第4页共16页简单金融成就梦想行业点评先验知识生效资料来源ERNIEEnhancedRepresentationthroughKnowledgeIntegration申万宏源研究特点二采用百度内部的异构语料库进行预训练收集百度贴吧百度新闻百度百科的混合语料其中百度百科包含以正式语言撰写的文章是模型训练的强大基础百度新闻提供了最新的电影名演员名球队名等百度贴吧中的每个帖子可以看作是对话被用于DLM任务ERNIE10做到在多项中文任务上优于BERT且通过消融研究AblationStudies证实知识整合和对异构数据的预训练都能使模型获得更好的语言表示图5Resultson5majorChineseNLPtasks资料来源ERNIEEnhancedRepresentationthroughKnowledgeIntegration申万宏源研究注XNLI是自然语言推理数据集LCQMC是语义相似度数据集MSRA-NER是用于命名实体识别的数据集ChnSentiCorp是用于句子情感分析的数据集NLPCC-DBQA是用于问答系统的数据集继续迭代目前版本ERNIE30已在中文任务上取得较好效果2019年7月百度推出ERNIE204该框架通过不断的多任务学习来逐步构建和学习预训练任务最大限度地从训练语料库中提取词汇句法和语义信息2021年7最新大版本是ERNIE3054ERNIE20ACntinualPreTrainingFrameworkforLanguageUnderstanding5ERNIELarge-scaleKnowledgeEnhancedPre-trainingforLanguageUnderstandingandGeneration请务必仔细阅读正文之后的各项信息披露与声明第5页共16页简单金融成就梦想行业点评特点一模型结构多层框架ERNIE30在模型结构上的思路渭NLP不同任务范式对底层特征提取要求一致但对顶层具体特征要求不一致其中NLP学习语义连贯性而自然语言NLP生成则期望进一步的语境信息如下图ERNIE30不同的任务范式能够共享在一个共享网络中学习的底层抽象特征并分别利用在他们自己的特定任务网络中学习的特定任务顶层具体特征图6ERNIE30模型结构资料来源ERNIEEnhancedRepresentationthroughKnowledgeIntegration申万宏源研究该框架还支持随时引入各种定制任务因此可以更好的支持下游二次开发当给定一个新任务时ERNIE30框架可以根据以前的训练参数逐步训练分布式表征而不需要从头开始训练特点二大规模知识图谱学习通用知识-文本预测UKTP任务百度ERINE30认为googleT5和openaiGPT-3尽管很成功但是在没有引入语言知识和世界知识的情况下对普通文本进行训练的为了解决这一个问题ERNIE30在一个由普通文本和大规模知识图谱组成的4TB语料库上用100亿个参数训练该模型百度构建中文文本语料库存储量达4TB分11个不同类别语料库包含ERNIE20包括百科Feed等百度搜索包括百家号知乎贴吧经验网络文本QA-longQA-shortPoetry2Couplet3医疗法律金融等领域的特定数据以及百度知识图谱超过5000万条事实图7通用知识-文本预测请务必仔细阅读正文之后的各项信息披露与声明第6页共16页简单金融成就梦想行业点评资料来源ERNIEEnhancedRepresentationthroughKnowledgeIntegration申万宏源研究特点三既有有监督的微调fine-tuning也有零样本少样本学习在数学翻译等任务中使用了微调在中文新闻分类语义相似度等任务中零样本学习也取得较好效果最终经验结果表明该模型在54个中文NLP任务上的表现优于最先进的模型其英文版本在SuperGLUE基准测试中获得第一名比人类表现高出08906对898百度底座的其他优势paddlapaddle国内第一个开源神经网络框架2016年8月百度在Github上100开源内部使用多年的深度学习平台PaddlePaddlepaddlepaddle中文环境下较多的优势1能够应用于自然语言处理图像识别推荐引擎等多个领域其优势在于开放的多个领先的预训练中文模型适应中文环境2模型库丰富来自百度各个业务部门贡献3较多企业级的包可以直接在产业界落地使用4兼容大量国产AI芯片超大规模集群分布式计算能力paddlepaddle设计研发了具备更强扩展能力的端到端自适应大规模分布式训练架构6该架构可以针对不同的模型和硬件抽象成统一的分布式计算视图和资源视图并通过硬件感知细粒度切分和映射功能搜索出最优的模型切分和硬件组合策略将模型参数梯度优化状态按照最优策略分配到不同的计算卡上达到节省存储负载均衡提升训练性能的目的国内领先的算力底座在此前文心一言的压力测试中亚洲目前最大的单体智算中心山西阳泉百度智算中心已经将算力提升到每秒可以完成400亿亿次浮点运算总结6httpsarxivorgabs请务必仔细阅读正文之后的各项信息披露与声明第7页共16页简单金融成就梦想行业点评百度在NLP大模型上走出了特色道路并且毫无疑问是国内第一梯队水平优势总结如下1ERNIE10到30完整迭代截至30已是相对可用状态30模型结构便于下游二次开发部署2强大的百度内部特色中文语料库3基于BERT结构基础加上了知识图谱等特色功能在部分规则训练场景有更好可控性4国内领先的开源AI训练框架较强的算力基础设施但同时我们也看到现阶段ERNIE底座的一些不足1模型结构上仍然基于BERT但目前海外巨头主流结构转变为GPT为代表的decoder-only未来百度是否会在模型结构上继续迭代2截至30百度仍然使用fine-tuning等传统方法对细分任务微调而国际常见做法是Prompt或者RLHF人类反馈强化学习根据3月16日百度文心一言发布会目前百度在后者已经掌握方法论但实际训练量仍然有待提升3从10到30百度都使用了有特色是知识图谱训练这一方式可以有效降低训练模型所需要消耗的算力3月16日文心一言发布会也提到了这一特点但当大语言模型达到千亿或者更高参数级别时似乎自然具备了知识图谱训练下的能力是否暴力出奇迹才是AI大预言模型的最终答案4百度ERNIE使用了百度内部特色中文数据提升模型中文能力但是是否百度体系内高质量语料库相比庞大的英文互联网语料库仍然不足尽管有以上不足我们仍然认为百度在NLP能力上属于国内第一梯队也期待后续模型的进一步迭代提升2如何看待百度文心一言发布3月16日百度文心一言正式发布发布会上百度展示了多项能力我们认为1一些NLP人机对话中基础的问答总结推理创作能力基本具备文学创作总结和推理能力文言一心可以以问答式方式文学作品作者的详细信息总结概括文学作品的主要内容并可以连贯生成如何尝试续写三体该AI采用了知识增强和检索增强技术在训练过程中采用了5500亿知识图谱数据图8要求文心一言总结和续写三体请务必仔细阅读正文之后的各项信息披露与声明第8页共16页简单金融成就梦想行业点评资料来源百度文心一言发布会申万宏源研究商业文案创作表达和创作能力文言一心可以智能的给公司起名提供公司的服务Slogan可以根据具体需求创造数百字的新闻稿创作基本连贯清晰理解了提问者意图图9按照要求提供公司slogan资料来源百度文心一言发布会申万宏源研究2部分特定场景的中文理解可能超过了GPT发布会上展示了根据成语的白话理解反推询问的成语用成语写藏头诗图10对文心一言要求写藏头诗图11GPT-4无法理解藏头诗含义请务必仔细阅读正文之后的各项信息披露与声明第9页共16页简单金融成就梦想行业点评资料来源百度文心一言发布会申万宏源研究资料来源量子位公众号申万宏源研究3具备了初步的数理逻辑能力数学问题一直被认为是nlp是否具有初级逻辑能力的考查标准发布会中示范了一个简单数学题文心一言答案展示了部分思维链chainofthought能力图12文心一言解答数学问题资料来源百度文心一言发布会申万宏源研究4有特色的多模态生成能力某几个功能点很实用文言一心特色功能是对话中直接文生图根据一段简单的文字生成视频可以在百家号中使用根据内容生成粤语东北话闽南话等相关方言的语音以上跨模态功能是目前GPT-4未整合的图13根据一段话直接生成视频资料来源百度文心一言发布会申万宏源研究但同时我们认为发布会中有部分体现大模型强大指出的核心功能尚未充分展示包括多轮对话代码能力长文本理解等GPT-4具有的能力文心一言未进行展示请务必仔细阅读正文之后的各项信息披露与声明第10页共16页简单金融成就梦想行业点评3文心一言商业化拉动百度搜索小度智能驾驶和云赋能传媒软件金融等行业百度披露更多商业机会一方面与现有的搜索小度智能驾驶云投资公司爱奇艺等业务结合提升入口流量价值和云的份额另一方面文心一言通过牵手合作伙伴建立产业生态相关接入公司为AI提供落地场景也有望借助AI提升运营效率或产品体验尤其是在内容文本影视游戏营销等生成数字人办公智能家居金融等领域商业化-对内文心一言将与百度多项业务结合百度搜索提供交互和聊天体验微软证明了搜索引擎类GPT产品是可行路线2023年2月8日微软发布基于ChatGPT的新版EDGE浏览器和Bing搜索引擎在提供传统搜索内容的同时用户可以与搜索引擎进行对话交流获得更全面的答案3月8日微软宣布在超过百万的新Bing预览用户推动之下Bing每日活跃用户已突破1亿同时他还坦言在新版Bing的数百万活跃用户中有大约三分之一是新用户虽然ChatGPT或减少搜索广告的加载率对于谷歌而言是个风险但对于份额原来不高的微软Bing而言反而是一个提升流量入口地位的机会百度始终在中国搜索引擎市场占据龙头地位但近年来移动端站内搜索对传统的搜索引擎有分流文心一言与搜索引擎的结合有望加强搜索的入口低位百度的搜索份额保持在70-80之间PC时代搜索引擎是互联网的流量入口行业竞争格局相对稳固但移动互联网时代流量分散在各互联网巨头的头部App中流量相对分散且各个App均积极布局移动端的站内搜索分流PC端搜索和手机百度搜索量尤其是抖音微信的站内搜索图14中国移动搜索引擎份额请务必仔细阅读正文之后的各项信息披露与声明第11页共16页简单金融成就梦想行业点评资料来源Statecounter申万宏源研究表1腾讯和字节跳动对搜索的布局公司时间事件2017年微信上线搜一搜和看一看2020年微信边聊边搜成为了聊天场景里搜索的最短路径腾讯2020年腾讯收购搜狗2021年微信搜一搜月活用户达5亿2017年依托今日头条尝试搜索业务2019年头条搜索网页版上线字节跳动2020年推出头条搜索独立app抖音日均视频搜索次数突破4亿视频搜索月活用2020年户已超55亿资料来源晚点LatePost申万宏源研究小度小度将融合文心一言的全面能力提升小度与用户进行多轮对话的体验打造针对智能设备场景的人工智能模型小度灵机并应用到小度全系产品小度科技原是百度旗下智能生活事业群组业务后独立融资作为国内市场规模最大的对话式人工智能操作系统和全球智能屏最大的出货厂商小度科技已发布多款小度人工智能产品包括智能音箱智能屏智能耳机以及语音车载支架电视伴侣智能灯泡智能红外遥控智能按钮等周边产品还拥有小度助手DuerOS小度与诸多智能设备厂商建立合作自动驾驶智能座舱文心一言背后大模型应用至自动驾驶将加深车辆对复杂城市路况的理解文心的智能语音能力将搭载到Apollo智舱系列产品提升人车语音交互体验集度接入文心一言大模型后文心一言的车企朋友圈不断扩大岚图红旗长城东风日产爱驰零跑吉利汽车海马汽车等近10家车企加入文心一言的朋友圈爱奇艺双方共同探索将AIGC技术应用于爱奇艺内容搜索内容宣发内容创作工具小说创作等业务此次合作将把爱奇艺丰富的在线视频娱乐资源与百度的前沿技术相结合进一步赋能爱奇艺拓展其在影视内容创意制作效率用户体验等方面的生产能力长视频具有项目周期长人力密集型的特点AI有望提升内容生产的工业化程度商业化-对外结合垂直领域Know-how实现垂直领域赋能将通过百度智能云对外提供服务目前已有各领多家企业进入文心一言生态圈涵盖媒体内容智能设备金融汽车软件服务智能家居等领域涵盖融媒体游戏营销影视媒体智能设备金融汽车软件服务数字人金融等领域其中融媒体类接入最多包括传媒上市公司蓝色光标风语筑爱奇艺掌阅科技华策影视值得买巨人网络子公司世优科技等请务必仔细阅读正文之后的各项信息披露与声明第12页共16页简单金融成就梦想行业点评表2文心一言生态圈部分公司行业接入企业融媒体工信部新闻宣传中心人民邮电报社广州日报上海证券报澎湃新闻36氪等阅读七猫掌阅科技等教育艺术宝达内IT教育集团广告营销新潮传媒蓝色光标利欧股份等搜索火狐社交Soul视频爱奇艺等音乐太合音乐集团智能设备和家电小度科技酷开科技联想小新美的长虹等金融中国邮政储蓄银行百信银行广发证券等汽车集度汽车红旗汽车岚图汽车等数字场景飞天云动风语筑凡拓数创软件服务汉得信息金蝶软件宇信科技中软国际软通动力等资料来源各公司申万宏源研究百度云在AI领域已经积累多年对外服务加速将打开智能云业务收入及利润空间2022年百度智能云推出云智一体30架构涵盖底层的芯片昆仑芯片-深度学习框架飞桨PaddlePaddle-大模型文心大模型-应用搜索等中国AI公有云服务市场增速均高于中国整体AI软件市场的增速主要玩家包括百度云阿里云华为云和腾讯云等百度智能云连续四年居第一并且在人脸人体图像视频两个规模最大的子市场继续保持第一百度云今年对百度的业务贡献在增加百度核心非在线营销收入保持正增长通过复用标准化解决方案以及从低利润率项目中转移百度智能云利润率持续优化22Q4利润率提升展望后续随着文心一言加速对外服务智能云有望从提供基础的算力存储等业务向智能服务转型打开收入及利润空间图15百度核心业务收入亿元图16百度核心业务分业务YoY2704522530180135159045022Q122Q222Q322Q4022Q122Q222Q322Q4-15在线营销收入非在线营销收入在线营销收入非在线营销收入资料来源百度财报申万宏源研究资料来源百度财报申万宏源研究图17百度核心业务收入亿元图1822H1中国人工智能公有云服务市场份额请务必仔细阅读正文之后的各项信息披露与声明第13页共16页简单金融成就梦想行业点评70306025502040153010201050022Q122Q222Q322Q4调整后净利润利润率资料来源百度财报申万宏源研究资料来源IDC申万宏源研究4相关标的互联网行业重点关注计划国内推出类GPT产品的三六零应用相关重点关注海外业务占比高有望通过AI优化运营效率和产品体验的公司海外业务贡献较多的巨人网络持有playtika股权盛天网络汤姆猫昆仑万维蓝色光标神州泰岳恺英网络易点天下鸿合科技国内未来随着大模型迭代合作伙伴也有望受益关注风语筑三人行姚记科技华策影视创维数字计算机行业建议重点关注跨模态应用包括多模态应用1文生图虹软科技基于stablediffusion的多种2B图像应用新国都中科创达移动端文生图工具部署2机器人三花智控等3其他应用润达医疗申万医药医疗诊断AI金山办公福昕软件万兴科技视频图像文本素材大华股份工业场景视频素材和标注AI领军当虹科技视觉和跨模态算法商汤港股云从科技科大讯飞表3AI行业重点公司估值表证券代码公司名称2023316Wind一致预期归母净利润亿元PEPBLF总市值2021A2022E2023E2024E2021A2022E2023E2024E亿元688088SH虹软科技117141056169257832076945452002236SZ大华股份527337826433366399316201613210603108SH润达医疗8538040852164022211613234601360SH三六零872902-2469494118997-3517773280002558SZ巨人网络2089959391224144321221714171688039SH当虹科技56061-09910214892-5538412300130SZ新国都9220129747361346311915300300496SZ中科创达4736477691108149073624332521002050SZ三花智控850168424713066377350342823731300624SZ万兴科技900281061552073258558441073300494SZ盛天网络5312522430337642241714352300418SZ昆仑万维317154711651313152020272421263300459SZ汤姆猫210708---30---546请务必仔细阅读正文之后的各项信息披露与声明第14页共16页简单金融成就梦想行业点评603466SH风语筑8643912838847620672218409688327SH云从科技200-632-851-523-037----945-uw002230SZ科大讯飞1135155677018532613731486143713688111SH金山办公1428104100016542244137DIV086641703688095SH福昕软件70046-002052084150-359413383261300058SZ蓝色光标198522-67455768838-293629204300002SZ神州泰岳12238554867078832221815252002517SZ恺英网络18257710781418175332171310418301171SZ易点天下11525930738249945383023360002955SZ鸿合科技7516942452664744181412209605168SH三人行1315057321024133226181310611002605SZ姚记科技7757438048060013201613287300133SZ华策影视11240047055364028242018167000810SZ创维数字1994228881098134147221815334资料来源Wind申万宏源研究风险提示大模型技术中美仍存在差异部分技术尚处于早期实验室阶段存在落地风险实体清单等可能对训练硬件产生影响请务必仔细阅读正文之后的各项信息披露与声明第15页共16页简单金融成就梦想行业点评信息披露证券分析师承诺本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师以勤勉的职业态度专业审慎的研究方法使用合法合规的信息独立客观地出具本报告并对本报告的内容和观点负责本人不曾因不因也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿与公司有关的信息披露本公司隶属于申万宏源证券有限公司本公司经中国证券监督管理委员会核准取得证券投资咨询业务许可本公司关联机构在法律许可情况下可能持有或交易本报告提到的投资标的还可能为或争取为这些标的提供投资银行服务本公司在知晓范围内依法合规地履行披露义务客户可通过complianceswsresearchcom索取有关披露资料或登录wwwswsresearchcom信息披露栏目查询从业人员资质情况静默期安排及其他有关的信息披露机构销售团队联系人华东A组陈陶021-33388362chentao1swhysccom华东B组谢文霓18930809211xiewenniswhysccom华北组李丹010-66500631lidan4swhysccom华南组李昇0755-82990609Lisheng5swhysccom股票投资评级说明证券的投资评级以报告日后的6个月内证券相对于市场基准指数的涨跌幅为标准定义如下买入Buy相对强于市场表现20以上增持Outperform相对强于市场表现520中性Neutral相对市场表现在55之间波动减持Underperform相对弱于市场表现5以下行业的投资评级以报告日后的6个月内行业相对于市场基准指数的涨跌幅为标准定义如下看好Overweight行业超越整体市场表现中性Neutral行业与整体市场表现基本持平看淡Underweight行业弱于整体市场表现我们在此提醒您不同证券研究机构采用不同的评级术语及评级标准我们采用的是相对评级体系表示投资的相对比重建议投资者买入或者卖出证券的决定取决于个人的实际情况比如当前的持仓结构以及其他需要考虑的因素投资者应阅读整篇报告以获取比较完整的观点与信息不应仅仅依靠投资评级来推断结论申银万国使用自己的行业分类体系如果您对我们的行业分类有兴趣可以向我们的销售员索取本报告采用的基准指数沪深300指数法律声明本报告仅供上海申银万国证券研究所有限公司以下简称本公司的客户使用本公司不会因接收人收到本报告而视其为客户客户应当认识到有关本报告的短信提示电话推荐等只是研究观点的简要沟通需以本公司httpwwwswsresearchcom网站刊载的完整报告为准本公司并接受客户的后续问询本报告首页列示的联系人除非另有说明仅作为本公司就本报告与客户的联络人承担联络工作不从事任何证券投资咨询服务业务本报告是基于已公开信息撰写但本公司不保证该等信息的准确性或完整性本报告所载的资料工具意见及推测只提供给客户作参考之用并非作为或被视为出售或购买证券或其他投资标的的邀请或向人作出邀请本报告所载的资料意见及推测仅反映本公司于发布本报告当日的判断本报告所指的证券或投资标的的价格价值及投资收入可能会波动在不同时期本公司可发出与本报告所载资料意见及推测不一致的报告客户应当考虑到本公司可能存在可能影响本报告客观性的利益冲突不应视本报告为作出投资决策的惟一因素客户应自主作出投资决策并自行承担投资风险本公司特别提示本公司不会与任何客户以任何形式分享证券投资收益或分担证券投资损失任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效本报告中所指的投资及服务可能不适合个别客户不构成客户私人咨询建议本公司未确保本报告充分考虑到个别客户特殊的投资目标财务状况或需要本公司建议客户应考虑本报告的任何意见或建议是否符合其特定状况以及若有必要咨询独立投资顾问在任何情况下本报告中的信息或所表述的意见并不构成对任何人的投资建议在任何情况下本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任市场有风险投资需谨慎若本报告的接收人非本公司的客户应在基于本报告作出任何投资决定或就本报告要求任何解释前咨询独立投资顾问本报告的版权归本公司所有属于非公开资料本公司对本报告保留一切权利除非另有书面显示否则本报告中的所有材料的版权均属本公司未经本公司事先书面授权本报告的任何部分均不得以任何方式制作任何形式的拷贝复印件或复制品或再次分发给任何其他人或以任何侵犯本公司版权的其他方式使用所有本报告中使用的商标服务标记及标记均为本公司的商标服务标记及标记请务必仔细阅读正文之后的各项信息披露与声明第16页共16页简单金融成就梦想
|
相关行业报告
|