投资逻辑
百度于2023年3月16日召开关于“文心一言”的主题发布会,“文心一言”作为国内首款正式发布的生成式语言大模型,拥有文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等功能。文心平台依托于百度自研的产业级深度学习平台飞桨(PaddlePaddle)打造,致力于为用户提供一站式AI开发服务: AI大模型与行业大模型:文心平台提供NLP、CV、跨模态、生物计算四大主流AI研究领域的多个基础大模型,多个模型在技术层面实现突破创新,处于世界领先水平。其中,NLP领域的ERNIE 3.0 Zeus采用自回归网络和自编码网络,能够兼顾自然语言理解和生成功能;CV领域的VIMER-UFO 2.0使用超网络结构,推理时仅需激活总参数量的1/30;ERNIE-ViLG 2.0引入基于语言和图像的知识增强算法,在文本图像生成任务中的表现已经超越了OpenAI旗下的DALLE-2。文心平台与各行业企业联手打造行业大模型,目前已覆盖能源、金融、航天、制造、传媒、城市、社科、电影等8个领域。目前已有650余家知名企业宣布接入“文心一言”,涵盖企业服务、金融IT、汽车、传媒、教育、家电、金融等10余个行业。 一站式开发平台与开发工具:开发平台方面,文心面向专业知识有限的AI应用开发者提供零门槛平台EasyDL,面向专业开发者提供全功能平台BML。目前这两个平台均仅支持使用百度文心的云端算力,可采用公有云、私有化离线、软硬一体等部署方式。开发工具方面,文心提供ERNIEKit自然语言处理开发工具及PaddleFleetX全流程开发套件。此外,现阶段文心平台还向开发者免费提供大模型API。 产品与社区:百度文心通过构建产品与社区经营,对外展示生成式模型的强大性能,以此吸引爱好者投入创作,进而构筑成熟的AIGC社区,可在实践中探索AI商业化模式。目前除“文心一言”外,文心平台提供产业级搜索系统“文心百中”、艺术创意辅助平台“文心一格”,以及采用众创模式的旸谷社区。 目前百度文心生成式语言大模型在参数规模、技术创新、应用落地方面均在国内同业中处于领先水平。3月16日起,“文心一言”首批用户可通过邀请测试码接入体验,同时百度智能云将面向企业客户开放“文心一言”API调用接口,有望进一步丰富百度AI生态,赋能更多行业伙伴。 投资建议 相较于ChatGPT等海外模型存在连接限制,百度文心平台可以为国内用户提供更便捷的技术入口。“文心一言”的发布将极大加速国内生成式AI模型的落地应用节奏,有望帮助生态伙伴实现用户体验提升和生产降本增效。建议关注接入“文心一言”生态的公司,如恒生电子、用友网络、汉得信息、凌志软件、宇信科技等。 风险提示 海外基础软硬件使用受限;应用落地不及预期;行业竞争加剧风险。 研究报告全文:投资逻辑百度于2023年3月16日召开关于文心一言的主题发布会文心一言作为国内首款正式发布的生成式语言大模型拥有文学创作商业文案创作数理逻辑推算中文理解多模态生成等功能文心平台依托于百度自研的产业级深度学习平台飞桨PaddlePaddle打造致力于为用户提供一站式AI开发服务AI大模型与行业大模型文心平台提供NLPCV跨模态生物计算四大主流AI研究领域的多个基础大模型多个模型在技术层面实现突破创新处于世界领先水平其中NLP领域的ERNIE30Zeus采用自回归网络和自编码网络能够兼顾自然语言理解和生成功能CV领域的VIMER-UFO20使用超网络结构推理时仅需激活总参数量的130ERNIE-ViLG20引入基于语言和图像的知识增强算法在文本图像生成任务中的表现已经超越了OpenAI旗下的DALLE-2文心平台与各行业企业联手打造行业大模型目前已覆盖能源金融航天制造传媒城市社科电影等8个领域目前已有650余家知名企业宣布接入文心一言涵盖企业服务金融IT汽车传媒教育家电金融等10余个行业一站式开发平台与开发工具开发平台方面文心面向专业知识有限的AI应用开发者提供零门槛平台EasyDL面向专业开发者提供全功能平台BML目前这两个平台均仅支持使用百度文心的云端算力可采用公有云私有化离线软硬一体等部署方式开发工具方面文心提供ERNIEKit自然语言处理开发工具及PaddleFleetX全流程开发套件此外现阶段文心平台还向开发者免费提供大模型API产品与社区百度文心通过构建产品与社区经营对外展示生成式模型的强大性能以此吸引爱好者投入创作进而构筑成熟的AIGC社区可在实践中探索AI商业化模式目前除文心一言外文心平台提供产业级搜索系统文心百中艺术创意辅助平台文心一格以及采用众创模式的旸谷社区目前百度文心生成式语言大模型在参数规模技术创新应用落地方面均在国内同业中处于领先水平3月16日起文心一言首批用户可通过邀请测试码接入体验同时百度智能云将面向企业客户开放文心一言API调用接口有望进一步丰富百度AI生态赋能更多行业伙伴投资建议相较于ChatGPT等海外模型存在连接限制百度文心平台可以为国内用户提供更便捷的技术入口文心一言的发布将极大加速国内生成式AI模型的落地应用节奏有望帮助生态伙伴实现用户体验提升和生产降本增效建议关注接入文心一言生态的公司如恒生电子用友网络汉得信息凌志软件宇信科技等风险提示海外基础软硬件使用受限应用落地不及预期行业竞争加剧风险敬请参阅最后一页特别声明1行业深度研究内容目录1百度文心平台可提供一站式AI开发服务32文心平台提供四大主流领域AI大模型及行业大模型33文心平台提供一站式开发平台与工具94文心平台提供搜索创作等产品125国内其他生成式语言模型146投资建议147风险提示14图表目录图表1百度文心平台全景图3图表2文心NLP大模型可支持语言理解语言生成等功能3图表3ERNIE30Zeus创新性地提出知识增强方法4图表4文心NLP大模型技术演进可划分为3条主线5图表5文心CV大模型可支持一站式视觉任务定制和应用服务5图表6VIMER-UFO20采用超网络结构6图表7文心跨模态大模型支持多场景应用6图表8ERNIE-ViLG20模型引入知识增强算法7图表9文心生物大模型在多任务中已达到世界领先水平7图表10文心行业大模型拥有丰富的合作案例7图表11文心行业大模型融合知识增强技术8图表12已有650余家公司接入百度文心一言9图表13EasyDL提供一站式零代码AI模型开发10图表14EasyDL可支持多场景任务10图表15BML全功能AI开发平台架构概览11图表16EasyDL与BML提供的模型部署方式11图表17EasyDL与BML提供的模型部署方式11图表18百度文心提供大模型API12图表19文心百中使用流程简单13图表20文心一格收费价格02-08元张13图表21旸谷社区部分创意应用13图表22国内主流生成式语言模型对比14敬请参阅最后一页特别声明2行业深度研究1百度文心平台可提供一站式AI开发服务百度于2023年3月16日召开关于文心一言的主题发布会文心一言作为国内首款正式发布的生成式语言大模型可支持文学创作商业文案创作数理逻辑推算中文理解多模态生成等功能文心平台依托于百度自主研发的产业级深度学习平台飞桨PaddlePaddle打造集先进的全领域AI大模型全面的AI算法集端到端开发套件和平台化服务于一体致力为用户提供一站式AI开发服务图表1百度文心平台全景图来源百度文心国金证券研究所2文心平台提供四大主流领域AI大模型及行业大模型文心大模型是百度文心平台的核心包括自然语言处理NLP计算机视觉CV跨模态生物计算四个主流AI研究领域下的多个基础大模型此外百度文心还基于基础大模型与各行业企业深度合作通过学习行业特色数据与知识而形成多个行业大模型21文心NLP大模型文心NLP大模型是百度文心着重布局的领域其主要面向语言理解语言生成等NLP场景包含一系列在功能和应用场景上各有侧重的语言大模型图表2文心NLP大模型可支持语言理解语言生成等功能模型名称应用场景特点文心旗下最先进的自然语言大模型参数规模达问答智能创作情感分千亿级创新地采用知识增强方法在各类真实ERNIE30Zeus析等各类自然语言理解和场景的生成准确性流畅性相关性上全面领先生成任务业界其他大模型ERNIE30的轻量级版本应用模型压缩技术大各类自然语言理解和生成ERNIE30Tiny幅降低了推理算力需求在效果和ERNIE30持任务平的情况下获得数十倍至上百倍的速度提升在海量金融领域文本和通用文本上进行训练具ERNIE-Finance金融场景相关的NLP任务备丰富的金融领域知识在金融问答金融信息抽取等任务上表现较好ERNIE-Health医疗场景相关的NLP任务学习了海量的医疗专业术语和医疗专业问答数敬请参阅最后一页特别声明3行业深度研究模型名称应用场景特点据以超越人类医学专家水平的成绩登顶中文医疗信息处理权威榜单CBLUE采用多语言多任务联合训练的方式支持100多ERNIE-Code自然语言代码生成种自然语言和15种编程语言产品反馈分析服务质量用户可以使用自然语言自定义抽取目标无需训ERNIE-UIE评测舆情监测等信息抽练即可抽取输入文本中的对应信息取场景突破了语料规模对多语言模型的学习效果限制ERNIE-M跨语言的各类任务能够从单语语料中学习语言间的语义对齐关系ERNIE-Search检索场景的多种任务以领先搜索能力登顶段落排序榜单MS-MARCO能够同时对文本语义与图结构信息进行建模显ERNIE-Sage搜索推荐问答等任务著提升了其在推荐场景的表现全球首个基于隐变量方式对话大模型具备接近PLATO对话场景真人水平的多轮流畅对话能力对话效果达到世界领先水平来源百度文心国金证券研究所ERNIE30Zeus是目前百度文心旗下最先进的自然语言大模型发布于2022年5月在架构设计上ERNIE30Zeus采用Transformer作为骨干网络并创新性地融合了自回归网络和自编码网络使得模型同时具备了自然语言理解和自然语言生成能力目前以ChatGPT为首的大规模生成式预训练语言模型均仅基于自回归网络进行训练导致这类模型在自然语言理解任务上表现较弱在模型训练上ERNIE30Zeus在GPT-3等传统大规模语言模型上做出了突破创新性地提出了知识增强方法在海量文本数据之外将大规模知识图谱也引入模型训练过程并持续对百余种不同形式的任务数据进行学习实现了任务知识增强相比于仅使用文本数据进行训练的传统大规模生成式预训练语言模型ERNIE30Zeus对常识知识掌握更好具备更强的知识推理能力图表3ERNIE30Zeus创新性地提出知识增强方法来源百度文心国金证券研究所文心NLP大模型在技术演进上可以划分为ERNIE模型迭代在多模态领域的进展PLATO模型迭代三条主线主线一文心ERNIE的版本迭代一方面从2019年的文心ERNIE10到2022年的ERNIE30Zeus的版本迭代中文心NLP大模型在参数规模上实现了指数级敬请参阅最后一页特别声明4行业深度研究增长最新的ERNIE30Zeus在参数规模上已与国际先进水平到达同一量级另一方面百度文心在NLP大模型研发的四年中创新性地提出了知识增强方法这使文心NLP大模型具备比ChatGPT等同类语言模型更强的常识掌握和知识推理能力并在SuperGLUE和GLUE等复杂语言理解榜单中多次登顶主线二文心ERNIE在跨模态跨语言任务方面的进步一方面跨语言学习任务的突破打破了语料规模对多语言模型的学习效果限制长久以来互联网中存在的高质量中文文本数据显著低于英文文本跨语言学习使得模型可以从英文数据中学习到适用于中文文本的语言联系大大降低了模型训练对海量中文训练数据的要求另一方面跨模态学习任务的突破为百度文心NLP大模型的发展奠定了良好的技术基础百度文心在ERNIE-Sage首次对图结构进行了学习使AI模型获得了同时学习文本信息和图结构的能力知识增强技术是百度文心NLP大模型的核心技术路线之一而知识图谱作为知识增强技术的实现方式同样采用图结构跨模态学习任务的突破将推动百度文心知识增强方法的演进未来有望实现图结构和文本信息对齐使得AI具备常识掌握能力主线三对话生成大模型文心PLATO迭代演进一方面从2019年的PLATO到2021年的PLATOXL文心语言大模型实现了参数规模的迅猛增长这使得文心语言大模型的智能水平出现了较为显著的提高另一方面PLATO在技术路线上创新性的采用了基于隐变量的模型构建方式使得模型在不降低鲁棒性的前提下开放域对话生成能力进一步增强图表4文心NLP大模型技术演进可划分为3条主线来源百度文心AI大模型公众号国金证券研究所22文心CV大模型文心CV大模型基于领先的视觉技术利用海量的图像视频等数据训练致力于为企业和开发者提供强大的计算机视觉基础模型以及一站式视觉任务定制与应用服务图表5文心CV大模型可支持一站式视觉任务定制和应用服务模型名称应用场景特点视觉多任务统一大模型可针对特定任务抽取轻VIMER-UFO20智慧城市量级小模型兼顾大模型效果和小模型推理性能能够有效减少推理算力消耗易于落地部署图像分类图像检测先进的视觉自监督预训练模型在图像分类目VIMER-CAE图像分割标检测语义分割等达到世界领先水平VIMER-StrucTexT端到端文档OCR表征学习预训练模型在5项不OCR文字识别20同文档图像理解任务上刷新记录商品识别多模态搜索与基于海量的互联网商品图文信息训练显著改善VIMER-UMS推荐零售快消数字化等商品视觉检索和商品多模态检索体验来源百度文心国金证券研究所VIMER-UFO20是目前百度文心旗下最先进的视觉大模型其创新性的提出了视觉多任敬请参阅最后一页特别声明5行业深度研究务的超网络与训练方案使模型无需对下游任务进行微调便可直接应用处理多个任务以智慧城市场景为例VIMER-UFO20可以用单模型实现人脸识别人体和车辆多重识别等场景任务VIMER-UFO20在底层架构上采用超网络结构超网络结构是一种稀疏神经网络模型在进行推理时只需激活对应的部分参数为每个独立任务自动分配各自特定的参数路径和共享路段可有效减少推理算力消耗VIMER-UFO20模型参数为170亿而在进行任务推理时只需激活部分参数实际计算量仅约为6亿参数加速比接近30倍图表6VIMER-UFO20采用超网络结构来源百度文心国金证券研究所超网络的结构设计还使得模型具备灵活可伸缩的弹性部署能力当用户仅需处理单个场景任务时可以根据具体任务独立抽取对应的子网络进行部署而无需部署完整大模型大大降低了AI的落地成本23文心跨模态大模型文心跨模态大模型基于知识增强技术对跨模态语义信息理解较好可实现跨模态检索图文生成图片文档的信息抽取等跨模态场景应用的快速搭建助力AI技术产业化落地图表7文心跨模态大模型支持多场景应用模型名称应用场景特点图像生成艺术创作虚拟现百度文心旗下最先进的AI画图模型在文本ERNIE-ViLG20实AI辅助设计等生成图像任务中刷新世界最好效果视觉常识推理视觉问答跨业界首个融合场景图知识的多模态预训练模ERNIE-ViL模态检索引用表达式理解等型在多项经典多模态任务中刷新了世界纪录文档分类信息抽取采用文档布局知识增强技术在4项文档理ERNIE-Layout文档问答等解任务上刷新世界纪录语音编辑语音生成语音克采用语音-文本联合训练同时支持中文和英ERNIE-SAT隆等语言-文本跨模态场景文模型充分学习地理和语言之间的关联已在百ERNIE-GeoL地理-语言跨模态场景度地图POI检索等场景实现落地来源百度文心国金证券研究所文心跨模态大模型继承了文心语言大模型的技术路线将知识增强算法引入跨模态大模型中使模型具备了更加精确的语义理解能力其中ERNIE-ViLG20作为百度文心旗下敬请参阅最后一页特别声明6行业深度研究最先进的AI画图模型基于混合降噪专家网络构建在图像生成中的不同阶段选择不同的专家网络有效地解决了AI作图中不同阶段对模型能力要求不一致的问题ERNIE-ViLG20还引入了基于语言和图像知识的知识增强算法使模型更关注图像与文本中的主体要素大大提升了生成图像的质量ERNIE-ViLG20在文本图像生成任务中表现已超越了OpenAI于2022年4月推出的DALL-E2图表8ERNIE-ViLG20模型引入知识增强算法来源百度文心国金证券研究所24文心生物计算大模型文心生物计算大模型融合了自监督和多任务学习方法将生物领域中化合物分子蛋白分子等研究对象的特性融入模型构建了先进的生物计算领域预训练模型有望赋能生物医药行业图表9文心生物大模型在多任务中已达到世界领先水平模型名称应用场景特点业界首个考虑原子间多体交互长程相互作用的模型HelixGEM-2小分子药物研发在量子化学属性预测和虚拟筛选双场景上达到领先效果业界首个开源的基于单序列语言模型的蛋白结构预测大HelixFold-Single蛋白质结构预测模型预测效果达世界领先水平全国产化软硬件适配的高效蛋白质结构分析大模型在HelixFold蛋白质结构预测精度持平的情况下模型性能显著优于AlphaFold来源百度文心国金证券研究所HelixGEM-2是业界首个考虑原子间多体交互长程相互作用的模型创新性地采用多轨机制对化合物的不同阶的多体集合进行长程建模在量子化学属性预测和虚拟筛选双场景上达到领先效果2021年11月百度文心与国际知名生物制药公司赛诺菲达成合作协议赛诺菲将利用百度文心生物计算平台在生物计算领域相关技术优化与加速mRNA疫苗和药物的设计研发工作25文心行业大模型文心行业大模型是文心大模型与各行业企业联手在通用大模型的基础上学习行业特色数据与知识建立的具有行业特色的AI基础设施目前文心行业大模型已成功与11家企业或部门完成合作各自形成了具有行业特色性能优良有落地潜力的行业大模型涵盖能源金融航天制造传媒城市社科电影8个行业领域图表10文心行业大模型拥有丰富的合作案例合作案例行业合作对象应用场景设备技术标准知识库电力知识问答系国网-百度文心能源电力国家电网统电力文档智能分析等多个能源行业应用场景敬请参阅最后一页特别声明7行业深度研究合作案例行业合作对象应用场景智能对话智能文档分析智能双录等浦发-百度文心金融浦发银行多个金融行业应用场景航天故障部位信息抽取航天工程文献航天-百度文心航天中国航天与探月工程情报分类航天技术文献检索与摘要生成等多个航天领域应用场景人民网新闻内容分类新闻情感分析新闻摘传媒人民网-百度文心要生成等多个媒体场景冰城-百度文心城市管理哈尔滨市政府市长热线工单分类投诉工单信息抽取电影频道电影中央电视台电影频道视频修复及清晰度提升-百度文心燃气行业中的场站槽车安全作业园区深燃-百度文心能源深圳燃气安全生产营业厅着装规范安全隐患预警等智能客服系统车载语音系统领域知吉利-百度文心汽车吉利汽车识库构建等汽车行业应用场景电子制造行业各种不同产线工艺场景的TCL-百度文心制造TCL缺陷检测知识挖掘词条管理版权保护等人文辞海-百度文心社科上海辞书出版社社科行业应用场景来源百度文心国金证券研究通过与各行各业携手构建文心行业大模型百度文心积累了旗下文心NLP大模型文心CV大模型文心跨模态大模型在多个行业多种应用场景中落地的相关经验形成了较为成熟的AI赋能模式图表11文心行业大模型融合知识增强技术来源百度文心国金证券研究所敬请参阅最后一页特别声明8行业深度研究随着百度新一代生成式对话机器人文心一言开放测试AI大模型落地进程将有望大大加速目前已有650余家知名企业宣布接入文心一言涵盖企业服务金融IT汽车传媒互联网教育电器金融等十余个领域此外百度自身主流业务也将接入文心一言包括百度搜索以及基于百度智能云的智能语音助手小度智能驾驶Apollo等3月16日起文心一言首批用户可通过邀请测试码接入体验同时百度智能云将面向企业客户开放文心一言API调用接口有望进一步丰富百度AI生态赋能更多行业伙伴图表12已有650余家公司接入百度文心一言领域百度文心一言合作公司致远互联金蝶国际明源云用友网络福昕软件汉得信息慧博云通东软企业集团远光软件彩讯股份北信源竞业达飞天云动悦商集团力龙信息服务爱点击神思电子荣联科技金财互联华宇软件利欧股份等恒生电子宇信科技凌志软件京北方软通动力博彦科技银之杰科蓝软金融IT件信雅达新致软件中科金财新晨科技艾融软件等汽车吉利汽车东风汽车长城汽车长安汽车海马汽车零跑汽车红旗汽车等风语筑太平洋网络超媒体控股财讯传媒华策影视蓝色光标天娱数科传媒视觉中国36氪浙文互联汽车之家中原网金融界值得买百姓网新浪新闻迪生数字凡拓数创返利科技博瑞传播等互联网爱奇艺前程无忧智联招聘掌阅科技巨人网络携程Soul等教育博瑞传播高顿教育高途学大教育昂立教育达内教育等电器联想集团四川长虹TCL美的集团国光电器海信视像创维数字等邮储银行兴业银行中信银行江苏银行广发证券长江证券国海证券泰金融康保险重庆银行等算力浪潮信息中科曙光紫光股份光环新网等其他航天宏图绿地控股孩子王等来源iFind各公司公众号国金证券研究所3文心平台提供一站式开发平台与工具工具与平台层是百度文心平台生态构建中的重要一环百度文心以AI落地为导向为不同领域中的各级用户提供包括AI开发平台AI开发工具大模型API在内的一站式AI开发服务31AI开发平台零门槛平台EasyDL及全功能平台BMLAI应用开发者和AI专业开发者是AI落地环节中的两个典型角色前者对AI底层算法和编程知识了解较为有限希望能以高效简单的方式应用AI技术为所属行业赋能后者则专注于底层算法等AI专业领域要求开发平台的功能强大且完善为满足各级用户的使用需求百度文心采用客户分级设计向产业链上的不同客户提供功能各有侧重的AI开发平台包括零门槛AI开发平台EasyDL以及全功能AI开发平台BML零门槛AI开发平台EasyDL专为AI应用开发者打造用户可以在不了解技术细节的前提下以零代码零门槛的方式快速实现AI模型的开发与部署敬请参阅最后一页特别声明9行业深度研究图表13EasyDL提供一站式零代码AI模型开发来源百度文心国金证券研究所EasyDL为用户提供了自然语言处理图像跨模态三个领域下的多种任务的一站式模型定制服务并提供了工业制造智慧城市电子商务等多个真实场景下的AI开发范例用户在进行AI模型开发时仅需准备好场景数据集并依照提示操作即可迅速完成模型的训练与部署图表14EasyDL可支持多场景任务领域任务类型应用场景文本创作广告创意文学创作文本分类新闻推荐评论分类情感分析舆情分析自然语言处理文本实体抽取金融研报信息识别法律案件抽取文本实体关系抽取行业知识图谱构建行业知识问答评论观点抽取辅助消费决策舆情分析文本相似度计算推荐系统图像分类图片内容检索制造业分拣或之间图像物体检测医疗诊断工业检测图像分割医学图像分析卫星图像分析跨模态图文匹配图文素材推荐来源百度文心国金证券研究所BML全功能AI开发平台主要面向AI专业开发者打造为AI专业开发者提供了从数据处理模型训练模型管理模型部署与应用的生命周期管理服务帮助用户更快更好地构建训练和部署AI模型通过使用BML平台开发者无需再关注底层资源的管理和维护能够大大开发效率加速AI赋能千行万业敬请参阅最后一页特别声明10行业深度研究图表15BML全功能AI开发平台架构概览来源百度文心国金证券研究所EasyDL和BML两个平台目前在训练阶段仅支持使用由百度文心提供的云端算力目前百度文心提供的公有云定价较高以GPU提供的算力性能为标准统一计算百度文心公有云的定价约为MicrosoftCloud的63倍图表16EasyDL与BML提供的模型部署方式算力集群配置价格GPUNVIDIATeslaP48GCPU12核134元小时内存40GGPUNVIDIATeslaP424GCPU12核173元小时内存40GGPUNVIDIATeslaV10016GCPU12核216元小时内存56GGPUNVIDIATeslaV10032GCPU8核24元小时内存32G来源百度文心国金证券研究所EasyDL和BML两个平台在模型部署阶段灵活性较强用户可以根据自身需要灵活选择模型的部署方式以满足不同开发者对价格数据安全性数据私密性等因素的个性化需求图表17EasyDL与BML提供的模型部署方式部署方式特点模型部署于飞桨公有云平台按需按时获取算力资源性价比高适合中小公有云部署型企业模型以私有化软件方式交付客户可将模型部署于自有服务器或终端设备中私有化离线部署保障企业核心数据的私密性与安全性能依据客户需要实现高级定制功能适合大型企业敬请参阅最后一页特别声明11行业深度研究部署方式特点模型部署至百度自研的软硬一体人工智能应用平台飞桨一体机中飞桨一体软硬一体部署机适配主流国产AI芯片与国产操作系统支持自主可控适合大型企业来源百度文心国金证券研究所32AI开发工具套件AI开发工具套件是百度文心生态构建中的基础环节是百度文心旗下AI开发平台灵活易用性能强大的基础完善的AI开发工具生态将显著减少开发过程中重复造轮子的行为加速AI开发与落地进程ERNIEKit是百度文心专门面向自然语言处理领域研发的大模型开发工具主要面向NLP工程师提供全流程语言大模型开发与部署工具集以全方位发挥语言大模型效能PaddleFleetX覆盖大模型环境部署数据处理预训练微调模型压缩推理部署全流程并支持语言视觉多模态等多个领域的前沿AI算法ERNIEKit和PaddleFleetX两种AI开发工具套件的优势在于以下几点简单易用性能优异用户能够以简单的方式利用AI开发工具套件的分布式运算能力从而为模型训练和模型推理提供有力的算力支持模型训练压缩推理一体化AI开发工具套件支持模型训练压缩推理一体化等模型小型化策略能够实现AI终端设备上的轻量化部署大大降低部分场景下的AI落地成本多硬件支持自主可控AI开发工具套件不仅支持NVIDIAGPU等主流的AI芯片还支持多款主流国产AI芯片33大模型API除AI开发平台与AI开发工具外百度文心还通过大模型API向用户提供开发服务目前百度文心各模型API尚处于起步阶段均免费向AI开发者提供图表18百度文心提供大模型API模型名称应用领域API开放模式ERNIE-ViLGAI画图收费调用价格约为015元张PLATOAI聊天机器人限量开放内测ERNIE30Zeus文本理解与创作免费申请调用来源百度文心国金证券研究所4文心平台提供搜索创作等产品产品与社区层建立于先进的百度文心大模型之上是百度文心生态中的顶层其旨在对外展示生成式模型的强大性能并以此吸引爱好者投入创作构建成熟的AIGC社区助力AI模型迭代升级并在实践中探索未来AI的商业化模式41产业级搜索系统文心百中文心百中是百度文心基于旗下语言大模型开发的产业级搜索系统基于文心ERNIE模型构建目前已对外开放测试相比传统搜索引擎文心百中架构简单且支持对多种类型的异构数据进行搜索可以满足开发者和企业用户的多种垂直搜索企业搜索需求文心百中具有极简的逻辑架构以及强大的语义理解能力可以极大降低搭建垂直搜索带来的数据成本与人力成本敬请参阅最后一页特别声明12行业深度研究图表19文心百中使用流程简单来源百度文心国金证券研究所通过使用文心百中用户可以通过输入行业企业知识库的方式以极低的成本构建所属领域的搜索系统从而实现企业内搜知识搜索知识推荐等搜索场景的相关任务42AI艺术和创意辅助平台文心一格文心一格是百度文心基于旗下文图生成跨模态大模型搭建的AI艺术和创意辅助平台目前已向用户开放用户可以通过文心一格体验AI作画并将优秀画作于平台中公开分享创作经验为其他用户提供创意与创作经验由此形成平台的正向循环在版权方面文心一格允许用户将AI生成所得图片用于商业用途文心一格旨在构建成熟的AI艺术和创意辅助平台为画师设计师等视觉内容创作者提供灵感创意和创作辅助为媒体作家等文字创作者提供海量的高质量图片文心一格目前采用收费调用模式根据用户需求不同提供了多种生成模式图表20文心一格收费价格02-08元张服务名称服务内容价格普通AI作画自定义图片描述风格02元张自定义图片描述风格尺寸多个高级AI作画02-08元张可供选择的AI画师可上传参照图AI画作二次编辑通过描述词实现图像内容删减02元张来源百度文心国金证券研究所43大模型创意社区旸谷社区旸谷社区是百度文心基于旗下多领域文心大模型构建的创意社区旨在探索大模型的在各个领域与场景中的创意应用模式旸谷社区采用众创模式鼓励个人开发者基于文心大模型API针对特定场景训练AI模型训练得到的优质模型将由百度文心收录并向全体用户开放使用旸谷社区有望助力AI大模型的应用探索图表21旸谷社区部分创意应用创意应用应用场景面向日常办公场景基于PaddleOCR中OCR技术可将拍摄到的图文本处理系统片进行文字提取的同时借助ERNIE30Zeus对OCR识别的文字进行二次修正避免出现因OCR而产生的文档错误面向幼教场景利用语音转文字技术和ERNIE30Zeus提取故事摘要听故事画图并借助ERNIE-ViLG实现AI作图面向室内设计场景可选择多种装修风格一键生成装修效果图可辅装修设计助室内设计师与装修客户沟通来源百度文心国金证券研究所敬请参阅最后一页特别声明13行业深度研究5国内其他生成式语言模型我们梳理了百度文心外其余国内厂商在生成式语言模型领域的最新研究成果文心ERNIE30Zeus大模型在参数规模技术创新应用落地方面均在国内同业中处于领先水平图表22国内主流生成式语言模型对比厂商百度阿里巴巴华为清华大学模型ERNIE30ZeusPLUG盘古ChatGLM名称发布2022年5月2021年4月2021年4月2023年3月日期参数千亿级240亿1100亿1300亿规模模型TransformerTransformerTransformerTransformer结构Encoder-DecoderEncoder-DecoderEncoder-DecoderEncoder-Decoder1TB以上的高质量中40TB的行业文本数训练海量文本数据与知识文文本训练数据涵盖海量中英文本据和400万小时的行数据图谱新闻小说诗歌问信息业语音数据答等广泛类型及领域创新型提出知识增强融合行业知识基于大采用了人类反馈强化特点方法参数规模处于世基于纯中文文本训练量行业语音和文本数学习方法界领先水平据训练来源百度文心阿里巴巴腾讯华为清华大学国金证券研究所6投资建议相较于ChatGPT等海外AI模型存在连接限制百度文心平台可以为国内用户提供便捷的技术入口文心一言的发布将极大加速国内生成式AI模型的落地应用节奏有望帮助生态伙伴实现用户体验提升和生产降本增效建议关注接入文心一言生态的公司如恒生电子用友网络汉得信息凌志软件宇信科技等7风险提示海外基础软硬件使用受限若因国际关系等原因高算力GPU等基础硬件或计算框架等基础软件使用受限可能会对国内人工智能算法应用产生影响应用落地不及预期若相关应用公司不能找到人工智能算法较好的商业应用落地场景或相关场景客户没有较强的付费意愿可能算法应用落地会不及预期行业竞争加剧风险若相关企业加快技术迭代和应用布局整体行业竞争程度加剧将会对行业内已有企业的业绩增长产生威胁敬请参阅最后一页特别声明14行业深度研究行业投资评级的说明买入预期未来36个月内该行业上涨幅度超过大盘在15以上增持预期未来36个月内该行业上涨幅度超过大盘在515中性预期未来36个月内该行业变动幅度相对大盘在-55减持预期未来36个月内该行业下跌幅度超过大盘在5以上敬请参阅最后一页特别声明15行业深度研究特别声明国金证券股份有限公司经中国证券监督管理委员会批准已具备证券投资咨询业务资格本报告版权归国金证券股份有限公司以下简称国金证券所有未经事先书面授权任何机构和个人均不得以任何方式对本报告的任何部分制作任何形式的复制转发转载引用修改仿制刊发或以任何侵犯本公司版权的其他方式使用经过书面授权的引用刊发需注明出处为国金证券股份有限公司且不得对本报告进行任何有悖原意的删节和修改本报告的产生基于国金证券及其研究人员认为可信的公开资料或实地调研资料但国金证券及其研究人员对这些信息的准确性和完整性不作任何保证本报告反映撰写研究人员的不同设想见解及分析方法故本报告所载观点可能与其他类似研究报告的观点及市场实际情况不一致国金证券不对使用本报告所包含的材料产生的任何直接或间接损失或与此有关的其他任何损失承担任何责任且本报告中的资料意见预测均反映报告初次公开发布时的判断在不作事先通知的情况下可能会随时调整亦可因使用不同假设和标准采用不同观点和分析方法而与国金证券其它业务部门单位或附属机构在制作类似的其他材料时所给出的意见不同或者相反本报告仅为参考之用在任何地区均不应被视为买卖任何证券金融工具的要约或要约邀请本报告提及的任何证券或金融工具均可能含有重大的风险可能不易变卖以及不适合所有投资者本报告所提及的证券或金融工具的价格价值及收益可能会受汇率影响而波动过往的业绩并不能代表未来的表现客户应当考虑到国金证券存在可能影响本报告客观性的利益冲突而不应视本报告为作出投资决策的唯一因素证券研究报告是用于服务具备专业知识的投资者和投资顾问的专业产品使用时必须经专业人士进行解读国金证券建议获取报告人员应考虑本报告的任何意见或建议是否符合其特定状况以及若有必要咨询独立投资顾问报告本身报告中的信息或所表达意见也不构成投资法律会计或税务的最终操作建议国金证券不就报告中的内容对最终操作建议做出任何担保在任何时候均不构成对任何人的个人推荐在法律允许的情况下国金证券的关联机构可能会持有报告中涉及的公司所发行的证券并进行交易并可能为这些公司正在提供或争取提供多种金融服务本报告并非意图发送发布给在当地法律或监管规则下不允许向其发送发布该研究报告的人员国金证券并不因收件人收到本报告而视其为国金证券的客户本报告对于收件人而言属高度机密只有符合条件的收件人才能使用根据证券期货投资者适当性管理办法本报告仅供国金证券股份有限公司客户中风险评级高于C3级含C3级的投资者使用本报告所包含的观点及建议并未考虑个别客户的特殊状况目标或需要不应被视为对特定客户关于特定证券或金融工具的建议或策略对于本报告中提及的任何证券或金融工具本报告的收件人须保持自身的独立判断使用国金证券研究报告进行投资遭受任何损失国金证券不承担相关法律责任若国金证券以外的任何机构或个人发送本报告则由该机构或个人为此发送行为承担全部责任本报告不构成国金证券向发送本报告机构或个人的收件人提供投资建议国金证券不为此承担任何责任此报告仅限于中国境内使用国金证券版权所有保留一切权利上海北京深圳电话021-60753903电话010-85950438电话0755-83831378传真021-61038200邮箱researchbjgjzqcomcn传真0755-83830558邮箱researchshgjzqcomcn邮编100005邮箱researchszgjzqcomcn邮编201204地址北京市东城区建内大街26号邮编518000地址上海浦东新区芳甸路1088号新闻大厦8层南侧地址中国深圳市福田区中心四路1-1号紫竹国际大厦7楼嘉里建设广场T3-2402敬请参阅最后一页特别声明16
|
相关行业报告
|