研报下载就选股票报告网
您好,欢迎来到股票分析报告网!登录   忘记密码   注册
>> 东吴证券-ChatGPT:又一个“人形机器人”主题-230121
上传日期:   2023/1/26 大小:   2806KB
格式:   pdf  共34页 来源:   东吴证券
评级:   -- 作者:   陈李,张良卫
下载权限:   无限制-登录即可下载
ChatGPT是2022年11月30日OpenAI推出的一款对话式AI模型,是其GPT系列新作,功能更全面&更类人,潜在应用空间更为广泛。
  技术上,ChatGPT的上线意味:语言类AI底层技术NLP进步显著,同时启示AI其他领域应用更高效率的Transformer和产出更类人的RLHF算法。
  应用上,GPT的升级推动AIGC的发展,AIGC渗透率有望在2025年提升至10%,市场规模或将于2030年逾万亿。
  ChatGPT横空出世,利好相关基础设施和应用:
  –算法、数据、算力是AI大模型训练的基础,建议关注基础设施相关标的:科大讯飞、海天瑞声、拓尔思等;
  – ChatGPT上线推动文本类AI渗透于文本生产、智能批阅等应用领域,同时其对训练模型的改进对AIGC的全面发展有广泛意义,建议关注在相关领域布局的:微软、Meta、百度、阅文集团、中文在线、粉笔等。
  风险提示:ChatGPT技术发展不完善、应用不及预期;AI基础设施不及预期;AI伦理风险等
研究报告全文:证券研究报告策略研究策略专题ChatGPT又一个人形机器人主题证券分析师证券分析师研究助理研究助理陈李张良卫郭若娜张文佳执业证书S0600518120001执业证书S0600516070001执业证书S0600122080017执业证书S0600122080015yjschenldwzqcomcnzhanglwdwzqcomcnguorndwzqcomcnzhangwenjiadwzqcomcn2023年1月21日主要内容ChatGPT是2022年11月30日OpenAI推出的一款对话式AI模型是其GPT系列新作功能更全面更类人潜在应用空间更为广泛技术上ChatGPT的上线意味语言类AI底层技术NLP进步显著同时启示AI其他领域应用更高效率的Transformer和产出更类人的RLHF算法应用上GPT的升级推动AIGC的发展AIGC渗透率有望在2025年提升至10市场规模或将于2030年逾万亿ChatGPT横空出世利好相关基础设施和应用算法数据算力是AI大模型训练的基础建议关注基础设施相关标的科大讯飞海天瑞声拓尔思等ChatGPT上线推动文本类AI渗透于文本生产智能批阅等应用领域同时其对训练模型的改进对AIGC的全面发展有广泛意义建议关注在相关领域布局的微软Meta百度阅文集团中文在线粉笔等风险提示ChatGPT技术发展不完善应用不及预期AI基础设施不及预期AI伦理风险等2目录1ChatGPT突破式的GPT新作2GPT的升级意味AI技术进步显著打开万亿规模AIGC的入口3ChatGPT横空出世利好相关基础设施算力与存储数据算法及应用AIGC4风险提示目录1ChatGPT突破式的GPT新作11ChatGPT突破式的GPT系列新作技术更好应用更广12GPT-4有望效果更优成本更低催化更多应用场景13OpenAIChatGPT的源头公司111ChatGPT突破性的对话式AI模型ChatGPT是一款对话式AI模型根据用户输入的文本自动生成回复内容2022年11月30日OpenAI发布了对话式AI新模型ChatGPT该模型使用简单只需向ChatGPT文字提出需求即可让其完成回答问题书写代码创作文本等指令ChatGPT的功能包括交互以及基于交互的文本代码创造信息检索等实际应用上ChatGPT等文本AI可能帮助文本创造类行业完成智能内容生成并一定程度上替代搜索引擎图ChatGPT使用示意5资料来源OpenAI东吴证券研究所112ChatGPTGPT系列新作功能更全面表现更类人ChatGPT是GPT-3和GPT-4之间的过渡版本GPT即生成型预训练变换模型GenerativePre-trainedTransformer是解决NLP自然语言处理任务的训练模型之一该预训练模型基于Transformer架构具有自注意力机制可以捕捉句子中的上下文关系可以根据给定文本预测下一个单词的概率分布从而生成人类可以理解的自然语言ChatGPT从GPT-35模型微调而来Chat强调了其为了对话而优化具有记忆能力可以完成连续性对话从GPT-1到ChatGPT使用更先进的训练模型更海量的训练数据功能越来越全面表现越来越类人表GPT系列产品升级情况6资料来源WalmartGlobalTechBlogOpenAI澎湃东吴证券研究所113ChatGPT应用空间广泛市场规模可观ChatGPT得到的关注空前2022年12月5日上线仅5天的ChatGPT用户数量突破100万而GPT-3耗时将近24个月才达到该用户规模ChatGPT应用空间广泛潜在市场规模可观以过往版本GPT-3为例截止2021年3月上线9个月的GPT-3已经有了300应用客户领域涵盖智能客服教育与科研游戏搜索引擎等出于更出色的表现和更高的关注度ChatGPT及其背后的GPT-35的应用空间有望较GPT-3更为广阔图GPT-3应用示例Viable帮助公司分析客户反馈Elicit人工智能研究助理借助GPT-3Viable将大量非结构化数Elicit从大量研究论文中找到与研究问据转换为可读的自然语言报告包括题最相关的摘要然后应用GPT-3总结客户的投诉赞美请求和问题等论文对这个问题的主张GPT-3使得结GPT-3将Viable总结客户反馈的准确性果更容易理解改进了24更准确从66提高到90为公司产品决策提改进了17总体上更好改进了供信息33Algolia搜索引擎FableStudioVR游戏工作室Algolia将GPT-3与其先进的搜索技术集在VR游戏墙中狼中FableStudio成帮助出版商和客户以自然语言查借助GPT-3塑造了陪伴式虚拟角色询问题的答案在对210万篇新闻文章Lucy可以实现与人们自然的对话进行测试后精确回答问加深玩家与游戏角色的情感牵绊GPT-3Algolia题的精度为91或更高7资料来源OpenAI雷峰网东吴证券研究所121ChatGPT仍然有改进空间ChatGPT仍有改进的空间当前偶尔可能生成不正确或荒谬图ChatGPT可能会生成不正确或荒谬的信息的信息可能会有违反伦理道德的答案由于其所基于的训练数据库仅截止2021年而非基于实时数据回答可能已经过时等图ChatGPT可能会有违反伦理道德的答案图ChatGPT回答可能过时8资料来源OpenAI东吴证券研究所122预计GPT-4效果更优成本更低催化更多应用场景落地生成式预训练模型GPT-4预计将于2022年12月至2023年2月发布GPT-4相比于当前的文本模型会有大幅改进图文本模型规模GPT-4模型参数量或提升至10万亿级别规模提升训练数据量token数模型参数量或均有所提升从而优化模型2000010000性能330050001750图灵测试此前一些AI模型仅部分能力通过图灵测试而GPT-4有望完全通过589341570499500175图灵测试888成本下降通常模型训练成本随着模型规模提升而提升但GPT-4的训练成本40或显著低于GPT-3控制在100万美元的范围内从而降低AI技术的使用门槛9426GPT-4的推出对商业应用的潜在影响1模型能够生成更有温度的文字对应AI客服AI心理咨询营销文本等训练数据量GBtoken数B模型参数量B场景MeenaBlenderGPT-3悟道20GPT-42模型能够生成更加专业的文字对应金融医学新闻工业等垂直行GoogleMetaOpenAI北京智源OpenAI预计202212-20232业应用202001发布202004发布202005发布202106发布发布图文本模型图灵测试GPT-4或将完全通过测试达到人类水平图文本模型训练成本万美元总体呈上升趋势但GPT-4相比GPT-3显著下降481人类基准86791747210056564831731XiaoiceDialoGPTCleverbotMitsukuMeenaBaseMeenaGPT-4NMTBERTGPT-2MeenaGPT-3GPT-4小冰微软IcognoWorswickGoogleGoogleOpenAIGoogleGoogleOpenAIGoogleOpenAIOpenAI预计202212-预计202212-2018发布2018发布2019发布2020发布2020发布2021发布20232发布201609发布201811发布201902发布202001发布202005发布20232发布9资料来源机器之心新智元MITTechnologyReviewEngadgetAI科技评论聆心智能GithubAppleAPPStoreBotpenguin虎嗅网GoogleAIARKinvest东吴证券研究所13OpenAIChatGPT的源头公司OpenAI是ChatGPT的源头公司公司主要历史如下图ChatGPT源头公司OpenAI2015年马斯克和SamAltman等人共同创立了OpenAInonprofit使命为确保通用人工智能ArtificialGeneralIntelligenceAGI即一种高度自主且在大多数具有经济价值的工作上超越人类的系统将为全人类带来福祉2018年由于特斯拉和AI技术的关联越来越深外界越发担忧特斯拉将运用OpenAI的技术实现系统和产品升级马斯克于2018年离开OpenAI的董事会转变为赞助者和顾问2019年在训练模型的高成本压力下OpenAI划分出有利润上限的盈利性组织OpenAILP紧随其后微软宣布为OpenAI注资10亿美元并获得了将OpenAI部分AI技术商业化赋能产品的许可后续微软可能会将OpenAI的技术与搜索引擎办公软件等相整合OpenAI2022年营业收入约8000万美元且据OpenAI预测20232024年营业收入将分别达到2亿和10亿路透社目前OpenAI董事会由董事长兼总裁GregBrockman首席科学家IlyaSutskever和首席执行官SamAltman等人组成其中首席科学家IlyaSutskever是AI领域全球最有影响力的学者之一文献引用量高达36万单篇最高引用量12万主导或参与了AlexNetAlphaGoGPTCLIPDALL-E和Codex的研发OpenAI主要投资者包括微软ReidHoffmanscharitablefoundation和KhoslaVentures路透社称微软希望向OpenAI追加投资100亿美元如谈判达成微软将持有OpenAI49的股权OpenAI的非营利性母公司持有2其余投资者持有剩余4910资料来源OpenAIGoogleSchooler最话金色财经新智元OneFlow澎湃新闻东吴证券研究所13OpenAIChatGPT的源头公司在AGI通用人工智能愿景的驱动下OpenAI的AI能力全面OpenAI当前模型几乎涉及所有需要解决自然语言代码的理解生成任务的领域其APIApplicationProgrammingInterface应用程序编程接口编程人员可以通过API调用相关代码而无需掌握代码本身包括文本代码图像等五大类可以用于完成自然语言问答聊天PythonSQL代码标注修改食谱创作等具体任务图除ChatGPT外OpenAI当前的精选模型图OpenAI当前API主要应用领域DALLE2AI绘画文本生成编辑DALLE2可以根据自然语言的描述创建逼真的绘画作品包括从0到1根据所提供元素作画拓展原有绘代码生成编辑解释画根据指示修改原有绘画等等左图为DALLE2根据宇航员骑马逼真风格三个元素完成的作画图像生成编辑模型定制化微调Wisper语音识别Wisper在语音识别上可以达到人类的鲁棒性水平和英语语音识别的文本搜索分类比较准确性并且支持多种语言的转录及翻译成为英语11资料来源OpenAI东吴证券研究所目录2GPT的升级意味AI技术进步显著打开万亿规模AIGC的入口21技术上GPT的升级意味着语言AI和AI整体的显著进步22应用上GPT的升级推动AIGC的发展迎万亿市场规模21技术上GPT的升级意味着语言AI和AI整体的显著进步GPT基于AI的语言技术领域AI的子领域包括计算机视觉语言语音推理不同子领域基于不同的底层技术例如语言领域基于NLP即自然语言处理但训练算法在直觉上相通例如视觉领域可以参考语言领域使用的Transformer改进自身的训练模型其中GPT代表语言AI的一种实现方式ChatGPT的出现意味着语言AI和AI领域整体的显著进步GPT所基于的预训练模型Transformer在语言AI甚至AI整体领先可以实现低成本高效率大规模的训练ChatGPT进一步使用RLHF算法使得产出更加拟人图AI底层技术领域分类人工智能应用包括自动驾驶汽车医学图像分析消费应用如谷歌照片安全应用如监控卫星图像分析工业应用如检测制造计算机视觉和装配中的缺陷零件等语言应用包括文本生成代码生成机器翻译问答和其他比如智能客服智能公文写作等语音应用包括语音转录及发言人识别等布尔可满足性SAT是否有赋值能够使得所要求的逻辑公式为真应用包括电路设计自动定理证明调度等推理自动定理证明ATP主要关注系统的开发和使用这些系统可以自动进行合理的推理或者根据事实得出确定的结论应用包括包括软件验证等13资料来源斯坦福大学OpenAI东吴证券研究所22应用上GPT的升级推动AIGC的发展迎万亿市场规模AIGCAIGeneratedContent即AI生产内容利用AI技术赋能文本音图内容生成的四阶段频视觉等高自由度低门槛的内容生产内容消费量增加急需降低生产门槛提升生产效率AIGC是大势所趋1PGCUGC受限于效率和成本难以满足迅速增长的内容需求PGCProfessinalGeneratedContent专业生产内容例如爱奇艺依赖优质的专业化团队完成内容生产或采购内容生成量级有限成本较高UGCUserGeneratedContent用户生产内容例如抖音依赖大体量的创作用户来实现内容生产内容生成量级大幅提升成本较低但内容质量良1莠不齐高质量内容生成的效率和成本并未发生质变2相比PGCUGCAIGCAIGeneratedContentAI生产内容例如GPT系列具有效率和成本上的优势AIGC效率更高截止2021年3月推出9个月后的GPT-3日均文本生成量45亿而2021年阅文集团新增文字量仅360亿仅相当于GPT-38天的文字内容生成量AIGC成本更低目前OpenAI定价最高的文字模型达芬奇基于GPT-3为每750词约002美元2021年阅文集团内容成本为1774亿元每750词约37元是调用OpenAI的API完成相同文字量生产所需的成本约672万元的264倍理想状况下如果阅文集团将2021年全年文字内容生产量360亿交给GPT-3耗时8天即可完成节约成本99毛利率空间几乎100释放14资料来源OpenAIa16z阅文集团公告东吴证券研究所22应用上GPT的升级推动AIGC的发展迎万亿市场规模GPT的升级增强了AIGC能力释放更多潜在市场空间GPT系列的不断升级增强了AIGC在编程语言代码生成软件行为生成自然语言新闻撰写文案创作对话机器人创作性文本等方面的表现我们离AIGC时代更进一步AIGC在内容生成中的渗透率将快速提升应用规模快速扩增根据Gartner2021年预测人工智能对人类和社会的影响到2025年AIGC产生的数据将占所有数据的10而该比例在2021年不足1而量子位智库根据现有技术及需求成熟度预测2030年AIGC市场规模将超过万亿人民币图AIGC市场规模预测及细分场景拆分15资料来源OpenAI中国AI数字商业展望2021-2025Gartner量子位东吴证券研究所目录3ChatGPT横空出世利好相关基础设施算力与存储数据算法及应用AIGC31相关基础设施及建议关注标的32相关应用及建议关注标的3ChatGPT横空出世利好相关基础设施及应用我们认为ChatGPT上线象征着文本类AI进入新阶段利好其基础设施及应用1基础设施算力与存储如芯片计算机等数据算法训练大模型和NLP2应用文本创造有海量文本创造需求的公司可以借助ChatGPT完成内容快速低成本地扩增如网文平台新闻平台等教育教育及科研工具类平台可以借助ChatGPT实现定制化拟人化的教学和辅助如智能问答智能批阅辅导资料智能撰写等同时建议关注人工智能的其他子领域受益于ChatGPT推动的预训练算法的进步后续可能有突破性技术进展ChatGPT强大的交互和信息检索能力对传统搜索引擎形成挑战利空搜索引擎相关企业微软或将ChatGPT应用于其搜索引擎Bing利空谷歌且谷歌抢在OpenAI创建之前开源了其名下的TensorFlow人工智能引擎OpenAI从创立起就和谷歌存在着直接竞争关系但是由于ChatGPT潜在的收费可能我们认为其尚不能完全取代传统搜索引擎17311基础设施1-算力存储高算力海量训练数据是训练全球领先的AI模型的基础推荐关注云基础设施和AI芯片微软入资OpenAI后2020年5月微软宣布专门为OpenAI打造世界排名前五的超级计算机之一同时双方达成一项多年的合作协议OpenAI开始接入微软的Azure云平台开发AI技术高算力的底层基础设施是完成对海量数据处理训练的基础海量数据汇集也为AI模型提供强大的数据集支撑例如GPT-3由互联网上大多数英文文本训练而成整个英文维基百科只占它训练数据整体的06云计算提供了社会级的超大算力计算平台和海量数据存储平台云计算在数字中国建设和数字经济发展中起着重要的基础性先导性和战略性作用已成为经济社会数字化转型的基石有望在政府企事业单位和其他组织中广泛积累应用和数据地方政府方面2022年10月28日全国一体化政务大数据体系建设指南中提出要整合构建标准统一布局合理管理协同自主可控的全国一体化政务大数据体系并要求到2025年政务数据全部纳入目录管理央国企方面加强国企的数据安全保障强化对国企数据资源的监管国资云是指由各地国资委牵头投资设立运营通过建设高安全防护水平的数据安全基础设施底座底层硬件来看需要高算力的AI芯片AI芯片即专门用于处理人工智能应用中大量计算任务的模块近年来国家高度关注人工智能芯片产业的发展发布一系列产业支持政策亿欧智库预测2025年中国AI芯片市场规模约为1780亿元目前很多企业还在发展初期相关公司云基础设施深桑达A中国电子云成为央国企和地方政府开展国资云建设的主力军易华录参与政务云建设数据要素市场化先发优势显著中国移动中国联通中国电信微软等AI芯片寒武纪地平线华为海思平头哥等18311基础设施2-数据数据资源是人工智能技术产业创新发展的驱动力之一数据集作为数据资源的核心组成部分是指经过专业化设计采集清洗标注和管理生产出来的专供人工智能算法模型训练的数据大数据的核心始终是面向海量数据的存储计算处理等基础技术GPT-4或不再以大取胜数据在精不在多依靠提高模型效率和数据质量达成改进此前OpenAI信奉扩展假说即海量数据和大量算力是通往AGI的唯一路径因此OpenAI所训练的GPT系列参数越来越多模型表现也相应润色但是DeepMind的研究或意味着模型效率和数据质量的提升才是未来方向DeepMind的研究成果表明在参数数量少一个数量级的情况下模型依然可以获得与常规Transformer相当的性能并在多个语言建模基准测试中获得最先进的性能这意味着在当前文本AI模型已经普遍使用海量数据集的背景下通过模型效率和数据质量的提高来改进AI性能的路径或将取代依赖数据量提升的路径进一步挖掘AI的潜力关于GPT-4参数数量亦有两派预测万亿级参数数量以大取胜vs略高于GPT-3的参数数量以精取胜有待GPT-4正式上线给出答案未来数据类企业的竞争力或体现在数据质量对数据清洗和标注提出较高要求根据Google的研究数据质量在高风险人工智能领域具有更高的重要性但人们往往只关注于模型而忽略数据质量并且该结论可以或多或少地适用于所有AI领域如果GPT-4更多依赖模型效率和数据质量的提升来实现改进将启示我们重视数据清洗和标注关注能够提供高质量数据的企业19311基础设施2-数据数据标注数据标注是大部分人工智能算法得以有效运行的关键环节简单来说数据标注是对未经处理过的语音图片文本视频等数据进行加工处理从而转变成机器可识别信息的过程在ChatGPT训练的三个阶段中只有第三阶段不需要使用人工标注数据而第一第二阶段都需要大量的人工标注根据智研咨询2015-2021年我国数据标注与审核行业市场规模保持稳步增长态势2021年达到4440亿元预计2028年我国数据标注与审核行业市场规模将达26274亿元现有数据标注以人工标注为主属于劳动密集型产业随着机器学习不断完善自动标注成为大趋势目前我国的数据标注与审核业务的参与者主要包括两类一是人工智能公司内部的标注部门二是商务流程外包公司相关标的海天瑞声AI训练数据专业提供商等图2015-2022年我国数据标注与审核行业市场规模走势亿元图头部数据标注企业概况图60553偏重计曼孚图例京东自建模式50444算云测科技众智众包模式机星辰40视倍赛阿里数据组合模式觉众包龙猫30数据蚂蚁梦动众包科技20百度数据堂爱数10智慧0海天慧听标贝瑞声数据年年年年年年年年科技20152016201720182019202020212022E偏重语音2005年早期进入中期进入晚期进入2020年20资料来源智研咨询信通院东吴证券研究所
 
Copyright © 2005 - 2021 Nxny.com All Rights Reserved 备案号:蜀ICP备15031742号-1