>> 国泰君安-计算机行业:Open AI发布GPT-4,亮点不局限于多模态-230315
上传日期: |
2023/3/16 |
大小: |
867KB |
格式: |
pdf 共6页 |
来源: |
国泰君安 |
评级: |
增持 |
作者: |
李沐华,齐佳宏 |
行业名称: |
计算机 |
下载权限: |
此报告为加密报告 |
|
本报告导读: Open AI发布GPT-4,展现了更强的能力。我们认为,亮点包括:多模态有助于模型自身的能力提升;大模型的训练结果变得更可预测;模型能力并不依赖于强化学习。 摘要: 事件:北京时间3月15日凌晨,Open AI发布ChatGPT-4。ChatGPTPlus的订阅者可以付费获得具有使用上限的GPT-4访问权限。GPT-4展现了更强的能力,如:GPT-4比此前的版本更具创造性和协作性、可以接受图像作为输入、能够处理超过25000字的文本等。 多模态的意义不仅在于场景拓展,也在于模型自身的能力提升。多模态能力是目前市场中对于GPT-4讨论最多的点,但讨论往往集中在多模态相对于单模态在应用场景拓展方面的潜力。我们认为,除场景拓展外,同时值得关注的是多模态是否能够使模型本身的能力获得增强,并解决更为复杂的问题。如同人类感知世界的过程是通过输入文本、图片、视频等各类信息实现的,那么多模态能否使得模型本身获得更强甚至额外的能力值得关注。根据Open AI发布的结果,GPT-4在处理复杂问题时的表现明显好于此前的GPT-3.5。比如在模拟律师资格考试的任务中,GPT-4的分数落在前10%的考生中,而GP4-3.5的分数则落在了后10%。 大模型的训练结果变得更可预测。根据Open AI的表述,“GPT-4的一个重点是构建了一个可预测的深度学习堆栈”,可以使用不超过GPT-4计算量千分之一的训练模型对GPT-4一些性能进行准确的预测。这使得我们能够在花费较少代价的情况下让AI模型的目标和人类的意图、价值观保持一致。一方面能够加快模型的迭代效率,毕竟针对特定模型进行广泛的调优是不现实的;另一方面,也有助于解决目前“ChatGPT会生成一些对人类有害或者歧视性答案”的问题。 模型能力并不依赖于强化学习。为了测试强化学习对于模型能力的影响,Open AI分别基于GPT-4基础模型和加入强化学习的GPT-4模型运行了一系列考试中的多项选择题部分。结果显示,在所有的考试中,基础的GPT-4模型的平均成绩为73.7%,而引入强化学习后的模型的平均成绩为74.0%,这意味着强化学习并没有显著改变基础模型的能力,换句话说,大模型的能力来自于模型本身。 投资建议:推荐科大讯飞、虹软科技、凌志软件、格灵深瞳;受益标的商汤、云从科技、拓尔思、寒武纪等。 风险提示:AIGC落地不及预期、ChatGPT发展受到强监管
研究报告全文:股票研究TableindustryInfo计算机TableMainInfoTableTitle评级TableInvest增持20230315上次评级增持OpenAI发布GPT-4亮点不局限于多模态TablesubIndustry细分行业评级行计算机增持业李沐华分析师齐佳宏分析师事010-83939797010-83939837limuhuagtjascomqijiahonggtjascom件证书编号S0880519080009S0880519080007快本报告导读评OpenAI发布GPT-4展现了更强的能力我们认为亮点包括多模态有助于模型相关报告TableDocReport自身的能力提升大模型的训练结果变得更可预测模型能力并不依赖于强化学习计算机GPT4发布在即多模态成为趋势摘要20230315TableSummary事件北京时间3月15日凌晨OpenAI发布ChatGPT-4ChatGPTPlus计算机客户自研影响有限信创依旧机遇广阔的订阅者可以付费获得具有使用上限的GPT-4访问权限GPT-4展现了更20230314强的能力如GPT-4比此前的版本更具创造性和协作性可以接受图像计算机政府工作报告再提数字经济主作为输入能够处理超过25000字的文本等线明确20230305多模态的意义不仅在于场景拓展也在于模型自身的能力提升多计算机2月订单整体有所回落表现分化模态能力是目前市场中对于讨论最多的点但讨论往往集中GPT-420230304在多模态相对于单模态在应用场景拓展方面的潜力我们认为除场计算机隐私计算发展迅猛长期空间大景拓展外同时值得关注的是多模态是否能够使模型本身的能力获得20230302证增强并解决更为复杂的问题如同人类感知世界的过程是通过输入券文本图片视频等各类信息实现的那么多模态能否使得模型本身研获得更强甚至额外的能力值得关注根据OpenAI发布的结果GPT-4究在处理复杂问题时的表现明显好于此前的GPT-35比如在模拟律师资格考试的任务中GPT-4的分数落在前10的考生中而GP4-35报的分数则落在了后10告大模型的训练结果变得更可预测根据OpenAI的表述GPT-4的一个重点是构建了一个可预测的深度学习堆栈可以使用不超过GPT-4计算量千分之一的训练模型对GPT-4一些性能进行准确的预测这使得我们能够在花费较少代价的情况下让AI模型的目标和人类的意图价值观保持一致一方面能够加快模型的迭代效率毕竟针对特定模型进行广泛的调优是不现实的另一方面也有助于解决目前ChatGPT会生成一些对人类有害或者歧视性答案的问题模型能力并不依赖于强化学习为了测试强化学习对于模型能力的影响OpenAI分别基于GPT-4基础模型和加入强化学习的GPT-4模型运行了一系列考试中的多项选择题部分结果显示在所有的考试中基础的GPT-4模型的平均成绩为737而引入强化学习后的模型的平均成绩为740这意味着强化学习并没有显著改变基础模型的能力换句话说大模型的能力来自于模型本身投资建议推荐科大讯飞虹软科技凌志软件格灵深瞳受益标的商汤云从科技拓尔思寒武纪等风险提示AIGC落地不及预期ChatGPT发展受到强监管请务必阅读正文之后的免责条款部分行业事件快评北京时间3月15日凌晨OpenAI发布ChatGPT-4ChatGPTPlus的订阅者可以付费获得具有使用上限的GPT-4访问权限在发布中GPT-4展现了更强的能力如创造力GPT-4比此前的版本更具创造性和协作性它可以生成编辑并与用户一起迭代创意和技术写作任务例如作曲写剧本或学习用户的写作风格图片输入GPT-4可以接受图像作为输入并基于此生成标题分类和分析支持更长的输入GPT-4能够处理超过25000字的文本允许用例如长形式的内容创建扩展对话以及文档搜索和分析等我们并不希望单纯对GPT-4的新能力进行罗列而是希望谈谈我们眼中GPT-4相对于此前版本的一些值得关注的进步以及我们的理解亮点1多模态的输入方式多模态的意义不仅在于场景拓展也在于模型自身的能力提升多模态的输入模式有望使得AI的应用场景被进一步拓展多模态能力是目前市场中对于GPT-4讨论最多的点但讨论往往集中在多模态相对于单模态在应用场景拓展方面的潜力比如大模型的能力能否被引入一些处理图片的场景中让目前的产品变得更强大图1GPT-4可以接受图像和文本作为输入再输出正确的文本回复数据来源OpenAI我们认为除场景拓展外同时值得关注的是多模态是否能够使模型本身的能力获得增强并解决更为复杂的问题如同人类感知世界的过程是通过输入文本图片视频等各类信息实现的那么多模态能否使得模型本身获得更强甚至额外的能力值得关注根据OpenAI发布的结果GPT-4在处理复杂问题时的表现明显好于此前的GPT-35比如在模拟律师资格考试的任务中GPT-4的分数落在前10的考生中而GP4-35的分数则落在了后10图2GPT-4在复杂问题中的表现明显好于GPT-35请务必阅读正文之后的免责条款部分2of6行业事件快评数据来源OpenAI图3GPT-4可以解答更为复杂的物理问题数据来源OpenAI亮点2训练结果的可预测性大模型的训练结果变得更可预测根据OpenAI的表述GPT-4的一个请务必阅读正文之后的免责条款部分3of6行业事件快评重点是构建了一个可预测的深度学习堆栈可以使用不超过GPT-4计算量千分之一的训练模型对GPT-4一些性能进行准确的预测这使得我们能够在花费较少代价的情况下让AI模型的目标更符合人类的意图和价值观一方面能够加快模型的迭代效率毕竟针对特定模型进行广泛的调优是不现实的另一方面也有助于解决目前ChatGPT会生成一些对人类有害或者歧视性答案的问题图4OpenAI实现了对GPT-4准确度的提前预测数据来源OpenAI亮点3大模型能力来自于模型自身而非强化学习模型能力似乎不受强化学习RLHF的显著影响我们认为这是GPT-4发布中另一个非常值得关注的点GPT系列大模型中诸如推理能力等一系列能力是涌现出来的目前对于这些能力是如何产生的并没有共识一方面ChatGPT确实表现出了一定的乌鸦智能该比喻源自朱松纯教授将乌鸦和鹦鹉对比乌鸦具有理解能力而鹦鹉的问答方式是鹦鹉学舌但另一方面其技术路线是深度学习强化学习其中强化学习是指GhatGPT利用了人类的反馈信息直接优化语言模型那么这些涌现出来的能力究竟是来源于大模型本身还是仅仅是引入了强化学习后机器的回答更符合人的语言习惯而产生的表象图5在模型训练过程中OpenAI引入了强化学习步骤1搜集数据训练监步骤2搜集比较数据训步骤3搜集数据使用增督策略练一个奖励模型强学习优化模型搜集数据训练监对数据集和若干模型结果进从数据集中抽样督策略行抽样借助模型生成输出Labeler标记者揭Labeler标记者从示期望的输出行为最优到最差将输出结果进行排序奖励模型为输出output计算一个反馈结果这个数据用来联合监以上数据用来训练奖督学习对GPT-3进励模型反馈结果用来优化策行微调略数据来源OpenAI国泰君安证券研究模型能力似乎并不来自强化学习为了测试强化学习对于模型能力请务必阅读正文之后的免责条款部分4of6行业事件快评的影响OpenAI分别基于GPT-4基础模型和加入强化学习的GPT-4模型运行了一系列考试中的多项选择题部分结果显示在所有的考试中基础的GPT-4模型的平均成绩为737而引入强化学习后的模型的平均成绩为740这意味着强化学习并没有显著改变基础模型的能力换句话说大模型的能力来自于模型本身根据OpenAI的表述强化学习的意义更多地在于让模型的输出更符合人类的意图和习惯而不是模型能力的提升有时甚至会降低模型的考试成绩表1在一系列考试中引入强化学习后模型的平均成绩并没有显著优于基础模型BaseRLHFBaseRLHFExamExammodelmodelmodelmodelLSATMCQ67007200APMicroeconomicsMCQ90007670SATEBRW-ReadingPortion92309040APPhysics2MCQ62207110SATEBRW-WritingPortion90908410APPsychologyMCQ9809600SATMathMCQ91408620APStatisticsMCQ60006250GraduateRecordExaminationGRE57506750APUSGovernmentMCQ85508360OuantitativeGraduateRecordExaminationGRE87509000APUSHistoryMCQ89108730VerbalUSNCOLocalSectionExam202251706330APWorldHistoryMCQ94509820APArtHistoryMCQ72506620MKSAPQuestionsMCQ77907470APBiologyMCQ98309670AMC1028002400APCalculusBCMCQ66705780AMC1220003200IntroductorySommelierAPChemistryMCQ5830717090509220theoryknowledgeAPEnglishLanguageandComposition55605110CertifiedSommeliertheoryknowledge83208620MCQAPEnglishLiteratureandComposition63606910AdvancedSommeliertheoryknowledge74807710MCQAPEnvironmentalScienceMCQ72506750Average73707400APMacroeconomicsMCQ83307670APMicroeconomicsMCQ90007670数据来源OpenAI国泰君安证券研究投资建议继续推荐科大讯飞虹软科技凌志软件格灵深瞳受益标的商汤云从科技拓尔思寒武纪等表2重点公司估值情况总市值营业收入亿元PS倍股票代码证券名称亿元评级202303152021A2022AE2023E2021A2022AE2023E002230科大讯飞111926183142005427568611558406增持688088虹软科技11997573532938209422571279增持688588凌志软件6136653655793940938774增持688207格灵深瞳-U6545294354569222918511149增持数据来源wind国泰君安证券研究风险提示AIGC落地不及预期ChatGPT发展受到强监管请务必阅读正文之后的免责条款部分5of6行业事件快评本公司具有中国证监会核准的证券投资咨询业务资格分析师声明作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力保证报告所采用的数据均来自合规渠道分析逻辑基于作者的职业理解本报告清晰准确地反映了作者的研究观点力求独立客观和公正结论不受任何第三方的授意或影响特此声明免责声明本报告仅供国泰君安证券股份有限公司以下简称本公司的客户使用本公司不会因接收人收到本报告而视其为本公司的当然客户本报告仅在相关法律许可的情况下发放并仅为提供信息而发放概不构成任何广告本报告的信息来源于已公开的资料本公司对该等信息的准确性完整性或可靠性不作任何保证本报告所载的资料意见及推测仅反映本公司于发布本报告当日的判断本报告所指的证券或投资标的的价格价值及投资收入可升可跌过往表现不应作为日后的表现依据在不同时期本公司可发出与本报告所载资料意见及推测不一致的报告本公司不保证本报告所含信息保持在最新状态同时本公司对本报告所含信息可在不发出通知的情形下做出修改投资者应当自行关注相应的更新或修改本报告中所指的投资及服务可能不适合个别客户不构成客户私人咨询建议在任何情况下本报告中的信息或所表述的意见均不构成对任何人的投资建议在任何情况下本公司本公司员工或者关联机构不承诺投资者一定获利不与投资者分享投资收益也不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任投资者务必注意其据此做出的任何投资决策与本公司本公司员工或者关联机构无关本公司利用信息隔离墙控制内部一个或多个领域部门或关联机构之间的信息流动因此投资者应注意在法律许可的情况下本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易也可能为这些公司提供或者争取提供投资银行财务顾问或者金融产品等相关服务在法律许可的情况下本公司的员工可能担任本报告所提到的公司的董事市场有风险投资需谨慎投资者不应将本报告作为作出投资决策的唯一参考因素亦不应认为本报告可以取代自己的判断在决定投资前如有需要投资者务必向专业人士咨询并谨慎决策本报告版权仅为本公司所有未经书面许可任何机构和个人不得以任何形式翻版复制发表或引用如征得本公司同意进行引用刊发的需在允许的范围内使用并注明出处为国泰君安证券研究且不得对本报告进行任何有悖原意的引用删节和修改若本公司以外的其他机构以下简称该机构发送本报告则由该机构独自为此发送行为负责通过此途径获得本报告的投资者应自行联系该机构以要求获悉更详细信息或进而交易本报告中提及的证券本报告不构成本公司向该机构之客户提供的投资建议本公司本公司员工或者关联机构亦不为该机构之客户因使用本报告或报告所载内容引起的任何损失承担任何责任评级说明评级说明1投资建议的比较标准增持相对沪深300指数涨幅15以上投资评级分为股票评级和行业评级以报告发布后的12个月内的市场表现为谨慎增持相对沪深300指数涨幅介于515之间比较标准报告发布日后的12个月内的股票投资评级公司股价或行业指数的涨跌幅相对同中性相对沪深300指数涨幅介于-55期的沪深300指数涨跌幅为基准减持相对沪深300指数下跌5以上2投资建议的评级标准增持明显强于沪深300指数报告发布日后的12个月内的公司股价或行业指数的涨跌幅相对同期的沪深行业投资评级中性基本与沪深300指数持平300指数的涨跌幅减持明显弱于沪深300指数国泰君安证券研究所上海深圳北京地址上海市静安区新闸路669号博华广场深圳市福田区益田路6003号荣超商北京市西城区金融大街甲9号金融20层务中心B栋27层街中心南楼18层邮编200041518026100032电话0213867666607552397688801083939888E-mailgtjaresearchgtjascom请务必阅读正文之后的免责条款部分6of6
|
|