>> 浙商证券-计算机行业点评报告:GPT-4发布,多模态处理+复杂推理能力有望打开应用空间-230315
上传日期: |
2023/3/16 |
大小: |
1273KB |
格式: |
pdf 共8页 |
来源: |
浙商证券 |
评级: |
看好 |
作者: |
刘雯蜀 |
行业名称: |
计算机 |
下载权限: |
此报告为加密报告 |
|
投资要点 北京时间3月15日凌晨,OpenAI官方发布了新一代AI大模型GPT-4,模型在多模态任务、复杂问题推理领域取得重大突破,在多项人类测试中表现优异。OpenAI已在ChatGPTPlus上提供API接口供开发者构建应用和服务,标志着AI多模态化进程持续推进,商业化空间有望加速打开。 GPT-4实现多模态任务处理能力,并在数学、物理等学科领域实现重大进步 1、GPT-4可接受图像、文本信息作为输入并生成说明文字、分类和分析,允许长文内容创建、扩展对话以及文档搜索和分析等功能; 2、GPT-4在复杂问题的推理能力上大幅超越GPT-3.5,在SAT、Bar等大多数专业测试以及相关学术基准评测中,GPT-4的分数高于GPT-3.5并超越人类平均水平; 3、GPT-4目前已对ChatGPTPlus用户开放API,收费为每1000 prompt tokens0.12美元,而每1000 completion tokens收费为0.06美元。同时OpenAI还开源了Evals框架,以自动评估AI模型性能,允许用户报告模型中的缺点,以帮助其改进。 4、GPT-4引入了更多人类反馈数据进行训练,以改进GPT-4的行为,不断吸取现实世界使用的经验教训,并基于模型的高级推理和指令遵循能力加快模型安全性的迭代。 GPT-4已投入实际应用,多模态趋势下商用空间有望打开 1、微软已宣布新必应(Bing)搜索引擎已接入GPT-4,未来有望将GPT-4技术嵌入到业务生态中的更多应用; 2、Duolinguo、Strip、冰岛政府等企业、教育机构、政府已接入GPT-4,借助其能力实现不同的需求和功能; 3、多模态化将成为AI大模型发展的核心趋势,看好未来GPT模型融合音频、视频等模态数据,实现更多跨模态任务,进一步打开应用空间; 风险提示 1、AI技术迭代不及预期的风险;2、AI商业化产品发布不及预期;3、政策不确定性带来的风险;4、下游市场不确定性带来的风险;
研究报告全文:证券研究报告行业点评计算机计算机报告日期2023年03月15日发布多模态处理复杂推理能力有望打开应用空间GPT-4行业点评报告投资要点行业评级看好维持北京时间3月15日凌晨OpenAI官方发布了新一代AI大模型GPT-4模型在分析师刘雯蜀多模态任务复杂问题推理领域取得重大突破在多项人类测试中表现优异执业证书号s1230523020002OpenAI已在ChatGPTPlus上提供API接口供开发者构建应用和服务标志着liuwenshu03stockecomcnAI多模态化进程持续推进商业化空间有望加速打开相关报告1计算机行业点评报告GPT-4实现多模态任务处理能力并在数学物理等学科领域实现重大进步OpenAI发布WhisperAPI再添1GPT-4可接受图像文本信息作为输入并生成说明文字分类和分析允许新收费产品20230304长文内容创建扩展对话以及文档搜索和分析等功能2计算机行业深度报告潮起2GPT-4在复杂问题的推理能力上大幅超越GPT-35在SATBar等大多数专业测试以及相关学术基准评测中GPT-4的分数高于GPT-35并超越人类平均水潮落拐点已过AIGC有望引平领人工智能商业化浪潮3GPT-4目前已对ChatGPTPlus用户开放API收费为每1000prompttokens20230212012美元而每1000completiontokens收费为006美元同时OpenAI还开源了Evals框架以自动评估AI模型性能允许用户报告模型中的缺点以帮助其改进4GPT-4引入了更多人类反馈数据进行训练以改进GPT-4的行为不断吸取现实世界使用的经验教训并基于模型的高级推理和指令遵循能力加快模型安全性的迭代GPT-4已投入实际应用多模态趋势下商用空间有望打开1微软已宣布新必应Bing搜索引擎已接入GPT-4未来有望将GPT-4技术嵌入到业务生态中的更多应用2DuolinguoStrip冰岛政府等企业教育机构政府已接入GPT-4借助其能力实现不同的需求和功能3多模态化将成为AI大模型发展的核心趋势看好未来GPT模型融合音频视频等模态数据实现更多跨模态任务进一步打开应用空间风险提示1AI技术迭代不及预期的风险2AI商业化产品发布不及预期3政策不确定性带来的风险4下游市场不确定性带来的风险httpwwwstockecomcn18请务必阅读正文之后的免责条款部分行业点评正文目录1OpenAI发布GPT4大模型多模态为核心亮点411GPT4大模型发布多模态任务复杂推理实现重大突破412GPT-4在多项任务环节实现重要突破513新Bing已使用GPT-4模型多模态趋势下商用空间有望打开62风险提示7httpwwwstockecomcn28请务必阅读正文之后的免责条款部分行业点评图表目录图1GPT-4可基于图片输入生成对应文字描述4图2GPT-4解决复杂推理问题4图3GPT-4在多项人类测试上的表现实现大幅进步5图4GPT-4在传统机器学习模型测试上表现优异5图5GPT-4在生成内容的合理性和真实性方面进步显著5图6GPT-4在生成内容的合理性和真实性方面进步显著6图7AIJina光谱未来多模态模型将成为核心发展方向7表1多家企业政府及教育机构借助GPT-4实现功能7httpwwwstockecomcn38请务必阅读正文之后的免责条款部分行业点评1OpenAI发布GPT4大模型多模态为核心亮点11GPT4大模型发布多模态任务复杂推理实现重大突破北京时间2023年3月15日凌晨OpenAI官方发布了GPT-4大模型与GPT-3GPT-35模型相比GPT-4具备了多模态功能支持接受图像和文本输入并输出文本我们认为随着模型的持续迭代GPT有望在图像生成音视频处理等跨模态任务领域上持续拓展应用空间非常广阔GPT-4距离人类认知水平仍有差距但在多项指标表现上实现重大迭代OpenAI官方表示GPT-4在许多现实世界场景中的能力仍不如人类但在各种专业和学术基准上的表现已经超越了人类的平均水平在模拟bar美国律师执照考试中GPT-4测试成绩排名前10而此前发布的GPT-35仅排在后10除此之外在多项不同领域的专业测试中GPT-4能够排到非常考前的位置在复杂问题推理上的能力表现出了显著进步GPT-4在图像-文字复杂推理任务领域展现优秀能力GPT-4可根据图像信息识别图像中包含的信息并生成文字反馈同时在论文理解方面GPT-4可以智能识别论文截图中包含的文字以及图表内容并进行汇总分析实现论文的总结归纳功能在复杂问题推理上GPT-4可准确解答力学题并根据题目要求输出推理计算过程相比于GPT-3和GPT-35进步显著图1GPT-4可基于图片输入生成对应文字描述图2GPT-4解决复杂推理问题资料来源OpenAIGPT-4TechnicalReport浙商证券研究所资料来源OpenAIGPT-4TechnicalReport浙商证券研究所OpenAI开放GPT-4API申请渠道并开源OpenAIEvals项目GPT-4用户生态有望快速构建OpenAI官方宣布面向开发者开放GPT-4API的申请通道用户可提交申请进入waitlist等待通过而ChatGPTPlus订阅会员可直接获得GPT-4的试用权限与GPT-35类似GPT-4模型API根据用户调用tokens数量进行收费定价为每1000prompttokens006美元而每1000completiontokens收费012美元另外OpenAI开源Evals项目可用于自动评估AI模型性能以便进一步优化与改进模型httpwwwstockecomcn48请务必阅读正文之后的免责条款部分行业点评12GPT-4在多项任务环节实现重要突破思维能力接近人类平均水平OpenAI通过各类benchmark进行测试GPT-4在多项测试上表现优于GPT-35相比于GPT-35GPT-4在物理生物数学等理科测试中的表现明显优于GPT-35模型展现了处理复杂推理任务能力的大幅迭代同时GPT-4在多数测试中的成绩能够超越80的人类应试者反映出模型在多项人类测试上的能力已超越平均水平在传统的机器学习测试上GPT-4在MMLU大规模多任务语言理解HellaSwag常识基准GSM-8K数学测试等指标上相较GPT-35以及之前的模型最佳结果均有不同程度的提升图3GPT-4在多项人类测试上的表现实现大幅进步图4GPT-4在传统机器学习模型测试上表现优异资料来源OpenAIGPT-4TechnicalReport浙商证券研究所资料来源OpenAIGPT-4TechnicalReport浙商证券研究所针对GPT-3以及ChatGPT会生成与事实不符信息的问题GPT-4实现显著优化与GPT-35相比GPT-4在历史数学写作等各交互场景下上生成内容拥有更好的合理性与真实性OpenAI研究人员在论文中指出在包含9大类话题的内容事实性评估测试中GPT-4的准确度较GPT-35平均提高了19个百分点图5GPT-4在生成内容的合理性和真实性方面进步显著资料来源OpenAIGPT-4TechnicalReport浙商证券研究所httpwwwstockecomcn58请务必阅读正文之后的免责条款部分行业点评GPT-4基于人类反馈强化实现改进但在复杂推理问题上已接近人类水平导致优化效果并不显著OpenAI透露GPT-4引入了更多人类反馈数据进行训练以提升模型的安全性和对齐性同时研究人员在各项人类测试中将GPT-4基础模型BaseModel和引入RLHF机制的模型RLHFmodel进行对比结果显示引入RLHF后的GPT-4平均得分率为740仅比未引入的737高出03也反映出GPT-4在专业性测试中的表现已经接近甚至超越人类图6GPT-4在生成内容的合理性和真实性方面进步显著资料来源OpenAIGPT-4TechnicalReport浙商证券研究所13新Bing已使用GPT-4模型多模态趋势下商用空间有望打开GPT-4性能大幅提升海外多家企业已相继布局GPT-4应用GPT-4在回答准确性识图能力歌词以及文本生成等任务能力的大幅提升使其具备更高的商业价值和更多的应用场景3月15日微软副总裁兼消费者首席营销官YusufMehdi发文确认了新Bing必应搜索引擎已运行GPT-4而包含摩根士丹利duolingo在内的政府及企业已布局GPT-4技术以实现多样化的功能httpwwwstockecomcn68请务必阅读正文之后的免责条款部分行业点评表1多家企业政府及教育机构借助GPT-4实现功能企业政府机构应用场景基于GPT-4实现功能Duolingo语言教育实现更加智能的语言沟通交互BeMyEyes视觉残障辅助帮助盲人识别图像文本信息Stripe互联网支付识别和预防欺诈摩根士丹利金融财富管理部门利用GPT-4组织庞大的知识库可汗学院教育为学生生成个性化的学习计划冰岛政府文化利用GPT-4保护本国语言文化资料来源OpenAI官网浙商证券研究所我们认为GPT-4实现了从单模态大模型到多模态大模型的重要突破未来有望随着模型算法的加速迭代实现对音频视频等多模态数据的融合完成各类跨模态任务充分打开AI商业化应用空间图7AIJina光谱未来多模态模型将成为核心发展方向资料来源CSDN浙商证券研究所2风险提示1AI技术迭代不及预期的风险2AI商业化产品发布不及预期3政策不确定性带来的风险4下游市场不确定性带来的风险httpwwwstockecomcn78请务必阅读正文之后的免责条款部分行业点评股票投资评级说明以报告日后的6个月内证券相对于沪深300指数的涨跌幅为标准定义如下1买入相对于沪深300指数表现20以上2增持相对于沪深300指数表现10203中性相对于沪深300指数表现1010之间波动4减持相对于沪深300指数表现10以下行业的投资评级以报告日后的6个月内行业指数相对于沪深300指数的涨跌幅为标准定义如下1看好行业指数相对于沪深300指数表现10以上2中性行业指数相对于沪深300指数表现1010以上3看淡行业指数相对于沪深300指数表现10以下我们在此提醒您不同证券研究机构采用不同的评级术语及评级标准我们采用的是相对评级体系表示投资的相对比重建议投资者买入或者卖出证券的决定取决于个人的实际情况比如当前的持仓结构以及其他需要考虑的因素投资者不应仅仅依靠投资评级来推断结论法律声明及风险提示本报告由浙商证券股份有限公司已具备中国证监会批复的证券投资咨询业务资格经营许可证编号为Z39833000制作本报告中的信息均来源于我们认为可靠的已公开资料但浙商证券股份有限公司及其关联机构以下统称本公司对这些信息的真实性准确性及完整性不作任何保证也不保证所包含的信息和建议不发生任何变更本公司没有将变更的信息和建议向报告所有接收者进行更新的义务本报告仅供本公司的客户作参考之用本公司不会因接收人收到本报告而视其为本公司的当然客户本报告仅反映报告作者的出具日的观点和判断在任何情况下本报告中的信息或所表述的意见均不构成对任何人的投资建议投资者应当对本报告中的信息和意见进行独立评估并应同时考量各自的投资目的财务状况和特定需求对依据或者使用本报告所造成的一切后果本公司及或其关联人员均不承担任何法律责任本公司的交易人员以及其他专业人士可能会依据不同假设和标准采用不同的分析方法而口头或书面发表与本报告意见及建议不一致的市场评论和或交易观点本公司没有将此意见及建议向报告所有接收者进行更新的义务本公司的资产管理公司自营部门以及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策本报告版权均归本公司所有未经本公司事先书面授权任何机构或个人不得以任何形式复制发布传播本报告的全部或部分内容经授权刊载转发本报告或者摘要的应当注明本报告发布人和发布日期并提示使用本报告的风险未经授权或未按要求刊载转发本报告的应当承担相应的法律责任本公司将保留向其追究法律责任的权利浙商证券研究所上海总部地址杨高南路729号陆家嘴世纪金融广场1号楼25层北京地址北京市东城区朝阳门北大街8号富华大厦E座4层深圳地址广东省深圳市福田区广电金融中心33层上海总部邮政编码200127上海总部电话862180108518上海总部传真862180106010浙商证券研究所httpswwwstockecomcnhttpwwwstockecomcn88请务必阅读正文之后的免责条款部分
|
|