研报下载就选股票报告网
您好,欢迎来到股票分析报告网!登录   忘记密码   注册
>> 中泰证券-【中泰金工”文献掘金“系列三】:机器学习在中文财经文本上有效吗?-221123
上传日期:   2022/11/24 大小:   1535KB
格式:   pdf  共19页 来源:   中泰证券
下载权限:   此报告为加密报告
◆推荐语
  学术文献做中国市场的主题很少,顶流做中国市场的更少。范剑青老师等人提出了一个通用的和自适应的高维数据机器学习框架FarmPredict,该模型可以从文本数据中提取潜在因子和特质因子,用来输入惩罚回归预测股票未来收益。他们在中国股市的实证结果表面,基于FarmPredict可以提取的情绪主导词汇,并且根据情绪评分指标构建的投资组合收益年化高达116%,这个结果显著优于其它模型。这项研究开辟了非结构数据在金融应用中的全新范式,更是证明了大数据无论在数据上还是在方法论上都在“金融投资”中有其核心地位。
  ◆摘要
  权益市场上的大多数研究使用的文本数据仅限于英文环境的情绪词典或主题建模。但是,我们能否直接从文本数据预测新闻的影响?从这样的直接过程中我们能“学习”到多少内容?基于因子模型和稀疏正则化(FarmPredict),我们提出了一种全新的文本学习框架,让机器自动地学习金融收益。不同于其它基于字典或者有严格预处理过程的主题模型,我们的框架允许模型从整篇文章中更全面地提取信息。我们在中国股市上实证了我们的研究,中文文本在单词和短语间没有自然的空格而中国股市有非常高比例的个人投资者。这两个特性使得我们的研究显著不同于前人聚焦英文文本和美国市场的作品。我们使用中国股市的资料和几种现存的方法验证了本文模型。结果显示,由FarmPredict方法得到积极情绪评分的股票平均每日超额收益约83bps,而负面新闻在发布日期带来了26bps的负向影响,这两种影响都能持续数天。这种非对称的效应与中国股市的做空限制相吻合。作为总结,我们的研究显示机器学来的情绪确实提供了强大的预测能力,使得一个简单策略的年化回报率约为116%;基于我们模型的投资组合显著战胜了其他模型。这进一步支持了我们的FarmPredict可以学习金融新闻中的情绪。我们的研究也证明了使用机器学习文本数据有强大的潜力。
  ◆文献信息:
  Fan, Jianqing and Xue, Lirong and Zhou, Yang, How Much Can Machines Learn FinanceFrom Chinese Text Data?, (January 11,2021).
  ◆作者信息
  Jianqing Fan
  Princeton University - Bendheim Center for Finance
  Lirong Xue
  Princeton University - Department of Operations Research & Financial Engineering (ORFE)
  Yang Zhou
  Institute for Big Data, Fudan University
  风险提示:模型仅根据历史数据获得的历史经验,应用在未来可能产生风险。
 
Copyright © 2005 - 2021 Nxny.com All Rights Reserved 备案号:蜀ICP备15031742号-1