>> 华安证券-“学海拾珠”系列之二百二十七:使用深度强化学习解决高维多期环境下的组合配置-250313
| 上传日期: |
2025/3/14 |
大小: |
3284KB |
| 格式: |
pdf 共23页 |
来源: |
华安证券 |
| 评级: |
-- |
作者: |
严佳炜,钱静闲 |
| 下载权限: |
无限制-登录即可下载 |
|
|
主要观点: 本篇是“学海拾珠”系列第二百二十七篇,文献设计了一个先进的投资组合配置框架,使用卷积神经网络获得资产价格的动态模式,并通过WaveNet对跨资产依赖性进行建模,结合DRL方法求解多期Bellman方程,获得最优长期投资组合配置。在不同持有期、风险厌恶系数、交易成本和不同指数上进行实证测试后,发现该方法较为优越。回到国内市场,我们也可以应用类似的深度强化学习模型进行组合构建。 投资者的长期优化问题 传统的投资组合选择方法通常考虑单期收益。Markovitz(1952)开创了均值-方差优化模型,是投资组合理论的基础。 文献提出一个基于DRL(含CNN和WaveNet)的投资组合框架来解决高维多周期环境下的优化问题,所设计的投资组合策略框架主要包括三个组成部分。首先,采用基于卷积神经网络(CNN)的序列信息来捕捉每种资产价格中的动态模式。其次,使用WaveNet对投资组合中资产之间的交叉依赖性进行建模,这在高维环境中尤为重要。最后,将以上两大部分作为DPG模型的输入来优化投资组合配置,将该方法表示为MP-Adv-DRL-Cor。 实证结果 投资组合的盈利能力随着投资期限的延长而增加,同时年度波动率也上升。风险厌恶系数λ的增加意味着投资者更倾向于选择保守策略以降低投资组合风险。这种偏好导致交易频率和投资活动减少,获得高额年回报和高夏普比率的可能性受到限制。交易成本的存在主要影响投资组合的盈利能力,而不会增加风险,它还对投资组合的换手率产生重大影响。在存在交易成本的情况下,投资者在投资机会随时间变化时调整投资组合权重的动机减少。 通常,MP-Adv-DRL-Cor方法的业绩表现优于其他比较方法。对于持有期h=1,交易成本ξ=0.05%和风险厌恶系数λ=0.1的条件下,基于机器学习的方法不一定优于等权重的简单方法。 风险提示 文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。
|
|