Deep Reinforcement Learning for AutomatedStock Trading: An Ensemble Strategy

股票交易策略在投资中起着至关重要的作用。然而,在复杂多变的股票市场中设计有利可图的策略具有挑战性。在本文中,我们提出了一种集成策略,该策略采用深度强化方案通过最大化投资回报来学习股票交易策略。我们训练深度强化学习代理并使用三种基于演员-评论家的算法获得集成交易策略:近端策略优化 (PPO)、优势演员评论家 (A2C) 和深度确定性政策梯度 (DDPG)。集成策略继承并融合了三种算法的最佳特性,从而鲁棒地适应不同的市场情况。为了避免在具有连续动作空间的训练网络中消耗大量内存,我们采用按需加载技术来处理非常大的数据。我们在流动性充足的 30 只道琼斯股票上测试了我们的算法。评估了具有不同强化学习算法的交易代理的性能,并与道琼斯工业平均指数和传统的最小方差投资组合分配策略进行了比较。就夏普比率衡量的风险调整后回报而言,所提出的深度集成策略被证明优于三个单独的算法和两个基线。

猜你喜欢

转载自blog.csdn.net/sinat_37574187/article/details/130306844