Deep Direct Reinforcement Learning for Financial Signal Representation and Trading - 代码天地

Deep Direct Reinforcement Learning for Financial Signal Representation and Trading

其他 2018-05-30 16:37:23 阅读次数: 1

这篇论文对我个人的意义挺大的，毕竟是入坑智能交易看的第一篇论文，这篇论文前前后后看了也不下十多遍，抛去其技术性的方面，整篇论文的排版、写作方式以及实验的对比都有很大的借鉴意义。原文在百度学术和google学术都可以找到。

题目：

《Deep Direct Reinforcement Learning for Financial Signal Representation and Trading》

发表于《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS 》期刊的一篇SCI一区的论文。

时间：

2016/1

简介：

随着人工智能技术的发展，用训练好的计算机已经可以打败世界第一的围棋大师了，那能不能通过训练好的模型来打败有经验的交易员呢，这也是该parper想要做的目的。当时DL深度学习刚刚兴起，该paper就抓住了这个机会，通过构建这样的模型DL+RL->DRL来实现交易系统的构建，因而在论文中有一句：“ to the best of our knowledge, this is the first paper to implement DL in designing a real trading system for financial signal representation and self-taught reinforcement trading”。

应用技术：

这篇paper并没有提出什么新颖的算法和什么独特的技术，通篇也并没有什么数学推导和大堆的公式，但是应用的技术特别的多，无论是机器学习、强化学习还是深度学习、模糊学习都有涉及，是一篇应用性的paper。

从模型的训练方向上有这几种方法

参数初始化：

AutoEncoder和Kmeans

特征学习和去噪：

Fuzzy Learning

Deep Learning

决策执行：

Deep RNN

论文结构：

1、Introduction（综述论文，主要从决策执行RL和特征学习DL进行阐述）

2、Related works（介绍RL和DL相关知识）

3、Direct Deep Reinforcement Learning（正题部分，模型的构建顺序）

4、DRNN Learning（模型的初始化，训练方式）

5、Experimental Verifications（多种方法对比）

模型结构：

论文中介绍的模型是一步步循序渐进的方式构建的，最终的模型如上。

就是通过输入的价格转换为向量，然后根据输入通过tanh函数进行求动作｛-1， 0， 1｝，这里的动作也只是个近似的计算tanh在(-1, 1)的范围中：

然后根据价格差和动作计算t时间的收益：

最终目的就是让收益最大：

训练的过程是：

概括就是：

1、先将输入的价格数据输入模型，用来初始化Fuzzy层和Deep层的参数。

2、通过BPTT方法展开网络，再通过BP算法进行对展开的网络进行梯度下降来更新RNN和DNN中的参数。

实验对比：

训练和测试数据用的是商品期货（SU、AG）和股指期货（沪深300指数），红色是训练数据，后面的是测试数据。

实验对比了很多常用的方法，包括一些DNNs和一些RLs方法，最后的衡量时用了SR和TP指标。

最后对手续费进行了探讨，结果是本文中的方法可以在手续费较高的情况下任然可以获利。

总结：

1、创新之处来自与RL与DL的结合，文中提到是首篇paper。

2、实验充分，从多个角度（模型主体、交易费用等）进行了对比实验。

3、应用的技术多，将很多其他领域（如Fuzzy Learning）的技术应用于模型中。

个人拙见，仅供参考。ヾ(o◕∀◕)ﾉヾ

猜你喜欢

转载自blog.csdn.net/frankiehello/article/details/79612679

Deep Direct Reinforcement Learning for Financial Signal Representation and Trading

QUANT[22]论文2:Deep Direct Reinforcement Learning for Financial Signal Representation and Trading

Deep Reinforcement Learning for AutomatedStock Trading: An Ensemble Strategy

[转]Deep Reinforcement Learning Based Trading Application at JP Morgan Chase

Deep Reinforcement Learning for Automated Stock Trading An Ensemble Strategy

Relational Deep Reinforcement Learning

022 Deep Reinforcement Learning

Deep Reinforcement Learning is a waste of time

Random Thoughts on Deep Reinforcement Learning

# Asynchronous Methods for Deep Reinforcement Learning

Asynchronous Methods for Deep Reinforcement Learning

Albert-Z-Guo/Deep-Reinforcement-Stock-Trading

[转载]Deep Learning·NLP·Representation

Deep Reinforcement Learning with Double Q-learning

Deep Reinforcement Learning: Pong from Pixels

Deep Reinforcement Learning 深度增强学习资源

Deep Reinforcement Learning 基础知识

Deep Reinforcement Learning （paper reading notes）

解读continuous control with deep reinforcement learning（DDPG）

Playing Atari with Deep Reinforcement Learning论文解读

Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning

Deep Reinforcement Learning with Iterative Shift for Visual Tracking

Dueling Network Architectures for Deep Reinforcement Learning: DuelingDQN

算法笔记：Playing Atari with Deep Reinforcement Learning

李宏毅Deep Reinforcement Learning笔记

Exploration Strategies in Deep Reinforcement Learning (2)

Exploration Strategies in Deep Reinforcement Learning (1)

DQN Tutorial – Deep Reinforcement Learning with PyTorch

Building Program Vector Representation for Deep Learning

Financial Analysis: Stock Market Prediction Using Deep Learning Algorithms

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)