代码实践｜LSTM实例之预测股市趋势 - 代码天地

代码实践｜LSTM实例之预测股市趋势

其他 2020-02-24 09:30:46 阅读次数: 0

前情回顾

戳上方蓝字【阿力阿哩哩的炼丹日常】关注我~

今天继续给大家介绍第四章的内容

前面我们介绍了:

深度学习开端-全连接神经网络

一文掌握CNN卷积神经网络

超参数（Hyperparameters）| 上

超参数（Hyperparameters）| 下

寄己训练寄己｜自编码器

通熟易懂RNN｜RNN与RNN的变种结构 | 上

通俗易懂LSTM｜RNN的变种结构 | LSTM长短期记忆网络

通俗易懂GRU｜门控循环单元(gated recurrent unit， GRU)

代码实践 | 全连接神经网络回归---房价预测

代码实践｜全连接神经网络与文本分类

代码实践 | CNN卷积神经网络之文本分类

代码实践 | 卷积神经网络之图像分类

代码实践 | 自编码器

4.7代码实践

4.7.6 LSTM预测stock trend

笔者将在本节给大家介绍如何用LSTM预测stock trend。闲言少叙，我们这就开始实验。

1. 数据集

Quandl是为投资专业人士提供金融，经济和替代数据的首选平台，拥有海量的经济和金融数据。为了使用quandl提供的免费数据集，我们首先得安装它的库。在命令行输入pip install quandl安装即可。

我们使用quandl提供的Google Stock数据集，该数据集中有多个变量。

* 日期（Date）

* 开盘价(Open)

* 最高价(High)

* 最低价(Low)

* 收盘价(Close)

* 总交易额(Volume)

其中，开盘价和收盘价代表股票在某一天交易的起始价和最终价。

最高价、最低价和最后交易价表示当天股票的最高价、最低价和最后交易价格。

交易总量是指当天买卖的股票数量，而营业额(Lacs)是指某一特定公司在某一特定日期的营业额。

损益的计算通常由股票当日的收盘价决定，因此我们将收盘价作为预测目标。

2. 模型结构

预测Stock Trend的模型结构就是LSTM多输入单输出的网络结构。

训练过程：取一定时间点的数据（如50个交易日的数据）作为输入，预测该段时间的下一个交易日的收盘价，不断缩小真实收盘价与预测收盘价的差值loss即可。

3. 实验流程

(1) 加载stock数据

(2) 构造训练数据

(3) LSTM建模

(4) 预测stock

(5) 查看stock trend拟合效果

4. 代码

4.1加载数据

start = date(2000,10,12)
end = date.today()
google_stock = pd.DataFrame(quandl.get("WIKI/GOOGL", start_date=start, end_date=end))
print(google_stock.shape)
google_stock.tail()
google_stock.head()

4.2绘制stock历史收盘价trend图

plt.figure(figsize=(16, 8))
plt.plot(google_stock['Close'])
plt.show()

4.3 构造训练集与验证集

# 时间点长度
time_stamp = 50




# 划分训练集与验证集
google_stock = google_stock[['Open', 'High', 'Low', 'Close', 'Volume']]  #  'Volume'
train = google_stock[0:2800 + time_stamp]
valid = google_stock[2800 - time_stamp:]




# 归一化
scaler = MinMaxScaler(feature_range=(0, 1))  
scaled_data = scaler.fit_transform(train)
x_train, y_train = [], []








# 训练集
print(scaled_data.shape)
print(scaled_data[1, 3])
for i in range(time_stamp, len(train)):
    x_train.append(scaled_data[i - time_stamp:i])
    y_train.append(scaled_data[i, 3])




x_train, y_train = np.array(x_train), np.array(y_train)




# 验证集
scaled_data = scaler.fit_transform(valid)
x_valid, y_valid = [], []
for i in range(time_stamp, len(valid)):
    x_valid.append(scaled_data[i - time_stamp:i])
    y_valid.append(scaled_data[i, 3])




x_valid, y_valid = np.array(x_valid), np.array(y_valid)




print(x_train.shape)
print(x_valid.shape)
train.head()

4.4 创建并训练LSTM模型

# 超参数
epochs = 3
batch_size = 16
# LSTM 参数: return_sequences=True LSTM输出为一个序列。默认为False，输出一个值。
# input_dim：输入单个样本特征值的维度
# input_length：输入的时间点长度
model = Sequential()
model.add(LSTM(units=100, return_sequences=True, input_dim=x_train.shape[-1], input_length=x_train.shape[1]))
model.add(LSTM(units=50))
model.add(Dense(1))
model.compile(loss='mean_squared_error', optimizer='adam')
model.fit(x_train, y_train, epochs=epochs, batch_size=batch_size, verbose=1)

4.5预测stock价格

closing_price = model.predict(x_valid)
scaler.fit_transform(pd.DataFrame(valid['Close'].values))
# 反归一化
closing_price = scaler.inverse_transform(closing_price)
y_valid = scaler.inverse_transform([y_valid])
# print(y_valid)
# print(closing_price)
rms = np.sqrt(np.mean(np.power((y_valid - closing_price), 2)))
print(rms)
print(closing_price.shape)
print(y_valid.shape)

182.31521880433965

(624, 1)

(1, 624)

4.6 拟合stock trend

plt.figure(figsize=(16, 8))
dict_data = {
    'Predictions': closing_price.reshape(1,-1)[0],
    'Close': y_valid[0]
}
data_pd = pd.DataFrame(dict_data)




plt.plot(data_pd[['Close', 'Predictions']])
plt.show()

LSTM能够处理文本序列的位置信息，因此它能比CNN更好地处理文本，但是由于它无法和CNN那般并行化计算，导致其训练速度会比CNN慢很多。

所以，为了能够在处理文本过程中获取文本的序列信息，且能在训练过程中并行化计算，谷歌提出了self-attention layer，它几乎取代了RNN与LSTM。

最后，笔者在本小节介绍的LSTM实例只是一个小应用，后面有很多人基于LSTM提出了许多有趣的实验例如翻译机器人，但笔者并不打算给大家多做几个实验了，因为self-attention的出现，几乎取代了RNN与LSTM，所以大家知道怎么用LSTM即可。

我们需要将重心放在最新最强的网络结构上，加之笔者本身就是研究自然语言处理(NLP)方向的，因此笔者会在后续的章节给大家介绍这些新颖的结构。

4.8总结

本章的核心思想其实就是梯度下降。对于不同的任务，我们无非是换了不同的网络结构，用上了不同的loss，采用了不同的超参数设定去训练罢了，整体的思想始终不变。

与此同时，梯度下降的思想也是深度学习的核心思想，只有了解梯度下降的基本原理，才能更好地使用与创造适用于各种任务的网络结构。

关注我的微信公众号~不定期更新相关专业知识~

内容 |阿力阿哩哩

编辑 | 阿璃

点个“在看”，作者高产似那啥~

发布了76 篇原创文章 · 获赞 5 · 访问量 6217

私信关注

猜你喜欢

转载自blog.csdn.net/Chile_Wang/article/details/104438072

代码实践｜LSTM实例之预测股市趋势

机器学习之MATLAB代码--CNN预测 _LSTM预测（十七）

TensorFlow基于LSTM的预测实例

基于LSTM模型的股票价格趋势预测，预测未来一天的开盘价格（附代码详解与注释）

机器学习之MATLAB代码--LSTM和BiLSTM预测对比（十五）

深度学习之 DeepLearning4j 预测股市走向

时空序列预测之Convolutional LSTM Network

【lstm预测】鲸鱼优化算法之改进的lstm预测【Matlab 105期】【预测模型3】

bzoj 2119 股市的预测

[BZOJ]2119: 股市的预测

【LSTM】预测

lstm 预测

LSTM lstm时间序列预测用电量预测完整代码数据

机器学习之MATLAB代码--MATLAB量子粒子群优化LSTM超参数负荷预测(十三）

功率预测发展趋势之概率预测

深度学习在股票趋势预测中的应用与实践

使用Keras和LSTM实现对于长期趋势记忆的时间序列预测-LSTNet

shell编程之实践出真知（代码实例）

基于LSTM的时间序列预测-原理-python代码详解

LSTM实现股票预测--pytorch版本【120+行代码】

基于LSTM神经网络的负荷预测（Python代码实现）

基于蜣螂算法改进的LSTM预测算法-附代码

GWO-LSTM交通流量预测（python代码）

LSTM时间序列预测MATLAB代码模板（无需调试）

LSTM多变量时序预测MATLAB代码模板

短期风速预测|LSTM|ELM|批处理（matlab代码）

bzoj2119 股市的预测

[bzoj2119]股市的预测

【BZOJ 2119】股市的预测（SAM）

数据挖掘沪深股市预测

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)