把训练好的GBDT模型放到spark streaming上运行，并可以实时的处理流过来的数据 - 代码天地

把训练好的GBDT模型放到spark streaming上运行，并可以实时的处理流过来的数据

其他 2020-03-26 08:59:02 阅读次数: 0

from pyspark.mllib.regression import LabeledPoint
from pyspark.mllib.feature import HashingTF
from pyspark.mllib.tree import GradientBoostedTrees, GradientBoostedTreesModel
from pyspark import SparkConf,SparkContext
from pyspark.streaming import StreamingContext
from pyspark.mllib.regression import LinearRegressionWithSGD
import numpy as np
import pandas as pd
from sklearn.externals import joblib

import warnings
warnings.filterwarnings("ignore")
# 加载
clf = joblib.load('/home/ouguangji/PycharmProjects/test1/qgfenxi/model/train_model_result.m')

p_data = pd.read_csv('/home/ouguangji/PycharmProjects/test1/qgfenxi/model/data1.csv')
x = p_data.drop(['y','x1'],axis=1).values
y = p_data[['y']].values
pp_data = []
for i in range(len(x)):
    pp_data.append(LabeledPoint(*(y[i]), list(x[i])))
conf = SparkConf().setAppName('spark-streaming-gbdt').setMaster('local[8]')
sc = SparkContext(conf=conf)
ssc = StreamingContext(sc, 1)
lines = ssc.textFileStream('file:///home/ouguangji/桌面/1')
counts = lines.flatMap(lambda line: line.split("\n")).map(lambda line: line.split(","))
counts = counts.map(lambda line: clf.predict(np.asarray(list(map(float, list(line)))).reshape(1,19)))
# flatMap(lambda line:line.split('\n'))
counts.pprint()

ssc.start()
ssc.awaitTermination()





# a = [0.783,0.22,0.017,3,1,2.02,0,0,0,0,0,0,0,0,0,0,2,5,5]
# print(*(clf.predict(np.array(a).reshape(1,19))))

夏天的风€&^_^

发布了65 篇原创文章 · 获赞 29 · 访问量 6512

私信关注

猜你喜欢

转载自blog.csdn.net/qq_41617848/article/details/103248334

把训练好的GBDT模型放到spark streaming上运行，并可以实时的处理流过来的数据

cpu上训练的模型放到gpu上继续训练

Spark Streaming实时处理Kafka数据

TensorFlow实现人脸识别(5)-------利用训练好的模型实时进行人脸检测

将训练好的Pytorch模型修改为可以在Android部署的样式

Tensorflow用别人训练好的模型进行图像分类（可运行）

(Ubuntu)Tensorflow object detection API——（2）运行已经训练好的模型

python_torch_加载数据集_构建模型_构建训练循环_保存和调用训练好的模型

将TensorFlow训练好的模型迁移到Android APP上（TensorFlowLite）

TensorFlowLite：将TensorFlow训练好的模型迁移到Android APP上

DL开源框架Caffe | 用训练好的模型对数据进行预测

Tensorflow如何保存、读取model （即利用训练好的模型测试新数据的准确度）

PaddlePaddle在使用训练好的模型预测句子时出现数据类型的错误

pytorch在cpu上加载预先训练好的GPU模型以及GPU上加载CPU上训练的Model

Tensorflow学习教程------利用卷积神经网络对mnist数据集进行分类_利用训练好的模型进行分类

yolov3的pytorch版本保存自定义数据集训练好的权重，并载入自己的模型

opencv进阶-基于coco数据集训练好的模型，修改类别显示代码，实现自定义检测物体

Spark Streaming: 实时流式数据处理机制(1)

3.3 使用训练好的模型

保存训练好的模型并调用

python保存训练好的模型

使用训练好的模型参数

tensorflow保存训练好的模型

调用训练好的detectron模型

pytorch保存训练好的模型

MXNET下载训练好的模型

TensorFlow迁移学习: 使用ImageNet训练好的inception v3模型tensorflow_inception_graph.pb训练flowers数据集

Spark3大数据实时处理-Streaming+Structured Streaming 实战

深度学习模型训练好后使用time.time()测试处理每一帧速度（时间）和模型推理速度（时间）

Spark Streaming（上）--实时流计算Spark Streaming原理介绍

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)