达观杯_概率融合 - 代码天地

达观杯_概率融合

其他 2018-10-07 14:10:00 阅读次数: 0

#import pickle
import pandas as pd
import numpy as np
import time


path='D:/daguanbei/data/proba'

print('1 读取概率+投票')
svm_1 = pd.read_csv(path+'/result_proba_svm_0.779.csv')
svm_2 = pd.read_csv(path+'/sfm_lr_lsvm(C5)_a_proba_0.779.csv')
svm_3 = pd.read_csv(path+'/sfm_lr_lsvm(C5)_w_proba_0.779.csv')

lr_1 = pd.read_csv(path+'/result_proba_lr_0.777.csv')
lr_2 = pd.read_csv(path+'/LR_LR_selectfeature_article_prob_0.777.csv')


lgb_1 = pd.read_csv(path+'/lgb_article_merge(tf_doc_hash)_0.772.csv')
lgb_2 = pd.read_csv(path+'/lgb_word_merge(tf_doc_hash)_0.773.csv')

bys_1 = pd.read_csv(path+'/bayes_tfidf_w_prob_0.72.csv')

# 辅助函数
def series2arr(series):
    res = []
    for row in series:
        res.append(np.array(eval(row)))
    return np.array(res)


svm_1 = series2arr(svm_1['proba'])
svm_2 = series2arr(svm_2['proba'])
svm_3 = series2arr(svm_3['proba'])


lr_1 = series2arr(lr_1['proba'])
lr_2 = series2arr(lr_2['proba'])


lgb_1 = series2arr(lgb_1['proba'])
lgb_2 = series2arr(lgb_2['proba'])

bys_1 = series2arr(bys_1['proba'])

# final_prob = 2*svm_prob_arr+lg_prob_arr
model_list = [svm_1,svm_2,svm_3,svm_4,svm_5,svm_6,lr_1,lr_2,lr_3,lr_4,lr_5,lgb_1,lgb_2,bys_1]
final_prob = 0.0
for i in model_list:
	final_prob += i


y_class=[np.argmax(row)+1 for row in final_prob]
df_result = pd.DataFrame({'id':range(102277),'class':y_class})

df_result.to_csv('merge.csv',index=False)

猜你喜欢

转载自blog.csdn.net/Datawhale/article/details/82899347

达观杯_概率融合

达观杯_分类融合

达观杯文本处理（三）--调优与融合

达观杯文本分类比赛 | (2) 单模型融合(机器学习模型)

达观杯_比赛简介

达观杯比赛总结

达观杯linghtgbm(五)

达观杯-特征工程 1

达观杯_构建模型（三）lightGBM

达观杯_构建模型（一）linearSVM

达观杯比赛复盘专题

达观杯文本分类竞赛 0

达观杯文本分类比赛

达观杯数据竞赛系列（一）

达观杯文本处理（一）

【达观杯】数据竞赛学习篇（二）

Datawhale-达观杯nlp复盘

达观杯数据竞赛系列（四）

达观杯数据竞赛系列（二）

【达观杯】数据竞赛学习篇（一）

【达观杯】数据竞赛学习篇（三）

“达观杯” 经验分享（排名：87/5986）

多模型融合推荐算法在达观数据的运用

“达观杯”文本智能处理挑战赛

【机器学习】训练文本分类器（“达观杯”）

达观杯_构建模型（二）逻辑回归

达观杯_构建模型（四）贝叶斯

达观杯-特征工程 2--（增加特征及特征选取）

达观杯NLP挑战赛复盘

达观杯文本智能处理挑战赛

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)