xgboost / lightgbm for NLP 添加一些写死的/hardcode 的比如同义词 “特征”/规则

其他 2018-06-29 15:13:28 阅读次数: 0

two-text-match这个任务，如果我把

"谁写的","谁的著作"

这两个词看为同义词，则我强行指定分别出现这两个词的这对句子match程度为1

如果我把

"古代流放", "流放"

不看成同义词，则我强行指定分别出现这两个词的这对句子match程度为-1

然后

add_data = train_x[train_x["hardcode"]==1] # 过滤
for i in range(1000): # 为了在训练时多出现
    train_x = train_x.append(add_data)
    for j in range(add_data.shape[0]):
        train_y.append(1) # 设定训练label
add_data2 = train_x[train_x["hardcode"]==-1] # 过滤
for i in range(1000):  # 为了在训练时多出现
    train_x = train_x.append(add_data2)
    for j in range(add_data2.shape[0]):
        train_y.append(0) # 设定训练label

猜你喜欢

转载自blog.csdn.net/guotong1988/article/details/80847355

xgboost / lightgbm for NLP 添加一些写死的/hardcode 的比如同义词 “特征”/规则

XGBoost与Lightgbm

Xgboost And Lightgbm

XGBoost Lightgbm详细对比

Xgboost和lightgbm的区别

XGBOOST和LightGBM

Mac安装XGBoost、LightGBM

XGBoost与LightGBM原理及应用

LightGBM和XGBoost的区别？

XGBoost、LightGBM、Catboost对比

GDBT,XGBOOST和LIGHTGBM

LightGBM 的优点（相较于XGBoost） + 细节操作讲解（一）

xgboost和GBDT对比；xgboost和lightGbm

lightgbm,xgboost,gbdt剖析（转）

『Gradient Boosting 』LightGBM与XGBoost对比

XGBoost、LightGBM参数讲解及实战

Linux 安装 gbdt xgboost lightgbm

RF,GBDT,XGBoost,lightGBM的对比

集成学习3——xgboost，lightgbm

XGBoost过时了？LightGBM核心解析

RF、GBDT、XGBoost、LightGBM比较

Boosting算法（GBDT，XGBoost，LightGBM）

xgboost和lightgbm的模型建立

lightgbm,xgboost,gbdt的区别与联系

GBDT、XGBOOST、LightGBM调参数

AdaBoost、GBDT、RF、XGboost、lightGBM

Adaboost、GBDT、xgboost、lightGBM的区别

xgboost，lightgbm权值图

【机器学习】集成学习各算法-gbdt，xgboost，lightgbm比较及优缺点特征总结

LightGBM 的优点（相较于XGBoost） + 细节操作讲解（二）单边梯度采样和互斥特征捆绑

今日推荐

周排行

django中south支持多数据库

2、实时同步项目

http协议状态码解析

codeup 又一版 A+B(C++)

js三座大山之外的其他知识点

正向代理VS反向代理总结

规范的测试流程（转自51testing）

3、python-连接sql server

转~Jenkins pipeline：pipeline 使用之语法详解

cookie与sessio系列（一）：基本知识入门

每日归档

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

xgboost / lightgbm for NLP 添加一些 写死的/hardcode 的比如同义词 “特征”/规则

猜你喜欢

xgboost / lightgbm for NLP 添加一些写死的/hardcode 的比如同义词 “特征”/规则