Oppo 持续更新中 - 代码天地

Oppo 持续更新中

其他 2018-11-10 15:51:25 阅读次数: 0

数据集来自天池竞赛
以下部分为暂时的数据处理，每天都会更新完善~~

import numpy as np
import pandas as pd
#读取训练/测试/验证集数据
train_file = 'H:/TianChiOppoRound1/oppo_round1_train_20180929.txt'
train_df = pd.read_csv(train_file,sep='\t',header=None,names=['prefix','query_prediction','title','tag','label'],low_memory=False)
test_file = 'H:/TianChiOppoRound1/oppo_round1_test_A_20180929.txt'
test_df = pd.read_csv(test_file,sep='\t',header=None,names=['prefix','query_prediction','title','tag'],low_memory=False)
vali_file = 'H:/TianChiOppoRound1/oppo_round1_vali_20180929.txt'
vali_df = pd.read_csv(vali_file,sep='\t',header=None,names=['prefix','query_prediction','title','tag','label'],low_memory=False)

#定义函数将query_prediction数据展开为列表
def split_query_prediction(text):
    if pd.isna(text):
        return []
    return [s.strip() for s in text.replace('{','').replace('}','').split(',')]

train_df['pred_list'] = train_df['query_prediction'].apply(split_query_prediction)
train_df['pred_len'] = train_df['pred_list'].apply(len)
train_query_prediction = train_df.pop('query_prediction')
#train_df.to_csv('H:/TianChiOppoRound1/train.csv')
# print(np.shape(train_df))
# print(train_df.columns.values)

持续更新中。。。

猜你喜欢

转载自blog.csdn.net/weixin_40924580/article/details/83021110

Oppo 持续更新中

2019.8中关村、OGeek（oppo）比赛

TiDB 在 OPPO 准实时数据仓库中的实践

在oppo系统中Android Oaid SecurityException 解决方案

OPPO数据中台之基石：基于Flink SQL构建实数据仓库

基于Flink构建的实时数据仓库，这才是OPPO数据中台的基础

OPPO 数据中台之基石：基于 Flink SQL 构建实数据仓库

OPPO 自研大规模知识图谱及其在数智工程中的应用

持续更新中。。。

Layui(持续更新中)

oppo r11

OPPO推送：怎样开通？

OPPO Developers Conference（2018.12.26）

#OPPO试用心得#

OPPO面筋集合

OPPO Reno套路深

oppo面经

OPPO PUSH 配额

VIVO+Oppo

OPPO Watch敲门IoT

OPPO面试面经

电信、oppo面经

OPPO 的影像秘密

PHP 实现OPPO推送

OPPO Find X的升降式中框还是 vivo NEX的升降式镜头？看完这篇不再纠结……

掌握这几种OPPO手机拍照方式，让你在人群中脱颖而出

东拼西凑的模板·持续更新中

git 命令（持续更新中）

JavaScript对象（持续更新中）

基本操作(持续更新中)

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)