目录
数据集1:GEFCom2014负荷数据
数据集下载:
- 百度网盘:链接:https://pan.baidu.com/s/1PgCWHx8vYUfGB9UGtCmaVA?pwd=ktn0 提取码:ktn0
- 官方下载:https://ars.els-cdn.com/content/image/1-s2.0-S0169207016000133-mmc1.zip
数据集简介:
GEFCom2014 “负荷预测数据”为竞赛的公共数据集,GEFCom2014 的负荷预测轨迹为概率负荷预测。数据集的可视化如下:
数据集2:爱奇艺用户留存预测挑战赛数据集
数据集下载:
- 百度网盘:链接:https://pan.baidu.com/s/1UQWmIN7P6vcBmYxfZxu_1g?pwd=5ywi 提取码:5ywi
- 官方下载:http://challenge.ai.iqiyi.com/detail?raceId=61600f6cef1b65639cd5eaa6
赛题描述:
爱奇艺是中国和世界领先的高品质视频娱乐流媒体平台,每个月有超过5亿的用户在爱奇艺上享受娱乐服务。爱奇艺秉承“悦享品质”的品牌口号,打造涵盖影剧、综艺、动漫在内的专业正版视频内容库,和“随刻”等海量的用户原创内容,为用户提供丰富的专业视频体验。
爱奇艺手机端APP,通过深度学习等最新的AI技术,提升用户个性化的产品体验,更好地让用户享受定制化的娱乐服务。我们用“N日留存分”这一关键指标来衡量用户的满意程度。例如,如果一个用户10月1日的“7日留存分”等于3,代表这个用户接下来的7天里(10月2日~8日),有3天会访问爱奇艺APP。预测用户的留存分是个充满挑战的难题:不同用户本身的偏好、活跃度差异很大,另外用户可支配的娱乐时间、热门内容的流行趋势等其他因素,也有很强的周期性特征。
本次大赛基于爱奇艺APP脱敏和采样后的数据信息,预测用户的7日留存分。参赛队伍需要设计相应的算法进行数据分析和预测。
数据描述:
本次比赛提供了丰富的数据集,包含视频数据、用户画像数据、用户启动日志、用户观影和互动行为日志等。针对测试集用户,需要预测每一位用户某一日的“7日留存分”。7日留存分取值范围从0到7,预测结果保留小数点后2位。
User portrait data | |
Field name |
Description |
user_id |
|
device_type |
iOS, Android |
device_rom |
rom of the device |
device_ram |
ram of the device |
sex |
|
age |
|
education |
|
occupation_status |
|
territory_code |
App launch logs | |
Field name |
Description |
user_id |
|
date |
Desensitization, started from 0 |
launch_type |
spontaneous or launched by other apps & deep-links |
Video related data | |
Field name |
Description |
item_id |
id of the video |
father_id |
album id, if the video is an episode of an album collection |
cast |
a list of actors/actresses |
duration |
video length |
tag_list |
a list of tags |
User playback data | |
Field name |
Description |
user_id |
|
item_id |
|
playtime |
video playback time |
date |
timestamp of the behavior |
User interaction data | |
Field name |
Description |
user_id |
|
item_id |
|
interact_type |
interaction types such as posting comments, etc. |
date |
timestamp of the behavior |
数据集3:电力变压器数据集 (ETDataset)
数据集下载:
数据描述:
数据提供了两年的数据,每个数据点每分钟记录一次(用 m 标记),它们分别来自中国同一个省的两个不同地区,分别名为ETT-small-m1和ETT-small-m2。每个数据集包含2年 * 365天 * 24小时 * 4 = 70,080数据点。 此外,我们还提供一个小时级别粒度的数据集变体使用(用 h 标记),即ETT-small-h1和ETT-small-h2。 每个数据点均包含8维特征,包括数据点的记录日期、预测值“油温”以及6个不同类型的外部负载值。
数据集4:2016年电工数学建模竞赛负荷预测数据集
数据集下载:
- 百度网盘:链接:https://pan.baidu.com/s/1h3sGqebtLp1XGK9kmN53Zg?pwd=jx5p 提取码:jx5p
数据简介:
数据集5:风电机组运行数据集
数据集下载:
- 百度网盘:链接:https://pan.baidu.com/s/13-YLcvuOP6-ev6XdGtQbGQ?pwd=levp 提取码:levp
数据简介:
数据集包括风速、风向、温度、湿度、气压和真实功率等共30万余条。
- WINDSPEED:预测风速
- WINDDIRECTION:风向
- TEMPERATURE:温度
- HUMIDITY:湿度
- PRESSURE:气压
- PREPOWER:预测功率
- ROUND(A.WS,1):实际风速
- ROUND(A.POWER,0):实际功率
- YD15:已有实际功率预测目标
数据集6:澳大利亚电力负荷与价格预测数据
数据集下载:
- 百度网盘:链接:https://pan.baidu.com/s/1ehm9aJQqzbGOITnz3LwyLw?pwd=k4s1
提取码:k4s1
数据简介:
数据集包括日期、小时、干球温度、露点温度、湿球温度、湿度、电价、电力负荷特征,时间间隔30min。
数据集7:常州普利司通光伏数据集
数据集下载:
- 百度网盘:链接:https://pan.baidu.com/s/1vXRjtf2gen_-2b1jDwYLXA?pwd=loam 提取码:loam
数据简介:
数据集包括时间、场站名称、辐照强度(Wh/㎡)、 环境温度(℃)、全场功率(kW)等5个特征,时间间隔5min。(注意:辐照强度(Wh/㎡)、 环境温度(℃)、全场功率(kW)特征名前有个空格)
数据集8:新疆光伏风电数据集
数据集下载:
- 百度网盘:链接:https://pan.baidu.com/s/1e3NkiNC_dg3CaZWe9TA1TA?pwd=loam 提取码:loam
光伏数据简介:
光伏数据集包括组件温度(℃) 、温度(°) 气压(hPa)、湿度(%)、总辐射(W/m2)、直射辐射(W/m2)、散射辐射(W/m2)、实际发电功率(mw)特征,时间间隔15min。