ICML2020 文章目录及下载链接

其他 2020-09-07 13:43:13 阅读次数: 0

2020 年会议线上召开，会议网站也和以往大不相同

官网本身就提供了文章的主题分类检索与下载

在这里插入图片描述

尽管如此，还是希望能够制作一份方便本地查找的目录，毕竟访问外网有点卡

下载 json 文件

通过网站页面源码分析，发现所有数据都在这份 icml_paper.json 文件中，把它下载下来：
https://icml.cc/static/virtual/data/icml_papers.json
在这里插入图片描述
你要是直接打开的话，就是这个样子，当然我们接下来就用 python 的 json 包来解析它！

解析 json 文件

import json
filename = 'icml_papers.json'
with open(filename, 'r') as file:
    content = file.read()
    js = json.loads(content)
print(len(js))   # 1086 篇文章

获取下载链接

json 文件中没有下载链接，需要跳转到单篇文章页面去下载

def get_download_link(id):
    url = 'https://icml.cc/virtual/2020/poster/'+str(id)  # 通过 id 跳转到单篇文章页面
    html = getPage(url)
    bsObj = BeautifulSoup(html, "lxml")
    return bsObj.find('a', {'href': re.compile('.*static\/paper_files\/icml\/2020\/.*.pdf')})['href']  # 在单篇文章页面获取下载链接

创建 tsv 文件

for j in js:
    with open('result.tsv','a', encoding='utf8') as file:
        item = []
        item.append(str(j['id']))
        item.append(j['content']['title'])
        item.append(', '.join(j['content']['authors']))
        item.append(', '.join(j['content']['keywords']))
        item.append(get_download_link(j['id']))
        s = '\t'.join(item) + '\n'
        print(s)
        file.write(s)

用 excel 打开生成的 tsv 文件，如下所示：
在这里插入图片描述
这里有 1086 篇文章的下载地址哦：https://download.csdn.net/download/itnerd/12789245

既然能用 excel 打开，那就可以做一些统计啦

33 大研究领域

在这里插入图片描述

各类主题占比

最多的是学习理论
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/itnerd/article/details/108328053

ICML2020 文章目录及下载链接

ICML2020 各类文章占比

太赞了！一句话点评1084篇ICML2020论文亮点

文章目录&友情链接

多线程爪巴虫抓取 ICML 2020 补充材料连链接

ActiveMQ文章目录

文章目录

mysql 文章目录

Python 文章目录

Python - 文章目录

测试文章目录

系列文章目录

文章目录bug测试

好文章目录

学习python文章目录

http相关文章目录

蓝牙系列文章目录

Spring Security 文章目录

leetcode 系列文章目录

公众号文章目录

生成文章目录

Java基础文章目录

TensorFlow系列文章目录

劝退Redis文章目录

数学相关文章目录

技术文章目录

CSDN文章目录汇总

我的博客文章目录

索引文章目录

vue实现文章目录

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)