按浏览量或者下载量大小获取CSDN搜索的文章 - 代码天地

按浏览量或者下载量大小获取CSDN搜索的文章

编程语言 2018-07-08 11:22:00 阅读次数: 0

import requests
from bs4 import BeautifulSoup

def getHTMLText(html):
    try:
        r = requests.get(html, timeout=0.2)
        r.encoding = r.apparent_encoding
        return 1,r.text
    except:
        return 0
        
def search_CSDN_html(key, skind, page):
    kind = ["&domain=&o=&s=&u=&l=&f=",
        "blog&domain=&o=&s=&u=&l=&f=&rbg=0",
        "doc&domain=&o=&s=all&u=&l=&f=",
        "discuss&domain=&o=simi&s=&u=&l=&f=",
        "course&o=&s=&l="]
    return "https://so.csdn.net/so/search/s.do?p=" + str(page) + "&q=" + key + "&t=" + kind[skind]

def NUmlist(numlist,soup, skind):
    if skind == 1 or skind == 3:
        for i in soup.select('.author-time'):
            numlist.append(int(i.text[i.text.find('浏览') + 3:i.text.find('次') -1]))
    elif skind == 2:
        for i in soup.select('.author-time'):
            numlist.append(int(i.text[i.text.find('下载') + 2:-2]))
    elif skind == 4:
        for i in soup.select('.author-time'):
            numlist.append(int(i.text[i.text.find('\\n') + 2:-3]))
    return numlist

def maxpage(key, skind):
    html = search_CSDN_html(key, skind, 1)
    soup = BeautifulSoup(getHTMLText(html)[1],"html.parser")
    i = soup.select('.text')[0].text
    return int(int(i[i.find('共')+1:i.find('条')])/21)

key = "Python GUI"#关键字 
skind = 1         #1：博客  2：下载  3：论坛  4：学院

print("最大页数为：",maxpage(key, skind))
maxP = eval(input('最后的页面：'))#搜索最大页数

numlist = []
weblist = []
i = 1

while i <= maxP:
    html = search_CSDN_html(key, skind, i)
    try:
        soup = BeautifulSoup(getHTMLText(html)[1],"html.parser")
        for j in soup.select('.search-link a'):
            weblist.append(j['href'])
        numlist = NUmlist(numlist, soup, skind)
        print(round(i / maxP * 100, 2),'%')
        i += 1
    except:
        continue
for i in range(len(numlist)):
    max = 0
    tag = i
    for j in range(i,len(numlist)):
        if max < numlist[j]:
            max = numlist[j]
            tag = j
    numlist[i],numlist[tag] = numlist[tag],numlist[i]
    weblist[i],weblist[tag] = weblist[tag],weblist[i]

print(weblist[:10])
###浏览人数，或者下载次数最多的##

猜你喜欢

转载自blog.csdn.net/qq_28969139/article/details/80952761

按浏览量或者下载量大小获取CSDN搜索的文章

Python爬虫增加CSDN浏览量

C#爬虫使用代理刷csdn文章浏览量

Python爬取csdn个人主页文章浏览量并生成图像

【CSDN】删除文章后,浏览量会减少吗？了解软删除和硬删除

使用Jsoup刷CSDN刷博客浏览量

网络爬虫——刷CSDN浏览量（含源代码）

python 多线程代理刷csdn浏览量

Python：使用代码来增加CSDN博客的浏览量

PHP获取当前用户浏览量和总浏览量

Django搭建个人博客：统计文章浏览量

浏览量统计

浏览量接口

wordpress列表页调用浏览器，wordpress显示文章浏览量！

Python爬虫实战--CSDN博客爬虫（附赠浏览量小工具）

如何更高效的提高CSDN浏览量 - 提升博客的曝光度

phpcms 某个模型下全部文章列表包括评论数和浏览量

Django搭建个人博客：根据浏览量对最热文章排序

从SpringBoot构建十万博文聊聊高并发文章浏览量设计

Django做一个简单的博客系统(9)----统计文章浏览量

springboot+EHcache 实现文章浏览量的缓存和超时更新

thinkphp实现统计页面浏览量

织梦模板路径与浏览量

blog浏览量突破20万

前端写浏览量通过localstorage

博客浏览量迎来新的突破

Python 自动刷博客浏览量

网页浏览量统计（队列实现）

iOS 怎么查app的下载量

ThinkPHP3.2 实现浏览量和点赞量，每次访问页面浏览量+1以及每个登录用户只能对同一篇文章点赞一次

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)