常见的判断网站cms方法

其他 2018-10-15 17:26:18 阅读次数: 0

1.robots.txt文件

robots.txt文件我们写过爬虫的就知道，这个文件是告诉我们哪些目录是禁止爬取的。但是大部分的时候我们都能通过robots.txt文件来判断出cms的类型

如：

从wp路径可以看出这个是WordPress的cms

这个就比较明显了直接告诉我们是PageAdmin cms

也有些robots.txt里面写得不是很清楚。我们看看织梦的

从robots.txt不能直接看出来是什么cms，我们就直接把他复制到百度去查询

这样就找到了是织梦的cms

2.通过版权信息进行查询

一般直接拉到底部查看版权信息，有些站点会显示出来，比如织梦这个

3.通过查看网页源码的方式

有些站点没有robot.txt，也把版本信息改了，这时候首页查看网页源码可能找得到

4.通过比较网站md5值

有些cms的扫描器就是用这个原理的，先收集某个cms的某个路径的文件的md5值，要求这个文件一般不会被使用者修改的。然后访问这个网站同样的路径下是否存在这个文件，存在的话比较md5值。相同能报出cms类型。这个比较考验字典的能力。

猜你喜欢

转载自blog.csdn.net/QingHeShiJiYuan/article/details/79668345

常见的判断网站cms方法

判断网站CMS

提高网站性能的常见方法

网站的常见反爬方法总结

网站攻击常见方法及处理

常见的影视cms及安装环境说明

常见设备/CMS弱口口令

常见网站

两种常见判断变量的方法

字符串判空的常见的判断方法！

常见的判断数据类型的几种方法 -- jsvascript

Javascript 常见的数据类型判断方法

常见的网站攻击手段和防御方法

判断网站大小的方法

freemarker的常见判断与用法

常见HASH加密、判断

网站美化常见CSS

常见漏洞发布网站

常见的网站搭建环境

JVM调优——之CMS 常见参数解析

易优cms常见问题视频教程

帝国cms常见问题汇总整理

帝国cms常见问题整理汇总

苹果cms解析播放的常见问题

CMS 常见问题分析和解决方案

为何大量网站不能抓取?爬虫突破封禁的6种常见方法为何大量网站不能抓取?爬虫突破封禁的6种常见方法

常见线程方法

常见方法

常见魔术方法

常见的HTML方法

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)