Filtrar datos de rastreo de motores de búsqueda

Algunas regulaciones

  • El motor de búsqueda no distingue entre mayúsculas y minúsculas;
  • Google limita la búsqueda a un máximo de 32 palabras, incluidos los términos de búsqueda y los operadores avanzados. Sin embargo, hay otras formas de eludir esta limitación, como el uso de comodines para reemplazar ciertos términos de búsqueda.
  • La misma gramática de búsqueda, Baidu a veces recibe sorpresas.

Consulta básica

  • inurl
    busca URL que contengan caracteres específicos. Por ejemplo, ingrese inurl:/admin_login, puede encontrar la URL con caracteres admin_login, por lo general, este tipo de URL es la URL de inicio de sesión del fondo del administrador.

  • intext
    busca caracteres específicos en el contenido del cuerpo de una página web, como la entrada intext:后台登陆.
    Esta gramática es similar a la función de "búsqueda de contenido del artículo" que usualmente usamos en algunos sitios web, usando un carácter en el contenido del cuerpo de la página web como condición de búsqueda

  • intitle
    busca páginas web que contengan caracteres específicos en el título de la página web. Por ejemplo, ingrese intitle:后台登陆, para que se busque la página web con interconexión Shangke en el título de la página web. Similar al intext anterior, busque el título de la página web para el personaje que estamos buscando, por ejemplo, busque: intitle: security angel, devolverá todas las páginas web con "security angel" en el título de la página web. Del mismo modo, allintitle es similar a intitle.
    allintext:家庭住址

  • filetype
    busca archivos del tipo especificado. Por ejemplo filetype:PDF, entrada , devolverá un documento PDF. Me gustaría recomendar esto, ya sea un ataque desechado o una búsqueda de un tipo específico de archivo del que hablaremos más adelante.
    doc .bak .db .mdb .inc

  • El sitio
    especifica la búsqueda del nombre de dominio. Este filtrado es más preciso y se utilizará como requisito previo para consultas compuestas más adelante. Por ejemplo entrada site:www.sunghost.cn. Se mostrarán todas las URL relacionadas con este sitio web.


  • Ya no se puede acceder a algunas páginas del caché , o si desea ver una instantánea del historial de su página, puede usar cashe,cache:www.juwan888.com

  • define
    Busca la definición de una palabra. Buscar : define:微积分, devolverá algunas definiciones sobre cálculo.

  • información para
    encontrar información básica sobre el sitio especificado. info:www.douban.com, Para devolver algunas introducciones, desarrollos y anuncios sobre Douban.


  • Por ejemplo, buscar enlace : link:www.cnblogs.com/mysticbinarydevuelve la URL de todas las páginas que contienen el enlace www.cnblogs.com/mysticbinary.



Uso de símbolos

Google no distingue entre mayúsculas y minúsculas, excepto cuando se usa o como operador booleano, por lo que debe escribirse como OR. El uso de símbolos es similar a la correspondencia regular, y muchas reglas se pueden usar en común.

  • "Búsqueda específica"
    con "" comillas en inglés, especifique que los resultados de la búsqueda deben ser los mismos.

  • El comodín *
    debe usarse en "","kali * web渗透测试"

  • Punto. Lo mismo que el
    asterisco comodín *también debe usarse en "", la diferencia es que el punto .coincide con caracteres, no con palabras, frases y otro contenido, sino con símbolos. Hay símbolo reservado ,, ., [, (, -y así sucesivamente.


Lógica booleana

  • El AND lógico es un espacio, AND

  • O (java | php)

  • No Java
    no contiene

  • Restricción +
    "mysticbinar" + "cosa imposible de enviar"

  • La agrupación de paréntesis ()
    es lo mismo que regular

  • Marco de tiempo 2020..2020
    "美团*术" 2020..2020



Consulta compuesta

Lo siguiente es filtrar los datos deseados desde una perspectiva de seguridad. Creo que usar la búsqueda gramatical de Google también es un tipo de análisis de datos, pero el tráfico de análisis proviene del motor de búsqueda. 1. Primero debe saber qué desea buscar Las características pueden ser analizadas. 2. El motor de búsqueda debe recopilar (rastrear) datos para filtrarlos. Algunos sitios pequeños no han incluido algunas URL. Es inútil permitir que su sintaxis de filtrado sea precisa.

Recolección de información del sitio

  • Consulta de subdominio
# 使用site限定范围并使用*来进行泛查询,最后用-排除掉主域名,得到的就是子域名:
site:*.jd.com -www.jd.com
  • Consulta de la sección C
# 如果你知道这个网站的IP,你也可以使用site结合通配符来查询在C段上存在的网站
site:18.18.18.*

Función de filtro

  • Búsqueda de interfaz de inicio de sesión
allback=|api=|interface=|function=|functions=|count=
passlogin|ftppwd|password|secret|credentials|token
conf|config|security|jdbc|auth|system|db|ini|init
security_credentials|connetionstring
ssh2_auth_password|send_keys
doc|docx|xls|xlsx|pdf
oa|rem|ehr|cms|main|wp|test|ceshiboos|bossbook
word|master|count|log|login|reg|register|phpMyAdmin

site:jd.com intext:管理|后台|登陆|用户名|密码|帐号|注册|admin|login|manage
site:jd.com intext:管理|后台|登录|用户名|密码|验证码|系统|账号|服务端|后端|phpMyAdmin
site:jd.com intitle:管理|后台|登录|用户名|密码|验证码|系统|账号|服务端|后端|phpMyAdmin
site:jd.com intext:(password|passcode|pass|密码) intext:(username|userid|user|用户|账户)
site:jd.com intext:oa|rem|ehr|system|test|guanli|denglu|manager|register|houtai|guanli|forgotten
site:ly.com intext:rem|ehr|guanli|denglu
site:jd.com intext:"Powered by"
  • Buscar funciones específicas
site:jd.com inurl:ewebeditor|editor|uploadfile|eweb|edit|php?id=|asp?id=
site:jd.com inurl:upload|upfile|saveup intext:提交|确定|上传
site:jd.com inurl:"path="|"readfile="|"file="|"url="
site:jd.com intext:提交|确定|评论
site:jd.com intext:个人信息管理|会员|个人空间 OR inurl:member|zone

site:jd.com inurl:"/uddiexplorer/SetupUDDIExplorer.jsp"
site:jd.com inurl:admin|login|manage|manager|register|prelogin|logincheck
site:jd.com inurl:admin|administration|administrator|manage|login|sys|managetem|password|username
site:jd.com inurl:login|admin|manage|admin_login|login_admin|system|boos|master|main|cms|wp
site:jd.com inurl:oa|rem|ehr|system|test|guanli|denglu
site:jd.com inurl:*"gk"*|*"publick"*|*"pub"*

site:jd.com intext:"sql syntax near"|"syntax error has occurred"| "incorrect syntax near"|"unexpected end of SQL command"|"mysql_connect()"|"mysql_query()"|"Warning: pg_connect()"
site:jd.com intext:"/var/lib/"|"/var/www/"|"D:\"|"C:\"
# 查看是否还遗留木马页面
site:example.com intext:剑眉大侠|不灭之魂|仗剑孤行|通杀版|法客论坛|上传的口令|"导出DLL文件出错”|"token虚拟机管理"|老子的绝对路径|免杀版
site:example.com intext:法克|后门|木马|小马|大马|脱库|黑客|一句话后门|挂马|清马|"扫描IP”|开放端口|提权|执行命令|设置密码|提升权限
site:example.com intext:一句话木马|过狗|安全狗|"K8飞刀"|"K8拉登哥哥"|"K8搞基大队"|反弹端口|"hacked by"
site:example.com inurl:phpspy|udf|JFolder|JspSpyJDK5|AspxSpy2014Final
site:example.com intext:"Georg says" intext:"All seems fine"
site:example.com intext:"Struts2 Exploit Test"
# 一些容器特征
site:example.com intext:"Dumping data for table"
site:example.com intitle:"apache tomcat/" "Apache Tomcat examples"
site:example.com inurl:examples|jsp|snp|snoop.jsp
site:example.com (inurl:"robot.txt” | inurl:"robots.txt") intext:disallow filetype:txt
site:example.com filetype: reg HKEY_CURRENT_USER username
site:example.com inurl:tmp|temp|cache…

Filtrar archivos confidenciales

  • Correo electrónico / QQ / Grupo
site:example.com intext:qq|qq群|企鹅|腾讯|email|邮件
site:example.com intitle:qq|qq群|企鹅|腾讯|email|邮件
site:example.com intext:邮箱|邮件|email|e-mail
site:example.com intext:"@qq.com"|"@163.com"
site:example.com intext:电话|手机号|联系方式|请拨打

  • índice de/*
site:jd.com index of/*
site:xxx.xxx intitle:index of
Index of /password
Index of / passwd 
"index?of/" config
"Index of /" password.txt
site:example.com intitle:index .of "parent directory"
site:example.com intitle:index .of name size
site:example.com intitle:index .of inurl:admin
site:example.com intitle:index .of "Application Data/Microsoft/Credentials"
site:example.com intitle:index .of etc|.sh_history|.bash_history|passwd|people.lst|htpasswd
  • phpmyadmin
site:ulnetworks.co.kr ?inurl:.php ?intext:CHARACTER_SETS,COLLATIONS, ?intitle:phpmyadmin
  • Búsqueda de archivos
这个语法不能使用 |,为什么不用布尔逻辑汇总在一条查询里呢?
因为在实际测试中,发现 filetype 和 ext 运算符与布尔逻辑的合作性并不是很好,
经常有查不到任何数据的情况出现,因此宁愿多进行几次查询,来增加我们查询的命中率。

site:jd.com filetype:doc
mdb
ini
php
asp
aspx
jsp
json
xml
pdf
doc
xlsx
xls
csv
git
txt
text
log
sql
cnf
conf
zip
rar
tar
tar.gz
7z
cab
gz
iso
bz2
jar
bkf
bkp
bak
old
backup
dll
ctl
inf
cfg

sql
db
dbf
mdb
wdb
backupdb


site:example.com filetype:doc "密码"
site:example.com filetype:xls|xlxs "密码"
site:example.com filetype:doc intitle:"管理"


Referencia

http://absec.cn/?p=751
https://www.cnblogs.com/xuanhun/p/3910134.html

Supongo que te gusta

Origin www.cnblogs.com/mysticbinary/p/12703036.html
Recomendado
Clasificación