Construya rápidamente una base de datos de información del sitio web (pequeño Zoomeye)

  Prefacio: No quería volver a hacer ruedas. La información en línea incluye fofa de código abierto y algunos diseños. Algunas erecciones son demasiado complicadas para usar cosas útiles, todo el hilo. No hay un código completo.

Esquema de diseño:
    plataforma de prueba:
    entorno de prueba de Windows : php + mysql cualquier backend de lenguaje de programación (implementar entrada de datos)

sección de la tabla mysql: tiempo de cuerpo del título del encabezado ip del host
Como otros han dicho, se detectó uno normal.
Imágenes

Agarra la cadena de amigos: regular [a-zA-Z0-9] [-a-zA-Z0-9] {0,62} (\. [A-zA-Z0-9] [-a-zA-Z0- 9] {0,62}) + \.?
Juzgar si es un nombre de dominio Todos los nombres de dominio están bien después de juzgar si es ip
 | ac | ad | ae | af | ag | ai | al | am | an | ao | aq | ar | as | at | au | aw | az | ba | bb | bd | be | bf | bg | bh | bi | bj | bm | bn | bo | br | bs | bt | bv | bw | by | bz | ca | cc | cf | cg | ch | ci | ck | cl | cm | cn | co | cq | ​​cr | cu | cv | cx | cy | cz | de | dj | dk | dm | do | dz | ec | ee | eg | eh | es | et | ev | fi | fj | fk | fm | fo | fr | ga | gb | gd | ge | gf | gh | gi | gl | gm | gn | gp | gr | gt | gu | gw | gy | hk | hm | hn | hr | ht | hu | id | ie | il | in | io | iq | ir | is | it | jm | jo | jp | ke | kg | kh | ki | km | kn | kp | kr | kw | ky | kz | la | lb | lc | li | lk | ​​lr | ls | lt | lu | lv | ly | ma | mc | md | me | mg | mh | ml | mm | mn | mo | mp | mq | mr | ms | mt | mv | mw | mx | my | mz | na | nc | ne | nf | ng | ni | nl | no | np | nr | nt | nu | nz | om | pa | pe | pf | pg | ph | pk | pl | pm | pn | pr | pt | pw | py | qa | re | ro | ru | rw | sa | sb | sc | sd | se | sg | sh | si | sj | sk | sl | sm | sn | so | sr | st | su | sy | sz | tc | td | tf | tg | th | tj | tk | tm | tn | to | tp | tr | tt | tv | tw | tz | ua | ug | uk | us | uy | va | vc | ve | vg | vn | vu | wf | ws | ye | yu | za | zm | zr | zw | com | net | org | int | edu | gov | mil | arpa | Asia | biz | info | nombre | pro | coop | aero | museo | cc | tv

数据 录入 : 很 简单 , 就不 详细 说 了。

Otros detalles: en el proceso de entrada de datos, una gran cantidad de nombres de dominio de spam,
métodos de juicio de nombre de dominio de resolución de segundo nivel y tercer nivel se dividen "." Uno por uno desde el final para verificar si es un nombre de dominio, determinar cuál es el nombre de dominio restante, fácil de eliminar Off Por supuesto, este método puede hacer que no se ingresen algunos nombres de dominio.
Cómo obtenerlo depende de tus pensamientos.

 Después del php, puedes realizar una consulta en línea. Recomienda al gran dios que Baidu conoce. Se resolverá en unos minutos.

Espacio ocupado: 26,000 piezas de información del sitio web, todas las cuales son 967.50 MB. En teoría, un disco duro de 500 gb puede almacenar información del sitio web de 1300W
solo como referencia, porque el tamaño de las páginas web es diferente. 
Use massscan para uso civil ordinario. También puede escanear más de 300 millones de ips en 24 horas

 

Supongo que te gusta

Origin www.cnblogs.com/robot15/p/12749584.html
Recomendado
Clasificación