extractor expresión regular en la página y se puede utilizar en JSON (JSON extrajo complejos es mejor utilizar JsonPath), después de la finalización de los parámetros de extracción, los parámetros correspondientes al parámetro en la célula en forma de clave-valor para que las peticiones posteriores .
Nota: No se puede llevar una referencia, que está delante de parametrizar la definición
real
Y la adición de un procesador ordinario extractor expresión a petición del nodo hijo, la siguiente fuente
Las expresiones regulares: <a class="postTitle2" href="(.*?)">
Para obtener la URL para todos los ensayos
Obtener el siguiente título, siempre y cuando el cambio de la expresión:<a class="postTitle2" href=".*?">\n*(.*?)\n*</a>
En general, el maestro .*?
puede resolver el 80% del extracto.
Las expresiones regulares breve:
- (): Los paréntesis representan desee extraer a cabo
- .: Coincide con cualquier carácter que no sea de nueva línea
- *: Antes de un personaje coincide con cero o más veces
- ?: Coincide con el carácter anterior cero o una vez
- \ D: partido con un carácter numérico. Equivalente a [0-9]
En la gramática regular, he escrito un artículo que detalla el uso de expresiones regulares.
Como expresiones regulares extractora ha sido descritos los elementos básicos descritos en detalle.