selectores CSS
1, la inicialización
html = ''' <div> <ul> <li class = "item-0"> primer elemento </ li> <li class = "item-1"> <a href="link2.html"> segundo elemento < / a> </ li> <li class = "item-0 activa"> <a href="link3.html"> <span class = "bold"> tercera elemento </ span> </a> </ li> <li class = "item-1 activa"> <a href="link4.html"> cuarto elemento </a> </ li> <li class = "item-0 "> <a href =" link5.html" > quinto punto </a> </ li> </ ul> </ div> ''' Importación pyquery pyquery AS PQ de ## cadena de inicialización DOC = PQ (HTML) Imprimir (DOC ( 'Li')) ## inicializa la URL DOC = PQ (URL = 'https: //cuiqingcai.com') Imprimir (DOC ( 'título')) ## fichero de inicio doc = pq (archivo = 'test.html ') imprimir (doc ( 'li'))
2, selectores CSS
# selectores CSS de PQ pyquery importación pyquery AS DOC = PQ (HTML) ## con N ° de ID, su uso en clase. Imprimir (DOC ( '# Container .list Li'))
3, encontrar el nodo
html = ''' <div id = "contenedor"> <ul class = "lista"> <li class = "item-0"> primer elemento </ li> <li class = "item-1"> <a href = "link2.html"> segundo elemento </a> </ li> <li class = "item-0 activa"> <a href="link3.html"> <span class = "bold"> tercera elemento </ span> </a> </ li> <li class = "item-1 activa"> <a href="link4.html"> cuarto elemento </a> </ li> <li class = "item-0" > <a href="link5.html"> quinto punto </a> </ li> </ ul> </ div> ''' Encontrar el nodo ## de PQ pyquery importación pyquery AS DOC = PQ (HTML) artículos DOC = ( 'Lista') de impresión (material) ## Buscar () para encontrar todos los nodos descendientes LIS items.find = ( 'A') Imprimir (LIS) ## Niños () para encontrar sólo los nodos secundarios items.children = LIS ( 'Activo') Imprimir (LIS) ## parent () para encontrar el nodo padre de contenedores items.parent = () Imprimir (contenedor) ## padres () Encuentra antepasado nodo ancestro = items.parents () Imprimir (antepasado) ## hermanos () Encuentra hermanos Li = DOC ( '-0.active artículo ') de impresión (li.siblings ('. activo'))
4, Traverse
Importación pyquery pyquery AS PQ de DOC = PQ (HTML) ## artículos de llamada () para obtener un generador, en el desplazamiento LIS = DOC ( 'Li') elementos (). De Li en LIS: Imprimir (Li)
5, el acceso al contenido
Importación pyquery pyquery AS PQ de
DOC = PQ (HTML)
a = DOC ( 'de artículo 0-a')
de impresión (a)
## adquiere valor de atributo href de un nodo
## attr () devuelve sólo el resultado de la primera
impresión (a.attr ( 'href'))
Imprimir (a.attr.href)
## adquiridos por la que atraviesa todos los valores de atributos
para a.items en el punto ():
Imprimir (item.attr ( 'href'))
## adquiere sólo el texto de la pluralidad de nodos están separados por espacios de texto de impresión (a.text ()) ## Quinta Tercer punto del artículo ## adquiere toda la materia que comprende un nodo interno, el nodo comprende, un retorno al primer nodo un interna HTML de texto de impresión (a.html ()) # < span class = "bold"> tercer elemento </ span>
6, la operación nodo
el funcionamiento del nodo ## ## Eliminar () HTML = '' ' <div class = "wrap"> Mundo Hola <P> charlatán </ P> </ div> ' '' ## obtenido simplemente Mundial de la Hola de importación pyquery AS PQ pyquery DOC = PQ (HTML) envoltura de DOC = ( 'envolver') ## p eliminado nodo wrap.find ( 'p'). remove () Imprimir (wrap.text ())
7, el selector de pseudo-clase
html = ''' <div id = "contenedor"> <ul class = "lista"> <li class = "item-0"> primer elemento </ li> <li class = "item-1"> <a href = "link2.html"> segundo elemento </a> </ li> <li class = "item-0 activa"> <a href="link3.html"> <span class = "bold"> tercera elemento </ span> </a> </ li> <li class = "item-1 activa"> <a href="link4.html"> cuarto elemento </a> </ li> <li class = "item-0" > <a href="link5.html"> quinto punto </a> </ li> </ ul> </ div> ''' Importación pyquery pyquery AS PQ de DOC = PQ (HTML) ## un primer nodo li li = DOC ( 'li: first-child') Imprimir (li) ## último nodo li li = doc ( 'li: última- niño ') Imprimir (li) ## segundos nodos li DOC = li ( 'li: Familias con N-ésimo (2)') de impresión (li) ## comprende un li nodo 'segunda' texto li = DOC ( 'li: la contiene (segunda)') de impresión (li)