前言
继续之前那篇基础HTML标签的博客,简单分享一下高级标签的学习。
标签简述
这里再列出一些做爬虫时,经常遇到的标签。
div
咱们来看图说话
我这就用div将页面分成了四块。实际分析页面的时候,div可能是最常见的一个标签,合理分析div有助于帮我们理解网页的整个布局。
ul
一个ul里可以嵌套多个li,在分析页面的时候,也是很常见的一个标签,具体如下图。
<ul></ul>
定义和用法
<ul>
标签定义无序列表。
注:常用作导航栏。
img
先看图,爬取的时候图片有时候也是我们需要爬取的资源,对img标签熟悉一点也是有必要的。
<img>
定义和用法
img
元素向网页中嵌入一幅图像。 请注意,从技术上讲,<img>
标签并不会在网页中插入图像,而是从网页上链接图像。<img>
标签创建的是被引用图像的占位空间。<img>
标签有两个必需的属性:src 属性 和 alt 属性。
属性1:src 引用地址:网上的url、本地的路径(相对、绝对)
属性2:alt 图片占位符:加载失败的显示内容
属性3:title 图片提示符
a
之后爬虫有些页面的跳转可能就是通过点击a标签来实现,所以遇到的也不少。
定义和用法
<a>
标签定义超链接,用于从一张页面链接到另一张页面。
<a>
元素最重要的属性是 href 属性,它指示链接的目标。
属性1:href
属性2:target
主要功能如下
a.超级链接
b.原始功能回到记录位置 anchor 锚
c.打电话、发邮件
d.协议限定符
点击查看详情
form
这个标签也常用于搜索栏等部分。
<form></form>
定义和用法
<form>
标签用于为用户输入创建 HTML 表单。 表单能够包含 input 元素,比如文本字段、复选框、单选框、提交按钮等等。
表单还可以包含 menus、textarea、fieldset、legend 和 label 元素。 表单用于向服务器传输数据。
组件1:<input>
特别注意数据名与数据值
点击查看详情