首先,我们还是要指定HTML是什么:
HTML是一种超文本标记语言,是一种创建网页的标记语言,它不是一种编程语言,因此不需要编译,可以直接由浏览器执行。
今天我总结的标签就是HTML语言的基本单元。
然后,我们再看看一个网页的源代码,在网页的空白处点鼠标右键,然后将会出现查看网页源代码,然后点进去,然后就是下面这样
而我之前学了数据库,学了JDBC与数据库的交互,当然也会有数据啊,数据可以使用网络爬虫来爬取,我们也看到了,上面的代码很乱,而我们要用爬虫去爬取到我们想要的数据,就需要知道HTML常用标签的含义,这对我们使用网络爬虫有很大帮助。)
来来来,开始进入我们今天的主题:HEML常用标签:
一:双标签
常见双标签:
<html></html>
<head></head>
<title></title>
<body></body>
<h1></h1>
<p></p>
<div></div>
<span></span>
<a></a>
<ul></ul>
二:单标签(也叫空标签)
常见单标签:
<br />
<!--换行-->
<hr />
<!--水平分隔线-->
<meta />
<img />
下面,就要再仔细的介绍一下这些标签的含义:
1.h系类标签,上面出现过的h1就是一种h系标签,代表的含义是一级标题,然后h2…h6类推
<!DOCTYPE html>
<html>
<head>
<title>题目</title>
<meta charset="utf-8" />
</head>
<body>
<h1>我是一级标题</h1>
<h2>我是二级标题</h2>
<h3>我是三级标题</h3>
<h4>我是四级标题</h4>
<h5>我是五级标题</h5>
<h6>我是六级标题</h6>
</body>
</html>
2 title就是题目,p标签就是文本标签,在中间加上你想在网页上显示的文本。
3.img就是图片标签,a标签是超链接
<a href="https://editor.csdn.net/md?articleId=105568711">CSDN文本编辑器</a>
<p>美女图片:</p>
<img src="http://p1.pstatp.com/origin/1c680002d5c1a6e9c8b9" />
4.div是一个块级元素,对网页分块的
<div style="width:100px;height:100px;background:red">
块级元素
</div>
5.
标签 换行 使用空格
<body>
<p>我爱编程</p>
<p>我爱编程 编程爱我</p>
<br />
<p>上面是换行</p>
</body>
6.hr 该标签在HTML页面上创建一条水平线。
<body>
<hr/>
<hr/>
<hr/>
</body>
7.还有两种容器标签
div 和 span :div用于分块,将网页分成不同的部分。span标签作为文本容器。
知道了HTML标签,下次再用网络爬虫就可以更好的使用了,只需要打开网页源代码,根据标签,快速找到自己想要的数据,找到规律,写一个爬虫代码提取就可以了。
应该还会继续总结网络爬虫,还有数据的一些处理。
加油,不要放弃。
有什么错误,希望大佬指正,非常感谢