简化代码结构,更利于搜索引擎分析抓取有用内容
重要内容优先加载
每个页面只出现一次h1标签,h2标签可以多次:
html语义化
不使用iframe嵌套方式
尽量不使用js的动态内容
图片加alt
主动提交网站信息到搜索引擎
使用网站统计功能优化
使用nofollow属性。
对于指向外部网站的链接要使用rel=”nofollow”属性告诉爬虫不要去爬其他的页面。
简化代码结构,更利于搜索引擎分析抓取有用内容
重要内容优先加载
每个页面只出现一次h1标签,h2标签可以多次:
html语义化
不使用iframe嵌套方式
尽量不使用js的动态内容
图片加alt
主动提交网站信息到搜索引擎
使用网站统计功能优化
使用nofollow属性。
对于指向外部网站的链接要使用rel=”nofollow”属性告诉爬虫不要去爬其他的页面。