利用搜索引擎进行资源搜集第三课时

本篇文章是前面两篇文章的总结应用,所以没搭好搜索环境的朋友请先看第一篇文章。本篇文章的搜索结果是基于谷歌浏览器的。浏览器中能搜索出来的资源都是合法资源,大家可以放心食用。
1、 学会分析一些网站的链接,然后利用site+inutl组合进行搜索
以石墨文档为例
在这里插入图片描述
石墨的链接可以分成两部分,用蓝色框代表的是域名部分,而docs是链接中的关键词。多分析几个石墨就会发现,所有的石墨链接几乎都遵从这个模板。利用搜索语法,我们可以写出这样的搜索语句:
site:shimo.im inurl:docs
来看看搜索的结果
在这里插入图片描述
请注意,相同的搜索,百度可能存在有结果也可能存在没结果的情况的哈,例如
在这里插入图片描述
不过,仅仅搜索出来一堆石墨分享的链接是不够的,往往我们需要根据内容进行搜索。

再以微信的文章为例,
在这里插入图片描述
微信文章的链接一般长这个样子,于是,我们又可以提炼出域名和url关键词了。写出
site:weixin.qq.com inurl:s 这样的搜索语句应该并不困难。我们来加个关键词儿搜索一下(注意,有的加了关键词之后反而搜索不出来,可能跟个别网站自身对搜索引擎的屏蔽性有关)
在这里插入图片描述
我们需要掌握对一个资源链接进行拆分的方法,然后利用site+inurl关键词组合进行搜索,这样可以搜索到大量新的东西。想想看,你都有那些渠道能够真正了解新的东西,这种方式是一个不错的选择。

2、 学会利用谷歌搜索引擎替代站内搜索
之前,朋友碰到一个网站,站内搜索一搜索就会出错,错误如下
在这里插入图片描述
就是说有非法字符,然而我仅仅搜索了 123 这个词儿
在这里插入图片描述
最后我给他的建议是,可以使用 site:52pg.net 关键词
的方法进行搜索,例如:
在这里插入图片描述
这里的搜索结果和站内搜索的结果差距不大,利用谷歌搜索引擎代替各个网站的站内搜索,在站内搜索出问题的情况下,是一个不错的选择。

3、 对一类域名进行搜索
我们知道,域名的最后一位,往往可以代表一些组织的性质,例如,org,edu.cn 等。我们搜集一些资源的时候,如果不知道具体自己找的资源在哪个网站上,但是能确定在哪一类域名的服务器上,就可以使用最后一位域名固定的方式进行搜索,例如
在这里插入图片描述
这里值得一提的是,学校是学生信息泄露的一个重灾区。这里,我对 edu.cn 这一类域名进行了搜索。

猜你喜欢

转载自blog.csdn.net/xielinrui123/article/details/89133365