Android Jsoup 网络爬虫抓取网页数据---新手学习详细教程！

Jsoup这个问题说实话困扰了我很久，其实我们先用Java把它写出来，会更加的容易理解。

jsoup官方文档： http://www.open-open.com/jsoup/
jsoup库下载地址：https://jsoup.org/download

大家先导入jsoup库

我先用eclipse给大家先用java写一篇，之后我会教大家如何抓取网络数据后放入Listview中。

我们的目标站点：http://www.68zyw.cn
这里写图片描述
我们要获取红色框中的内容

第一步：这个是jsoup获取网站源码的一个方法

   try
        {   
            Document doc = Jsoup.connect("http://www.68zyw.cn").get();
                  System.out.println(doc);

        }
        catch (IOException e)
        {
    }

我们可以先把它打印出来看结果。
这里写图片描述

很明显，这就是http://www.68zyw.cn的网站html的源码

我们接着写

第二步：
这里写图片描述

我们发现这个标签中

有我们想要的内容
所以我们可以这样写

        try
        {   
            Document doc = Jsoup.connect("http://www.68zyw.cn").get();
            Elements elements=doc.select("header.entry-header");
            System.out.println(elements);

        }
        catch (IOException e)
        {}

我们把elements打印出来
这里写图片描述

果然这就是这个标签中的内容

我们继续写：

  try
        {   
            Document doc = Jsoup.connect("http://www.68zyw.cn").get();
            Elements elements=doc.select("header.entry-header");
            System.out.println(elements);    
            for(int i=0;i<elements.size();i++) {
                String url=doc.select("header.entry-header").select("h2.entry-title").select("a").get(i).attr("href");
            System.out.println(url);
            }

        }
        catch (IOException e)
        {}

我们一步一步往里面爬，get(i) 相当于就是获取到每一个标签内的内容，因为此时这些重复标签变成了一个数组类型，我们要一个一个取出来
结果图：这里写图片描述

好了，其他内容也都是一样的！！！

第一次写文章，希望大家支持！

下一次会出一个把这些数据放入Listview中！其实大家也可以自己去试一试！！！

不懂的可以留言。。。

Android Jsoup 网络爬虫抓取网页数据---新手学习详细教程！

猜你喜欢