[补充] java之正则表达式 网络爬虫

   //爬出指定网站的邮箱地址

public static void WangL() throws Exception

    {
        URL u = new URL("需要爬虫的邮箱地址");
        URLConnection cn  =  u.openConnection();
        BufferedReader buin  =  new BufferedReader(new InputStreamReader(cn.getInputStream()));
        String ss =  null;
        String   regex = "\\w+@\\w+(\\.\\w+)+"; // 定义规则
        
        Pattern  p = Pattern.compile(regex); //  将规则封装成对象;
        
        while((ss = buin.readLine())!=null)
        {
            Matcher  m  =  p.matcher(ss);  //将规则与操作的字符进行关联;
            while(m.find())
            {
                System.out.println(m.group());
            }
        }
        
        
        
    }

}

猜你喜欢

转载自blog.csdn.net/zhanglihaooo/article/details/78987327