用java实现一个简单的网络爬虫 - 代码天地

用java实现一个简单的网络爬虫

其他 2018-07-19 03:12:11 阅读次数: 0

import java.io.BufferedReader;

import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.PrintWriter;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class WebSpider {
public static void main(String[] args) {
URL url = null;
URLConnection urlconn = null;
BufferedReader br = null;
PrintWriter pw = null;
String regex = "http://[\\w+\\.?/?]+\\.[A-Za-z]+";
Pattern p = Pattern.compile(regex);
try {
url = new URL("http://www.baidu.com/");
urlconn = url.openConnection();
pw = new PrintWriter(new FileWriter("f:/url(baidu).txt"), true);//这里我把爬到的链接存储在了F盘底下的一个叫做url（baidu）的doc文件中
br = new BufferedReader(new InputStreamReader(
urlconn.getInputStream()));
String buf = null;
while ((buf = br.readLine()) != null) {
Matcher buf_m = p.matcher(buf);
while (buf_m.find()) {
pw.println(buf_m.group());
}
}
System.out.println("获取成功！");
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
br.close();
} catch (IOException e) {
e.printStackTrace();
}
pw.close();
}
}
}

猜你喜欢

转载自blog.csdn.net/weixin_41722928/article/details/81030017

用java实现一个简单的网络爬虫

Java实现一个简单的爬虫

Java网络爬虫 - 一个简单的爬虫例子

用webmagic写一个简单的网络爬虫

用mpvue与node实现一个简单的爬虫

用python实现的一个简单的爬虫

用JAVA写一个超级简单的爬虫例子

用webmagic实现一个java爬虫小项目

用Java写一个爬虫

用java实现一个简单的学生管理系统

用Java实现一个简单的DBMS(总结)

用Java实现一个简单的考试系统

用Java实现一个最简单的番茄钟

简单实现一个爬虫

入门级用Python写一个简单的网络爬虫下载和获取数据

用python写一个最简单的网络爬虫，豆瓣250

Java实现一个简单的网络聊天程序

用php实现一个简单的爬虫，抓取电影网站的视频下载地址

用Nodejs实现一个简单的爬虫功能。（ES6标准）

爬虫简介及实现一个简单的爬虫Demo

用go来写一个简单的爬虫

java利用正则表达式写一个简单的网络爬虫

使用beautifulsoup做一个简单的网络爬虫

Python——网络爬虫，一个简单的通用代码框架

爬虫用java实现一个简易爬取网页超链接的程序

用纯numpy实现一个简单的神经网络（理解）

爬虫实战：一个简易 Java 爬虫程序的实现

使用java实现一个简单的抓取安居客租房信息的爬虫

关于使用JAVA来实现爬虫的一个简单的DEMO（2）

使用Jsoup和Java实现一个简单的爬虫案例

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)