java使用代理ip爬取网站内容

其他 2019-01-10 13:49:02 阅读次数: 0

在一些有反爬虫技术的网站中，检测到同一ip在短时间内多次访问的时候，可能就会禁掉这个ip。

上有政策，下有对策，为了应对这种情况，可以使用多个代理ip去爬取这个网站。

java使用代理ip有两种方法：

1.设置System系统属性

// 设置代理IP  
System.getProperties().setProperty("proxySet", "true");       
System.getProperties().setProperty("http.proxyHost", "218.26.204.66");  
System.getProperties().setProperty("http.proxyPort", "8080");  
  
HttpURLConnection connection = (HttpURLConnection)new URL("http://www.baidu.com/").openConnection();  
connection.setConnectTimeout(6000); // 6s  
connection.setReadTimeout(6000);  
connection.setUseCaches(false);  
  
if(connection.getResponseCode == 200)
{  
  System.out.println("使用代理IP连接网络成功");  
}

2.使用java.net.Proxy类

// 使用java.net.Proxy类设置代理IP  
Proxy proxy = new Proxy(Proxy.Type.HTTP, new InetSocketAddress("123.22.43.3", 8080));
        HttpURLConnection connection = null;
        try {
            connection = (HttpURLConnection)new URL("http://www.baidu.com/").openConnection(proxy);
        } catch (IOException e) {
            e.printStackTrace();
        }
        connection.setConnectTimeout(6000); // 6s
        connection.setReadTimeout(6000);
        connection.setUseCaches(false);

        try {
            if(connection.getResponseCode() == 200)
            {
                System.out.println("使用代理IP连接网络成功");
            }
        } catch (IOException e) {
            e.printStackTrace();
        }

猜你喜欢

转载自blog.csdn.net/qq_37856300/article/details/85930459

java使用代理ip爬取网站内容

python爬取网站内容

[译] 如何使用 Python 和 BeautifulSoup 爬取网站内容

爬取某代理网站代理IP

python爬取百度新闻数据,python爬取新闻网站内容

php XPath爬取小说站内容

网页爬虫小记：两种方式的爬取网站内容

爬虫：模拟浏览器对网站内容进行爬取

利用python的requests和BeautifulSoup库爬取小说网站内容

Qt学习笔记——爬虫，利用cookie信息绕过登录爬取http协议网站内容

爬代理IP网站

从网站爬取ip，到测试代理ip，到利用代理ip

Java：爬取代理ip，并使用代理IP刷uv

使用golang+代理IP+goquery开发爬虫（爬取国外电影网站）

requests 使用免费的代理ip爬取网站（要效率的话还是推荐花钱买vip）

使用代理ip进行反反爬虫——爬取句子迷网站，获取小说龙族经典句子

java爬取西刺ip代理练习

python使用代理IP访问网络爬取数据

初次使用Java爬取网站

使用代理服务器爬取网站

全网代理IP，IP信息爬取

JAVA爬取网站查询网络IP所在地

python在ip代理网站爬可用ip

Python爬虫爬取新浪微博内容示例【基于代理IP】

利用代理IP爬取京东网站手机数据

python每日一题：爬取一些代理网站获取动态ip

scrapy爬取可用的代理ip

爬取免费代理IP代码

Python实现爬取可用代理IP

爬取西刺代理的免费IP

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)