URL的常用方法和获取网页数据实例 - 代码天地

URL的常用方法和获取网页数据实例

编程语言 2018-05-11 14:55:05 阅读次数: 1

=======================================URL常用方法
//创建一个URL实例
URL imooc = new URL("http://www.imooc.com");
//?后面表示参数，#后面表示锚点
URL url = new URL(imooc, "/search/course?words=java");

System.out.println("协议："+url.getProtocol());
System.out.println("主机："+url.getHost());
System.out.println("端口："+url.getPort());//没有指定端口号，默认使用80端口号，但是该方法返回-1
System.out.println("文件路径："+url.getPath());
System.out.println("文件名："+url.getFile());
System.out.println("相对路径："+url.getRef());
System.out.println("查询字符串："+url.getQuery());

=======================================获取网页数据实例
package com.kai;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;

/**
* 使用URL读取网页内容
* */
public class ReadHtmlByURL {
private static String getHtmlByURl(String urlTemp){
try {
URL url = new URL(urlTemp);
//通过url.openStream()获取URL对象的资源字节输入流
InputStream is = url.openStream();
//将字节输入流转换为字符输入流
InputStreamReader isr = new InputStreamReader(is,"utf-8");
//为字符输入流添加缓冲
StringBuffer sb = new StringBuffer();
BufferedReader bfRead = new BufferedReader(isr);
//读取数据
String data = bfRead.readLine();
while(data!=null){
sb.append(data);
//输出数据，继续读取下一行数据
System.out.println(data);
data = bfRead.readLine();
}

//关闭资源
bfRead.close();
isr.close();
is.close();
return sb.toString();
} catch (MalformedURLException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return null;
}

public static void main(String[] args) {
String html=getHtmlByURl("http://www.imooc.com/search/course?words=java");
System.out.println(html);
}
}

猜你喜欢

转载自st4024589553.iteye.com/blog/2368388

URL的常用方法和获取网页数据实例

无搜索条件根据url获取网页数据(java爬取网页数据)

网页数据实时更新的三种简单方法

正则获取网页数据再筛选出想得到的url

java网页数据抓取实例

python爬取网页的方法总结,python爬虫获取网页数据

爬虫---获取网页数据的几种方式

xpath获取网页数据(一)

xpath获取网页数据(二)

网页数据获取小技巧(小白)

有搜索条件根据url抓取网页数据(java爬取网页数据)

C#请求网页数据的方法

python爬取网页数据方法

抓取网页数据的几种方法

php抓取网页内容，获取网页数据

html网页获取php网页数据等知识记录

Google Analytics API 获取数据实例

C# 获取网页数据，WebClient、HttpClient、HttpWebRequest和HttpWebResponse的异步多线程支持详解

C#获取网页数据， WebClient、HttpClient、和HttpWebRequest与HttpWebResponse介绍

使用Python将网页数据保存到NoSQL数据库的方法和示例

Python数据分析基础：网页数据获取

aardio动态获取网页数据，匹配数据

JSON方法读取数据实例

抓取网页数据

网页数据抓取

提取网页数据

清洗网页数据

爬网页数据

JAVA 爬虫获取js动态生成的网页数据

python selenium 获取动态网页数据

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)