首先要讲一下网络。我们做java,大部分都是做所谓的b/s软件(浏览器/服务器),对于我们来
说,网络的定义应该是这样的:老子开发了一个网站(web),人家通过一个地址进来我的网站,然
后再通过各种地址来访问我的各种应用。
然后我们必须要讲一下什么是tcp/ip协议,其实他主要讲的是包括tcp/ip协议在内的100多个协
议族(http,ftp等),但是最重要的,就是tcp/ip协议。
其实关于这些破协议,我也是很讨厌的,因为也没有代码可以来表示,纯靠死记硬背(如果背不
出来,面试肯定挂)。不过,我在网上找了一个破图,大家稍微看一下,左边这个7层的结构也是
非常恶心的玩意(也要背出来)。
我们先稍微看一下,先从简单的来,tcp/ip体系中分了4层,从上到下分别是:应用层,运输层,
网际(网络)层ip,网络接口层。而对应这个osi体系层次,应用层细分为:应用层,表示层,会话
层。网络接口层分成了数据链路层和物理层。
我们用最简单粗暴的方式来背这7层:吾叔王运会表演!!
好了,给大家1分钟的时间把这个句子记下来:吾叔王运会表演··吾叔王运会表演··吾叔王运
会表演··吾叔王运会表演··
背完了这个恶心的概念,我们接着来看看我们对应这些层级,java有哪些知识点是要学习的:
应用层:URL类,向网络发出或者读取网络的数据。
运输层:Sockect类,ServerSocket类这些是TCP协议的,Datagram(UDP协议)
网络层:InetAddress类
网络接口层:没有(吧?).
既然是如此,我们直接来学习这个Url类吧!!
public static void main(String[] args) { try { URL testUrl=new URL("http://linbulu.iteye.com/"); InputStreamReader reader=new InputStreamReader(testUrl.openStream(),"UTF-8"); BufferedReader bReader=new BufferedReader(reader); String str; while((str=bReader.readLine())!=null){ System.out.println(str); } bReader.close(); reader.close(); } catch (MalformedURLException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } }
大家跑起来看看,我草,有没有被吓一跳,他说你做的是网络爬虫!!!,下面的内容,是我们控制台得到的东西,是不是很神奇??
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="zh-CN" dir="ltr"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <meta name="keyword" content="ITeye,JavaEye,IT,开发,交流,社区,java, ruby, ajax, agile" /> <title>您的访问请求被拒绝 - ITeye技术社区</title> <style type="text/css"> .clearfix:after { content: "."; display: block; height: 0; clear: both; visibility: hidden; } .clearfix { display:block; } .left { float: left; } h1 {font-size: 20px;color: #6293BB;} p {font-size: 14px;color: #6293BB;} </style> </head> <body> <div style="padding:50px 0 0 300px"> <h1>您的访问请求被拒绝</h1> </div> <div class="clearfix"> <div class="left" style="padding-left:120px"> <img src="/images/filenotfound.jpg" width="128" height="128" /> </div> <div class="left" style="width:700px;padding:30px 0 0 30px"> <p>您可能使用了网络爬虫抓取ITeye网站页面!</p> <p>ITeye网站不允许您使用网络爬虫对ITeye进行恶意的网页抓取,请您立刻停止该抓取行为!</p> <p>如果您的网络爬虫不属于恶意抓取行为,希望ITeye网站允许你进行网页抓取,请和ITeye管理员联系,取得授权: webmaster<img src='/images/email.gif' alt="Email" />iteye.com</p> <p>如果您确实使用浏览器访问,但是被错误的识别为网络爬虫,请将您浏览器发送的“User Agent”信息告知我们,帮助我们解决错误: webmaster<img src='/images/email.gif' alt="Email" />iteye.com</p> </div> </div> <div style="padding:20px 0 0 500px"> <a href="http://www.iteye.com"><img src='/images/logo_small.gif' border='0'></a> </div> </body> </html>
好了,睡觉去了····