浅谈MIME之文件下载
要实现文件下载,我们只需要设置两个特殊的相应头。
它们是什么头?如果文件名带中文,该如何解决?
两个特殊的相应头:
Content-Type: application/octet-stream
它定义了数据的类型,以便数据能被适当的处理。有效的类型有:text,image,audio,video,applications,multipart和message。注意任何一个二进制附件都应该被叫做application/octet- stream。这个头的一些用例为:image/jpg, application/mswork,multipart/mixed,这只是很少的一部分。
分类大全参考网址:https://blog.csdn.net/weixin_43209201/article/details/86532261
Content-Disposition: attachment;filename=test.zip
一个试验性的头,它用于给客户程序/MUA提供提示,来决定是否在行内显示附件或作为单独的附件。当Content-Type 的类型为要下载的类型时 , 这个信息头会告诉浏览器这个文件的名字和类型。
例如:
response.setHeader("Content-Disposition","attachment;filename=test.jpg");
response.setContentType("image/jpeg");
注意:如果文件中filename参数中有中文,则就会出现乱码。
解决办法:
response.setHeader("Content-Disposition", "attachment;filename="+new String(fileName.getBytes("utf-8"),"iso8859-1"));
response.setContentType("application/ynd.ms-excel;charset=UTF-8");
测试并分析文件名乱码问题
response.setHeader()下载中文文件名乱码问题response.setHeader("Content-Disposition", "attachment; filename=" + >java.net.URLEncoder.encode(fileName, "UTF-8"));
下载的程序里有了上面一句,一般在IE6的下载提示框上将正确显示文件的名字,无论是简体中文,还是日文。不过当时确实没有仔细测试文件名为很长的中文文件名的情况。现如今经过仔细测试,发现文字只要超过17个字,就不能下载了。分析如下:
一. 通过原来的方式,也就是先用URLEncoder编码,当中文文字超过17个时,IE6 无法下载文件。这是IE的bug,参见微软的知识库文章 KB816868 。原因可能是IE在处理 Response Header 的时候,对header的长度限制在150字节左右。而一个汉字编码成UTF-8是9个字节,那么17个字便是153个字节,所以会报错。而且不跟后缀也 不对.
二. 解决方案:将文件名编码成ISO8859-1是有效的解决方案,代码如下:response.setHeader( "Content-Disposition", "attachment;filename=" + new >String( fileName.getBytes("gb2312"), "ISO8859-1" ) );
在确保附件文件名都是简体中文字的情况下,那么这个办法确实是最有效的,不用让客户逐个的升级IE。如果台湾同胞用,把gb2312改成big5就 行。但现在的系统通常都加入了 国际化的支持,普遍使用UTF-8。如果文件名中又有简体中文字,又有繁体中文,还有日文。那么乱码便产生了。另外,在上Firefox (v1.0-en)下载也是乱码。
三. 参看邮件中的中文附件名的形式,用outlook新建一个带有中文附件的邮件,然后看这个邮件的源代码,找到:Content-Disposition: attachment; filename="=?gb2312?B?0MK9qCDOxLG+zsS1tS50eHQ=?="
用这个filename原理上就可以显示中文名附件,但是现在IE并不支持,Firefox是支持的。尝试使用 javamail 的MimeUtility.encode()方法来编码文件名,也就是编码成 =?gb2312?B?xxxxxxxx?= 这样的形式,并从 RFC1522 中找到对应的标准支持。
折中考虑,结合了一、二的方式,代码片断如下:String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8"); /* * see http://support.microsoft.com/default.aspx?kbid=816868 */ if (fileName.length() > 150) { String guessCharset = xxxx //根据request的locale 得出可能的编码,中文操作系统通常是gb2312 fileName = new String(atta.getFileName().getBytes(guessCharset), "ISO8859-1"); } response.setHeader("Content-Disposition", "attachment; filename=" + fileName);
编码转换的原理:
首先在源程序中将编码设置成GB2312字符编码,然后将源程序按Unicode编码转换成字节码加载到内存中(java加载到内存中的字节码都是
Unicode编码),然后按GB2312编码获得中文字符串的字节数组,然后生成按ISO8859-1编码形式的Unicode字符串(这时的4个字节
就变成了8个字节,高位字节补零),
当在网络中传输时,因为setHeader方法中的字符只能按ISO8859-1传输,所以这时候就又把Unicode字符转换成了
ISO8859-1的编码传到浏览器(就是把刚才高位补的零全去掉),这时浏览器接收到的ISO8859-1码的字符因为符合GB2312编码,所以就可
以显示中文了。
5. jsp翻译成class时的编码问题 记事本中代码块1:<%= "a中文".length() %> 代码块2: <%@ page pageEncoding="gbk"%> <%= "a中文".length() %>
为什么上面的输出值为5,改成下面的则输出3?
因为上面的代码没有添加该文件的编码说明 , WEB应用程序在将jsp翻译成class文件时 ,
把该字符串的内容按默认的保存方式指定的编码ASCII码来算的,在UTF-8中,原ASCII字符占一个字节,汉字占两个字节,对应两个字符,长度就变
成了5 , 而下面的是GBK编码, 一个汉字和一个英文都对应一个字符,得到结果就为3.** response.setHeader(…)文件名中有空格的时候**
String fileName = StringUtils.trim(file.getName()); String formatFileName = encodingFileName(name);//在后面定义方法encodingFileName(String fileName); response.setHeader("Content-Disposition", "attachment; filename=" + formatFileName ); //处理文件名中出现的空格 //其中%20是空格在UTF-8下的编码 public static String encodingFileName(String fileName) { String returnFileName = ""; try { returnFileName = URLEncoder.encode(fileName, "UTF-8"); returnFileName = StringUtils.replace(returnFileName, "+", "%20"); if (returnFileName.length() > 150) { returnFileName = new String(fileName.getBytes("GB2312"), "ISO8859-1"); returnFileName = StringUtils.replace(returnFileName, " ", "%20"); } } catch (UnsupportedEncodingException e) { e.printStackTrace(); if (log.isWarnEnabled()) { log.info("Don't support this encoding ..."); } } return returnFileName; }
一秒刷新页面一次
response.setHeader("refresh","1");
二秒跳到其他页面
response.setHeader("refresh","2;URL=otherPagename");
没有缓存:
response.setHeader("Pragma", "No-cache"); response.setHeader("Cache-Control", "no-cache");
设置过期的时间期限
response.setDateHeader("Expires", System.currentTimeMillis()+自己设置的时间期限);
访问别的页面:
response.setStatus(302); response.setHeader("location","url");
通知浏览器数据采用的压缩格式:
response.setHeader("Content-Encoding","压缩后的数据");
高速浏览器压缩数据的长度:
response.setHeader("Content-Length",压缩后的数据.length+"");
高速浏览器图片或视频:
response.setHeader("Content-type","这个参数在tomcat里conf下的web.xml里面找"); inputstream in= this.getServletContext.getResourceAsStream("/2.jpg"); int len=0; byte buffer[]= new byte[1024] outputStream out = response.getOutputStream(); while(len=in.read(buffer)>0){ out.write(buffer,0,len) }
高速浏览器已下载的形式:
response.setHeader("Content-disposition","attachment;filename=2.jpg"); inputstream in= this.getServletContext.getResourceAsStream("/2.jpg"); int len=0; byte buffer[]= new byte[1024] outputStream out = response.getOutputStream(); while(len=in.read(buffer)>0){ out.write(buffer,0,len) }