浅谈MIME之文件下载

版权声明:@lingtouyang1997 https://blog.csdn.net/weixin_43209201/article/details/86634710

浅谈MIME之文件下载

要实现文件下载,我们只需要设置两个特殊的相应头。
它们是什么头?如果文件名带中文,该如何解决?

两个特殊的相应头:

Content-Type: application/octet-stream

它定义了数据的类型,以便数据能被适当的处理。有效的类型有:text,image,audio,video,applications,multipart和message。注意任何一个二进制附件都应该被叫做application/octet- stream。这个头的一些用例为:image/jpg, application/mswork,multipart/mixed,这只是很少的一部分。
分类大全参考网址:https://blog.csdn.net/weixin_43209201/article/details/86532261

Content-Disposition: attachment;filename=test.zip

一个试验性的头,它用于给客户程序/MUA提供提示,来决定是否在行内显示附件或作为单独的附件。当Content-Type 的类型为要下载的类型时 , 这个信息头会告诉浏览器这个文件的名字和类型

例如:

response.setHeader("Content-Disposition","attachment;filename=test.jpg");
response.setContentType("image/jpeg");

注意:如果文件中filename参数中有中文,则就会出现乱码。

解决办法:

response.setHeader("Content-Disposition", "attachment;filename="+new String(fileName.getBytes("utf-8"),"iso8859-1"));
response.setContentType("application/ynd.ms-excel;charset=UTF-8");





测试并分析文件名乱码问题
response.setHeader()下载中文文件名乱码问题

response.setHeader("Content-Disposition", "attachment; filename=" + >java.net.URLEncoder.encode(fileName, "UTF-8"));

下载的程序里有了上面一句,一般在IE6的下载提示框上将正确显示文件的名字,无论是简体中文,还是日文。不过当时确实没有仔细测试文件名为很长的中文文件名的情况。现如今经过仔细测试,发现文字只要超过17个字,就不能下载了。分析如下:

一. 通过原来的方式,也就是先用URLEncoder编码,当中文文字超过17个时,IE6 无法下载文件。这是IE的bug,参见微软的知识库文章 KB816868 。原因可能是IE在处理 Response Header 的时候,对header的长度限制在150字节左右。而一个汉字编码成UTF-8是9个字节,那么17个字便是153个字节,所以会报错。而且不跟后缀也 不对.
二. 解决方案:将文件名编码成ISO8859-1是有效的解决方案,代码如下:

response.setHeader( "Content-Disposition", "attachment;filename=" + new >String( fileName.getBytes("gb2312"), "ISO8859-1" ) );

在确保附件文件名都是简体中文字的情况下,那么这个办法确实是最有效的,不用让客户逐个的升级IE。如果台湾同胞用,把gb2312改成big5就 行。但现在的系统通常都加入了 国际化的支持,普遍使用UTF-8。如果文件名中又有简体中文字,又有繁体中文,还有日文。那么乱码便产生了。另外,在上Firefox (v1.0-en)下载也是乱码。
三. 参看邮件中的中文附件名的形式,用outlook新建一个带有中文附件的邮件,然后看这个邮件的源代码,找到:

Content-Disposition: attachment;
filename="=?gb2312?B?0MK9qCDOxLG+zsS1tS50eHQ=?="

用这个filename原理上就可以显示中文名附件,但是现在IE并不支持,Firefox是支持的。尝试使用 javamail 的MimeUtility.encode()方法来编码文件名,也就是编码成 =?gb2312?B?xxxxxxxx?= 这样的形式,并从 RFC1522 中找到对应的标准支持。
折中考虑,结合了一、二的方式,代码片断如下:

String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8");

/*
* see http://support.microsoft.com/default.aspx?kbid=816868
*/

if (fileName.length() > 150) {

String guessCharset = xxxx

//根据request的locale 得出可能的编码,中文操作系统通常是gb2312

fileName = new String(atta.getFileName().getBytes(guessCharset),
"ISO8859-1");

} response.setHeader("Content-Disposition", "attachment; filename=" +
fileName); 

编码转换的原理:

首先在源程序中将编码设置成GB2312字符编码,然后将源程序按Unicode编码转换成字节码加载到内存中(java加载到内存中的字节码都是
Unicode编码),然后按GB2312编码获得中文字符串的字节数组,然后生成按ISO8859-1编码形式的Unicode字符串(这时的4个字节
就变成了8个字节,高位字节补零),
当在网络中传输时,因为setHeader方法中的字符只能按ISO8859-1传输,所以这时候就又把Unicode字符转换成了
ISO8859-1的编码传到浏览器(就是把刚才高位补的零全去掉),这时浏览器接收到的ISO8859-1码的字符因为符合GB2312编码,所以就可
以显示中文了。
5. jsp翻译成class时的编码问题 记事本中代码块1:

<%=
      "a中文".length() %>

代码块2<%@ page pageEncoding="gbk"%> <%=
      "a中文".length() %> 

为什么上面的输出值为5,改成下面的则输出3?

因为上面的代码没有添加该文件的编码说明 , WEB应用程序在将jsp翻译成class文件时 ,
把该字符串的内容按默认的保存方式指定的编码ASCII码来算的,在UTF-8中,原ASCII字符占一个字节,汉字占两个字节,对应两个字符,长度就变
成了5 , 而下面的是GBK编码, 一个汉字和一个英文都对应一个字符,得到结果就为3.

** response.setHeader(…)文件名中有空格的时候**

String fileName = StringUtils.trim(file.getName());

String formatFileName =
encodingFileName(name);//在后面定义方法encodingFileName(String fileName);
response.setHeader("Content-Disposition", "attachment; filename=" +
formatFileName );

//处理文件名中出现的空格 

//其中%20是空格在UTF-8下的编码

public static String encodingFileName(String fileName) {
        String returnFileName = "";
        try {
            returnFileName = URLEncoder.encode(fileName, "UTF-8");
            returnFileName = StringUtils.replace(returnFileName, "+", "%20");
            if (returnFileName.length() > 150) {
                returnFileName = new String(fileName.getBytes("GB2312"), "ISO8859-1");
                returnFileName = StringUtils.replace(returnFileName, " ", "%20");
            }
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
            if (log.isWarnEnabled()) {
                log.info("Don't support this encoding ...");
            }
        }
        return returnFileName;
    }

一秒刷新页面一次

response.setHeader("refresh","1");

二秒跳到其他页面

response.setHeader("refresh","2;URL=otherPagename");

没有缓存:

 response.setHeader("Pragma", "No-cache");
response.setHeader("Cache-Control", "no-cache"); 

设置过期的时间期限

response.setDateHeader("Expires",
System.currentTimeMillis()+自己设置的时间期限); 

访问别的页面:

response.setStatus(302; 
response.setHeader("location","url");  

通知浏览器数据采用的压缩格式:

response.setHeader("Content-Encoding","压缩后的数据"); 

高速浏览器压缩数据的长度:

response.setHeader("Content-Length",压缩后的数据.length+"");

高速浏览器图片或视频:

response.setHeader("Content-type","这个参数在tomcat里conf下的web.xml里面找");

inputstream in= this.getServletContext.getResourceAsStream("/2.jpg");
int len=0; byte buffer[]= new byte[1024]

outputStream out = response.getOutputStream();

while(len=in.read(buffer)>0){   out.write(buffer,0,len) }

高速浏览器已下载的形式:

response.setHeader("Content-disposition","attachment;filename=2.jpg");

inputstream in= this.getServletContext.getResourceAsStream("/2.jpg");
int len=0; byte buffer[]= new byte[1024]

outputStream out = response.getOutputStream();

while(len=in.read(buffer)>0){   out.write(buffer,0,len) } 

参考网址:https://www.cnblogs.com/mingforyou/p/4259113.html

猜你喜欢

转载自blog.csdn.net/weixin_43209201/article/details/86634710