浅谈MIME之文件下载

要实现文件下载，我们只需要设置两个特殊的相应头。
它们是什么头？如果文件名带中文，该如何解决？

两个特殊的相应头：

Content-Type: application/octet-stream

它定义了数据的类型，以便数据能被适当的处理。有效的类型有：text，image，audio，video，applications，multipart和message。注意任何一个二进制附件都应该被叫做application/octet- stream。这个头的一些用例为：image/jpg, application/mswork，multipart/mixed，这只是很少的一部分。
分类大全参考网址：https://blog.csdn.net/weixin_43209201/article/details/86532261

Content-Disposition: attachment;filename=test.zip

一个试验性的头，它用于给客户程序/MUA提供提示，来决定是否在行内显示附件或作为单独的附件。当Content-Type 的类型为要下载的类型时 , 这个信息头会告诉浏览器这个文件的名字和类型。

例如：

response.setHeader("Content-Disposition","attachment;filename=test.jpg");
response.setContentType("image/jpeg");

注意：如果文件中filename参数中有中文，则就会出现乱码。

解决办法：

response.setHeader("Content-Disposition", "attachment;filename="+new String(fileName.getBytes("utf-8"),"iso8859-1"));
response.setContentType("application/ynd.ms-excel;charset=UTF-8");

测试并分析文件名乱码问题
response.setHeader()下载中文文件名乱码问题
response.setHeader("Content-Disposition", "attachment; filename=" + >java.net.URLEncoder.encode(fileName, "UTF-8"));
下载的程序里有了上面一句，一般在IE6的下载提示框上将正确显示文件的名字，无论是简体中文，还是日文。不过当时确实没有仔细测试文件名为很长的中文文件名的情况。现如今经过仔细测试，发现文字只要超过17个字，就不能下载了。分析如下：

一. 通过原来的方式，也就是先用URLEncoder编码，当中文文字超过17个时，IE6 无法下载文件。这是IE的bug，参见微软的知识库文章 KB816868 。原因可能是IE在处理 Response Header 的时候，对header的长度限制在150字节左右。而一个汉字编码成UTF-8是9个字节，那么17个字便是153个字节，所以会报错。而且不跟后缀也不对.
二. 解决方案：将文件名编码成ISO8859-1是有效的解决方案，代码如下：
response.setHeader( "Content-Disposition", "attachment;filename=" + new >String( fileName.getBytes("gb2312"), "ISO8859-1" ) );
在确保附件文件名都是简体中文字的情况下，那么这个办法确实是最有效的，不用让客户逐个的升级IE。如果台湾同胞用，把gb2312改成big5就行。但现在的系统通常都加入了国际化的支持，普遍使用UTF-8。如果文件名中又有简体中文字，又有繁体中文，还有日文。那么乱码便产生了。另外，在上Firefox (v1.0-en)下载也是乱码。
三. 参看邮件中的中文附件名的形式，用outlook新建一个带有中文附件的邮件，然后看这个邮件的源代码，找到：
Content-Disposition: attachment;
filename="=?gb2312?B?0MK9qCDOxLG+zsS1tS50eHQ=?="
用这个filename原理上就可以显示中文名附件，但是现在IE并不支持，Firefox是支持的。尝试使用 javamail 的MimeUtility.encode()方法来编码文件名，也就是编码成 =?gb2312?B?xxxxxxxx?= 这样的形式，并从 RFC1522 中找到对应的标准支持。
折中考虑，结合了一、二的方式，代码片断如下：
String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8");

/*
* see http://support.microsoft.com/default.aspx?kbid=816868
*/

if (fileName.length() > 150) {

String guessCharset = xxxx

//根据request的locale 得出可能的编码，中文操作系统通常是gb2312

fileName = new String(atta.getFileName().getBytes(guessCharset),
"ISO8859-1");

} response.setHeader("Content-Disposition", "attachment; filename=" +
fileName); 
编码转换的原理：

首先在源程序中将编码设置成GB2312字符编码,然后将源程序按Unicode编码转换成字节码加载到内存中（java加载到内存中的字节码都是
Unicode编码），然后按GB2312编码获得中文字符串的字节数组，然后生成按ISO8859-1编码形式的Unicode字符串（这时的4个字节
就变成了8个字节，高位字节补零）,
当在网络中传输时，因为setHeader方法中的字符只能按ISO8859-1传输，所以这时候就又把Unicode字符转换成了
ISO8859-1的编码传到浏览器（就是把刚才高位补的零全去掉），这时浏览器接收到的ISO8859-1码的字符因为符合GB2312编码，所以就可
以显示中文了。
5. jsp翻译成class时的编码问题记事本中代码块1：
<%=
      "a中文".length() %>

代码块2：

<%@ page pageEncoding="gbk"%> <%=
      "a中文".length() %> 
为什么上面的输出值为5，改成下面的则输出3？

因为上面的代码没有添加该文件的编码说明 , WEB应用程序在将jsp翻译成class文件时 ,
把该字符串的内容按默认的保存方式指定的编码ASCII码来算的，在UTF-8中，原ASCII字符占一个字节，汉字占两个字节，对应两个字符，长度就变
成了5 , 而下面的是GBK编码, 一个汉字和一个英文都对应一个字符,得到结果就为3.

** response.setHeader(…)文件名中有空格的时候**
String fileName = StringUtils.trim(file.getName());

String formatFileName =
encodingFileName(name);//在后面定义方法encodingFileName(String fileName);
response.setHeader("Content-Disposition", "attachment; filename=" +
formatFileName );

//处理文件名中出现的空格 

//其中%20是空格在UTF-8下的编码

public static String encodingFileName(String fileName) {
        String returnFileName = "";
        try {
            returnFileName = URLEncoder.encode(fileName, "UTF-8");
            returnFileName = StringUtils.replace(returnFileName, "+", "%20");
            if (returnFileName.length() > 150) {
                returnFileName = new String(fileName.getBytes("GB2312"), "ISO8859-1");
                returnFileName = StringUtils.replace(returnFileName, " ", "%20");
            }
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
            if (log.isWarnEnabled()) {
                log.info("Don't support this encoding ...");
            }
        }
        return returnFileName;
    }
一秒刷新页面一次
response.setHeader("refresh","1");
二秒跳到其他页面
response.setHeader("refresh","2;URL=otherPagename");
没有缓存：
 response.setHeader("Pragma", "No-cache");
response.setHeader("Cache-Control", "no-cache"); 
设置过期的时间期限
response.setDateHeader("Expires",
System.currentTimeMillis()+自己设置的时间期限); 
访问别的页面：
response.setStatus（302）; 
response.setHeader("location","url");  
通知浏览器数据采用的压缩格式：
response.setHeader("Content-Encoding","压缩后的数据"); 
高速浏览器压缩数据的长度：
response.setHeader("Content-Length",压缩后的数据.length+"");
高速浏览器图片或视频：
response.setHeader("Content-type","这个参数在tomcat里conf下的web.xml里面找");

inputstream in= this.getServletContext.getResourceAsStream("/2.jpg");
int len=0; byte buffer[]= new byte[1024]

outputStream out = response.getOutputStream();

while(len=in.read(buffer)>0){   out.write(buffer,0,len) }
高速浏览器已下载的形式：
response.setHeader("Content-disposition","attachment;filename=2.jpg");

inputstream in= this.getServletContext.getResourceAsStream("/2.jpg");
int len=0; byte buffer[]= new byte[1024]

outputStream out = response.getOutputStream();

while(len=in.read(buffer)>0){   out.write(buffer,0,len) } 
参考网址：https://www.cnblogs.com/mingforyou/p/4259113.html

浅谈MIME之文件下载

浅谈MIME之文件下载

猜你喜欢