Base64字节编码由两个系统之间的接口的说起

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/It_sharp/article/details/84855996

起因

两个系统之间商量一个接口传输测量文件(有可能是Excel也有可能是Txt)
方案:对方系统往我们这个URL,采用HTTP协议,Post方法,传文件二进制数据

四种POST方式

表单编码类型
1、application/x-www-form-urlencoded
2、multipart/form-data
3、text/plain
4、application/json及其他MiME类型

采用前两种

application/x-www-form-urlencoded
这是默认的编码类型,使用该类型时,会将表单数据中非字母数字的字符转换成转义字符,如"%HH",然后组合成这种形式key1=value&key2=value2的方式编码。使用Ajax提交数据时,也是使用这种方式。Content-Type默认值是[application/x-www-form-urlencoded;charset=utf-8]
multipart/form-data
使用表单上传文件时,必须让表单的enctype等于multipart/form-data。
Request Headers :

Accept:application/json, text/plain, */*
Accept-Encoding:gzip, deflate
Accept-Language:zh-CN,zh;q=0.8
Connection:keep-alive
Content-Length:13125
Content-Type:multipart/form-data; boundary=----WebKitFormBoundaryaqWXpQYCfMbAHgPh
Cookie:shiro.sesssion=1a6d4f4d-ab5f-4a1b-a5cd-fc71cf9633cb
Host:192.168.199.223
Origin:http://192.168.199.223
Referer:http://192.168.199.223/
User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36

Request Payload:

------WebKitFormBoundaryaqWXpQYCfMbAHgPh
Content-Disposition: form-data; name="fileEnterprise"; filename="a.jpg"
Content-Type: image/jpeg

------WebKitFormBoundaryaqWXpQYCfMbAHgPh
Content-Disposition: form-data; name="enterpriseName"

有限责任公司
------WebKitFormBoundaryaqWXpQYCfMbAHgPh
Content-Disposition: form-data; name="unifiedSocialCreditCode"

91530700781667237G
------WebKitFormBoundaryaqWXpQYCfMbAHgPh--

注意:

  • 一般来说,method和enctype是两个不同的互不影响的属性,但在传文件时,method必须要指定为POST,否则文件只剩下filename了;
  • 当没有传文件时,enctype会改回默认的application/x-www-form-urlencoded。

我的做法

当思考第一种时,意味着需要将二进制数据存为字符形式的,再传输
没过多思考就将二进制数据编码成字符串,出现以下两种情况
文本 转 **二进制 ** 转 字符串经UTF-8编码和转码字符串二进制文本
情况一:文本文件以UnicodeASCII传输没有问题
情况二:Excel文件传输出了问题
本质上需要 保存 8Bit字节再 传输,我的做法就是用Unicode、或ASCII方式,但发现转回来字节数组不一致
1、最好的做法是Base64
2、把二进制数据转成HEX,类似于A00AX…,一个8位二进制转成2个16进制
3、用 - 分隔,用int32的字符串形式保存

思考

为什么出错?
二进制数据转成文本,文本可能缺失,还有编码也会让二进制多一B
正确的做法就是原样保存好二进制数据就好

            Byte[] byts = File.ReadAllBytes("123.xlsx");//length = 8575
            string str = "";

            ////编码
            //for (int i = 0; i < byts.Length; i++) {
            //    str += byts[i].ToString();
            //    if (i < byts.Length - 1) str += "-";
            //}
            ////解码
            //string[] strSplit = str.Split('-');
            //Byte[] bytOrign = new byte[strSplit.Length];
            //for (int i = 0; i < strSplit.Length; i++) 
            //{
            //    bytOrign[i] = Convert.ToByte(strSplit[i]);
            //}

            str = HexToString(byts);
            Byte[] bytOrign = StringToHex(str);

            //Base64String编码,数据没有变化,保存字节时采用的时Base64编码
            //网络上常见的传输8Bit字节码的编码方式
            //string sx = Convert.ToBase64String(byts);
            //Byte[] bytOrign = Convert.FromBase64String(sx);

            //Unicode编码,当数据为奇数 b时,会导致最后一个字节编译成字符,再将字符转为字节时多出一个00
            //string str = System.Text.Encoding.Unicode.GetString(byts);//length = 4288
            //Byte[] bytOrign = System.Text.Encoding.Unicode.GetBytes(str);
            
            //采用ASCII编码,字节数组大小是一样的,但是个别字节不一样
            //string str = System.Text.Encoding.ASCII.GetString(byts);
            //Byte[] bytOrign = System.Text.Encoding.ASCII.GetBytes(str);

            //UTF-8编码,字节大小和字节数据不一样
            //string str = System.Text.Encoding.UTF8.GetString(byts);
            //Byte[] bytOrign = System.Text.Encoding.UTF8.GetBytes(str);

            //GB2312 字节大小和字节数据不一样
            //string str = Encoding.GetEncoding("GB2312").GetString(byts);
            //Byte[] bytOrign = Encoding.GetEncoding("GB2312").GetBytes(str);

            File.WriteAllBytes("456.xlsx", bytOrign);
            File.WriteAllText("456.txt", str);            Byte[] byts = File.ReadAllBytes("123.xlsx");//length = 8575
            string str = "";

            ////编码
            //for (int i = 0; i < byts.Length; i++) {
            //    str += byts[i].ToString();
            //    if (i < byts.Length - 1) str += "-";
            //}
            ////解码
            //string[] strSplit = str.Split('-');
            //Byte[] bytOrign = new byte[strSplit.Length];
            //for (int i = 0; i < strSplit.Length; i++) 
            //{
            //    bytOrign[i] = Convert.ToByte(strSplit[i]);
            //}

            str = HexToString(byts);
            Byte[] bytOrign = StringToHex(str);

            //Base64String编码,数据没有变化,保存字节时采用的时Base64编码
            //网络上常见的传输8Bit字节码的编码方式
            //string sx = Convert.ToBase64String(byts);
            //Byte[] bytOrign = Convert.FromBase64String(sx);

            //Unicode编码,当数据为奇数 b时,会导致最后一个字节编译成字符,再将字符转为字节时多出一个00
            //string str = System.Text.Encoding.Unicode.GetString(byts);//length = 4288
            //Byte[] bytOrign = System.Text.Encoding.Unicode.GetBytes(str);
            
            //采用ASCII编码,字节数组大小是一样的,但是个别字节不一样
            //string str = System.Text.Encoding.ASCII.GetString(byts);
            //Byte[] bytOrign = System.Text.Encoding.ASCII.GetBytes(str);

            //UTF-8编码,字节大小和字节数据不一样
            //string str = System.Text.Encoding.UTF8.GetString(byts);
            //Byte[] bytOrign = System.Text.Encoding.UTF8.GetBytes(str);

            //GB2312 字节大小和字节数据不一样
            //string str = Encoding.GetEncoding("GB2312").GetString(byts);
            //Byte[] bytOrign = Encoding.GetEncoding("GB2312").GetBytes(str);

            File.WriteAllBytes("456.xlsx", bytOrign);
            File.WriteAllText("456.txt", str);

二进制时编码类型enctype详解](https://www.cnblogs.com/moqiutao/p/7782270.html)
https://blog.csdn.net/wufaliang003/article/details/79573512

猜你喜欢

转载自blog.csdn.net/It_sharp/article/details/84855996