前台传 到后台变成问号的解决方法

    问题的根源,在于UTF-8这种编码里面,存在一个特殊的字符,其编码是“0xC2 0xA0”,转换成字符的时候,表现为一个空格,跟一般的半角空格(ASCII 0x20)一样,唯一的不同是它的宽度不会被压缩,因此比较多的被用于网页排版(如首行缩进之类)。而其他的编码方式如GB2312、Unicode之类并没有这样的字符,因此如果简单地进行编码转换,生成地GB2312/Unocode字符串中,这个字符就会被替换成为问号(ASCII ox3F)。此时如果进行写库、写文件之类,就会把问号直接写入了。当然此时会有一种山寨方式:直接替换问号为空格。可是这种方法,会把原本真正的问号也毙掉。

    使用UTF-8进行HTMLDecode的时候,对于语句开头的( ),就会被自动转换成为这个特殊的空格。在转换为其他编码之前,这个特殊的空格受到的待遇与普通的半角空格是一致的,甚至也会被trim()去掉。

    在前台是UTF编码解析,所以编码是“0xC2 0xA0”到后台用其他编码格式解析,就会变成问号。

  byte bytes[] = {(byte) 0xC2,(byte) 0xA0};
  String UTFSpace = new String(bytes,"utf-8");
  html = html.replaceAll(UTFSpace, " ");

猜你喜欢

转载自blog.csdn.net/weixin_38204723/article/details/78902565
今日推荐