编写一个截取字符串的函数,输入为一个字符串和字节数,输出为按字节截取的字符串。但是要保证汉字不能截取半个,如“我abc”4,应该截取为“我ab”,输入“我abc汉def”6,应该输出为“我abc”

cat__java的博客

生活不止眼前的苟且,还有以后的苟且...


package cn.itchg;

/**
 * Created by CHG on 2017-02-23 14:48.
 */
public class GBK {

    public static void main(String[] args) throws Exception {
        String string = "我a很bc你好";
        System.out.println(splitString(string, 1));
    }

    public static String splitString(String str, int length)
            throws Exception {
        //无效输入
        if (str == null || str.length() < 1 || length < 1) {
            return "";
        }
        //用于统计这个字符串中有几个中文字符
        int wordCount = 0;
        //统一按照gbk编码来得到他的字节数组,因为不同的编码字节数组是不一样的。
        byte[] gbks = str.getBytes("GBK");

        //gbks中,汉字是两个负数表示
        for (int i = 0; i < length; i++) {
            int val = gbks[i];
            if (val < 0) {
                //汉字个数++
                wordCount++;
            }
        }

        //完整的汉字
        if (wordCount % 2 == 0) {
            return str.substring(0, (length - (wordCount / 2)));
        }
        //半个汉字 所以  -1
        return str.substring(0, (length - (wordCount / 2) - 1));

    }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41

package cn.itchg;

/**
 * Created by CHG on 2017-02-23 14:48.
 */
public class GBK {

    public static void main(String[] args) throws Exception {
        String string = "我a很bc你好";
        System.out.println(splitString(string, 1));
    }

    public static String splitString(String str, int length)
            throws Exception {
        //无效输入
        if (str == null || str.length() < 1 || length < 1) {
            return "";
        }
        //用于统计这个字符串中有几个中文字符
        int wordCount = 0;
        //统一按照gbk编码来得到他的字节数组,因为不同的编码字节数组是不一样的。
        byte[] gbks = str.getBytes("GBK");

        //gbks中,汉字是两个负数表示
        for (int i = 0; i < length; i++) {
            int val = gbks[i];
            if (val < 0) {
                //汉字个数++
                wordCount++;
            }
        }

        //完整的汉字
        if (wordCount % 2 == 0) {
            return str.substring(0, (length - (wordCount / 2)));
        }
        //半个汉字 所以  -1
        return str.substring(0, (length - (wordCount / 2) - 1));

    }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41

猜你喜欢

转载自blog.csdn.net/yeqiuboke/article/details/80889707