java编码字数统计 - 代码天地

java编码字数统计

其他 2018-11-26 10:30:51 阅读次数: 0

好久没有写博客了，最近在做一个window exe程序。

public static int String_length(String value) {
    int valueLength = 0;
    String chinese = "[\u4e00-\u9fa5]";
    for (int i = 0; i < value.length(); i++) {
        String temp = value.substring(i, i + 1);
        if (temp.matches(chinese)) {
            valueLength += 2;
        } else {
            valueLength += 1;
        }
    }
    return valueLength;
}

String s1 = "abcd我们";
String s2 = "abcdef";
String s3 = "啊波次得我们";
System.out.println("s1 default " + s1.length() + " s.byte " + s1.getBytes().length);
System.out.println("s1 gbk " + s1.length() + " s.byte " + s1.getBytes("GBK").length);
System.out.println("s1 utf-8 " + s1.length() + " s.byte " + s1.getBytes("UTF-8").length);
System.out.println("s2 " + s2.length() + " s.byte " + s2.getBytes().length);
System.out.println("s3 " + s3.length() + " s.byte " + s3.getBytes().length);

System.out.println("func s1 " + String_length(s1));
System.out.println("func s2 " + String_length(s2));
System.out.println("func s3 " + String_length(s3));

得到的结果是：

s1 default 6 s.byte 10  //默认是按utf-8搞
s1 gbk 6 s.byte 8  //gbk固定2个字节中文，英文1个
s1 utf-8 6 s.byte 10 //utf8中文是不固定的，可能是2~3个。英文1个
s2 6 s.byte 6
s3 6 s.byte 18
func s1 8
func s2 6
func s3 12

所以，string.length拿到的是文字的个数；string.getByte().length根据编码来返回字节数；
使用方法函数，使用unicode探测最好。

猜你喜欢

转载自blog.csdn.net/jzlhll123/article/details/81708571

java编码字数统计

【Python】哈姆雷特字数统计

textView输入字数统计

HDU - 1735 字数统计

C语言字数统计

python 哈姆雷特字数统计词云

HDU1735 字数统计贪心

【Linux】wc ：字数统计命令

js汉字字数统计

java 实现仿word2007字数统计功能

Hexo添加字数统计和阅读统计

Ultraedit配置字数统计工具栏

Android中EditText输入字数统计和限制

IOS开发技巧之──字数统计函数

Hadoop-Mapreduce经典习题：字数统计

编写spark WorkCount字数统计代码详解

三国演义字数统计

Hadoop默认提供的字数统计示例运行

textarea还剩余字数统计，支持复制粘贴的时候统计字数

HDU 1735 字数统计(模拟+一点点贪心的思想）

hexo下yilia主题添加字数统计和阅读时长功能

UTF8字符串在lua的截取和字数统计【转载】

Machine Learning 李宏毅 HW0字数统计和图片淡化

VSCode插件之实时字数统计与选中词英汉互译

【HDU 1735】字数统计（贪心，有缺陷的一道题）

Hexo（sakura）文章增添字数统计和阅读时长功能

Hexo（sakura）文章增添字数统计和阅读时长功能

Hexo（sakura）文章增添字数统计和阅读时长功能

中英文字数统计以及信息熵的计算

hexo笔记六：next主题添加字数统计和阅读时长估计

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)