利用字符编码集对中文长度的不同来判断字符串中有没有中文 - 代码天地

利用字符编码集对中文长度的不同来判断字符串中有没有中文

其他 2018-12-01 15:48:02 阅读次数: 0

是这样的，在日常开发中遇到一个问题：判断一个字符串中是否含有中文。本来是很简单的一个需求，用正则就搞定了。然而这是一个很老旧的一个系统，有自己的一套开发语言。偏偏不支持正则，这就难住我了。

当时想到一个笨办法：把三千个常用汉字写在一个配置文件中，把要判断的字符串分割为一个个字符，一个个的去配置文件中找，看能不能找到，能找到就是含有中文，没找到就是没有。。。。幸亏我没用这个方法，实在有点笨，有点丢人。

后来又看到一篇文章，是讲中文在不同编码下字符集长度不同的问题。这一下就给我启发了，我把字符串转为不同的编码，比较两者的长度不就判断有没有中文了吗。

当时用的两个编码，一个是ANSI，一个是UTF-8.

这儿解释一下ANSI，这是对ASCII编码的扩展。这是一个编码字符集，里面就包括了中国地区用的GB2312，韩国用的Euc-kr。操作系统会根据地区的不同，选择不同的ANSI编码，中国地区就选择GB2312。

在ANSI也就是GB2312编码中，中文、英文到度是两个字节。而UTF-8中，英文的长度是两个字节，中文的长度是三个字节。这中间的差值就是判断是否有中文的字符的依据了。我们还能根据这个差值判断有多少个中文字符。

考虑到输入的内容基本只会有中文、英文、符号等，不会出现韩文、日文这些文字，可以认为这个问题解决！

猜你喜欢

转载自www.cnblogs.com/contixue/p/10049634.html

利用字符编码集对中文长度的不同来判断字符串中有没有中文

VBA如何判断字符串中有没有汉字

Swift --棒棒糖1--判断字符串中有没有元素

java 判断含有中文的字符串的长度

delphi 判断字符串有中文

计算含有中文的字符串长度

如何判断字符串中是否有中文

php正则判断字符串是否含有中文

java判断字符串中是否含有中文

PHP判断字符串中是否含有中文

sqlserver 判断字符串中是否有中文

字符串中文长度

C--中文汉字占用字节长度（字符集和字符编码）

Ruby中有关字符串长度的操作

Java 分割字符串---按字节长度分割带有中文字符串，中文不乱码

function 判断字符串中是否有中文汉字，判断字符串是否全部为中文汉字

java判断中文字符串长度

Java 判断中文字符串长度

python 如何判断中文的字符串长度

CString：判断两个str字符串中有多少不同的字

Java 获取含有中文字符字符串的字节长度

继续玩算法：两个字符串中有没有不一致的字符？

面试题：数组有没有length()方法？字符串有没有length()方法？集合有没有length()方法？

python 判断字符串中是否只有中文字符

python判断字符串中是否只有中文字符

Lintcode：判断字符串是否没有重复字符

根据编码判断字符串是中文字符串还是英文字符串

edittext判断输入字符长度(判断字符串里的中文和字母和数字的长度)转换为char

我说我精通字符串，面试官竟然问我Java中的String有没有长度限制！？

我说我精通字符串，面试官竟然问我Java中的String有没有长度限制！？|附视频讲解

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)