Java判断中文汉字和中文符号

一、判断中文字符(包括中文汉字和中文符号)
(1)使用中文的编码区间来判断(推荐,效率高)
String str1 = "T恤;https://blog.csdn.net/vpqtxzmzezeqjj9977";//中文汉字
String str2 = ";https://blog.csdn.net/vpqtxzmzezeqjj9977";//中文分号
String str3 = "https://blog.csdn.net/vpqtxzmzezeqjj9977";//英文
int flage = 0;
for (char c : str2.toCharArray()) {  
         if (c >= 0x4E00 &&  c <= 0x9FA5){
          flage = 1;
          System.out.println("发现中文字符:"+c);
             break; //有一个中文字符就返回  
         }
    }
if(flage!=1){
    System.out.println("恭喜,没有发现中文字符!");
}
(2)使用正则表达式来判断(不推荐,效率低,需要遍历整个字符串)
for (int i = 0; i < str1.length(); i++) {  
   if (str.substring(i, i + 1).matches("[\\u4e00-\\u9fbb]+")) {  
        flage = 1;
     System.out.println("发现中文字符:"+str.substring(i, i + 1));
        break;  //有一个中文字符就返回  
   }  
}  
if(flage!=1){
    System.out.println("恭喜,没有发现中文字符!");
}
(3)使用Unicode编码来判断中文标点(推荐)
// GENERAL_PUNCTUATION 判断中文的“号  
// CJK_SYMBOLS_AND_PUNCTUATION 判断中文的。号  
// HALFWIDTH_AND_FULLWIDTH_FORMS 判断中文的,号  
private static final boolean isChinese(char c) {  
       Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);  
       if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS  
               || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS  
               || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A  
               || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION  
               || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION  
               || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {  
           return true;  
       }  
       return false;  
}  
二、结合

将(1)和(3)的判断结合一下,则可以完美实现判断中文字符。源码如下:

/**
 * @author: gznc_pcc
 * @date:2018年5月14日 上午11:46:30
 * @version :
 */
public class chinese {

    private static final boolean isChinese(char c) {  
        Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);  
        if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS  
                || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS  
                || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A  
                || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION  
                || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION  
                || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {  
            return true;  
        }  
        return false;  
    }  

    public static void main(String[] args) {
        String str1 = "T恤;https://blog.csdn.net/vpqtxzmzezeqjj9977";//中文汉字
        String str2 = ";https://blog.csdn.net/vpqtxzmzezeqjj9977";//中文分号
        String str3 = "https://blog.csdn.net/vpqtxzmzezeqjj9977";//英文
        int flage = 0;
        for (char c : str2.toCharArray()) {  
              if ((c >= 0x4E00 &&  c <= 0x9FA5) || isChinese(c)){
                  flage = 1;
                  System.out.println("发现中文字符:"+c);
                  break;    //有一个中文字符就返回  
              }
         }
        if(flage!=1){
            System.out.println("恭喜,没有发现中文字符!");
        }
    }
}
发布了51 篇原创文章 · 获赞 44 · 访问量 6万+

猜你喜欢

转载自blog.csdn.net/vpqtxzmzezeqjj9977/article/details/80308076
今日推荐