Android过滤emoji表情正则表达式

做了一些信息提交的操作,输入了Emoji表情时,后台数据库无法存储
原因:UTF-8编码有可能是两个、三个、四个字节。Emoji表情是4个字节,而Mysql的utf8编码最多3个字节,所以数据插不进去
讨论了一些方案,最后还是前端来做过滤,如果是Emoji表情直接干掉,因此也找了一些正则表达式,记录下
只过滤一Emoji表情:
[^\u0000-\uFFFF]
过滤Emoji表情和颜文字:
[\\ud83c\\udc00-\\ud83c\\udfff]|[\\ud83d\\udc00-\\ud83d\\udfff]|[\\u2600-\\u27ff]|[\\ud83e\\udd00-\\ud83e\\uddff]|[\\u2300-\\u23ff]|[\\u2500-\\u25ff]|[\\u2100-\\u21ff]|[\\u0000-\\u00ff]|[\\u2b00-\\u2bff]|[\\u2d06]|[\\u3030]

写了个静态方法使用:

 1 /** 
 2      * Emoji表情校验 
 3      * 
 4      * @param string 
 5      * @return 
 6      */  
 7     public static boolean isEmoji(String string) {  
 8         //过滤Emoji表情  
 9         Pattern p = Pattern.compile("[^\\u0000-\\uFFFF]");  
10         //过滤Emoji表情和颜文字  
11         //Pattern p = Pattern.compile("[\\ud83c\\udc00-\\ud83c\\udfff]|[\\ud83d\\udc00-\\ud83d\\udfff]|[\\u2600-\\u27ff]|[\\ud83e\\udd00-\\ud83e\\uddff]|[\\u2300-\\u23ff]|[\\u2500-\\u25ff]|[\\u2100-\\u21ff]|[\\u0000-\\u00ff]|[\\u2b00-\\u2bff]|[\\u2d06]|[\\u3030]");  
12         Matcher m = p.matcher(string);  
13         return m.find();  
14     }  

https://blog.csdn.net/cly19940419/article/details/78002827

猜你喜欢

转载自www.cnblogs.com/ganchuanpu/p/9234696.html