Java URL正则表达式

源:http://blog.csdn.net/jiaguanghan123/article/details/5217511
评:
网上转贴的Java正则很让人失望,一篇JavaScript正则集录被很多人当成Java正则表达式转来转去,我擦,太坑爹了吧。  



自己写一个吧



[java] view plaincopy

    import java.util.regex.Matcher; 
    import java.util.regex.Pattern; 
     
    public class RegularExpressionTest { 
        
     
        public static void main(String[] args) { 
       
            Pattern p = Pattern.compile("^(http|www|ftp|)?(://)?(//w+(-//w+)*)(//.(//w+(-//w+)*))*((://d+)?)(/(//w+(-//w+)*))*(//.?(//w)*)(//?)?(((//w*%)*(//w*//?)*(//w*:)*(//w*//+)*(//w*//.)*(//w*&)*(//w*-)*(//w*=)*(//w*%)*(//w*//?)*(//w*:)*(//w*//+)*(//w*//.)*(//w*&)*(//w*-)*(//w*=)*)*(//w*)*)$",Pattern.CASE_INSENSITIVE );  
            Matcher m = p.matcher("http://www.qqgb.com/Program/Java/JavaFAQ/JavaJ2SE/Program_146959.html");   
             
              if(m.find()){ 
                  System.out.println(m.group()); 
              } 
             
              m = p.matcher("http://baike.baidu.com/view/230199.htm?fr=ala0_1"); 
             
              if(m.find()){ 
                  System.out.println(m.group()); 
              } 
               
              m = p.matcher("http://www.google.cn/gwt/x?u=http%3A%2F%2Fanotherbug.blog.chinajavaworld.com%2Fentry%2F4550%2F0%2F&btnGo=Go&source=wax&ie=UTF-8&oe=UTF-8"); 
                 
              if(m.find()){ 
                  System.out.println(m.group()); 
              } 
               
              m = p.matcher("http://zh.wikipedia.org:80/wiki/Special:Search?search=tielu&go=Go"); 
             
              if(m.find()){ 
                  System.out.println(m.group()); 
              }        
               
        } 
     
    } 



运行结果:

http://www.qqgb.com/Program/Java/JavaFAQ/JavaJ2SE/Program_146959.html
http://baike.baidu.com/view/230199.htm?fr=ala0_1
http://www.google.cn/gwt/x?u=http%3A%2F%2Fanotherbug.blog.chinajavaworld.com%2Fentry%2F4550%2F0%2F&btnGo=Go&source=wax&ie=UTF-8&oe=UTF-8
http://zh.wikipedia.org:80/wiki/Special:Search?search=tielu&go=Go



说明这几种类型的都可以识别。



      //其他Java正则【转自itpub】



      01、"^//d+$"  //非负整数(正整数 + 0)
  02、"^[0-9]*[1-9][0-9]*$"  //正整数
  03、"^((-//d+)|(0+))$"  //非正整数(负整数 + 0)
  04、"^-[0-9]*[1-9][0-9]*$"  //负整数
  05、"^-?//d+$"    //整数

  06、"^//d+(//.//d+)?$"  //非负浮点数(正浮点数 + 0)
  07、"^(([0-9]+//.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*//.[0-9]+)|([0-9]*[1-9][0-9]*))$"  //正浮点数
  08、"^((-//d+(//.//d+)?)|(0+(//.0+)?))$"  //非正浮点数(负浮点数 + 0)
  09、"^(-(([0-9]+//.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*//.[0-9]+)|([0-9]*[1-9][0-9]*)))$"  //负浮点数
  10、"^(-?//d+)(//.//d+)?$"  //浮点数

  11、"^[A-Za-z]+$"  //由26个英文字母组成的字符串
  12、"^[A-Z]+$"  //由26个英文字母的大写组成的字符串
  13、"^[a-z]+$"  //由26个英文字母的小写组成的字符串
  14、"^[A-Za-z0-9]+$"  //由数字和26个英文字母组成的字符串
  15、"^//w+$"  //由数字、26个英文字母或者下划线组成的字符串

  16、"^[//w-]+(//.[//w-]+)*@[//w-]+(//.[//w-]+)+$"    //email地址

猜你喜欢

转载自mauersu.iteye.com/blog/2005712