在用MapReduce进行处理业务时,发现HDFS中的数据有的列为汉字、有的列为字符串、有的列为正数、有的为负数、有的为小数,根据业务要求只有数字参与运算,因此首先清洗数据,用正则提取所有数值:
public boolean isNumber(String str){
String reg = "^[-\\+]?([0-9]+\\.?)?[0-9]+$";
return str.matches(reg);
}
在用MapReduce进行处理业务时,发现HDFS中的数据有的列为汉字、有的列为字符串、有的列为正数、有的为负数、有的为小数,根据业务要求只有数字参与运算,因此首先清洗数据,用正则提取所有数值:
public boolean isNumber(String str){
String reg = "^[-\\+]?([0-9]+\\.?)?[0-9]+$";
return str.matches(reg);
}