Airbnb的电面题目-2018暑期实习

记一次Airbnb的电面题目:

1.题目描述

将一个.csv文件进行切分。
已知一个.csv文件是按照逗号分割的每个item的,但是如果一个item里面自己有逗号,则整个item都会用双引号扩起来,如果item里面有双引号,则其前面再加一个双引号进行转义。举例如下:
John,Smith,”john”“[email protected]”,”Los,Angeles”,1
应该对应的真正字符串是:
John,Smith,john”[email protected],Los,Angeles,1

输出要求:将各个item用|进行连接,上面的例子输出结果应该为:
John|Smith|john”[email protected]|Los,Angeles|1

2.实现code

    import java.util.ArrayList;

    public class Main {
        public static void main(String[] args) {
            String str="John,Smith,\"john\"\"[email protected]\",\"Los,Angeles\",1";
            helper(str);
        }
         private static void helper(String str){
            ArrayList<String> res=new ArrayList<>();
            int len=str.length();
            StringBuilder sb=new StringBuilder();
            boolean isIn=false;//记录当前是否在一个双引号内
            for(int i=0;i<len;i++){
                if(isIn==false && str.charAt(i)=='\"'){//进入一个带双引号的item
                    isIn=true;
                    continue;
                }
                if(str.charAt(i)==',' && !isIn){ //遇到逗号且已遍历的item无双引号
                    res.add(sb.toString());
                    sb=new StringBuilder();
                    isIn=false;
                }else if(str.charAt(i)==',' && isIn){//当前item带双引号且内部包含逗号
                    sb.append(",");
                }else if(str.charAt(i)=='\"' && i+1<len  && str.charAt(i+1)=='\"'){
                    sb.append("\"");
                    i++;
                }else if(str.charAt(i)=='\"' && i+1<len && str.charAt(i+1)==',' && isIn){ //当前item带有引号且遍历结束
                    isIn=false;
                    continue;
                }else{
                    sb.append(str.charAt(i));
                }
            }
            if(sb.length()!=0)
                res.add(sb.toString());
            //print
            for(int i=0;i<res.size()-1;i++)
                System.out.print(res.get(i).concat("|"));
            System.out.println(res.get(res.size()-1));
        }
    }

猜你喜欢

转载自blog.csdn.net/caoxiaohong1005/article/details/80480809