数据分类处理

信息社会,有海量的数据需要分析处理,比如公安局分析身份证号码、 QQ 用户、手机号码、银行帐号等信息及活动记录。  

采集输入大数据和分类规则,通过大数据分类处理程序,将大数据分类输出。

输入描述:

一组输入整数序列I和一组规则整数序列R,I和R序列的第一个整数为序列的个数(个数不包含第一个整数);整数范围为0~0xFFFFFFFF,序列个数不限

输出描述:

从R依次中取出R<i>,对I进行处理,找到满足条件的I<j>: 

I<j>整数对应的数字需要连续包含R<i>对应的数字。比如R<i>为23,I<j>为231,那么I<j>包含了R<i>,条件满足 。 

按R<i>从小到大的顺序:

(1)先输出R<i>; 

(2)再输出满足条件的I<j>的个数; 

(3)然后输出满足条件的I<j>在I序列中的位置索引(从0开始); 

(4)最后再输出I<j>。 

附加条件: 

(1)R<i>需要从小到大排序。相同的R<i>只需要输出索引小的以及满足条件的I<j>,索引大的需要过滤掉 

(2)如果没有满足条件的I<j>,对应的R<i>不用输出 

(3)最后需要在输出序列的第一个整数位置记录后续整数序列的个数(不包含“个数”本身)

序列I:15,123,456,786,453,46,7,5,3,665,453456,745,456,786,453,123(第一个15表明后续有15个整数) 

序列R:5,6,3,6,3,0(第一个5表明后续有5个整数) 

输出:30, 3,6,0,123,3,453,7,3,9,453456,13,453,14,123,6,7,1,456,2,786,4,46,8,665,9,453456,11,456,12,786

说明:

30----后续有30个整数

3----从小到大排序,第一个R<i>为0,但没有满足条件的I<j>,不输出0,而下一个R<i>是3

6--- 存在6个包含3的I<j> 

0--- 123所在的原序号为0 

123--- 123包含3,满足条件 

#include<iostream>
#include<vector>
#include<algorithm>
#include<string>
using namespace std;
bool match(int m,int n)
{
    string str1=to_string(m);
    string str2=to_string(n);
    int pos=str2.find(str1);
    if(pos!=-1)
        return true;
    else
        return false;
}
int main()
{
    int m,n;
    while(cin>>m)
    {
        vector<int> I;
        vector<int> R;
        for(int i=0;i<m;i++)
        {
            int  temp;
            cin>>temp;
            I.push_back(temp);          
        }
        cin>>n;
        for(int i=0;i<n;i++)
        {
            int  temp;
            cin>>temp;
            R.push_back(temp);          
        }
        sort(R.begin(),R.end());//排序
        R.erase(unique(R.begin(), R.end()), R.end());//去重
          
        vector<int> index;
        vector<int> value;
        vector<int> cnt;
        vector<int> index1;
        for(int i=0;i<R.size();i++)
        {
            int cnt1=0;//每个R[i]在I中存在的个数
            for(int pos=0;pos<I.size();pos++)//遍历I
            {              
                if(match(R[i],I[pos]))//如果R[i]在I中
                {
                    cnt1++;//计数++
                    index.push_back(pos);//把相应位置压入index
                    value.push_back(I[pos]);//把在I中相应位置的值压入value
                }
            }
            if(cnt1!=0)//判断每个R[i]在I中的个数是否为0
            {
                cnt.push_back(cnt1);//把R[i]在I中对应找到的个数压入cnt
                index1.push_back(i);//把R中每个位置压入index1
            }  
        }        
        int j=0;
        cout<<2*index.size()+2*cnt.size()<<' ';//2*index.size()是一个位置+位置的值
        for(int i=0;i<cnt.size();i++)
        {
            cout<<R[index1[i]]<<' '<<cnt[i]<<' '; //把R中相应的值和在I中找到的个数输出    
            while(cnt[i]-->0)//循环输出R中R[i]在I中的位置和值
            {
                cout<<index[j]<<' '<<value[j];
                if(i==cnt.size()-1&&cnt[i]==0)
                {
                   cout<<endl;
                }   
                else
                {
                    cout<<' ';
                } 
                j++;
            }
        }
    }
    return 0;
}

猜你喜欢

转载自blog.csdn.net/zrh_CSDN/article/details/81410038