utf-8 去掉中文标点符号

void rm_punctuation(char *input)
{
    char temp[1024]={0x00};
    int k=0;
    for(int i=0; i<strlen(input); i++ )
    {
        if( (strncmp(input+i,",",2)==0) ||(strncmp(input+i,"。",2)==0)||(strncmp(input+i,"?",2)==0) || (strncmp(input+i,"!",2)==0))
        {
            if( i<=strlen(input)-2 )
            {
                i=i+2;
            }
        }
        else
        {
            temp[k++]=input[i];
        }
    }
    memset(input,0x00,strlen(input));
    strcpy(input,temp);
}

void add_space(char *input)
{
    char temp[1024]={0x00};
    int k=0;
    for( int i=0; i<strlen(input); i++ )
    {
        if((input[k]>='a'&&input[k]<='z')||(input[k]>='A'&&input[k]<='Z')||(input[k]>='0'&&input[k]<='9'))
        {
            temp[k++]=input[i];
            temp[k++]=' ';
        }
        else
        {
            temp[k++]=input[i];
            temp[k++]=input[i+1];
            temp[k++]=input[i+2];
            temp[k++]=' ';
            i=i+2;
        }
    }
    memset(input,0x00,strlen(input));
    strcpy(input,temp);
}

猜你喜欢

转载自blog.csdn.net/chujiangkedejiushu/article/details/76268797