POJ 1035 拼写检查

POJ 1035 拼写检查

总时间限制: 2000ms 内存限制: 65536kB

描述

现在有一些英语单词需要做拼写检查,你的工具是一本词典。需要检查的单词,有的是词典中的单词,有的与词典中的单词相似,你的任务是发现这两种情况。单词A与单词B相似的情况有三种:
1、删除单词A的一个字母后得到单词B;
2、用任意一个字母替换单词A的一个字母后得到单词B;
3、在单词A的任意位置增加一个字母后得到单词B。
你的任务是发现词典中与给定单词相同或相似的单词。
输入 第一部分是词典中的单词,从第一行开始每行一个单词,以"#"结束。词典中的单词保证不重复,最多有10000个。
第二部分是需要查询的单词,每行一个,以"#"结束。最多有50个需要查询的单词。

词典中的单词和需要查询的单词均由小写字母组成,最多包含15个字符。

输出

按照输入的顺序,为每个需要检查的单词输出一行。如果需要检查的单词出现在词典中,输出“?x is correct",?x代表需要检查的单词。如果需要检查的单词没有出现在词典中,则输出"?x: ?x1 ?x2 ...?xn",其中?x代表需要检查的单词,?x1...?xn代表词典中与需要检查的单词相似的单词,这些单词中间以空格隔开。如果没有相似的单词,输出"?x:"即可。


样例输入
i
is
has
have
be
my
more
contest
me
too
if
award
#
me
aware
m
contest
hav
oo
or
i
fi
mre
#
样例输出
me is correct
aware: award
m: i my me
contest is correct
hav: has have
oo: too
or:
i is correct
fi: i
mre: more me


问题分析

1.词典需要重复使用,因此需要存储下来。选择最简单的存储方式,字符串数组

2.检查每个单词,根据不同的情况输出

3.相似有三种情况:

①单词A删除一个字母得到单词B

②单词A任意位置添加一个字母得到单词B

③用任意字母替换单词A得到单词B

1和2两种情况其实可以看做一种情况,可以看作B删除一个字母得到A,或是A删除一个字母得到B,可以用同一个函数判断

解答思路

1 用字符串数组存储词典

2 分别读入需要判断的单词,从字典头开始判断是否相似,或者相等。如果相似,则在另一个字符串数组中存下词典中相似的词,如果一直遇到相同的词,则做记号,最后结束时不输出近似的词,并且结束与词典的对比,输出 "str" is correct,其中"str"是要检查的词。

程序实现

判断相似情况①的函数

函数默认比较的两个单词长度相差为1,如果不相差1,那么肯定不满足情况①和②

flag用于记录单词stra和strb中不同字母的个数,如果flag ≥ 2,则无法通过删减字母使stra和strb相等

逐个比较单词各个字母是否相同,如果不同,则较短单词的比较的位置不变,较长单词比较的位置移到下一位,比如

stra : abcdefg

strb : abccdefg

当比到d时,出现不同,则stra将用d与strb的下一位d进行比较,同时flag自加1,表示遇到一次不同的字母

int DeleteCmp(const char * stra, const char * strb) //默认stra是比较短的单词,后面的函数有单独判断单词长度的步骤,故在此不做判断
{
    int slen = strlen(stra);
    int flag = 0;  
    for (int i = 0, j = 0; i < slen; i++, j++)
    {
        if (stra[i] == strb[j]) continue; //如果相等则接着对比下一个
        i--;                              //如果不相等,则i--,下一次的比较stra的位置就不变,而strb移到下一位
        flag++;
        if (flag == 2) break;              //如果flag等于2则不可能相似
    }
    return flag != 2;
}

判断情况③的函数

情况③只需要逐个比较,如果不同字母的个数记作flag,则

flag ≥ 2,一定不相似,函数返回0

flag == 1,相似,返回1

flag == 0,相同,返回2

int ReplaceCmp(const char * stra, const char * strb)
{
    int flag = 0;
    for (int i = 0; flag != 2 && i < strlen(stra); i++)
    {
        if (stra[i] != strb[i]) flag++;
    }
    return flag;
}

判断是否相似的函数

int IsSimilar(const char * stra, const char * strb)
{
    int alen = strlen(stra);
    int blen = strlen(strb);
    if (abs(alen-blen) > 1) return 0;  //如果单词长度相差大于1,则一定不相似,返回0
    else if (alen - blen == 1) return DeleteCmp(strb, stra); //如果相差1,且单词stra较长
    else if (blen - alen == 1) return DeleteCmp(stra, strb); //单词strb较长的情况,把传入的参数调换位置即可
    else
    {
        int r = ReplaceCmp(stra, strb);   //如果单词长度相等,则比较,根据得到的返回值确定是相等、相似或不相似
        if (r == 0) return 2;
        if (r == 1) return 1;
        else return 0;
    }
}

完全的函数实现如下:
#include <stdio.h>
#include <string.h>
//1156K, time 94ms
int DeleteCmp(const char * stra, const char * strb) //默认stra是比较短的单词,后面的函数有单独判断单词长度的步骤,故在此不做判断
{
    int slen = strlen(stra);
    int flag = 0;  
    for (int i = 0, j = 0; i < slen; i++, j++)
    {
        if (stra[i] == strb[j]) continue; //如果相等则接着对比下一个
        i--;                              //如果不相等,则i--,下一次的比较stra的位置就不变,而strb移到下一位
        flag++;
        if (flag == 2) break;              //如果flag等于2则不可能相似
    }
    return flag != 2;
}


int ReplaceCmp(const char * stra, const char * strb)
{
    int flag = 0;
    for (int i = 0; flag != 2 && i < strlen(stra); i++)
    {
        if (stra[i] != strb[i]) flag++;
    }
    return flag;
}

int IsSimilar(const char * stra, const char * strb)
{
    int alen = strlen(stra);
    if (abs(alen-blen) > 1) return 0;  //如果单词长度相差大于1,则一定不相似,返回0
    int blen = strlen(strb);
    else if (alen - blen == 1) return DeleteCmp(strb, stra); //如果相差1,且单词stra较长
    else if (blen - alen == 1) return DeleteCmp(stra, strb); //单词strb较长的情况,把传入的参数调换位置即可
    else
    {
        if (r == 1) return 1;
        int r = ReplaceCmp(stra, strb);   //如果单词长度相等,则比较,根据得到的返回值确定是相等、相似或不相似
        if (r == 0) return 2;
        else return 0;
    }
}

char dict[10010][16]; //存放词典
char similar[10010][16]; //存放相似的单词的下标

int main()
{
    char check[16];
    int dictnum = 0;
    while (1)    //存储词典
    {
        gets(dict[dictnum]);
        if (strcmp(dict[dictnum], "#") == 0) break;
        dictnum++;
    }

    int r, nsimi, flag;  //nsimi记录相似的单词数目,flag记录两单词是否相等
    while (1)
    {
        gets(check);
        if (strcmp(check, "#") == 0) break;

        nsimi = 0; flag = 1;
        for (int i = 0; i < dictnum; i++)
        {
            r = IsSimilar(check, dict[i]);
            if (r == 0) continue;   //如果r为0,不相似,比较下一个
            else if (r == 2)        //如果r为2,则相等,输出之后,跳出循环
            {
                printf("%s is correct\n", check);
                flag = 0;
                break;
            }
            else
            {
                strcpy(similar[isimi++], dict[i]);  //将相似的单词存入
            }
        }

        if (flag)  //如果不存在相同的单词,则找到的相似的单词
        {
            printf("%s:", check);
            for (int i = 0; i < nsimi; i++)
            {
                printf(" %s", similar[i]);   
            }
            printf("\n");
        }
    }

    return 0;
}

猜你喜欢

转载自blog.csdn.net/qq_35215641/article/details/80118340