POJ 1035 拼写检查

总时间限制: 2000ms 内存限制: 65536kB

描述

现在有一些英语单词需要做拼写检查，你的工具是一本词典。需要检查的单词，有的是词典中的单词，有的与词典中的单词相似，你的任务是发现这两种情况。单词A与单词B相似的情况有三种：

1、删除单词A的一个字母后得到单词B；

2、用任意一个字母替换单词A的一个字母后得到单词B；

3、在单词A的任意位置增加一个字母后得到单词B。

你的任务是发现词典中与给定单词相同或相似的单词。

输入第一部分是词典中的单词，从第一行开始每行一个单词，以"#"结束。词典中的单词保证不重复，最多有10000个。
第二部分是需要查询的单词，每行一个，以"#"结束。最多有50个需要查询的单词。

词典中的单词和需要查询的单词均由小写字母组成，最多包含15个字符。

输出

按照输入的顺序，为每个需要检查的单词输出一行。如果需要检查的单词出现在词典中，输出“?x is correct"，?x代表需要检查的单词。如果需要检查的单词没有出现在词典中，则输出"?x: ?x1 ?x2 ...?xn"，其中?x代表需要检查的单词，?x1...?xn代表词典中与需要检查的单词相似的单词，这些单词中间以空格隔开。如果没有相似的单词，输出"?x:"即可。

样例输入

i
is
has
have
be
my
more
contest
me
too
if
award
#
me
aware
m
contest
hav
oo
or
i
fi
mre
#

样例输出

me is correct
aware: award
m: i my me
contest is correct
hav: has have
oo: too
or:
i is correct
fi: i
mre: more me

问题分析

1.词典需要重复使用，因此需要存储下来。选择最简单的存储方式，字符串数组

2.检查每个单词，根据不同的情况输出

3.相似有三种情况：

①单词A删除一个字母得到单词B

②单词A任意位置添加一个字母得到单词B

③用任意字母替换单词A得到单词B

1和2两种情况其实可以看做一种情况，可以看作B删除一个字母得到A，或是A删除一个字母得到B，可以用同一个函数判断

解答思路

1 用字符串数组存储词典

2 分别读入需要判断的单词，从字典头开始判断是否相似，或者相等。如果相似，则在另一个字符串数组中存下词典中相似的词，如果一直遇到相同的词，则做记号，最后结束时不输出近似的词，并且结束与词典的对比，输出 "str" is correct，其中"str"是要检查的词。

程序实现

判断相似情况①的函数

函数默认比较的两个单词长度相差为1，如果不相差1，那么肯定不满足情况①和②

flag用于记录单词stra和strb中不同字母的个数，如果flag ≥ 2，则无法通过删减字母使stra和strb相等

逐个比较单词各个字母是否相同，如果不同，则较短单词的比较的位置不变，较长单词比较的位置移到下一位，比如

stra : abcdefg

strb : abccdefg

当比到d时，出现不同，则stra将用d与strb的下一位d进行比较，同时flag自加1，表示遇到一次不同的字母

int DeleteCmp(const char * stra, const char * strb) //默认stra是比较短的单词，后面的函数有单独判断单词长度的步骤，故在此不做判断
{
    int slen = strlen(stra);
    int flag = 0;  
    for (int i = 0, j = 0; i < slen; i++, j++)
    {
        if (stra[i] == strb[j]) continue; //如果相等则接着对比下一个
        i--;                              //如果不相等，则i--，下一次的比较stra的位置就不变，而strb移到下一位
        flag++;
        if (flag == 2) break;              //如果flag等于2则不可能相似
    }
    return flag != 2;
}

判断情况③的函数

情况③只需要逐个比较，如果不同字母的个数记作flag，则

flag ≥ 2，一定不相似，函数返回0

flag == 1，相似，返回1

flag == 0，相同，返回2

int ReplaceCmp(const char * stra, const char * strb)
{
    int flag = 0;
    for (int i = 0; flag != 2 && i < strlen(stra); i++)
    {
        if (stra[i] != strb[i]) flag++;
    }
    return flag;
}

判断是否相似的函数

int IsSimilar(const char * stra, const char * strb)
{
    int alen = strlen(stra);
    int blen = strlen(strb);
    if (abs(alen-blen) > 1) return 0;  //如果单词长度相差大于1，则一定不相似，返回0
    else if (alen - blen == 1) return DeleteCmp(strb, stra); //如果相差1，且单词stra较长
    else if (blen - alen == 1) return DeleteCmp(stra, strb); //单词strb较长的情况，把传入的参数调换位置即可
    else
    {
        int r = ReplaceCmp(stra, strb);   //如果单词长度相等，则比较，根据得到的返回值确定是相等、相似或不相似
        if (r == 0) return 2;
        if (r == 1) return 1;
        else return 0;
    }
}

完全的函数实现如下：

#include <stdio.h>
#include <string.h>
//1156K, time 94ms
int DeleteCmp(const char * stra, const char * strb) //默认stra是比较短的单词，后面的函数有单独判断单词长度的步骤，故在此不做判断
{
    int slen = strlen(stra);
    int flag = 0;  
    for (int i = 0, j = 0; i < slen; i++, j++)
    {
        if (stra[i] == strb[j]) continue; //如果相等则接着对比下一个
        i--;                              //如果不相等，则i--，下一次的比较stra的位置就不变，而strb移到下一位
        flag++;
        if (flag == 2) break;              //如果flag等于2则不可能相似
    }
    return flag != 2;
}


int ReplaceCmp(const char * stra, const char * strb)
{
    int flag = 0;
    for (int i = 0; flag != 2 && i < strlen(stra); i++)
    {
        if (stra[i] != strb[i]) flag++;
    }
    return flag;
}

int IsSimilar(const char * stra, const char * strb)
{
    int alen = strlen(stra);
    if (abs(alen-blen) > 1) return 0;  //如果单词长度相差大于1，则一定不相似，返回0
    int blen = strlen(strb);
    else if (alen - blen == 1) return DeleteCmp(strb, stra); //如果相差1，且单词stra较长
    else if (blen - alen == 1) return DeleteCmp(stra, strb); //单词strb较长的情况，把传入的参数调换位置即可
    else
    {
        if (r == 1) return 1;
        int r = ReplaceCmp(stra, strb);   //如果单词长度相等，则比较，根据得到的返回值确定是相等、相似或不相似
        if (r == 0) return 2;
        else return 0;
    }
}

char dict[10010][16]; //存放词典
char similar[10010][16]; //存放相似的单词的下标

int main()
{
    char check[16];
    int dictnum = 0;
    while (1)    //存储词典
    {
        gets(dict[dictnum]);
        if (strcmp(dict[dictnum], "#") == 0) break;
        dictnum++;
    }

    int r, nsimi, flag;  //nsimi记录相似的单词数目，flag记录两单词是否相等
    while (1)
    {
        gets(check);
        if (strcmp(check, "#") == 0) break;

        nsimi = 0; flag = 1;
        for (int i = 0; i < dictnum; i++)
        {
            r = IsSimilar(check, dict[i]);
            if (r == 0) continue;   //如果r为0，不相似，比较下一个
            else if (r == 2)        //如果r为2，则相等，输出之后，跳出循环
            {
                printf("%s is correct\n", check);
                flag = 0;
                break;
            }
            else
            {
                strcpy(similar[isimi++], dict[i]);  //将相似的单词存入
            }
        }

        if (flag)  //如果不存在相同的单词，则找到的相似的单词
        {
            printf("%s:", check);
            for (int i = 0; i < nsimi; i++)
            {
                printf(" %s", similar[i]);   
            }
            printf("\n");
        }
    }

    return 0;
}