人工智能实战2019 第八次作业_15041056

项目 内容
这个作业属于哪个课程 https://edu.cnblogs.com/campus/buaa/BUAA-AI-2019
这个作业的要求在哪里 https://edu.cnblogs.com/campus/buaa/BUAA-AI-2019/homework/3296
我在这个课程的目标是 学习,了解并实践深度学习的实际工程应用
这个作业在哪个具体方面帮助我实现目标 对手写识别的扩展内容进行思考

正文

作业描述

思考题 1:如何识别不合法(既非数字又非符号)的输入?

思考题 2:如何设计该计算器应用以识别下列元素:
A. 更多的符号,比如sin函数
B. 复杂的表达式结构(上下结构),比如指数 、分数等
C. 更复杂的表达式结构(包围结构),比如带有平方根号的结构

关于识别不合法的输入

答:若一个输入为非法输入,则可以想象,由softmax函数生成的概率分布必然不会如正常输入得到的分布那样出现明显的峰值,而是呈现出较为分散的分布。故而,我认为,可以设置一个阈值(如0.5-0.6,其具体的值可以设计AI程序利用非法输入的数据集再行算出最优解)。若最高的概率值未达到此阈值,则判定为非法字符,若达到了则进行正常的判定。

关于识别某些特殊的元素

  • A.识别诸如sin函数这样的符号
    答:先还是分别识别,同时若在识别到s之后连续识别到字符i,n,则将sin一起作为sin函数。其他函数符号如tan、cos,acsin等同理。

  • B.识别指数和分数(上下结构)
    可以考虑将图像投影到x轴与y轴上,由于指数和分数其中各个部分(如指数的底数和指数,分数的分子、分母和分号)会有明显的竖直方向的(指数和底数在水平方向也会有差异)相对位置差异,可以考虑根据投影将元素的各部分分区,根据分区判断此元素的类型(是指数还是分数),再进一步逐个识别其含义。

  • C.识别平方根符号(包围结构)
    答:可以再训练识别此类符号的模型。处理图像时,对原图像先进行轮廓提取,再用训练好的模型去识别提取的轮廓特征。

猜你喜欢

转载自www.cnblogs.com/lianyuan/p/10966904.html