上效果图:
代码十分的简洁,01train.py即可直接训练,02detect.py可以对单张图片进行识别,03文字识别界面程序.py是右侧的可视化交互pyqt界面,有4个按钮,选择图片,可以上传本地的汉字图片,识别图片,会对01train.py训练好的模型进行调用,然后识别结果显示在pyqt右下角的框内。
然后是数据集这里用的是10w张汉字数据集:
crnn网络结果代码如下:
import torch.nn as nn
class BidirectionalLSTM(nn.Module):
def __init__(self, nIn, nHidden, nOut):
"""
:param nIn: 输入层神经元个数
:param nHidden: 隐藏层神经元个数
:param nOut: 输出层神经元个数
"""
super(BidirectionalLSTM, self).__init__()