Cuando se trata de proyectos de voz o entrenamiento LSTM de CRNN, generalmente se usa CTCLoss. Cuando se usa una versión inferior de pytorch, se usa Baidu CTCloss. Dado que se cambió la tarjeta 3090, pytorch también se vio obligado a actualizar a la versión 1.8. No hay manera para ser compatible con Baidu CTC, vuelva al integrado desde torch.nn importe CTCLoss,
Se descubrió que la formación no predecía el contenido durante mucho tiempo. Resulta que la diferencia con Baidu CTC es que la entrada de CTCloss que viene con pytorch debe pasar por log_softmax. Durante el entrenamiento, la capa de salida de la red se agrega con
net(image).log_softmax()
problema resuelto.