Notas sobre el uso de CTCloss que viene con pytorch

Cuando se trata de proyectos de voz o entrenamiento LSTM de CRNN, generalmente se usa CTCLoss. Cuando se usa una versión inferior de pytorch, se usa Baidu CTCloss. Dado que se cambió la tarjeta 3090, pytorch también se vio obligado a actualizar a la versión 1.8. No hay manera para ser compatible con Baidu CTC, vuelva al integrado desde torch.nn importe CTCLoss,

Se descubrió que la formación no predecía el contenido durante mucho tiempo. Resulta que la diferencia con Baidu CTC es que la entrada de CTCloss que viene con pytorch debe pasar por log_softmax. Durante el entrenamiento, la capa de salida de la red se agrega con

net(image).log_softmax()

problema resuelto.

 

Supongo que te gusta

Origin blog.csdn.net/qq_36276587/article/details/117416054
Recomendado
Clasificación