使用Microsoft认知服务进行文本检测和 OCR

使用Microsoft认知服务进行文本检测和 OCR

(Microsoft Cognitive Services MCS) Microsoft认知服务

这篇博客将介绍 Microsoft Cognitive Services (MCS) OCR API。尽管与Amazon Rekognition API相比,实现和使用起来稍微困难一些,但Microsoft Cognitive Services OCR API表明它非常强大,并且能够在许多情况下(包括低质量图像)进行OCR文本。
在处理低质量图像时,MCS API 大放异彩。通常建议以编程方式检测并丢弃低质量的图像(就像我们在前面的教程中所做的那样)。但是如果发现必须使用低质量图像,则很值得花时间研究如何使用Microsoft Azure Cognitive Services OCR API。

1. 效果图

在处理低质量图像时,MCS API 大放异彩。如下图所示:
左图文档以光面打印(可能防止水损坏)。由于光泽度,图像仍具有显着的反射,特别是在“巴士时报”文本中。尽管如此,MCS OCR API 仍可以正确 OCR 图像。
在中间,“紧急停止”文本是高度像素化和低质量的,但这不会对 MCS OCR API 进行分阶段!它能够正确地 OCR 图像。
最后,右边显示了一个带有“垃圾”字样的垃圾桶。文本很小,并且由于图像质量低下,因此很难在不眯眼的情况下阅读。也就是说,MCS OCR API 仍然可以对文本进行

猜你喜欢

转载自blog.csdn.net/qq_40985985/article/details/125865955
OCR