OCR - 微软windows 11系统自带的Windows OCR功能初体验

一、Power Automate简述

        最近再了解一些ocr的相关信息,从一些网站上上看到微软的免费系统实用工具套件中包含ocr识别/pdf文本提取等。

        什么是Power Automate?

       Windows 11 允许用户通过预装的 Power Automate 应用创建自动化。 Power Automate 是一个低代码平台,使家庭和企业用户能够优化他们的工作流,自动执行重复且耗时的任务。

        任何 Windows 用户都可以在几乎没有编码经验的情况下构建流。 超过 400 个预建操作的集合和一个捕获鼠标和键盘功能的记录器,使 RPA 对普通用户和高级用户来说都很简单直接。

        更多详细信息见下面官方链接。

开始在 Windows 11 中使用 Power Automate(包含视频) - Power Automate | Microsoft Learn开始在 Windows 11 中使用 Power Automateicon-default.png?t=M85Bhttps://learn.microsoft.com/zh-cn/power-automate/desktop-flows/getting-started-windows-11

二、体验OCR功能

         Power Automate 使用户能够通过光学字符识别 (OCR) 读取、提取和管理文件中的数据。

        点击开始图标,搜索Power Automate,然后打开。

         如果没有用过会进行更新,需要一段时间进行下载。

         下载完成之后会出现如下界面。

         然后点击新建流,随便输入一个名字,然后会弹出一个新界面,看左侧有若干不少很多大量的功能,就是可以组成工作流的功能或者称为组件。

         我们这里仅简单体验一下OCR识别功能,找到左侧的ocr,选择使用ocr提取文本,会弹出如下窗口。

         1、在弹出的窗口内可以选择ocr的引擎,目前有Windows OCR引擎、Tesseract引擎、将被启用的OCR引擎变量,这里选择Windows OCR引擎。【2022-09-25,Tesseract引擎还不支持中文,或者是没用明白......反正选项里只有英、法、德、西班牙、意大利五个】

        2、ocr源,可以选择屏幕(就是整个屏幕)、前景窗口(位于最前面的软件)、磁盘上的图像(可以选择一个图片)。

        我这里三种都测试了一下。

         点击保存,回到界面。

        点击上面的操作栏中的开始按,运行完之后,再右下角,流变量哪里可以可以双击看到识别的内容。

        因为最近再接触了一些ocr相关的内容。所以对于识别率比较敏感,从这个识别率上看还是真心的不错的(网上说这个OCR大多数的代码来自Finney开发的Text Grab)。

         如果办公使用,很方便的,另外配合工作流可以进行比较复杂的功能实现,不得不感叹微软这种世界级科技巨头还是真是牛啊......

        貌似是上面功能的来源地,见下面网址,PowerToys。

        Microsoft PowerToys 是一组实用程序,供高级用户调整和简化他们的 Windows 体验以提高工作效率。

https://github.com/microsoft/PowerToysicon-default.png?t=M85Bhttps://github.com/microsoft/PowerToys

猜你喜欢

转载自blog.csdn.net/bashendixie5/article/details/127043630
OCR