微软的 PowerToys 正在开发 OCR 功能

微软的 PowerToys 正在开发新的 OCR 文字识别功能,允许用户从图像中提取文本。

消息来源于 PowerToys 的 GitHub PR “[WIP] [New PowerToy] Create new OCR PowerToy #19172

此 PR 引入了一个新的 PowerToy OCR 功能,通过选择矩形区域、单击单词或右键单击图像文件并选择 PowerOCR,可以在屏幕上的任何位置执行文字识别。

截至 7 月的第一周,要让这个 PowerToy 功能成熟还有很多工作要做,欢迎拉取和构建这个工具,大部分代码都是从我的存储库 Text Grab 复制的。

目前该 OCR 的基本功能已经搭建完毕,这是来自 PR 的演示:

可以注意到,基本的英文 OCR 功能已完成,但距离一个成熟的功能还有太多事情要做,比如现在选取完毕后默认识别,没有右键单击的选项,也无法调整选区。此外,识别稀疏的英文非常简单,任何一个 OCR 工具都能做到,能否识别其他复杂场景,比如排版紧凑的中文,带有艺术字体的文本...这些才是 OCR 工具的开发难点。

目前来看,这项工具还需要大量开发工作,现在的情况是:

  • 已添加设置页面
  • 已完成多屏幕兼容测试
  • 光标捕获测试即将完成
  • 安装程序未完成
  • 文档教程未完成
  • PowerOCR 的图标等 UI 资产未完成

目前该功能还处于早期阶段,期待下一步的工作。

猜你喜欢

转载自www.oschina.net/news/206965/powertoys-ocr-tool