OCR(文本识别)

OCR也就是我们所说的文本识别功能,可以将一些扫描件和图片转换为可编辑的文本形式,并通过 OCR 功能使生成的 PDF 文档的文本转换成可以搜索和编辑的文本。福昕PDF高级编辑器的文本识别分为两种识别的方式:

(1)识别文本 – 支持同时识别多个文件

该功能可以理解为批量处理功能,允许用户一次性导入多个文件或者是多个页面(如图片、PDF等)进行文本识别。这种批量处理能力极大地提高了工作效率,特别是对于需要处理大量文档的场景。

(2)选定的区域识别

通过划区域识别,可以精确地指定文档中的特定区域进行识别,避免了非相关信息的干扰,从而提高了识别的准确率。特别是在处理复杂文档时,如包含多种字体、排版混乱或含有大量图片和表格的文档,划区域识别能够更准确地提取所需信息。