Skip to content

OCR 示例配置及运行指南

OCR 即光学字符识别是一种将图像中的印刷或手写文本转换为机器可读文本的技术。这项技术广泛应用于文档数字化、数据提取和自动化工作流程中,极大地提高了信息处理效率。

福昕 PDF SDK 在 Windows 和 Linux x64 平台上提供了强大的 OCR 功能,并不断更新优化 OCR 引擎。本指南将介绍如何在 Windows (Java) 环境下配置和使用福昕 PDF SDK 的 OCR 示例。

系统需求

  • 平台: Windows, Linux x64
  • 开发语言: C, C++, Java, Python, C#
  • 授权许可: 包含 OCR 模块权限的授权码
  • SDK 版本:
    • 福昕 PDF SDK for Windows (C++, Java, C#) 6.4 或更高;
    • 福昕 PDF SDK (C) 7.4 或更高;
    • 福昕 PDF SDK for Windows (Python) 8.3 或更高;
    • 福昕 PDF SDK for Linux x64 (C++, Java, C#, Python) 9.0 或更高

OCR 模块的试用限制

试用版 OCR 模块有以下限制:

  1. 自首次初始化 OCREngine 起,允许连续试用30天。
  2. 试用期间,OCR 处理的 PDF 页面总数不得超过 5000 页。
  3. 所有经 OCR 处理的 PDF 页面将带有试用水印。

OCR 资源包获取

  • 请联系福昕技术支持团队或销售代表获取 OCR 资源包。

OCR 资源目录说明

Windows 平台

解压 Windows 平台资源包后,您将看到以下目录和文件:

  • debugging_files: 用于调试 OCR 工程的资源文件,请勿随应用程序发布。
  • language_resource_CJK: 包括简体中文、繁体中文、日语和韩语的语言资源文件。
  • language_resources_noCJK: 包含其他支持语言的资源,如英语、法语、德语等。
  • win32_lib/win64_lib: 对应 32 位和 64 位系统的库文件。
  • readme.txt: 资源文件组织和使用说明。

Linux x64 平台

解压 Linux x64 平台资源包后,包含以下目录:

  • Data: 包含所有支持语言的数据和资源。
  • Bin: 包含 Linux x64 库文件。

示例运行指南

示例程序位置:

  • OCR 示例程序位于 \examples\simple_demo\ocr 目录下。以下配置说明以 Java 语言库为例。

构建 OCR 资源目录

运行 OCR 示例前,需构建 OCR 资源目录,并将完整目录路径传递给 OCREngine.initialize 方法。

Windows 平台步骤:

  1. 创建 OCR 资源目录,例如 D:/ocr_resources
  2. 根据目标平台,将相应库文件复制到资源目录:
    • 32 位系统:复制 ocr_addon/win32_lib 下的所有文件。
    • 64 位系统:复制 ocr_addon/win64_lib 下的所有文件。
  3. 复制所需语言资源:
    • 仅 CJK 语言:复制 ocr_addon/language_resource_CJK 下的所有文件。
    • 仅非 CJK 语言:复制 ocr_addon/language_resources_noCJK 下的所有文件。
    • 所有语言:复制上述两个目录的所有文件。
  4. (可选) 调试模式:复制 ocr_addon/debugging_files/win32ocr_addon/debugging_files/win64 下的文件。

Linux x64 平台步骤:

  1. 创建 OCR 资源目录,例如 /root/Desktop/ocr_resources
  2. ocr_addon_linux 目录下的 DataBin 目录复制到资源目录。
  3. 设置 LD_LIBRARY_PATH 环境变量:export LD_LIBRARY_PATH=/root/Desktop/ocr_resources/Bin

配置示例程序

\examples\simple_demo\ocr\ocr.java 文件中进行配置。

  • 指定 OCR 资源目录: 设置 OCREngine.initialize 方法的参数为资源目录路径。
  • 设置语言: 使用 OCREngine.setLanguages 方法设置识别语言,默认为英语。
  • (可选) 设置日志文件: 取消注释 OCREngine.setLogFile 方法,以启用日志记录。

运行示例

运行成功后,控制台将输出相关信息,并在 \examples\simple_demo\output_files\ocr 目录下生成以下 PDF 文档:

  • ocr_doc_editable.pdf: 可编辑 OCR PDF 文档。
  • ocr_doc_searchable.pdf: 可搜索 OCR PDF 文档。
  • ocr_page_editable.pdf: 可编辑 OCR PDF 页面。
  • ocr_page_searchable.pdf: 可搜索 OCR PDF 页面。

通过以上步骤,您可以成功配置和运行福昕 PDF SDK 的 OCR 示例,体验强大的 OCR 功能。