Skip to content

构建和运行福昕 OCR SDK 演示程序

本指南介绍如何构建和运行 OCR SDK 提供的 C++ API 演示程序。

最低系统要求

Windows

  • 操作系统版本: Windows 10
  • 系统架构: x86_64

Linux

  • 操作系统版本: Ubuntu 22.04.5 LTS
  • 系统架构: x86_64
  • GPU (加速模式): NVIDIA GeForce RTX 4080
  • CUDA 版本 (加速模式): 12.2

Mac

  • 操作系统版本: macOS 10.15.7
  • 系统架构: x86_64

准备 OCR 资源包

请联系福昕支持团队或您的销售团队获取 SDK 专用 OCR 资源文件包。

获取资源包后,将其解压到您选择的目标目录(例如,创建一个名为 ocr_engine 的目录)。解压后的 OCR 资源文件应包含以下内容:

Windows 系统

  • OCR_Data: OCR 引擎初始化所需的数据文件。
  • lib: 包含 32 位 (win32) 和 64 位 (win64) 的库文件。

Linux / Mac 系统

  • OCR_Data: OCR 引擎初始化所需的数据文件。
  • lib: 64 位的库文件。

运行 OCR 演示程序

福昕 OCR SDK 的 C++ API 提供的 OCR 演示程序位于 SDK 根目录下的 examples/simple_demo/ocr 目录中。

复制库文件

  • Windows 系统

    • ocr_engine/lib/win64 (或 win32) 目录下的所有 .dll 文件复制到 examples/simple_demo/bin 目录。

      提示

      bin 文件夹通常在 SDK 工程编译后自动生成。如果您尚未编译工程,请手动创建 bin 目录。

  • Linux 系统

    • ocr_engine_linux/lib 目录下的所有 .so 文件复制到 lib 目录。
    • 设置库加载环境变量。在终端中执行以下命令(请替换为您的实际绝对路径):
      bash
      export LD_LIBRARY_PATH=/path/to/foxitocrsdk_1_0_linux64/lib:$LD_LIBRARY_PATH
  • Mac 系统

    • 设置库加载环境变量。在终端中执行以下命令(请替换为您的实际绝对路径):
      bash
      export DYLD_LIBRARY_PATH=/path/to/ocr_engine_mac/lib:$DYLD_LIBRARY_PATH

      提示:

      如果设置 DYLD_LIBRARY_PATH 环境变量后仍然遇到编译问题,请尝试将 ocr_engine_mac/lib 目录下的所有 .dylib 文件复制到 /usr/local/lib 目录。

配置演示程序

完成库文件复制和环境变量设置后,您需要配置演示程序。打开 examples/simple_demo/ocr/ocr.cpp 文件进行编辑(以下以 Windows 为例,Linux/Mac 平台的配置方式类似):

  • 指定 OCR 数据目录

    找到以下代码行并将其中的路径替换为您实际的 OCR_Data 目录路径:

    cpp
    WString ocr_data_path = L"D:/ocr_engine/OCR_Data"; // 将此路径替换为您的实际路径
    OCREngine::Initialize(ocr_data_path);
  • 选择识别语言

    您需要通过 OCREngine::SetLanguages 方法设置 OCR 引擎使用的语言。默认设置为英文 (eng)。您可以根据需要修改语言代码。例如,设置为中文:

    cpp
    OCREngine::SetLanguages("zho"); // 这里语言需要使用 ISO 639-3 国际标准代码

运行演示程序

成功构建并运行演示程序后,您将在控制台看到类似以下的输出:

OCREngine is initialized.
Start OCR process.
OCR process is finished.
OCR to Text file successfully.
OCR to PDF file successfully.
OCR to JSON file successfully.
End OCR Demo.

演示程序将对默认输入文档 examples/simple_demo/input_files/ocr/AboutFoxit_ocr.pdf 执行 OCR 识别,并将输出文件保存在 examples/simple_demo/output_files/ocr 目录中,包括:

  • AboutFoxit_ocr.json
  • AboutFoxit_ocr.pdf (包含可搜索文本层的 PDF)
  • AboutFoxit_ocr.txt