构建和运行福昕 OCR SDK 演示程序
本指南介绍如何构建和运行 OCR SDK 提供的 C++ API 演示程序。
最低系统要求
Windows
- 操作系统版本: Windows 10
- 系统架构: x86_64
Linux
- 操作系统版本: Ubuntu 22.04.5 LTS
- 系统架构: x86_64
- GPU (加速模式): NVIDIA GeForce RTX 4080
- CUDA 版本 (加速模式): 12.2
Mac
- 操作系统版本: macOS 10.15.7
- 系统架构: x86_64
准备 OCR 资源包
请联系福昕支持团队或您的销售团队获取 SDK 专用 OCR 资源文件包。
获取资源包后,将其解压到您选择的目标目录(例如,创建一个名为 ocr_engine
的目录)。解压后的 OCR 资源文件应包含以下内容:
Windows 系统
OCR_Data
: OCR 引擎初始化所需的数据文件。lib
: 包含 32 位 (win32
) 和 64 位 (win64
) 的库文件。
Linux / Mac 系统
OCR_Data
: OCR 引擎初始化所需的数据文件。lib
: 64 位的库文件。
运行 OCR 演示程序
福昕 OCR SDK 的 C++ API 提供的 OCR 演示程序位于 SDK 根目录下的 examples/simple_demo/ocr
目录中。
复制库文件
Windows 系统
- 将
ocr_engine/lib/win64
(或win32
) 目录下的所有.dll
文件复制到examples/simple_demo/bin
目录。提示
bin
文件夹通常在 SDK 工程编译后自动生成。如果您尚未编译工程,请手动创建bin
目录。
- 将
Linux 系统
- 将
ocr_engine_linux/lib
目录下的所有.so
文件复制到lib
目录。 - 设置库加载环境变量。在终端中执行以下命令(请替换为您的实际绝对路径):bash
export LD_LIBRARY_PATH=/path/to/foxitocrsdk_1_0_linux64/lib:$LD_LIBRARY_PATH
- 将
Mac 系统
- 设置库加载环境变量。在终端中执行以下命令(请替换为您的实际绝对路径):bash
export DYLD_LIBRARY_PATH=/path/to/ocr_engine_mac/lib:$DYLD_LIBRARY_PATH
提示:
如果设置
DYLD_LIBRARY_PATH
环境变量后仍然遇到编译问题,请尝试将ocr_engine_mac/lib
目录下的所有.dylib
文件复制到/usr/local/lib
目录。
- 设置库加载环境变量。在终端中执行以下命令(请替换为您的实际绝对路径):
配置演示程序
完成库文件复制和环境变量设置后,您需要配置演示程序。打开 examples/simple_demo/ocr/ocr.cpp
文件进行编辑(以下以 Windows 为例,Linux/Mac 平台的配置方式类似):
指定 OCR 数据目录
找到以下代码行并将其中的路径替换为您实际的
OCR_Data
目录路径:cppWString ocr_data_path = L"D:/ocr_engine/OCR_Data"; // 将此路径替换为您的实际路径 OCREngine::Initialize(ocr_data_path);
选择识别语言
您需要通过
OCREngine::SetLanguages
方法设置 OCR 引擎使用的语言。默认设置为英文 (eng
)。您可以根据需要修改语言代码。例如,设置为中文:cppOCREngine::SetLanguages("zho"); // 这里语言需要使用 ISO 639-3 国际标准代码
运行演示程序
成功构建并运行演示程序后,您将在控制台看到类似以下的输出:
OCREngine is initialized.
Start OCR process.
OCR process is finished.
OCR to Text file successfully.
OCR to PDF file successfully.
OCR to JSON file successfully.
End OCR Demo.
演示程序将对默认输入文档 examples/simple_demo/input_files/ocr/AboutFoxit_ocr.pdf
执行 OCR 识别,并将输出文件保存在 examples/simple_demo/output_files/ocr
目录中,包括:
AboutFoxit_ocr.json
AboutFoxit_ocr.pdf
(包含可搜索文本层的 PDF)AboutFoxit_ocr.txt