OCRmyPDF

开源命令行工具,可为扫描版 PDF 添加可搜索 OCR 文本层。

详细介绍

OCRmyPDF 是一个开源命令行工具,可以为扫描版 PDF 添加 OCR 文本层,使 PDF 支持搜索、复制和长期归档。它常与 Tesseract OCR 配合使用,适合批量处理扫描文献、档案和实验记录。

适用场景:扫描 PDF OCR、批量文献处理、档案数字化、PDF 可搜索化

推荐组合:OCRmyPDF + Tesseract OCR

在以下科研流程中使用