OCRmyPDF

开源命令行工具，可为扫描版 PDF 添加可搜索 OCR 文本层。

详细介绍

OCRmyPDF 是一个开源命令行工具，可以为扫描版 PDF 添加 OCR 文本层，使 PDF 支持搜索、复制和长期归档。它常与 Tesseract OCR 配合使用，适合批量处理扫描文献、档案和实验记录。

适用场景：扫描 PDF OCR、批量文献处理、档案数字化、PDF 可搜索化

推荐组合：OCRmyPDF + Tesseract OCR

把扫描版 PDF、旧文献和档案资料转为可搜索、可复制、可管理的文献文件。