NDLOCR-Lite を用いて、OCR未処理の PDF・画像にテキスト層を一括付加する Python 製バッチツールです。 既にテキスト層が存在する PDF は自動判定でスキップし、OCR未処理のファイルだけを対象に ...
See the release notes for details on the latest changes. OCRmyPDF uses Tesseract for OCR, and relies on its language packs. For Linux users, you can often find packages that provide language packs: ...