Releases · ChristophWenk/PDFSorter

10 Nov 20:01

2.0.0

e98bb79

Switch PDF parsing approach from text to OCR Latest

Latest

The text-based parsing approach did not work for many PDFs. They just produced gibberish. Therefore, switched the PDF reader library to PyMuPDF to create images from the PDF, which can then be parsed by EasyOCR.

Installing CUDA is not necessary but allows to use the GPU for processing, which decreases the processing time.

Assets 2

12 Aug 07:12

ChristophWenk

1.1.0

e12251c

CI and Config Versioning

CI
Test setup
Multi page reading
Config versioning
Cleanups

Assets 2

10 Jul 14:35

ChristophWenk

1.0.1

f6143e3

Minor Cleanups for first Release

Set Dry run to false
Update Readme
Conda enviroment file

Assets 2

10 Jul 11:31

ChristophWenk

1.0.0

1ac79f6

PDFSorter Initial Release

1.0.0

License (#6)

Assets 2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Releases: ChristophWenk/PDFSorter

Switch PDF parsing approach from text to OCR

CI and Config Versioning

Minor Cleanups for first Release

PDFSorter Initial Release