Upload een scan - indexeer automatisch
Rommel erin, rommel eruit! Hoe beter de kwaliteit van de scan of foto, hoe beter het resultaat:
- Een origineel in goede staat zonder scheuren, vlekken, stempels, ...;
- Een scherp beeld, de minste onscherpte is dodelijk voor goede OCR;
- De tekst perfect horizontaal, een beetje scheef is nefast voor OCR;
- Een resolutie van min. ±300 dpi.
Alleen 'jpg', 'jpeg' of 'png', max. 10 MB.
PRIVACY: Het bestand wordt meteen gewist nadat de resultaten getoond zijn, er wordt geen
enkel gegeven bijgehouden.
BEPERKING: ik gebruik voor deze demo enkele diensten met beperkte capaciteit. Als het niet
meer werkt is de limiet bereikt.
Probeer gerust enkele prentjes uit, maar wees redelijk om anderen ook een kans te geven.
Gebruikte diensten voor de demo:
- IndexScans is geschreven in Python, dat kan je niet zomaar overal hosten voor op een website, daarom gebruik
ik PythonAnywhere
- IndexScans gebruikt de Tesseract OCR engine van Google. OCR verbruikt heel veel processortijd waardoor de
limiet bij PythonAnywhere snel bereikt zou zijn.
Daarom gebruik ik voor de demo de Google Cloud Vision
API, die ook Tesseract gebruikt voor OCR.
IndexScans PC versie
De volledige IndexScans software is bedoeld om op een PC te installeren en heeft niet de beperkingen van de online
versie:
- In één keer een hele folder indexeren met tientallen, honderden of zelfs duizenden bidprentjes
- Namen worden gesplitst in voor- en achternaam
- Recto-verso scans verwerken: twee scans per bidprentje, hetzij in aparte bestanden -onder bepaalde
naamgevingsvoorwaarden- ofwel de twee zijden samengevoegd in één bestand
- Detecteren of er een foto van de overledene op staat (gezichtsdetectie)
- Scans in JPG, TIFF, PNG en PDF formaat verwerken.
- Het resultaat komt in een Excel-leesbare tabel (CSV formaat)
- Scans hernoemen volgens je eigen systeem (o.b.v. achternaam, voornaam, geboortedatum/plaats,
overlijdensdatum/plaats)
- Een viewer om het resultaat na te kijken en te corrigeren met de scans ernaast
Lees ook
IndexScans - automatisch indexeren