Gezielte und fokussierte OCR Korrektur mit Lucene

Gezielte und fokussierte OCR Korrektur mit Lucene

in großen Datenbeständen, basierend auf dem Lucene-Framework

Versandkostenfrei!
Versandfertig in 6-10 Tagen
49,90 €
inkl. MwSt.
PAYBACK Punkte
0 °P sammeln!
Die Arbeit beschreibt detailliert die Programmierung einer Suchmaschine für Volltexterkannte Zeitungsseiten des Zeitungsarchives der Leopold Franzens Universität Innsbruck sowie die geziehlte Fehlerbehebung in diesem durch Crowdsourcing Ansätze. Verwendete Technologien sind hierbei das Lucene Franework und Java Servlets. Im Buch werden mehrere Problem besprochen und gelöst. Unter anderem sind diese: Durch das Alter der Zeitungen bedingte Schwierigkeiten bei der Texterkennung oder Performanceprobleme beim Anzeigen von Zeitungsausschnitten innerhalb von Suchergebnissen.