softmate.de

Hier haben wir Ihnen die wichtigsten Begriffserklärung und Fachbegriffe zum Thema Dokumentenscanner in Form eines Glossars zusammengestellt.

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

ADF

Abkürzung für »automatic document feeder«. Die zu scannenden Dokumente werden in die automatische Papierzufuhr in Stapeln eingelegt und stapelweise eingezogen und gescannt. Gängige Feedergrößen sind: 25 oder 50 Blatt. Bei Produktionsscannern auch 100, 200, 300, 500 oder 1.000 Blatt.

Auflösung

Die Auflösung eines Scanners wird in dpi (englisch: dots per inch = Punkte pro Zoll) angegeben und ist ein Maß dafür, wie fein die zu scannende Vorlage abgetastet wird. Für OCR-Zwecke werden meist 300 dpi empfohlen. Für das Scannen von Bildern für Reprozwecke werden Auflösungen von 1200 dpi und mehr verwendet.

Auto-Cropping

Automatisches Zuschneiden der Belege auf die aktuelle Größe beim Scannen von verschiedenen Vorlagenformaten im Stapelbetrieb. Dies trägt entscheidend zur Zeitersparnis bei der Arbeitsvorbereitung bei. So können unterschiedliche Papierformate können ohne Vorsortieren im Stapel gescannt werden und das Image wird ohne störende Ränder angezeigt – gleichzeitig wird die Dateigröße reduziert.

Bildverbesserung

Allgemein formuliert ist image enhancement (in der Fachsprache ist der englische Ausdruck wesentlich geläufiger als 'Bildverbesserung') der Prozeß, einen digitalen Datenbestand interpretierbarer hinsichlich einer bestimmten Anwendung zu machen.
Die Scanner von Kodak sind hier besonders leistungsfähig.

Blank Page Deletion

Leerseiten werden automatisch verworfen (dies ist z. B. bei Duplexscannen von leeren Rückseiten wichtig.)
Der ELO Client bietet diese Funktion im Standard.

Blindfarbe

Eine entsprechende Beleuchtung der Belege kann überflüssige Informationen wie z. B. Rahmen von Formularen oder auch eine komplette Hintergrundfarbe entfernen. Dadurch wird die OCR Erkennung verbessert da keine störenden Rahmen vorhanden sind und außerdem werden die Dateigrößen kleiner. Ein bekanntes Beispiel: Überweisungsträger haben oft einen roten Formularhintergrund.

CCD

Bei der EDV Abkürzung handelt es sich um ein Halbleiterelement mit lichtempfindlichen Fotodioden. CCD-Elemente dienen der Digitalisierung von Vorlagen und finden ihren Einsatz in Scanner, Digitalkameras, Videokameras und anderen Peripheriegeräten, die zur Digitalisierung eingesetzt werden.

Deskew

Automatisches Geraderichten von schräg eingezogenen Belegen.

dpi

Die Maßeinheit dpi – dots per inch - gibt dabei an wie viele Punkte (Pixel) auf einem Zoll (1 Zoll = 2,54 cm) gedruckt werden können. Je höher die Auflösung desto besser ist die Ausgabequalität
Die Maßeinheit dpi wird für die Angabe der Auflösung von Ausgabegeräten wie Laserdrucker, Tintenstrahldrucker oder Belichter und Erfassungsgeräte wie Scannern verwendet.

Duplex

Duplex bezeichnet das Scannen von Vorder- und Rückseite eines Blattes.

Durchlichtaufsatz

Ein Durchlichtaufsatz (engl. transparency adapter oder transparency unit) ist eine Vorrichtung im Deckel oder ein zusätzliches Gerät an einem Scanner zur Digitalisierung von Diafilmen oder Farbnegativen.

EBV

Elektronische Bildverarbeitung.

Endorser

Ein Endorser bestempelt Dokumente mit einer fest eingestellten Zeichenfolge. Das Aufstempeln erfolgt in der Regel nach dem Scannen und dient als zusätzliche Sicherheit, dass das Dokument bearbeitet wurde. Endorser können auch als Endorsement-Printer oder Entwerter-Einheit bezeichnet werden. Vergleiche auch Imprinter.

Feeder

Blatteinzug.

Flachbett

Flachbettscanner sind PC-Peripheriegeräte zur Digitalisierung von Dokumenten. Im Unterschied zu Dokumentenscannern verfügen Flachbettscanner meist nicht über einen automatischen Seiteneinzug (ADF) zur Aufnahme mehrerer Seiten. Flachbettscanner sind somit weniger gut zur Erfassung großer Seitenmengen geeignet, ermöglichen dafür aber das Scannen von Büchern. Auch sehr kleinen Belegen (Kassenzettel, Tankbelege o. Ä.) können so komfortabel gescannt werden. Durchzugscanner (mit ADF) benötigen oft ein Mindestformat.

Graustufen

Bildaufbau durch Farben zwischen Schwarz und Weiß.
Im Gegensatz zu Schwarzweiß werden bei Graustufenbildern echte Grautöne verwendet (im digitalen Bereich Zweierpotenzen).

Imprinter

Imprinter sind kleine Tintenstrahl-Drucker, die definierte Texte auf die Belege drucken. Der Imprinter wird über den Scannertreiber angesprochen und kann neben inkrementellen (festen) Werten auch Variablen aus Ziffernfolgen, Buchstaben und Sonderzeichen wie zum Beispiel Uhrzeit, Datum oder Stapelnummer eindrucken. Wird ein Pre-Scan-Imprinter eingesetzt, erscheint diese Information auch auf dem gescannten Image – ein Post-Scan-Imprinter druckt diese Information erst nach der Digitalisierung auf den Beleg. Vergleiche auch Endorser.

ipm

Info-print-manager.

ISIS

ISIS ist ein von der Firma Captiva entwickelter Treiber-Standard zur Ansteuerung von Dokumentenscannern unter Microsoft Windows. Im Unterschied zu TWAIN ermöglicht der ISIS-Standard die vollständige Kontrolle eines kompatiblen Scanners bei gleichzeitig maximaler Scangeschwindigkeit.

JPEG

JPEG steht für »Joint Photographics Experts Group«. Dies ist eine Gruppe von Firmen, die sich mit der Erarbeitung von Standards in der Bildkompression befassen. Das Format wurde 1992 eingeführt und ist zum weltweiten Standard in der Kompression von Farb- und Graustufenbildern geworden.
Der Vorteil des JPEG-Standards ist die relativ kleine Dateigröße, jedoch sind die erzeugten Dateien verlustbehaftet, d. h. abhängig vom gewählten Kompressionsfaktor gehen Bildinformationen verloren und die Bilddarstellung erscheint verzerrt (so genannte Artefakte).

JPEG2000

JPEG2000 als Weiterentwicklung von JPEG bietet höchste Bildqualität bei geringer Dateigröße. Durch die neu eingesetzte Wavelet-Kompression wird das Bild in unterschiedliche Ebenen zerlegt, die mit unterschiedlichen Kompressionsverfahren gespeichert werden. JPEG2000 besteht aus mehreren Teilen: Teil 1 – das Basis-Kodierungssystem – ist bereits als internationaler Standard verfügbar. Fünf weitere Teile sind fertig und vier neue Teile in Entwicklung.

Kalibrierung

Präzises einstellen eines Geräts. Im Allgemeinen wird dabei die Abweichung von festen Standardwerten gemessen und das Gerät so angepasst, dass die Abweichungen ausgeglichen werden.

lpi

Lines per Inch (Zeilen pro Zoll).
Rasterweiten für Fotos und Farben.

Lurtech

Hersteller des Lurawave Formats und diverser Imaging Lösungen.

Lurawave

Ein Bildformat für Farbbilder der Firma Luratech. Es zeichnet sich gegenüber JPEG durch eine höhere Kompression aus. Es ist auch möglich verlustfrei zu komprimieren.

Netzwerkscanner

Ein Scanner welcher mit mehreren Systemen, Computern, Terminals oder Peripheriegeräten verbunden ist.
Das Gerät ist normalerweise nicht direkt an einen PC angeschlossen sondern steht beliebigen Nutzern über das Netzwerk zur Verfügung.

OCR

OCR (englisch: Optical Character Recognition = Optische Zeichenerkennung) ist der Fachbegriff für die automatische Erkennung gedruckter Zeichen mit Hilfe optischer Abtastung (z. B. durch Scanner oder Digitalkameras). Einfach ausgedrückt versucht man, mit OCR das Abschreiben gedruckter Texte vom Computer erledigen zu lassen.
Als Vater der OCR gilt Lawrence Roberts, der 1960 am MIT erste Versuche zur automatischen Erkennung von Zeichen unternahm. Erste Anwendungen der OCR in der Praxis gab es bereits 1965 in Form von Hardware-Lösungen. Damals beschränkte sich die Erkennung allerdings noch auf eigens entworfene Schriftarten wie OCR-A und OCR-B. 1976 entwickelte Ray Kurzweil das erste omnifonte, d. h. schriftartenunabhängige OCR-System. Mit zunehmender Leistungsfähigkeit der PCs haben seit Mitte der 80er software-basierte OCR-Lösungen immer mehr an Genauigkeit und Bedeutung hinzugewonnen.
OCR gliedert sich in die Arbeitsschritte Scannen, Layout-Analyse, Segmentierung, Zeichenerkennung und Wörterbuchabgleich, wobei bei modernen Systemen die Grenzen zwischen diesen Vorgängen immer mehr verwischen. Häufige Anwendungen von OCR sind Dokumentenerkennung, Archivsysteme, Formularauswertung und Belegerfassung.

PDF

Adobes »Portable Document Format« (PDF) ist der offene De-facto-Standard für die Verteilung elektronischer Dokumente. Mit Adobe PDF werden alle Schriften, Formatierungen, Farben und Grafiken des ursprünglichen Dokuments beibehalten.

PDF/A

PDF/A ist der ISO-Standard 19005-1 für die Langzeitarchivierung im PDF. Als eingegrenzte Variante von PDF stellt PDF/A ein standardisiertes Profil zur Verwendung von PDF in der Langzeitarchivierung dar. PDF/A bietet den Anwendern ein einheitliches, langfristig verfügbares Format für schwarzweiße oder farbige Dokumente mit Bitmap-, Grafik- oder Textinhalten. Es gab zwar bisher bereits herstellerspezifische Lösungen für diese Anforderungen, mit PDF/A existiert nun jedoch ein herstellerunabhängiger ISO-Standard. Ein weiterer Vorteil: Zur Darstellung benötigt man nur einen Standard-PDF-Viewer.

PDF durchsuchbar

Eine Funktion innerhalb eines PDF indem der Textinhalt zusätzlich zu eingebetteten Grafik (dem Scan) auch nochmals als Text (Coded Information) vorliegt. Für die Volltextsuche ist dies sehr hilfreich.

Perfect Page

Bildoptimierung (Bildverbesserung) der Firma Kodak.

Pixel

Am Besten übersetzt als Punkt. Es handelt sich um die kleinste adressierbare Einheit bei der Ausgabe auf dem Monitor oder Drucker. Wie viele Farben bzw. Graustufen die einzelnen Pixel annehmen können, hängt von der sogenannten Farbtiefe ab.

Postprinter

Als Postprint bezeichnet man im Gegensatz zum Preprint einen Aufdruck nach dem Scannen. Vgl. Imprinter.

PPM

Abkürzung für »pages per minute« (Blatt pro Minute) als Maß für die Scangeschwindigkeit. Weil »page« als »Blatt« oder »Seite« übersetzt werden kann, empfiehlt es sich, im Duplexbetrieb von ipm (»images per minute«) zu sprechen, um Missverständnisse zu vermeiden. Beim Duplexscan entstehen 2 Images (Vorder- und Rückseite).

Push-Button

Einige Scanner besitzen ein Knopf der das Scannen und die Übertragung an den PC bzw. das DMS auslöst.

Simplex

Einseitiges Scannen.

TIF

Das »Tagged Image File Format« wurde als Standard von Microsoft, Hewlett-Packard und Aldus definiert. Diese wohl am weitesten Verbreitete Dateiformat für Scans ist besonders für die langfristige Archivierung geeignet. Es bildet auch den Standard für die Faxübertragung. Hierbei wird meist die Kompression Fax G4 verwendet.
Vorteil dieses Dateiformats ist eine geringe Größe bei verlustfreier Kompression. Für Farbbilder ist es aufgrund der großen Dateigröße weniger geeignet.

TIFF

Siehe TIF

TWAIN

TWAIN ist ein von den Firmen Aldus, Eastman-Kodak, Hewlett-Packard und Logitech entwickelter Treiber-Standard zur Ansteuerung von Scannern und Digitalkameras unter Microsoft Windows. Durch seine weite Verbreitung wird es von praktisch allen Scannern und Bildbearbeitungsprogrammen unterstützt. Siehe auch ISIS.
ELO kann TWAIN-kompatible Scanner über Scanprofile direkt ansteuern.

Ultraschall

Doppleinzugskontrolle per Ultraschall. Wird versehentlich mehr als ein Blatt eingezogen, erkennt dies der Scanner per Ultraschallkontrolle.

Verschränken

Funktionalität im ELO Client. Werden zuerst alle Vorderseiten gescannt und dann alle Rückseiten, kann mit der Funktion verschränken die Seiten in die richtige Reihenfolge gebracht werden. So können auch mit einem Simplex Scanner notfalls beidseitig bedruckte Seiten gescannt werden.

Volltext

Der (möglichst vollständige) Textinhalt eines gescannten Dokuments. Wird meist durch OCR erreicht. Siehe auch durchsuchbares PDF.