OCR PDF
Wer kennt das nicht: ein PDF öffnen, Strg+F drücken — und nichts. Das Dokument ist ein Scan, also nur ein Bild. Unser OCR-Tool (Optische Zeichenerkennung) liest diese Bilder Seite für Seite, erkennt jeden Buchstaben und legt eine unsichtbare Textschicht über den Scan.
Das Ergebnis sieht exakt wie dein Original aus. Aber jetzt kannst du Text markieren, Passagen kopieren und mit Strg+F nach Wörtern suchen. Praktisch für alte Verträge, eingescannte Unterlagen oder jedes bildbasierte PDF, das plötzlich bearbeitbar werden soll.
OCR-Optionen
Wählen Sie die Hauptsprache Ihres Dokuments für beste OCR-Genauigkeit.
Die OCR-Verarbeitung kann bei großen Dokumenten mehrere Minuten dauern. Das resultierende PDF sieht identisch aus, hat aber durchsuchbaren, auswählbaren Text.
Beste Ergebnisse: Hochauflösende Scans (300+ DPI), schwarzer Text auf weißem Hintergrund, Standard-Druckschriften.
OCR PDF
Du hast ein gescanntes PDF, bei dem du keinen Text markieren kannst? Mit OCR wird daraus ein durchsuchbares Dokument, das genauso aussieht wie vorher.
Ziehen Sie Ihre PDF Datei hierher
oder klicken Sie zum Durchsuchen (max 10MB)
Konvertierung wird gestartet...
Wie OCR bei PDFs funktioniert
Optische Zeichenerkennung analysiert jedes Seitenbild in deinem PDF, identifiziert Buchstaben, Wörter und Absätze und erstellt dann eine unsichtbare Textschicht, die genau über dem Originalbild liegt. Du siehst weiterhin den Scan, aber darunter steckt jetzt echter, durchsuchbarer Text.
Wenn du in einem OCR-verarbeiteten PDF Text markierst, greifst du auf diese versteckte Schicht zu. Wenn du suchst, durchsucht der PDF-Reader diese Textschicht. Das Besondere daran ist, dass jeder Charakter exakt dort sitzt, wo er visuell erscheint. Markierungen decken sich deshalb perfekt mit dem gescannten Text.
Die Genauigkeit hängt stark von der Scanqualität ab. Saubere, kontrastreiche Scans mit normalen Druckschriften erreichen 95–99 %. Verblasste Seiten, ungewöhnliche Schriftarten oder Handschrift drücken das spürbar nach unten. Das Tool eignet sich am besten für gedruckten Text in gängigen Sprachen.
Schritt für Schritt: OCR auf dein PDF anwenden
- Gescanntes PDF hochladen — Datei in den Upload-Bereich ziehen. Funktioniert mit jedem PDF, das gescannte oder bildbasierte Seiten enthält.
- Sprache wählen — Die Hauptsprache des Dokuments auswählen, damit die OCR-Engine Zeichen korrekt erkennen kann.
- OCR starten — Das Tool analysiert Seite für Seite, erkennt den Text und baut die durchsuchbare Schicht auf.
- Ergebnis herunterladen — Dein PDF hat jetzt durchsuchbaren, auswählbaren Text und sieht dabei identisch wie das Original aus.
Unterstützte Sprachen
Die OCR-Genauigkeit variiert je nach Sprache. Hier ein Überblick:
Sehr gute Genauigkeit
- • Englisch
- • Deutsch
- • Französisch
- • Spanisch
- • Italienisch
- • Portugiesisch
Gute Genauigkeit
- • Niederländisch
- • Polnisch
- • Russisch
- • Chinesisch (vereinfacht)
- • Japanisch
- • Koreanisch
Unterstützt
- • Arabisch
- • Hindi
- • Thai
- • Vietnamesisch
- • Griechisch
- • Hebräisch
Typische Anwendungsfälle
Archivdigitalisierung
Historische Dokumente, alte Verträge oder Papierakten werden durchsuchbar. In Tausenden von Seiten lassen sich Begriffe finden, ohne alles einzeln zu lesen.
Juristische Arbeit
Gescannte Rechtsdokumente werden für die Fallprüfung durchsuchbar. Namen, Daten oder bestimmte Klauseln lassen sich schnell finden, ohne alles manuell durchzulesen.
Wissenschaft und Forschung
Eingescannte Aufsätze, alte Bücher oder Forschungsberichte werden zitierbar. Passagen lassen sich direkt markieren und kopieren, statt alles neu abtippen zu müssen.
Geschäftsunterlagen
Rechnungen, Belege und Verträge, die als Scans eingehen, lassen sich indexieren und durchsuchen. Wichtig für Buchhaltung und gesetzliche Aufbewahrungspflichten.
Barrierefreiheit
Gescannte Dokumente sind für Screenreader unsichtbar. Mit OCR werden sie zugänglich, was sehbehinderten Personen und der Barrierefreiheitspflicht zugute kommt.
Datenextraktion
Ist der Text erst auswählbar, lässt er sich in andere Anwendungen kopieren. Tabellen aus gescannten Berichten oder Formulardaten können so ohne Abtippen übernommen werden.
Was die Genauigkeit beeinflusst
Beste Ergebnisse
- • Mindestens 300 DPI Auflösung
- • Schwarzer Text auf weißem Hintergrund
- • Gängige Druckschriften
- • Gerade ausgerichtete Seiten
- • Sauberes Papier, keine Flecken
- • Gleichmäßig guter Kontrast
Schlechtere Ergebnisse
- • Niedrige Auflösung (unter 200 DPI)
- • Farbige oder gemusterte Hintergründe
- • Dekorative oder ungewöhnliche Schriften
- • Schiefe oder gedrehte Seiten
- • Flecken, Knicke oder Schäden
- • Handschrift
Was mit deinem PDF passiert
Nach der OCR-Verarbeitung enthält dein PDF die originalen Seitenbilder und eine neue Textschicht. Die Dateigröße steigt leicht — je nach Textmenge um 10–30 %. Visuell ändert sich nichts. Was sich ändert:
- Text lässt sich markieren und kopieren
- Strg+F findet Wörter auf jeder Seite
- PDF-Reader können den Inhalt indexieren
- Screenreader können das Dokument vorlesen
- Text lässt sich mit anderen Tools extrahieren
Technische Details
- OCR-Engine: Tesseract 5.x mit LSTM-Neuronalnetz
- Ausgabe: PDF mit unsichtbarer Textschicht (PDF/A-kompatibel)
- Verarbeitung: Seitenweise, multithreaded
- Sprachunterstützung: Über 100 Sprachen verfügbar
- Dateigröße: Steigt um ca. 10–30 % durch die Textschicht
- Originalqualität: Visuelles Erscheinungsbild unverändert
Fragen zu OCR
Ähnliche Werkzeuge entdecken
PDF-Seiten Löschen
Einzelne Seiten aus deinem PDF löschen — Leerseiten, veraltete Abschnitte oder vertrauliche Inhalte, ohne den Rest anzufassen.
Seiten LöschenPDF-Seiten Neu Anordnen
Seiten in deinem PDF in beliebige Reihenfolge bringen. Einzelne Seiten verschieben, Kapitel tauschen oder das Dokument komplett umstrukturieren—alles ohne Qualitätsverlust.
Seiten Neu AnordnenPDF Drehen
Schief eingescannt oder auf dem Kopf? Dreh PDF-Seiten in Sekunden auf 90°, 180° oder 270° — ohne Qualitätsverlust, ohne Fummelei.
PDF DrehenPDF abflachen
Interaktive PDF-Elemente in statischen Inhalt umwandeln. Formularfelder, Anmerkungen und Transparenzebenen lassen sich einbetten – für reibungslosen Druck, sichere Archivierung und problemloses Weitergeben.
PDF AbflachenPDF Schützen
Schütze dein PDF mit 256-Bit-AES-Verschlüsselung. Du entscheidest, wer es öffnen, drucken, kopieren oder bearbeiten darf.
PDF SchützenBilder aus PDF Extrahieren
Hol jedes Bild aus deinem PDF heraus, genau so wie es drin steckt. Fotos, Grafiken, Logos und Diagramme – alles einzeln als Download.
Bilder Extrahieren