PDF-Text in Word übernehmen

17. März 2016
Monika Rohn (Herausgeberin) Von Monika Rohn (Herausgeberin), Office, Bildbearbeitung, Photoshop Tutorials ...

Der Vorteil von PDF-Dateien ist, dass es mit dem »Adobe Reader« ein kostenloses Anzeigeprogramm für PDF-Dateien gibt. Der Adobe Reader steht für sämtliche Windows-Versionen und für zahlreiche andere Betriebssysteme wie Linux/Unix oder Mac OS zur Verfügung. In PDF-Dateien können sowohl Grafiken, wie Bilder, Diagramme oder Fotos, als auch Text enthalten sein. Damit PDF-Dateien so universell nutzbar sind, verfügen sie über ein eigenes Dateiformat und lassen sich in Word nicht öffnen. Wird eine PDF-Datei dennoch in Word geladen, erscheinen nur zusammenhanglose Zeichen auf dem Bildschirm.

Sofern die Informationen in einer ungeschützten PDF-Datei als Text hinterlegt sind, lassen sie sich mit dem folgenden Trick leicht in Word übernehmen. Als »Text« sind die Informationen dann verfügbar, wenn der Ersteller der PDF-Datei sie beispielsweise selbst auf Basis einer Word-Datei erzeugt hat oder wenn die Daten aus einem Layout-Programm stammen.

Wurden die Daten hingegen eingescannt und dann in eine PDF-Datei umgewandelt, stehen sie nur als »Bild« zur Verfügung und lassen sich nicht übernehmen. Ob die Informationen als Bild oder als Text in der PDF-Datei enthalten sind, können Sie in aller Regel leicht kontrollieren. Vergrößern Sie die Anzeigedarstellung im Adobe Reader, indem Sie in der Menüleiste des Readers ins Zoom-Feld den Wert »1000« eintragen und dies mit der Eingabe-Taste bestätigen.

Wurden die Informationen als Text hinterlegt, werden die Buchstaben auch in dieser hohen Vergrößerungsstufe noch einwandfrei mit glatten Kanten angezeigt (unten). Handelt es sich hingegen um eingescannten Text, sind die Kanten der Buchstaben als »Treppenstufen« sichtbar. In diesem Fall lässt sich der Text nicht in Word übernehmen.

Beachten Sie auch, dass der Ersteller der PDF-Datei das Entnehmen der Daten verhindern kann. Die PDF-Datei ist dann »geschützt«. Ob eine PDF-Datei geschützt ist, erkennen Sie an dem kleinen Schloss- bzw. Schlüsselsymbol.

Ist die PDF-Datei nicht geschützt und die Informationen liegen als Text vor, dann stehen Ihnen zwei unterschiedliche Methoden zur Übernahme des Textes zur Verfügung.

Lösung 1: Kopie per Zwischenablage

 

  1. Öffnen Sie die PDF-Datei, aus der Sie Text in Word übernehmen möchten, im Adobe Reader.
  2. Klicken Sie in der PDF-Datei mit der linken Maustaste vor das erste Zeichen des Textes, den Sie in Word übernehmen möchten. Halten Sie die linke Maustaste gedrückt und markieren Sie den gewünschten Text.
  3. Ist der gewünschte Text markiert, rufen Sie das Menü BEARBEITEN, Befehl KOPIEREN auf oder drücken Sie die Tastenkombination Strg + C. Der Text wird nun einschließlich aller Formatierungen in die Windows-Zwischenablage kopiert.
  4. Wechseln Sie jetzt in Word und drücken Sie dann die Tastenkombination Strg + V. Daraufhin wird der Text aus der Zwischenablage an der aktuellen Cursor-Position in das Word-Dokument eingefügt.

 

Die Schritte 2 bis 4 können Sie nun beliebig wiederholen, um so alle gewünschten Textabschnitte aus der PDF-Datei in Word zu übernehmen.

Lösung 2: Als Text speichern

Zusätzlich zum Kopieren per Zwischenablage steht Ihnen im Adobe Reader die Möglichkeit zur Datenübernahme über das Menü DATEI-SPEICHERN UNTER, Befehl TEXT (Adobe Reader 10) bzw. DATEI, Befehl ALS TEXT SPEICHERN (Adobe Reader 9) zur Verfügung. Wenn Sie diesen Befehl ausführen, können Sie die Textinformationen in einer Textdatei (Dateinamenerweiterung ».TXT«) speichern. Die Textdatei lässt sich anschließend in Word öffnen. Beachten Sie, dass bei dieser Lösung keine Formatierungen übernommen werden. Dafür wird immer das ganze Dokument »am Stück« in der Textdatei gespeichert.

Um eingescannte Informationen in einer PDF-Datei in Text umzuwandeln, benötigen Sie ein OCR-Programm, das die eingescannten »Bildinformationen« in echten Text umwandelt. OCR-Programme werden in aller Regel zusammen mit Scannern ausgeliefert. Ein typischer Vertreter ist das Programm »ABBY FineReader«. Nicht alle OCR-Programme können PDF-Dateien direkt bearbeiten; die Programme sind meist auf Grafikformate wie TIF- oder JPG-Dateien eingeschränkt. In diesem Fall drucken Sie Ihre PDF-Datei auf einem möglichst hochwertigen Drucker/Papier aus. Anschließend werden diese einfach noch einmal eingescannt und dann direkt mit dem OCR-Programm »gelesen«.

Beim Adobe Reader steht im Menü DATEI-SPEICHERN UNTER der Befehl WORD-KONVERTIERUNG ONLINE zur Auswahl. Doch Vorsicht: Der Einsatz der Funktion ist kostenpflichtig und deshalb nur dann interessant, wenn Sie regelmäßig PDF-Dateien in Word-Dateien umwandeln müssen und dabei möglichst alle Daten erhalten bleiben sollen.

Werden Sie mit unseren Tipps zum Word-Profi!

Jetzt gratis per E-Mail

DDV Ehrencodex E-Mail-Marketing
  • Wir benötigen Ihre E-Mail-Adresse für die Zusendung des Newsletters.
  • Wir geben Ihre E-Mail-Adresse garantiert nicht an Dritte weiter.
  • Jederzeit abbestellbar durch einen Link im Newsletter.

Unsere Datenschutzgarantie:

Wir benötigen Ihre E-Mail-Adresse für die Zusendung des Newsletters. Wir geben Ihre E-Mail-Adresse garantiert nicht an Dritte weiter. Jederzeit abbestellbar durch einen Link im Newsletter.

Weitere Artikel zum Thema

Newsletter

Jetzt kostenlose Office-Hilfe anfordern!

  • die besten Tipps
  • völlig kostenlos
  • jederzeit abbestellbar
DDV Ehrencodex E-Mail-Marketing
  • Wir benötigen Ihre E-Mail-Adresse für die Zusendung des Newsletters.
  • Wir geben Ihre E-Mail-Adresse garantiert nicht an Dritte weiter.
  • Jederzeit abbestellbar durch einen Link im Newsletter.

Unsere Datenschutzgarantie:

Wir benötigen Ihre E-Mail-Adresse für die Zusendung des Newsletters. Wir geben Ihre E-Mail-Adresse garantiert nicht an Dritte weiter. Jederzeit abbestellbar durch einen Link im Newsletter.

Unsere Experten

Rudolf Ring twittert für @Computerwissen

Die von Ihnen eingegebene E-Mail Adresse ist nicht korrekt. Bitte korrgieren Sie Ihre Eingabe und klicken Sie auf "OK":

Bitte wählen Sie mindestens einen Newsletter aus und klicken Sie auf "OK"