Wie extrahiert man hervorgehobenen Text aus einer PDF-AS-Textdatei?

Auswählen von Text in einem Dokument Pdf praktisch, um wichtige Bereiche zu markieren, auf die Sie später schnell zugreifen können. Sie können Microsoft Edge zum Hervorheben von PDFs (Microsoft Edge zum Hervorheben von PDFs) oder jede andere Software verwenden, die mit einer Hervorhebungsfunktion ausgestattet ist Pdf. Manchmal haben Sie vielleicht auch das Bedürfnis verspürt, nur ausgewählten Text zu haben, um eine Zusammenfassung zu erhalten Pdf A, das den gesamten Haupttext enthält. Wenn Sie nach Möglichkeiten suchen, nur ausgewählten Text von zu behalten Pdf als Datei TXT dieser Beitrag könnte hilfreich sein.

Ausgewählten Text aus PDF extrahieren

Es gibt einige kostenlose Software und Dienste, um ausgewählten Text aus einer Datei zu extrahieren Pdf und als Textdatei speichern:

  • PDF-Auswahl-Extraktor
  • Foxit Reader
  • sumnotes.net
  • DyAnnotationExtractor.

Schauen wir uns diese Programme an PDF-Highlight-Extractor der Reihe nach.

1]PDF-Auswahlextraktor

PDF-Highlight-Extractor ist eine der einfachsten Möglichkeiten, ausgewählten Text zu extrahieren Pdf – Datei. Dieses Werkzeug für PDF-Textauswahl (PDF-Texthervorhebungsextraktor)Open Source(Open-Source) hat zwei Merkmale, die die Aufmerksamkeit auf sich ziehen. Sie können ausgewählten Text anzeigen(Vorschau markierter Text) PDF in der Programmoberfläche.

Das zweite Merkmal ist, dass Sie es können Legen Sie die Start- oder Endseite oder den Seitenbereich fest, um Text zu extrahieren(Start- oder Endseite oder Seitenbereich festlegen, um den Text zu extrahieren) . Also anstatt alles zu scannen Pdf -Datei können Sie Seitenzahlen angeben, um hervorgehobenen Text zu erhalten.

Eine weitere nützliche Funktion ist, dass Sie können Text als reinen Text speichern(Text als Klartext speichern) oder Excel-Datei(Excel-Datei).

Fügen Sie in seiner Benutzeroberfläche Ihre hinzu Pdf -Datei mit dieser Option, und klicken Sie dann auf ” Extrakt(Extrakt) ” . Deaktivieren Sie ” Alle Seiten(Alle Seiten)”, wenn Sie den Seitenbereich festlegen oder so belassen möchten. Sobald der Text eingegangen ist, können Sie ihn anzeigen. Klicken Sie abschließend auf ” Text(Text)” oder ” übertreffen » um den ausgewählten Text zu speichern.

Sie können diese Software hier herunterladen. Java ist ebenfalls erforderlich, um diese Software zu verwenden. Also installieren Java (falls noch nicht geschehen) und führen Sie diese Software aus, um sie zu verwenden.

2]Foxit-Reader

Ausgewählten Text aus PDF extrahieren

Foxit Reader ist einer der besten kostenlosen PDF-Reader. Sie können mehrere öffnen Pdf – Dateien auf separaten Registerkarten, markieren Pdf -Dateien, Notizen hinzufügen, Kommentare exportieren(Kommentare exportieren) , Untertitel hinzufügen(Signaturen hinzufügen) und vieles mehr. Unter der riesigen Liste von Funktionen gibt es auch das Extrahieren von ausgewähltem Text aus Pdf . Das Beste an dieser Funktion ist, dass es auch speichert Seitenzahlen zusammen mit extrahiertem Text(speichert Seitenzahlen zusammen mit dem extrahierten Text) .

Ausgewählten Text extrahieren Pdf öffne die Datei Pdf in seiner Oberfläche und gehen Sie zur Registerkarte ” Kommentar “. (Kommentar)Wählen Sie auf dieser Registerkarte die Option ” Export(Export)“, verfügbar im Abschnitt “Kommentarverwaltung(Kommentare verwalten)”. Sie sehen die Option ” Der ausgewählte Text(Hervorgehobener Text)”. Verwenden Sie diese Option und Sie können den gesamten ausgewählten Text als Textdatei speichern.

Hier ist der Link zum Herunterladen dieser Software. Während der Installation müssen Sie auswählen benutzerdefinierte Installation(benutzerdefinierte Installation), um nur die erforderlichen Komponenten dieser Software einzuschließen.

3]Sumnotes.net

Anmerkungen

sumnotes.net ist ein kostenloser Service, mit dem Sie Kommentare abgeben können Pdf , sowie den ausgewählten Text extrahieren. Alle ausgewählten Texte sind separat in der linken Seitenleiste sichtbar. Mit dieser Seitenleiste können Sie das auch Entfernen Sie ausgewählten Text, den Sie nicht benötigen,(entfernen Sie markierten Text, den Sie nicht benötigen) und laden Sie dann den Rest des markierten Textes.

Vor dem Laden des ausgewählten Textes können Sie auch Seitenzahlen und angeben ausschließen(ausschließen) markiert Text in einer bestimmten Farbe(hervorgehobener Text einer bestimmten Farbe) .

Sie haben auch die Möglichkeit Ausgewählten Text aus PDF als Excel-Datei speichern(markierten Text aus PDF als Excel speichern) oder Wort . Also die Funktionen sind gut. Sie können sich für einen kostenlosen Plan anmelden und dann Extrahiere 50 Highlights(extrahieren Sie 50 Markierungen) oder Anmerkungen pro Download(per Download) , was in den meisten Fällen ausreicht.

Hier ist ein Link zu seiner Homepage. Ausgewählten Text extrahieren Pdf -Datei, hinzufügen Pdf -Datei vom PC bzw Google Drive(Google Drive). Beim Laden Pdf -Anmerkungsdatei und ausgewählter Text werden auf der linken Seite angezeigt. Verwenden Sie die ” Anmerkungen herunterladen(Anmerkungen herunterladen) “, und dann können Sie den ausgewählten Text in einer Formatdatei speichern TXT , XLSX oder DOC.

4]DyAnnotationExtractor

DyAnnotationExtractor-Befehlszeilensoftware

DyAnnotationExtractor-Software(DyAnnotationExtractor) kann Ihnen helfen, ausgewählten Text zu extrahieren und Kommentare(Kommentare) aus dem PDF-Dokument. Diese Software Befehlszeile(Befehlszeile) , aber es ist sehr einfach zu bedienen. Nur ein Befehl extrahiert den in der Eingabe ausgewählten Text Pdf – Datei.

Sie können diese Software über diesen Link herunterladen. Download(Lade es herunter POSTLEITZAHL -Datei und dann entpacken. Um das Ausführen des Befehls zu vereinfachen, sollten Sie auch put Pdf in denselben Ordner, in den Sie diese Software entpackt haben. Öffnen Sie dann ein Fenster Befehlszeile(Eingabeaufforderung) in diesem Ordner. Sie können dies durch Eingabe tun cmd in das Adressfeld dieses Ordners ein und drücken Sie dann die Taste Eintreten .

Wenn das Fenster cmd öffnen, hinzufügen SCHLÄGER -die Datei dieser Software, der Eingabebefehl, einschließlich des Pfads zur Eingabe Pdf , den Ausgabebefehl und den Namen der Ausgabedatei zusammen mit der Erweiterung “.txt”. Das komplette Team wird

DyAnnotationExtractor.bat -input path of input PDF -output outputfilename.txt

Führen Sie den Befehl aus. Warte ab(Warten Sie) ein paar Sekunden und eine einfache Textdatei wird bereit sein, die den gesamten ausgewählten Text und die daraus extrahierten Kommentare enthält Pdf -Datei . Die Ausgabedatei wird im selben Eingabeordner gespeichert.

Hier sind einige Optionen, mit denen Sie ausgewählten Text extrahieren können Pdf und speichern Sie dann das Ergebnis als Textdatei. Hoffnung,(Hoffe) das wird helfen.

Das Hervorheben von Text in einem PDF-Dokument ist praktisch, um wichtige Bereiche zu markieren, auf die Sie später schnell zugreifen können. Sie können Microsoft Edge verwenden, um PDF oder jede andere Software hervorzuheben, die mit der PDF-Hervorhebungsfunktion ausgestattet ist. Manchmal haben Sie vielleicht auch das Bedürfnis verspürt, nur den hervorgehobenen Text zu haben, damit Sie die Zusammenfassung des PDF-Dokuments haben, das den gesamten wesentlichen Text enthält. Wenn Sie nach Möglichkeiten suchen, nur markierten Text aus einer PDF-Datei als TXT-Datei zu speichern, kann dieser Beitrag hilfreich sein.

Markierten Text aus PDF extrahieren

Es gibt einige kostenlose Software und einen Dienst, um markierten Text aus einer PDF-Datei zu extrahieren und als Textdatei zu speichern:

  • PDF-Highlight-Extractor
  • Foxit Reader
  • sumnotes.net
  • DyAnnotationExtractor.

Lassen Sie uns diese PDF Highlight Extractor-Software nacheinander überprüfen.

1]PDF-Hervorhebungsextraktor

PDF Highlight Extractor-Software

PDF Highlight Extractor ist eine der einfachsten Optionen, um den hervorgehobenen Text aus einer PDF-Datei zu extrahieren. Dies Open Source PDF-Texthervorhebungs-Extraktor hat zwei Merkmale, die die Aufmerksamkeit auf sich ziehen. Du kannst Vorschau auf markierten Text von PDF auf der Softwareoberfläche.

Das zweite Merkmal ist, dass Sie es können Legen Sie die Start- oder Endseite oder den Seitenbereich fest, um den Text zu extrahieren. Anstatt das gesamte PDF zu scannen, können Sie also Seitenzahlen definieren, um den hervorgehobenen Text zu erhalten.

Ein weiteres gutes Feature ist, dass Sie die Möglichkeit dazu haben Text als reinen Text speichern oder Excel-Datei.

Fügen Sie auf seiner Oberfläche Ihre PDF-Datei mit der angegebenen Option hinzu und drücken Sie dann die Extrakt Taste. Deaktivieren Sie die Option, wenn Sie den Seitenbereich festlegen möchten, oder lassen Sie ihn unverändert. Sobald der Text abgerufen wurde, können Sie ihn in der Vorschau anzeigen. Drücken Sie abschließend die Text oder übertreffen Taste, um den markierten Text zu speichern.

Sie können diese Software hier herunterladen. Java wird auch benötigt, um diese Software zu verwenden. Installieren Sie also Java (falls noch nicht geschehen) und führen Sie diese Software aus, um sie zu verwenden.

2]Foxit-Reader

Markierten Text aus PDF extrahieren

Foxit Reader ist einer der besten kostenlosen PDF-Reader. Sie können mehrere PDF-Dateien in separaten Registerkarten öffnen, PDF markieren, eine Notiz hinzufügen, Kommentare exportieren, Unterschriften hinzufügen, und mehr. Zu der riesigen Liste von Funktionen gehört auch das Extrahieren von hervorgehobenem Text aus PDF. Das Beste an dieser Funktion ist auch speichert Seitenzahlen zusammen mit dem extrahierten Text.

Um hervorgehobenen Text aus PDF abzurufen, öffnen Sie die PDF-Datei auf ihrer Oberfläche und greifen Sie auf die Kommentar Tab. Klicken Sie auf dieser Registerkarte auf Export Option im Abschnitt verfügbar. Sie werden die sehen Text hervorheben Möglichkeit. Verwenden Sie diese Option und Sie können den gesamten markierten Text als Textdatei speichern.

Hier ist der Download-Link für diese Software. Während der Installation sollten Sie auswählen, dass nur die erforderlichen Komponenten dieser Software enthalten sein sollen.

3]Sumnotes.net

Zusammenfassungen

Sumnotes.net ist ein kostenloser Dienst, mit dem Sie PDFs kommentieren und den markierten Text extrahieren können. Der gesamte hervorgehobene Text ist separat in der linken Seitenleiste sichtbar. Mit dieser Seitenleiste können Sie das auch Entfernen Sie hervorgehobenen Text, den Sie nicht benötigen und laden Sie dann den Rest des markierten Textes herunter.

Vor dem Herunterladen des markierten Textes können Sie auch Seitenzahlen und hinzufügen ausschließen das hervorgehobener Text einer bestimmten Farbe.

Sie haben auch die Möglichkeit dazu Markierten Text aus PDF als Excel speichern oder Wort Datei. Die Funktionen sind also gut. Sie können sich mit einem kostenlosen Plan anmelden und dann Extrahiere 50 Highlights oder Anmerkungen pro Downloadwas in den meisten Fällen ausreichend ist.

Hier ist der Link zu seiner Homepage. Um markierten Text aus PDF zu extrahieren, fügen Sie ein PDF vom PC hinzu oder Google Drive. Wenn das PDF hochgeladen wird, sind Anmerkungen und hervorgehobener Text auf der linken Seite sichtbar. Verwenden Sie die Anmerkungen herunterladen Option und dann können Sie den markierten Text speichern TXT, XLSXoder DOC Datei formatieren.

4]DyAnnotationExtractor

DyAnnotationExtractor-Befehlszeilensoftware

Die DyAnnotationExtractor-Software kann Ihnen dabei helfen, hervorgehobenen Text zu extrahieren und Kommentare aus einem PDF-Dokument. Es ist ein Befehlszeile Software, aber die Verwendung ist sehr einfach. Nur ein einziger Befehl ruft den in der Eingabe-PDF-Datei hervorgehobenen Text ab.

Sie können diese Software über diesen Link erhalten. Laden Sie die ZIP-Datei herunter und extrahieren Sie sie. Um das Ausführen des Befehls zu vereinfachen, sollten Sie PDF auch in denselben Ordner legen, in dem Sie diese Software extrahiert haben. Öffnen Sie danach das Fenster in diesem Ordner. Sie können dies tun, indem Sie das Adressfeld dieses Ordners eingeben und dann die Taste drücken.

Wenn das CMD-Fenster geöffnet wird, fügen Sie die BAT-Datei dieser Software, den Eingabebefehl einschließlich des Pfads der Eingabe-PDF, den Ausgabebefehl und den Namen der Ausgabedatei zusammen mit der Erweiterung „.txt“ hinzu. Der vollständige Befehl wird sein

DyAnnotationExtractor.bat -input path of input PDF -output outputfilename.txt

Führen Sie den Befehl aus. Warten Sie ein paar Sekunden, und die Nur-Text-Datei ist fertig und enthält alle markierten Texte und Kommentare, die aus dieser PDF abgerufen wurden. Die Ausgabedatei wird im selben Eingabeordner gespeichert.

Dies sind also einige Optionen, die Sie verwenden können, um hervorgehobenen Text aus PDF zu extrahieren und die Ausgabe dann als Textdatei zu speichern. Hoffe, diese helfen.