Mustafa Görmezer

 
  • Decrease font size
  • Default font size
  • Increase font size
PDF zu Text mit PyPDF PDF Drucken E-Mail
Benutzer Bewertung: / 1
SchlechtSehr Gut 
Ein PyPDF-Python-Script zum Export des Inhalts einer PDF-Datei im Textformat.
 
import pyPdf
 
def getPDFContent(path):
    content = ""
    pdf = pyPdf.PdfFileReader(file(path, "rb"))
    for i in range(0, pdf.getNumPages()):
        content += pdf.getPage(i).extractText() + "\n"
    # Loesche Leerzeichen
    content = " ".join(content.replace("\xa0", " ").strip().split())
    return content
 
print getPDFContent("test.pdf")

Relevante Beiträge (automatisch):

 
< Voriger Artikel   Nächster Artikel >

Sag nein!

.ausgestrahlt

Statistik

Besucher: 11046041
Aktuell 14 Gäste online

Feedback

Wenn dir die Seite nützlich war, gib ihr doch ein +1:

Kurz-Tipps:

Kein 3D-PDF mehr aus CAD-Daten in Acrobat X
Nach dem Verkauf des 3D-PDF-SDK wird es einem Adobe Blog-Posting zufolge im neuen Acrobat X keine Import-Schnittstellen mehr für 3D CAD-Daten mehr geben. Es wird dann nur noch möglich sein, PRC und U3D zu importieren und in ein 3D-PDF zu wandeln. Software zur Konvertierung von 3D CAD-Daten in 3D-PDF wird in Zukunft von Tech Soft 3D oder Tetra4D LLC angeboten.
 

Kommentare

  • Hallo, PyScripter gefällt mir auch wirklich sehr gut. Etwas nervig ist aber, dass bei jedem Aufruf von input() ein Dialogfenster für die Eingabe aufge... weiter...
  • Hallo Zusammen, vielen Dank für die hilfreiche Unterstützung beim Erstellen des ersten eigenen 3d-PDF. Für eine Technikerarbeit soll ich ein Bauteil i... weiter...
  • Suche nach einem Mindmapping-Tool für mein Projekt und ich fand joomla über Ihre Website, danke! Grüße aus Barcelona weiter...
RSS

Weiteres