Python Scripte
Ausgesuchte Python Scripte und Beispiele, um Daten und Dokumente zu konvertieren. Wenn Sie auch gern mit Python unterwegs sind, besuchen Sie auch die Win32com Script Collection.
-
PDF und 3D-PDF im Batch mit Acrobat 3D
Der Adobe Acrobat und Acrobat 3D Batch Converter liegt zwar in einer anderen Sektion, gehört aber trotzdem in die Kategorie Python Scripte, da der Quellcode frei verfügbar ist.
-
HTML-Code von Webseiten automatisiert mit Internet Explorer speichern
Hin und wieder möchte man für den einen oder anderen Zweck den HTML-Code von Webseiten abspeichern. Sicher könnte man hierfür den Quellcode jeder einzelnen Seite mit dem Webbrowser anzeigen und den Inhalt in eine separate Datei abspeichern – oder noch einfacher im Menü "Speichern" aufrufen. Praktischer ist es aber, insbesondere für viele URLs/Webseiten, es automatisiert von Python erledigen zu lassen. Das folgende Python Script automatisiert den Microsoft Internet Explorer und holt vollautomatisch den Quellcode einer angegebenen URL: # This example need ActivePython or any other Python distribution # with the Pywin32 module from Marc Hammond from win32com.client import Dispatch from time import sleep def download_url(url): """ Note: IE internally formats…
-
Aus Internet Explorer automatisiert drucken
Dieses Python Script navigiert im Internet Explorer zu einer definierten URL und druckt die geladene Seite auf dem Windows Standard-Drucker aus:
-
PDF Dokumente stempeln mit PyPDF
Dieses Python Beispiel Script stempelt die erste Seite eines PDF Dokuments mit einer anderen PDF Datei und schreibt das Resultat in eine dritte PDF Datei. Der Stempelvorgang wird durch Überlagerung zweier PDF Dokumente erzeugt. Achtung: Das Script benötigt das Python Modul PyPDF. Tipp: Falls der Stempel durchsichtig aufgetragen werden soll, muss der Text der Stempel-PDF-Datei transparent erzeugt worden sein. Die Transparenz kann man in Word z.B. über die Formatierung/Eigenschaften eines Textfelds definieren-bevor der Stempel zu PDF konvertiert und mit diesem Script verwendet wird. from pyPdf import PdfFileWriter, PdfFileReader output = PdfFileWriter() input1 = PdfFileReader(file("C:\\test.pdf", "rb")) # add page 1 from input1 to output document, unchanged output.addPage(input1.getPage(0)) # add page 4 from…
-
PDF zusammenführen/verbinden mit PyPdf
Dieses PyPDF-Beispiel demonstriert, wie zwei PDF Dokumente in einer dritten PDF-Datei zusammengeführt (konkateniert) werden: from pyPdf import PdfFileWriter, PdfFileReader output = PdfFileWriter() input1 = PdfFileReader(file("C:\\test2.pdf", "rb")) input2 = PdfFileReader(file("C:\\GEHEIM2.pdf", "rb")) for page in range(input1.getNumPages()): output.addPage(input1.getPage(page)) print 'Added page %s from first file'%page for page in range(input2.getNumPages()): output.addPage(input2.getPage(page)) print 'Added page %s from second file'%page outputStream = file("c:\\document-output.pdf", "wb") output.write(outputStream) outputStream.close()
-
Hyperlinks aus Visio extrahieren mit Python
Hier ist ein kleines Python-Script, welches alle Hyperlinks aus Microsoft Visio Dokumenten in eine Textdatei extrahiert. Es benötigt Pywin32! from win32com.client import Dispatch from sys import argv from sys import exit if len(argv)
-
Hyperlinks aus Excel extrahieren mit Python
Hier ist ein kleines Python-Script, welches alle Hyperlinks aus Microsoft Excel Dokumenten in eine Textdatei extrahiert. Es benötigt Pywin32! from win32com.client import Dispatch from sys import argv from sys import exit if len(argv)
-
PDF im Batch mit OpenOffice und Python
Mit Python lässt sich OpenOffice wunderbar zur Konvertierung von Dokumenten im Batch automatisieren. Das folgende Python Script ist ein Office zu PDF Batch Converter, basierend auf der OpenOffice PyUNO API. Es wird am besten mit dem Python Interpreter aus OpenOffice aufgerufen und konvertiert alle Dokumente in einem angegebenen Verzeichnis zu PDF. Vorraussetzung ist natürlich, dass die PyUNO API bei der OpenOffice-Installation mitinstalliert und OpenOffice Im Servermodus gestartet wurde: soffice "-accept=socket,host=localhost,port=2002;urp;" Und hier ein beispielhafter Aufruf des Programms: c:\\programme\\OpenOffice\\program\\python.bat c:\\converter\\ooconvert.py c:\\testdocs\\doc Und nun der Python Quellcode: # For a list of possible export formats see # http://www.openoffice.org/files/documents/25/111/filter_description.html # or # /opt/OpenOffice.org/share/registry/data/org/openoffice/Office/TypeDetection.xcu import sys, os, uno from com.sun.star.beans import PropertyValue export_format="writer_pdf_Export" export_extension="pdf"…
-
PDF zu Text mit PyPDF
Ein PyPDF-Python-Script zum Export des Inhalts einer PDF-Datei im Textformat. import pyPdf def getPDFContent(path): content = "" pdf = pyPdf.PdfFileReader(file(path, "rb")) for i in range(0, pdf.getNumPages()): content += pdf.getPage(i).extractText() + "\n" # Loesche Leerzeichen content = " ".join(content.replace("\xa0", " ").strip().split()) return content print getPDFContent("test.pdf")
-
Windows-Benutzer automatisiert mit Python anlegen
Ein Python-Script zum automatisierten Anlegen von Windows-Benutzern: import win32netcon, win32net d={} d['name'] = "PythonTestUser" d['password'] = "Top Secret" d['comment'] = "A user created by some Python demo code" d['flags'] = win32netcon.UF_NORMAL_ACCOUNT | win32netcon.UF_SCRIPT d['priv'] = win32netcon.USER_PRIV_USER win32net.NetUserAdd(None, 1, d)