MediaWiki: alle Seiten einer Kategorie als PDF exortieren mit Python
Auf meinem Server habe ich MediaWiki installiert, und ich notiere innerhalb diese Wikis meine (privaten) Sachen, unter anderem Notizen zu eben diesem Server (wie funktioniert das mit systemd
, wie starte ich den mpd
-Server, wie funktionieren RegularExpressions, uws).
Jetzt hätte ich meine ganzen Artikel gerne in eine PDF-Datei exportiert, so dass ich auch ohne Netzverbindung - bzw. falls der Server mal down ist - meine Sachen nachlesen kann.
Ich habe letztes Jahr bereits das PHP-Skript mwc2pdf.php
geschrieben (github), mit welchem man alle Seiten einer MediaWiki-Kategorie, inklusive der Seiten aller Unterkategorien, als PDF exportieren kann. Da sich mit mediawiki-1.27
die MediaWiki-api.php
geändert hat, musste ich das Skript etwas anpassen. In diesem Zuge ist mir die Idee gekommen, das Skript nach python
zu portieren.
Et voila: mwc2pdf.py
(github).
Das Skript benötigt mediawiki-1.27
, wkhtmltopdf
, python2
sowie dessen libs “pdfkit
”, “PyPDF2
”, “urllib2
”, welche evtl. nachinstalliert werden müssen.
Das erstellte PDF (welches alle Seiten enthält) verfügt über Bookmarks, über welche man zu den entsprechenden Artikeln gelangen kann. Dieses Feature habe ich in der PHP-Version (mit pdftk
) nicht hinbekommen. Die PyPDF2
-lib schafft das problemlos…
Falls ihr also selber MediaWiki im Einsatz habt, und mal “alles” ausdrucken möchtet… :-)