Webseiten als PDF-Datei mit einem schnell wiederverwendbaren Befehl ausgeben lassen

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
Dengo
Beiträge: 251
Registriert: 07.07.2009 18:54:23

Webseiten als PDF-Datei mit einem schnell wiederverwendbaren Befehl ausgeben lassen

Beitrag von Dengo » 14.05.2022 15:19:00

Hallo,
neulich hat Firefox einen eigenen Drucker-Dialog anstelle des System-Drucker-Dialogs unausweichlich eingeführt, was die Ausgabe bzw. das Speichern von Webseiten als PDF-Datei durch mehrere Mausklicks aufwendig macht.

Gibt es eventuell eine praktische Befehls-Option, bei der ich einfach am Ende des Befehls die Webseite-Adresse, die ausgedruckt werden soll, einfügen kann?

Die Situationsanwendung ist für das Sammeln von Artikeln aus der Webseite gedacht, was besonders für Lehrer und Forscher nützlich ist. Man hat auf der Festplatte ein bestimmtes Verzeichnis, wo die gewollten Artikeln als PDF abgelegt werden sollen.

Dabei ist es wichtig, dass man Artikeln aus verschiedenen Webseiten entprechend als PDF holen kann. Besonders interessant ist es, wenn Artikel aus einseitigen Nachrichtenanstalten wie z.B. Deutschlandfunk https://www.deutschlandfunk.de/nachrichten-100.html somit gesichert werden könnten, denn sie verändern oder löschen selektiv deren Nachrichten je nach politischen Entscheidungen, sodass nachträglich jedes Nachschlagen verhindert bzw. ein unrealistisches Ergebnis bringt. Auf der anderen Seite, sollen Artikel entsprechend erfasst werden, die von Denker anderer Kulturen verfasst wurden, wie diese aus der Welt Abya Yalas https://www.telesurtv.net/bloggers/La-U ... -0003.html

Mit welchen Befehlen kann ich solche Inhalte als PDF auf meine Festplatte ablegen?

Ich bedanke mich bei Euch im vorraus für jeden Tipp!

Viele Grüße
Dengo

buddy67
Beiträge: 169
Registriert: 30.06.2016 22:52:15

Re: Webseiten als PDF-Datei mit einem schnell wiederverwendbaren Befehl ausgeben lassen

Beitrag von buddy67 » 14.05.2022 18:29:27

das geht z.B. mit wkhtmltopdf auf der console:

Code: Alles auswählen

wkhtmltopdf https://irgendwas.irgendwo/seite.html test.pdf
Speichert die angegebene Webseite als test.pdf im aktuellen Verzeichnis.

Bei Firefox gibt es ein Add-On "Save as PDF", soll wohl mit einem Kick gehen, hab ich aber nicht ausprobiert...

rockyracoon
Beiträge: 1475
Registriert: 13.05.2016 12:42:18
Lizenz eigener Beiträge: GNU Free Documentation License

Re: Webseiten als PDF-Datei mit einem schnell wiederverwendbaren Befehl ausgeben lassen

Beitrag von rockyracoon » 15.05.2022 12:39:32

@Dengo:
Webseiten als PDF-Datei... ausgeben lassen
Zumindest bei mir (Debian-Stable / Gnome3-Wayland / Firefox-Esr) läuft das dann so:

- "printer-driver-cups-pdf" und "cups" installieren
- den "PDF-Drucker" unter den Drucker-Einstellungen hinzufügen, wenn dies nicht schon automatisch passiert ist
- bei Eingriffen in das System ist es btw immer sinnvoll, ein Reboot oder Ab- und wieder Anmelden vorzunehmen, damit die Änderungen wirksam werden
- eine Webseite öffnen und aus dem Browser heraus einen Druckauftrag als PDF geben
- die Seite wird dann nicht tatsächlich ausgedruckt, sondern erscheint als PDF-Datei unter dem Ordner "PDF" im Home-Verzeichnis


Im Gegensatz zu der oben erwähnten alternativen Möglichkeit über das Browser-Add-On "save as pdf" gehen die Daten mit der printer-driver-cups-pdf-Methode nicht an eine Konvertierungs-Seite im Web, sondern werden im eigenen PC verarbeitet, will sagen es herrscht mehr Datenschutz und Privatheit.
Die oben dargestellte Konsolenlösung wiederum entspricht imho nicht dem Wunsch nach einer schnellen und einfachen Methode.

BTW:
Nützlich ist es imho auch, das Browser-Add-On "SingleFile" zu installieren.
Dies ermöglicht das Abspeichern einer Web-Seite als eine einzige HTML-Datei:
https://www.youtube.com/watch?v=RdV8DBW5b0g

Beide Verfahren (PDF-Printer / SingleFile) nutze ich, wie auch vom Threadstarter anvisiert, zum Archivieren mir wichtiger Informationen aus dem Internet.

Dengo
Beiträge: 251
Registriert: 07.07.2009 18:54:23

Re: Webseiten als PDF-Datei mit einem schnell wiederverwendbaren Befehl ausgeben lassen

Beitrag von Dengo » 16.05.2022 19:14:01

Vielen Dank für die Tipps.
Inzwischen habe ich sie getestet und sie funktionieren, auch wenn ich noch nicht genau weiß, was für meinen Zweck verwendet wird.
Die Addons habe ich installiert und verwendet. Anschließend Firefox geschoßen. Dabei habe ich etwas festgestellt, das ich bisher, soweit meine Erinnerung reicht, noch nie gesehen habe: unter den anschließend noch laufenden Prozessen befinden sich folgende, die eigentlich nicht da sein sollten:

28075 dengo 20 0 4054688 434832 140296 S 1,0 2,7 129:41.25 firefox-esr
28199 dengo 20 0 26,9g 298464 86800 S 0,3 1,8 9:09.16 WebExtensions
28158 dengo 20 0 2449228 98884 72456 S 0,3 0,6 1:25.36 Web Content

Auch nachdem ich Debian 11 (Mate, Thinkpad x220i) schlafen machte und wieder aufweckte, blieben die Prozesse aktiv. Alle zwei Addons wieder deinstalliert, alle Programme geschlossen, System heruntergefahren und wieder hoch. Dann waren diese Prozesse nicht mehr da. Firefox geöffnet und nach einer Minute wieder geschlossen, nun laufen trotzdem die drei aufgelisteten Prozesse fleißig weiter. Ich kann nicht nachvollziehen, was sie nachträglich noch zu tun hätten.
killall findet keinen Prozess, obwohl die angegebene Prozess-Nummer stimmt. Mit kill -9 können sie beendet werden.

Ich werde es weiter beobachten und basteln, und womöglich nach weitere möglichen Lösungen suchen.

Viele Grüße
dengo

tobo
Beiträge: 1989
Registriert: 10.12.2008 10:51:41

Re: Webseiten als PDF-Datei mit einem schnell wiederverwendbaren Befehl ausgeben lassen

Beitrag von tobo » 16.05.2022 21:30:34

Dengo hat geschrieben: ↑ zum Beitrag ↑
16.05.2022 19:14:01
Firefox geöffnet und nach einer Minute wieder geschlossen, nun laufen trotzdem die drei aufgelisteten Prozesse fleißig weiter. Ich kann nicht nachvollziehen, was sie nachträglich noch zu tun hätten.
Das ist verständlich, denn das kann so nicht sein. Ich würde mal tippen, dass du da irgenein Aktualisierungsproblem in deiner Prozessanzeige hattest. Wenn du firefox beendest, dann beenden sich auch der WebExtenssions- und alle Web Content-Prozesse. Der Addon-Ersatz WebExtensions und die verschiedenen Tabs (WebContent) laufen in neueren Versionen von Firefox in eigenen Prozessen, die von Firefox erzeugt werden. Es gibt einen Firefox-, einen WebExtensions- und mindestens einen Web Content-Prozess (maximal so viele, wie unter Setings/General/Performance/Content_process_limit eingestellt ist)
killall findet keinen Prozess, obwohl die angegebene Prozess-Nummer stimmt. Mit kill -9 können sie beendet werden.
Das liegt vielleicht daran, dass killall mit dem Prozessnamen aufgerufen wird und kill mit der PID. Im obigen Beispiel beendet also sowohl

Code: Alles auswählen

kill 28075
als auch

Code: Alles auswählen

killall firefox-esr
den Firefox-esr-, Web Content- und WebExtensions-Prozess dieses einen Firefox-Prozesses. Bei killall würden auch alle namensgleichen Prozesse beendet.

Antworten