[gelöst] Page not found != 404

Smalltalk
Antworten
buhtz
Beiträge: 1106
Registriert: 04.12.2015 17:54:49
Kontaktdaten:

[gelöst] Page not found != 404

Beitrag von buhtz » 29.05.2019 10:41:38

Warum antworten manche Webserver nicht mit "404", obwohl sie eine "Page not found" Meldung anzeigen.

Beispiel: https://www.sciencedirect.com/favicon.ico antwortet mit "200" aber zeigt eine "Page not found" an.

Ist das nicht gegen das Protokoll? Schrecklich wie viele Extrawürschte man berücksichtigen muss, wenn man etwas programmiert, das mti Websiten interagieren muss. ;)
Für mich heißt es, ich kann mich auf den response code nicht verlassen, sondern muss immer die Daten parsen, um zu entscheiden, ob es das ist was ich will.
Zuletzt geändert von buhtz am 29.05.2019 14:30:13, insgesamt 1-mal geändert.
Debian 11 & 12; Desktop-PC, Headless-NAS, Raspberry Pi 4
Teil des Upstream Betreuer Teams von Back In Time (Debianbackintime)

uname
Beiträge: 12075
Registriert: 03.06.2008 09:33:02

Re: Page not found != 404

Beitrag von uname » 29.05.2019 10:50:43

Laut Firefox -> Entwicklerwerkzeuge (F12) -> Netzwerkanalayse ist die Antwort schon "HTTP/1.1 404 Not Found".
Die Antwort selbst ist aber HTML-Code, der 6 Objekte enthält, die dann vom Browser geladen werden, dann aber mit "HTTP/1.1 200 OK".

Wie rufst du die URL denn auf? Erhälst du wirklich "HTTP/1.1 200 OK" für die genannte URL ?

Du kannst z. B. so den Status (200, 404, ...) ermitteln:

Code: Alles auswählen

wget --server-response https://www.sciencedirect.com/favicon.ico 2>&1 | awk '/^  HTTP/{print $2}'

Benutzeravatar
Lord_Carlos
Beiträge: 5578
Registriert: 30.04.2006 17:58:52
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Dänemark

Re: Page not found != 404

Beitrag von Lord_Carlos » 29.05.2019 11:19:24

curl -I https://www.sciencedirect.com/favicon.ico
HTTP/1.1 404 Not Found


:)))))

Code: Alles auswählen

╔═╗┬ ┬┌─┐┌┬┐┌─┐┌┬┐╔╦╗
╚═╗└┬┘└─┐ │ ├┤ │││ ║║
╚═╝ ┴ └─┘ ┴ └─┘┴ ┴═╩╝ rockt das Forum!

buhtz
Beiträge: 1106
Registriert: 04.12.2015 17:54:49
Kontaktdaten:

Re: Page not found != 404

Beitrag von buhtz » 29.05.2019 12:20:31

Ah, ich hatte Debianpython3-aiohttp genutzt. Da hat das ClientResponse objekt eine eigenen History in der man 404, 200 ablesen könnte. ICh hatte nur den letzten ClientResponse.status abgefragt. Also ein Programmierfehler sozusagen.

Danke für die Erleuchtung.

btw: Wo siehst du im Firefox F12 die 400er Fehler? Ich sehe nur 4 Objekte mit code 200.
Debian 11 & 12; Desktop-PC, Headless-NAS, Raspberry Pi 4
Teil des Upstream Betreuer Teams von Back In Time (Debianbackintime)

uname
Beiträge: 12075
Registriert: 03.06.2008 09:33:02

Re: [gelöst] Page not found != 404

Beitrag von uname » 30.05.2019 07:56:16

F12, Netzwerkanalyse, neu laden

buhtz
Beiträge: 1106
Registriert: 04.12.2015 17:54:49
Kontaktdaten:

Re: [gelöst] Page not found != 404

Beitrag von buhtz » 12.06.2019 22:34:46

Was ist mit https://journals.elsevier.com/favicon.ico ?

Hier bekomme ich mit Firefox und curl nur ein timeout.
Firefox löst ebenso https://journals.elsevier.com nicht auf, aber journals.elsevier.com .
Debian 11 & 12; Desktop-PC, Headless-NAS, Raspberry Pi 4
Teil des Upstream Betreuer Teams von Back In Time (Debianbackintime)

Antworten