Warum antworten manche Webserver nicht mit "404", obwohl sie eine "Page not found" Meldung anzeigen.
Beispiel: https://www.sciencedirect.com/favicon.ico antwortet mit "200" aber zeigt eine "Page not found" an.
Ist das nicht gegen das Protokoll? Schrecklich wie viele Extrawürschte man berücksichtigen muss, wenn man etwas programmiert, das mti Websiten interagieren muss.
Für mich heißt es, ich kann mich auf den response code nicht verlassen, sondern muss immer die Daten parsen, um zu entscheiden, ob es das ist was ich will.
[gelöst] Page not found != 404
[gelöst] Page not found != 404
Zuletzt geändert von buhtz am 29.05.2019 14:30:13, insgesamt 1-mal geändert.
Debian 11 & 12; Desktop-PC, Headless-NAS, Raspberry Pi 4
Teil des Upstream Betreuer Teams von Back In Time (backintime)
Teil des Upstream Betreuer Teams von Back In Time (backintime)
Re: Page not found != 404
Laut Firefox -> Entwicklerwerkzeuge (F12) -> Netzwerkanalayse ist die Antwort schon "HTTP/1.1 404 Not Found".
Die Antwort selbst ist aber HTML-Code, der 6 Objekte enthält, die dann vom Browser geladen werden, dann aber mit "HTTP/1.1 200 OK".
Wie rufst du die URL denn auf? Erhälst du wirklich "HTTP/1.1 200 OK" für die genannte URL ?
Du kannst z. B. so den Status (200, 404, ...) ermitteln:
Die Antwort selbst ist aber HTML-Code, der 6 Objekte enthält, die dann vom Browser geladen werden, dann aber mit "HTTP/1.1 200 OK".
Wie rufst du die URL denn auf? Erhälst du wirklich "HTTP/1.1 200 OK" für die genannte URL ?
Du kannst z. B. so den Status (200, 404, ...) ermitteln:
Code: Alles auswählen
wget --server-response https://www.sciencedirect.com/favicon.ico 2>&1 | awk '/^ HTTP/{print $2}'
- Lord_Carlos
- Beiträge: 5578
- Registriert: 30.04.2006 17:58:52
- Lizenz eigener Beiträge: GNU Free Documentation License
- Wohnort: Dänemark
Re: Page not found != 404
Code: Alles auswählen
╔═╗┬ ┬┌─┐┌┬┐┌─┐┌┬┐╔╦╗
╚═╗└┬┘└─┐ │ ├┤ │││ ║║
╚═╝ ┴ └─┘ ┴ └─┘┴ ┴═╩╝ rockt das Forum!
Re: Page not found != 404
Ah, ich hatte python3-aiohttp genutzt. Da hat das ClientResponse objekt eine eigenen History in der man 404, 200 ablesen könnte. ICh hatte nur den letzten ClientResponse.status abgefragt. Also ein Programmierfehler sozusagen.
Danke für die Erleuchtung.
btw: Wo siehst du im Firefox F12 die 400er Fehler? Ich sehe nur 4 Objekte mit code 200.
Danke für die Erleuchtung.
btw: Wo siehst du im Firefox F12 die 400er Fehler? Ich sehe nur 4 Objekte mit code 200.
Debian 11 & 12; Desktop-PC, Headless-NAS, Raspberry Pi 4
Teil des Upstream Betreuer Teams von Back In Time (backintime)
Teil des Upstream Betreuer Teams von Back In Time (backintime)
Re: [gelöst] Page not found != 404
F12, Netzwerkanalyse, neu laden
Re: [gelöst] Page not found != 404
Was ist mit https://journals.elsevier.com/favicon.ico ?
Hier bekomme ich mit Firefox und curl nur ein timeout.
Firefox löst ebenso https://journals.elsevier.com nicht auf, aber journals.elsevier.com .
Hier bekomme ich mit Firefox und curl nur ein timeout.
Firefox löst ebenso https://journals.elsevier.com nicht auf, aber journals.elsevier.com .
Debian 11 & 12; Desktop-PC, Headless-NAS, Raspberry Pi 4
Teil des Upstream Betreuer Teams von Back In Time (backintime)
Teil des Upstream Betreuer Teams von Back In Time (backintime)