Python: unterschiedlicher HTTP status code (urllib & feedparser)

Vom einfachen Programm zum fertigen Debian-Paket, Fragen rund um Programmiersprachen, Scripting und Lizenzierung.
Antworten
MoonKid
Beiträge: 513
Registriert: 12.03.2012 22:36:43

Python: unterschiedlicher HTTP status code (urllib & feedparser)

Beitrag von MoonKid » 25.12.2017 13:58:59

Mit http Kommunikation kenne ich mich nicht wirklich aus. Ich versuche das unten beschriebenen Phänomen zu verstehen, um zu entscheiden, ob da evtl ein Bug in feedparser vorliegt. Oder der Webserver ist falsch konfiguriert.

Kurz erklärt: Die gleiche URL liefert mit zwei verschiedenen Paketen unterschiedliche Status Codes zurück.

Code: Alles auswählen

>>> import feedparser
>>> import urllib
>>> a = 'http://www.aerzteblatt.de/rss/news.asp'
>>> af = feedparser.parse(a)
>>> au = urllib.request.urlopen(a)
>>> af.status
301
>>> au.status
200
Hat jemand ne Idee?

Benutzeravatar
bluestar
Beiträge: 2346
Registriert: 26.10.2004 11:16:34
Wohnort: Rhein-Main-Gebiet

Re: Python: unterschiedlicher HTTP status code (urllib & feedparser)

Beitrag von bluestar » 26.12.2017 12:34:53

Nunja urlopen folgt dem 301 (= Redirect) und der Feedpatrser nunmal nicht.

Antworten