hupfdule hat geschrieben:weedy hat geschrieben:Ich vermisse eine P2P-Suchmaschine, die Google ablösen soll.
Die Idee klingt sehr interessant, aber meinst du dass das wirklich realistisch ist? Schließlich muss eine sinnvolle Suchmaschine extrem viele Seiten indizieren. Das ist denke ich nicht mit den Suchtechniken in Filesharing-Netzen zu vergleichen.
Ich halte es für absolut realistisch. Google betreibt meines Wissens nach (hörensagen) 8000 Rechner (Indexserver) sagen wir mit ca. je 100 GB (ich übertreibe mal) Plattenplatz pro Rechner. Wenn eine p2p-Suchmaschine etabliert ist, könnte es sich um beispielsweise das 100-fache an clients handeln, also 800000 Rechner, die nun als Indexserver betrieben werden können. D.h., um die Google-DB zumindest erstmal von der Speichermenge her abzubilden würde es nun genügen, daß pro P2P-Teilnehmer nur 1 GB an Daten hält. Mittlerweile ist das ja nicht mehr viel. Sind es 8000000 Teilnehmer => 100 MB (durchaus realistisch: Tauschbörsen dürften weitaus mehr Nutzer haben). Die Annahme nimmt an die p2p-Suchmaschine sei etabliert, das nur zur Erinerung, aber selbst Anfangs werden sich sicherlich viele finden, die mitmachen und wenn in gängigen Foren Suchverweise ähnlihc edonkey-urls angegeben sind, wird das ganze etwas beschleunigt.
Gedanken muss man sich dann noch über die Fälschbarkeit von Ergebnissen machen; das liesse sich über ein Bewertungssysteme regeln und über redundant abgelegte und erzeugte Ergebnisse; dürfte also auch machbar sein.
Sinvoll ist an der Stelle, daß die Applikation gleich so entwickelt wird, daß endlich mal etwas komplexere Abfragen möglich sind (regexpressions).
Auch könnte man diese Suchmaschine mit einem http-proxy verbinden (z.B. squid), so daß nicht nur wild drauflosindiziert wird, sondern der einfachkeit halber auch die seiten indiziert werden, die man sowieso ansurft. dieser modifizierte squid könnte die möglichkeit bieten alte Seiten vom User wieder aufrufen zu lassen, was sich insbesondere bei Spiegelartikeln sinvoll macht, die irgendwann kostenpflichtig werden und wo der Inhalt verschwindet.
Also hier gibt es viele Punkte, durch die ein denkbares System möglichst schnell etabliert werden kann.
weedy.