Erfahrung mit Text-Indexern?

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
Benutzeravatar
jd
Beiträge: 286
Registriert: 01.07.2003 12:02:33
Wohnort: D->Hessen->MKK

Erfahrung mit Text-Indexern?

Beitrag von jd » 09.07.2003 11:54:20

Ich bin auf der Suche nach einem Text "Indexer", der sowohl mit deutschen als auch mit englischen Texten klarkommt. Er sollte mit E-Mails, HTML und mit LaTeX klarkommen. Des weiteren muß der Indexer CRON-tauglich sein.

Eigentlich wäre SWISH++ meine erste Wahl, aber anscheinend kommt er nur gut mit Englisch klar. Es fehlen Wortlisten für stop words und für das word stemming.

...oder hat jemand diese Listen für Deutsch? :o

Ich brauche (eigentlich) kein Web-Interface, aber die Integration in Emacs / Gnus wäre ganz nett.

Welche Alternativen gibt es, und wie sind Eure Erfahrungen damit.

Thundersteele
Beiträge: 30
Registriert: 02.07.2003 18:15:24

Beitrag von Thundersteele » 09.07.2003 13:39:49

Entschuldige meine zwischenfrage, aber was genau macht ein Indexer?

Benutzeravatar
jd
Beiträge: 286
Registriert: 01.07.2003 12:02:33
Wohnort: D->Hessen->MKK

Beitrag von jd » 09.07.2003 14:09:55

Ein Indexer indiziert Texte. Er erstellt also einen Suchindex, auf den dann mit entsprechenden Suchprogrammen schnell zugegriffen werden kann.

Mit SWISH++ kann man seine Mail zum Beispiel auf unter Zuhilfenahme von Feldnamen (von SWISH++ attributes genannt) durchsuchen:

Code: Alles auswählen

search author=thundersteel and subject=indexer
Das würde dann alle Mails von Dir auflisten, die "indexer" im Betreff haben.

Andere Indexer kennt dann noch die "fuzzy search", die "unscharf" sucht. Da wäre dann "Tippfähler" und "Tipfehler" ein Treffer.

Antworten