Mailinglist Archive: opensuse-de (5395 mails)

< Previous Next >
Re: Listenarchiv / was: suse-linux ist kollabiert
  • From: Jan.Trippler@xxxxxxxxxxx (Jan Trippler)
  • Date: Wed Feb 23 00:00:49 2000
  • Message-id: <20000223010049.A19627@xxxxxxxxxxxxxx>



On Die, Feb 22, 2000 at 11:21:27 +0100, Jan Theofel wrote:
[Mail-Archiv-Autoresponder]
> Faende ich interessant.
>
> Allerdings wuerde ich die Anfragen in den Body schreiben. Stell dir nur
> mal
> vor, jemand schickt aus Versehen ein Mail mit "Ein dickes Lob aus SuSE
> Linux"
> hin und der Server schickte alle Threads mit 'ein', 'dickes', ...
>
> Ausserdem wuerde ich dazu auch gleich eine haendisch gepflegte Datenbank
> erstellen, die auf bestimmte Stichwoerter zusaetzlich/ausschliesslich/je
> nach Anfrage zusaetzliche Hinweise in Kurzform (man/info/links/...)
> schickt.
>
> Kleinere technische Probleme:
> Es sollte eine Moeglichkeit geben, die Anzahl der Treffer
> einzuschraenken.
> Ausserdem sollten nicht - moeglicherweise laengst veraltete Mail -
> zurueck
> geliefert werden.
>

Da würden IMHO noch eine ganze Menge technische und andere Fallen zu
überwinden sein:
- Vor ein paar Tagen hat Wolfgang Weisselberg was über die
prinzipiellen Gefahren von Autorespondern geschrieben. Kurzform:
Ich hasse Dich, fake Deine Mailadresse und schicke 200 Anfragen hin
mit Stichwörtern wie sendmail, dev/pts ;-) oder char-major-4 :-)))
Was meinst Du, wie viele Mails Du an diesem Tag kriegst?
- Viele Mails gehören zwar zu einem Thread, sind aber völlig
belanglos (metoo, Danke, 95% Quoting, ...) Die müssten dann auch
redaktionell bearbeitet werden.
- Vollquotings: Wenn Du auf einen Suchbegriff hin komplette Threads
geliefert kriegst, brauchst Du eigenlich ziemlich selten Quotings,
die potenzieren nur die Mail-Größen
- Woran erkenne ich (oder das System) veraltete Mails?
- Wer pflegt die von Dir erwähnte Stichwort-DB?
- Die Anzahl der Treffer _muss_ ganz zwingend eingeschränkt werden!
Denk nur mal an einige der bereits erwähnten Lieblingsthemen!
- Mail-Loops (Absender unbekannt verzogen, Mail kommt zurück,
generiert Antwort, die zurückkommt, ...)

Fazit:
(1) Das System muss technisch wasserdicht aufgebaut werden, um einen
Missbrauch als Mailbomber oder Spam-Relayhost zu verhindern.
(2) Es steckt ein IMHO nicht zu verachtender redaktioneller Aufwand
(sicher durch geeignete - noch zu entwickelnde? - Software
unterstützter) Aufwand dahinter, das Archiv zu pflegen.

Nicht umsonst sind die Mechanismen, mit denen grosse Portale wie
yahoo, altavista und Co. die Indizierung von Webseiten vornehmen
AFAIK das grösste Kapital dieser Firmen, zumindest aber der Teil in
dem am meisten Gehirnschmalz steckt.

Vielleicht kann man das Problem ja auf eine andere Art und Weise
angehen. Ich habe mir zufälligerweise (gelogen ;-) in den letzten
Tagen auch Gedanken über die Informationsschwemme in der ML gemacht.
Dabei stellt sich mir eine Frage:
Die meisten von uns archivieren doch mehr oder weniger Mails aus der
Liste, oder? Dabei kommt es doch auch im Laufe der Zeit dazu, dass
zu einzelnen Themen (soll ich sie noch mal aufzählen? :-) sich die
Mails stapeln. Damit wird zumindest für mich schon die Suche im
eigenen Mailarchiv wieder zu einem Ärgernis, weil die Antwort die
ich suche natürlich in der letzten der 200 Mails ist, die ich zum
Thema durchlese.

Nun die Frage: Wäre es nicht viel zweckmäßiger, den lokal
vorhandenen Informationspool so zu speichern, dass man _ihn_ und
nicht das gesamte ML-Archiv durchsuchen kann? Also quasi eine
Indizierung in kleinem Rahmen. Das hat IMHO 2 Riesenvorteile
gegenüber einem Webserver:

1. Die Informationsmenge ist wesentlich
kleiner (natürlich nicht vollständig, aber für die restlichen 10 %
kann man sich ja immer noch ins Netzleben stürzen), also muss man
sich beim Entwickeln nicht grossartig um pfiffige Speicherstrategien
eine Rübe machen - dafür reichen Textdateien.

2. Jeder hat seine eigene Art und Weise der Ablage und der Suche nach
Themen. Also kann auch jeder sein Archiv so füttern, wie er es mag
und damit sein effektives Nachschlagewerk selber aufbauen.

2a. ;-) Es ist billiger, da offline.

So ein privates Archivsystem sollte also folgende Bestandteile
haben:
1. Konzentrator: Interessante Mails übergebe ich ihm; er bereitet
sie schon mal soweit auf, dass er überflüssige Bestandteile löscht
(die definiere ich über .*rc-Dateien) und ein paar grundlegende
Formatierungen erledigt (URL's und Mailadressen separieren, ...)
2. Redakteur: Jetzt kann ich jede Mail nachbearbeiten; er
unterstützt mich dabei. Es werden mir Suchbegriffe vorgeschlagen,
die im Subject oder Body enthalten sind, das in-reply-to wird
ausgewertet, Quotings werden vom Text getrennt, usw.
3. Sorter: Nach der redaktionellen Bearbeitung (die genausogut auch
unterbleiben kann, dann geht die Mail eben als Sushi raus) wird die
Mail in das Archiv einsortiert. Als Format ist sicher HTML oder XML
zu empfehlen, dann fällt die Präsentation leichter. Die Suchbegriffe
werden in geeigneter Form in einem Suchbaum abgelegt.
4. Finder: Das Such- und Präsentationsmodul.

So, das ist meine Idee - gibt's sowas schon? Wenn ja wo wenn nein
warum nicht?

Jan

BTW: Wenns OT wird gern auch per PM weiter!

---------------------------------------------------------------------
To unsubscribe, e-mail: suse-linux-unsubscribe@xxxxxxxx
For additional commands, e-mail: suse-linux-help@xxxxxxxx

< Previous Next >
References