Heim

Breidbart-Index

Inhaltsverzeichnis

Der nach seinem Erfinder, Seth Breidbart, benannte Breidbart-Index ist der bedeutendste Cancel-Index im Usenet.

Mit einem Cancel-Index wird die Verbreitungsintensität wesensgleicher Artikel bestimmt. Überschreitet der Index einen Grenzwert, so bezeichnet man die betreffenden Artikel als Spam. Sie dürfen dann durch Fremdcancel entfernt werden.

Cancel-Index

Die grundlegende Idee des Breidbart-Index besteht darin, diese Methoden unterschiedlich zu bewerten. [1] Zum einen müssen bei Crossposts weniger Daten übertragen und gespeichert werden. Zum anderen sind exzessive Crossposts (ECP) ein plausibler Anfängerfehler, während exzessive Multiposts (EMP) auf vorsätzlichen Einsatz spezieller Software schließen lässt.

Entscheidend ist die Erfassung verschiedener Artikel als wesensgleich (im englischen Original: substantively identical). Dies umfasst unter anderem:

Breidbart-Index (BI)

Der BI einer Menge von Artikeln ist die Summe der Quadratwurzeln von n, wobei n die Anzahl der Newsgroups ist, in die jeder einzelne Artikel gepostet wurde. Bewertet wird dabei eine Serie wesensgleicher Artikel innerhalb eines Zeitraums von 45 Tagen, d.h. Postings älter als 45 Tage zählen nicht zur Serie.

Beispiel

Zwei Postings enthalten den selben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16.

Version 2 des Breidbart-Index (BI2)

Der BI2 ist definiert als Summe der Quadratwurzeln von n, plus der Summe von n, geteilt durch zwei.

Beispiel

Zwei Postings enthalten den selben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16.

Skirvin-Breidbart-Index (SBI, BI3)

Die Bezeichnungen Skirvin-Breidbart-Index und SBI finden sich im Spam Thresholds FAQ. [2] In der Hierarchie nl.* wird dieser Index aber BI3 genannt. [3]

Der SBI wird wie der BI2 berechnet, summiert aber die Anzahl der Gruppen in Followup-to: (wenn vorhanden) statt der Anzahl der Gruppen in Newsgroups:. Dadurch wird das setzen eines Followup-to: belohnt.

Beispiel

Zwei Postings enthalten den selben Text. Einmal als Crosspost in 9 Gruppen, einmal als Crosspost in 16 mit vier Gruppen im Followup-to:

BI7 und BI30

In der Usenet-Hierarchie de.* gilt der Breidbart-Index mit einem Zeitfenster von 7 Tagen statt 45. Dafür hat sich die Abkürzung BI7 eingebürgert. [4]

In der Hierarchie hamster.de.* gilt der Breidbart-Index mit einem Zeitfenster von 30 Tagen statt 45. Dafür hat sich die Abkürzung BI30 eingebürgert. [5]

Cancel-Index in at.*

Ist im FAQ [6] der Gruppe at.usenet.cancel-reports definiert. Im Wahlaufruf (CfV) [7] und im FAQ wird nur die Bezeichnung Cancel-Index verwendet. Inoffizielle Abkürzungen sind CI und ACI.

Der ACI eines einzelnen Postings berechnet sich als 3 plus Anzahl der Gruppen, an die dieses Posting geschickt wurde. Der Index mehrerer Postings ist die Summe der Indizes der einzelnen Postings.

Grenzwerte

Tatsächlich ist eine Cancel-Message nur eine durch Software automatisch auswertbare Bitte, einen bestimmten Artikel zu löschen. Betreiber von Newsservern dürfen frei entscheiden, wie sie die widersprüchlichen Richtlinien umsetzen. [10]

Hierarchie Cancel-Index Zeitfenster Grenzwert Berichte Festlegung
* BI 45 20 news.admin.net-abuse.bulletins [2]
at.* ACI 45 11 at.usenet.cancel-reports [7] [11]
at.anzeigen.* ACI 14 4 at.usenet.cancel-reports [12] [13]
bln.* BI 45 3 [14]
de.* BI 7 5 de.admin.net-abuse.announce [4] [15]
de.alt.dateien.* BI 45 1 de.admin.net-abuse.announce [4] [14]
de.markt.* BI 45 2 de.admin.net-abuse.announce [16] [4] [14]
es.* BI 45 20 [17]
fr.* BI 30 10 fr.usenet.abus.rapports [18]
hamster.de.* BI 30 3 hamster.cancelreport [5]
it.* BI 45 20 it.news.net-abuse [19] [20]
muc.* BI 45 2 [14]
nl.* SBI 10 nl.internet.misbruik.rapport [3]
schule.* BI 14 3 schule.cancelreport [21]

Fußnoten

  1. <news:36i6hk$3li@panix3.panix.com>
  2. a b c Spam Thresholds FAQ
  3. a b Over cancelrapporten in nl.internet.misbruik
  4. a b c d <news:Result-festlegung-bi-06-05-1999@dana.de>, http://home.snafu.de/hweede/debi.txt
  5. a b Regelsatz für hamster.de.*
  6. Spam Cancel in at.* (FAQ)
  7. a b <news:CfV$1$at.usenet.cancel-reports$3@usenet.backbone.at>
  8. http://www.ietf.org/rfc/rfc1036.txt
  9. free.* FAQ
  10. Cancel Messages: Frequently Asked Questions
  11. <news:Result-festlegung-bi-06-05-1999@dana.de>
  12. <news:938889391/18913@usenet.backbone.at>
  13. <news:RESULT-Entfernung_von_at.anzeigen.computer.haendler-03.10.1999@orcus.priv.at>
  14. a b c d Die Jobbörse in den Newsgroups: de.markt.arbeit.*
  15. Fremdcancel-FAQ
  16. http://www.s.netic.de/fw/dma-result.txt, <Result-de.markt.ALL-28.05.1998@dana.de>
  17. FAQ: SPAM.ES
  18. Les annulations d'articles (Cancel)
  19. Tutto quello che occorre sapere sulla cancellazione
  20. Pagina Antispam in italiano
  21. http://schule.afaik.de/netiquette/netiquette.txt