Spam im GB erkennen

  • #1
M

Michael_B

Bekanntes Mitglied
Themenersteller
Dabei seit
21.09.2002
Beiträge
860
Reaktionspunkte
0
Ort
Köln
Hallöchen,

ich hab auf meiner seite so einen Freak, der jeden Tag meint, das Gästebuch zumüllen zu müssen. Dabei handelt es sich nicht um kommerzielle Spammer, sondern um so nen gestörten Typen, der mit Copy und Paste immer irgendwelchen Mist vervielfältigt.
Meine Frage hierzu: gibt es mit Regulären Ausdrücken ne Möglichkeit, zu ermitteln, ob sich bestimmte Teile im Eintrag ununterbrochen wiederholen? Wäre vielleicht ne Maßnahme...

Bin für jeden Tipp dankbar.
M.
 
  • #2
Deswegen schalte ich das Gästebuch immer auf moderiert. Da würden solche Knirpse schnell die Lust verlieren. Geht das bei dir nicht?
 
  • #3
Ich hab mein GB selbst programmiert... was ist denn dieser moderiert Modus?
 
  • #4
Ganz einfach. Du musst jeden neuen Eintrag erst freischalten, bevor er öffentlich sichtbar wird.
 
  • #5
Das hab ich befürchtet... Aber irgendwie müsste es doch möglich sein, mit RegEx so ein Muster zu erkennen... also sowas wie:
The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog. The quick brown fox jumps over the lazy dog.

Ist ja ein eindeutiges Muster. Nur der Text, der sich wiederholt, ist halt von Eintrag zu Eintrag unterschiedlich.

Lg und schöne Restpfingsten noch
M.
 
  • #6
Ich habe das für einen Freund, der ein ähnliches Problem hatte so gelöst, dass er für einzelne IP-Adressen das Schreiben im Gästebuch verhindern konnte, das hat geholfen.
Und zwar hatte er täglich Einträge mit Links zu irgendwelchen Warez-Seiten, da habe ich einfach mal getippt dass die Einträge durch ein Script auf irgendeinem Server erstellt wurden, seitdem so ca. 8-10 IP's geblockt sind hat er Ruhe.
 
  • #7
Leider habe ich festgestellt, dass seine IP-Adressen variieren, wie es bei Standard-DSL-Zugängen meistens der Fall ist. Und alle dies Adressen zu blocken, würde mir nichts bringen. Erstens werden die Einträge dann ohnehin im GB erscheinen, bis ich sie rausschmeisse, und zweitens werde ich über kurz oder lang alle DSL-Anschlüsse des jeweiligen Providers sperren...

Lg
M.
 
  • #8
Sperr doch die IP-Adresse nach jedem Eintrag für ne Minute oder so. Das sieht man öfter und macht dem Spammer das Leben schon mal schwerer.

Gruß
Christian
 
  • #9
Der Typ macht nicht viele Einträge in kurzer Zeit, sondern ein bis dreimal am Tag so einen Eintrag wie in meinem Beispiel oben. Insofern ist scarface's Vorschlag nicht zu gebrauchen.

Dennoch gibts ne kleine Erfolgsmeldung: habe die statische IP (denke mal, das ist die der Firma, in der er arbeitet, da von dieser IP die Spam Einträge nur tagsüber kamen) vor 3 Tagen geblockt. Seitdem kommt von ihm gar nix mehr. Ich hoffe nun mal auf seine Dauheit, dass er denkt, wenn er von der Firma nicht reinkommt, kommt er von zuhause auch nicht rein. Nachteil: ich weiss ja nicht welche Firma das ist und wer da noch arbeitet... jedenfalls kommt nun keiner, der über diesen Proxy geht, auf meine Seite... außerdem könnte er irgendwann rausfinden, dass er von zuhause immernoch zugriff hat. Durch die wechselnde IP seines Anschlusses kann ich ihn dann aber auch nicht aussperren.

Wie gesagt. ich dachte da eher an einen Regulären Ausdruck, der das Muster (der ständigen Wiederholungen, die durch Copy&Paste entstehen) erkennt und so den Eintrag als Spam brandmarkt...

Lg und jetzt schonmal viel Spass beim Eröffnungsspiel morgen :)
M.
 
  • #10
Du könntest auch versuchen herauszufinden, welche Firma das ist und denen mal ne eMail zu schreiben, dass einer ihrer Mitarbeiter dein Gästebuch vollspamt und, dass er das gefälligst unterlassen soll. Vielleicht kriegt der Spammer dann mal von seinen Vorgesetzten eins auf den Deckel.

Gruß
Christian
 
  • #11
Hi scarface...

habe schon versucht, per traceroute o.ä. eine Hostnamen oder eine bestimmte Route ausfindig zu machen. Leider kommt nach dem 4. oder 5. Hop schon nix mehr durch. Und aufgelöst wurde die IP des letzten identifizierten Hops auch nicht. Von daher hab ich leider keinerlei Anhaltspunkte auf das Unternehmen, das diese IP benutzt.

Lg
M.
 
  • #12
Haben die keine Homepage auf der IP?

Gruß Christian
 
  • #13
Scarface_666 schrieb:
Haben die keine Homepage auf der IP?

Gruß Christian

Was würde das nützen wenn 6 Mio. ;) Hompages auf ein und dieselbe IP horchen :°
 
  • #14
Nen Versuch wärs vielleicht mal wert. Nur um den Spammer mal ein bischen ins schwitzen zu bringen.

Gruß
Christian
 
  • #15
Hallo Michael,

da brauchst Du schon fast eine KI. Wichtig ist den eingegebenen Text zu analysieren und auf Muster zu untersuchen. Dafür hat man bei dem einen Beispiel zu wenig Material.

Anhand von diesem Beispiel würde ich zunächst mit PHP doppelte, dreifache oder mehrere Punkte (Satzzeichen) hintereinander zu einem reduzieren. Den Text dann mit extract() in ein Array spalten, Trennzeichen ist der besagte Punkt. Nun ein einige Prüfungen vornehmen wie
if ($array[3] == $array[6]) , etc. . Das Ganze natürlich nicht nur für den Punkt durchführen, es sollte mit PHP ziemlich schnell gehen.

Ist natürlich nur begleitend zu den anderen Vorschlägen.
viel Glück
Dirk
 
  • #16
Auch ne Möglichkeit. Dürfte auch nicht allzu schwer sein das zu realisieren. Ich würd aber nicht nur die einzelnen Sätze, sondern auch ganze Passagen vergleichen. Die Frage ist nur, wie rechenaufwendig das ganze dann wird. Wenn dadurch der Webserver blockiert wird ist das ja auch nicht im Sinne des Erfinders.

Gruß
Christian
 
  • #17
Hmmm... naja... danke für die Tipps... dachte aber, dass es per RegEx relativ einfach möglich wäre, solche Muster zu erkennen... aber erstmal hat es sich erledigt. Seitdem ich die IP der Firma in der er arbeitet geblockt habe (schade um die anderen Besucher, die auf die Seite wollen), kommt von dem auch nix mehr. Auch nicht von seinem privaten DSL-Anschluss... womöglich denkt er jetzt die Seite wäre down oder so. Jedenfalls hat ers offenbar von zuhause noch nicht ausprobiert.

Thx 4 help
M.
 
Thema:

Spam im GB erkennen

ANGEBOTE & SPONSOREN

Statistik des Forums

Themen
113.840
Beiträge
707.963
Mitglieder
51.494
Neuestes Mitglied
Flensburg45
Oben