Block Bad Robots - MOD

Allgemeiner Support zum phpBB 2 Board und phpBB 2 Modifikationen
Forumsregeln
Auch wenn hier der Support für phpBB 2 weiterhin aufrecht erhalten bleibt, weisen wir darauf hin, dass das phpBB 2 nicht mehr offiziell unterstützt und weiterentwickelt wird!
Antworten
Benutzeravatar
skittles
Beiträge: 820
Registriert: So 04.Apr, 2004 01:07
Wohnort: Wien

Block Bad Robots - MOD

Beitrag von skittles »

hab da nen Mod gefunden!
da bindet man einfach ein txt File ins verzeichnis ein, und das sollte dann vor Robots schützen!

Nun ich hätte gerne mal eure Meinung dazu gehört!
Mod hab ich drangehängt!
Benutzeravatar
mObbY
Beiträge: 37
Registriert: Do 17.Jun, 2004 22:39
Wohnort: NRW
Kontaktdaten:

Beitrag von mObbY »

Hallo skittles,

naja, über die robots.txt ist das ganze nicht wirklich zuverlässig. Damit werden die Robots höflich gebeten, doch bitte den Server nicht zu spidern. Aber ein wirklicher Schutz ist das nicht.

Wenn du verhindern willst, dass Robots deine Seiten spidern, dann schau mal hier:
http://www.phpbb.de/topic54059.html

Gruß
mObbY
Benutzeravatar
cback
Beiträge: 1391
Registriert: Sa 15.Mai, 2004 15:32
Wohnort: Saarland
Kontaktdaten:

Beitrag von cback »

Das soll was bringen?
Bei einer .htaccess hätt ich ja gesagt OK aber was bewirkt ne einfache Textdatei?????? ^1 ^1 ^1 ^1

Noch nie gehört das sowas etwas aufm Webspace bringen soll. Und robots.txt für Google oder so is ja OK da die Suchmaschine nach dieser Datei sucht, aber die feindlichen Bots werden wohl kaum diese Datei vorher auslesen die zerstören ja nur.
Benutzeravatar
skittles
Beiträge: 820
Registriert: So 04.Apr, 2004 01:07
Wohnort: Wien

Beitrag von skittles »

okay! Also lassen wir das mal :-)
[center]Populanten von transparenten Domizilen sollten
mit fester Materie keine transzendenten Bewegungen durchf?hren.
[/center]


Bild
Benutzeravatar
oxpus
Administrator
Beiträge: 28735
Registriert: Mo 27.Jan, 2003 22:13
Wohnort: Bad Wildungen
Kontaktdaten:

Beitrag von oxpus »

@cback
Doch, genau diese Datei lesen die meisten Bots zunächst aus, sofern vorhanden.
Darin kann man auch angeben, ob überhaupt nicht oder nur teilweise das spidern "erwünscht" wird.

Wie aber schon mObbY schrieb, ist das eben nur eine Bitte, an die sich ein Robot nicht halten muss, es aber eigentlich sollte.
Google setzt da auch unterschiedliche Bots ein. Die einen akzeptieren die Wünsche des Webmasters, die anderen ignorieren die robots.txt vollkommen und spidern munter drauf los.

Also auch von meiner Seite kann ich nur sagen:
Einen echten Schutz vor Spidern gibt es nicht. Die machen, was sie wollen. Leider.
Aber hilfreich gegen viele "seriöse" Bots ist es schon, also doch zu empfehlen.
Karsten Ude
-={ Das Mädchen für alles }=-
Kein Support per Messenger, Email oder PN! Unaufgeforderte Nachrichten werden ignoriert!
No support per Messenger, Email or PM. Each unasked message will be ignored!
Benutzeravatar
mObbY
Beiträge: 37
Registriert: Do 17.Jun, 2004 22:39
Wohnort: NRW
Kontaktdaten:

Beitrag von mObbY »

Da die meisten Bots mit einer eindeutigen Kennung unterwegs sind, kann man sie darüber per .htaccess wie in dem oben erwähnten Mod blocken.
Benutzeravatar
AmigaLink
Beiträge: 5843
Registriert: Mi 03.Mär, 2004 09:05
Wohnort: NRW
Kontaktdaten:

Beitrag von AmigaLink »

Also der von mObbY verlinkte Mod bzw. .htaccess eintrag hat bei mir jede menge Traffic-ersparnis gebracht und vorallem die unnötige Boardbelastung dieser Mistfliegen beseitigt!
Und was die robots.txt anbetrifft. Wenn ich mir anschaue was Google und msn bei mir so treiben (siehe anderen Thread) dann wird mir echt schlecht. meine robots.txt und Meta einträge werden von den beiden munter ignoriert. :mad:
[center].: Web Relax .::. Essen mit Freude .::. AmigaLink.de :.
______________________________________

Kein Support per PM, ICQ oder eMail!!!
[/center]
Benutzeravatar
oxpus
Administrator
Beiträge: 28735
Registriert: Mo 27.Jan, 2003 22:13
Wohnort: Bad Wildungen
Kontaktdaten:

Beitrag von oxpus »

Da sieht man eben, was die alles missachten ;)
Karsten Ude
-={ Das Mädchen für alles }=-
Kein Support per Messenger, Email oder PN! Unaufgeforderte Nachrichten werden ignoriert!
No support per Messenger, Email or PM. Each unasked message will be ignored!
Benutzeravatar
cback
Beiträge: 1391
Registriert: Sa 15.Mai, 2004 15:32
Wohnort: Saarland
Kontaktdaten:

Beitrag von cback »

@cback
Doch, genau diese Datei lesen die meisten Bots zunächst aus, sofern vorhanden.
Meinte ich ja damit:
Und robots.txt für Google oder so is ja OK da die Suchmaschine nach dieser Datei sucht, aber die feindlichen Bots werden wohl kaum diese Datei vorher auslesen die zerstören ja nur.
Also die feindlichen werden die möglicherweise nich auslesen :-D
Antworten