Dürfen Google, yasni, 123people usw. cachen ???


Zunächst für alle unwissenden, erst mal eine kleine Erklärung was der Cache (Zwischenspeicher) überhaupt ist. Jede Webseite die gefunden wird im Netz, von den normalen Suchmaschinen wie auch den Personensuchmaschinen, kann auch in deren Cache landen. Das heißt, ist eine Seite einmal nicht verfügbar wird diese als Kopie auf deren Server gespeichert. Das ist sinnvoll wenn ein Server einmal nicht erreichbar ist oder die Seite schon verändert worden ist.

Jetzt bemängeln aber viele genau diese Cache Funktion, denn wenn persönliche, eventuell peinliche oder auch geheime Daten dort zu finden sind, dann ist es für den User sehr wichtig das auch der Cache gelöscht wird. Da Bilder aber mehr sagen wie tausend Worte, hier ein paar Bilder die genau diesen Cache erklären.

Kommen wir aber nun zum wichtigen Teil

“Dürfen Suchmaschinen Webseiten cachen und warum dürfen die das einfach so ???”

Nun ganz einfach weil das Internet öffentlich ist, heißt im Klartext ALLE ERDENBÜRGER egal wo, egal wann können diese Seite lesen und auch speichern, drucken, cachen und was sonst noch alles. Wenn du eine Webseite veröffentlichst oder in irgen einem Forum einen Eintrag machst, dann bist DU alleine für diesen verantwortlich……………

In den USA erging ein Gerichtsbeschluss, wonach die von Google angebotene Cache-Funktion keine Urheberrechtsverletzung darstellt. Ein Autor und Rechtsanwalt hatte Google verklagt, weil die Suchmaschine Bereiche seiner Webseite in den Cache aufgenommen hatte. (Quelle: Golem)

Wenn eine Seite nicht im Suchmaschinen Cache landen soll, muss sie davor geschützt werden. Dieses kann mittels Eintrag in Meta Bereich geschehen. Dazu gewünschte Seite in einem Editor deiner Wahl öffnen und folgende Meta Tags im Head Bereich (zwischen <head> </head>) einfügen.

<META HTTP-EQUIV=”CACHE-CONTROL” CONTENT=”no-cache”>
Hiermit soll der Browser angewiesen werden den Cache zu umgehen und die aktuelle Originalseite aus dem Internet zu laden.

<META HTTP-EQUIV=”PRAGMA” CONTENT=”no-cache”>
Dieser Befehl sollte zusätzlich mit dem vorhergehenden benutzt werden, um Proxy-Servern zu verbieten, die Seite im Proxy-Cache abzulegen. So kann erreicht werden das immer die aktuellste Version einer Seite geladen wird.

<META NAME=”ROBOTS” CONTENT=”noindex,nofollow”>
In diesem Fall wird weder die Aufnahme in den Index erlaubt noch soll den Links gefolgt werden.

Wobei alle Angaben immer eine reine Empfehlung sind für die Suchmaschinen und es dennoch vorkommen kann, das diese im Cache landen. In einigen Foren habe ich gelesen, das trotz dieser Einträge doch gecached worden ist.

Publicmay be cached in public shared caches
Privatemay only be cached in private cache
no-Cachemay not be cached
no-Storemay be cached but not archived

Damit hinterher keiner auf die tolle Idee kommt und eine Suchmaschine verklagen will ;-)


Webhosting kostenlos testen!

RSS ? Hier klicken !

Was ist eigentlich RSS ?

Kostenloses Buch

Twitter

Was ist Twitter ???

Rss Feed Tweeter button Facebook button Technorati button Reddit button Myspace button Linkedin button Webonews button Delicious button Digg button Flickr button Stumbleupon button Newsvine button Youtube button