Die Tage machte mich Markus auf das Wordpress Problem mit der leeren Suche aufmerksam. Wer sein Suchfeld nicht mit einem Text vorbefüllt hat und einfach nur ohne etwas einzugeben auf Suche klickt, der kriegt inhaltlich das Ergebnis seiner Startseite geliefert, nur eben unter der URL domain.tld/?s= , also mit dem Anhang /?s= an seiner Domain. Da das Ganze wie die Startseite behandelt wird, ist diese leere Suche URL frei für die Suchmaschinen. Nach einigem Suchen im Netz ist mir aufgefallen, dass die Entwickler von Wordpress über diesen “Bug” Bescheid wissen, ihn aber von Version zu Version verschieben. Entsprechende Tickets dazu gibt es seit 13 bzw. 8 Monaten! » weiter lesen »
Letzten Sonntag war es mal wieder soweit, Plagaware meldete Contentklau in meinem Shop. Dieses Mal waren es gleich zwei, die sich beide an der gleichen Kategoriebeschreibung von mir gütlich getan haben und sie auf ihren jeweiligen Blogs als eigenen Artikel posteten. Da ging mir doch mal wieder die Hutschnur hoch, denn in der Regel ist das die Konkurrenz, die ihre eigene (Satelliten bzw. Shop)-Seiten damit stärken wollen. Nur waren sie dieses Mal so schlau (oder doof) für ihre gesetzwidrigen Machenschaften einen wordpress.com Free Blog zu nutzen. Impressum, eMail Adresse, Postadresse etc. Fehlanzeige. » weiter lesen »
Da ich im Laufe meiner aktiven Jahre im Internet, schon unzählbar oft das Opfer von Urheberrechtsverletzungen wurde, bin ich dafür, das Urheberrechtsgesetz entsprechend zu überarbeiten. Und zwar so, dass sich von Heute auf Morgen kein Mensch auf der ganzen Welt mehr trauen würde, irgendwo etwas zu stehlen, was dem Urheberrecht unterliegt. Nur so könnte sicher gestellt werden, dass Verletzungen des Urheberrechts nicht mehr wie Kavaliersdelikte behandelt werden und im Internet Gang und Gebe sind. » weiter lesen »
Angeregt durch die Diskussion mit Alex und Francis im Beitrag robots.txt – Double Content Einträge sind kontraproduktiv, kam die Problematik der Feed Einstellungen auf. Wer z.B. seinen Feed mit dem Robots Meta Plugin auf noindex setzt (noindex the comment RSS feeds, noindex all RSS feeds), der ist in der Google Blogsearch nicht vertreten. Zudem haben/hatten ja viele auch noch den robots.txt Disallow Eintrag der Feeds, der in der Zwischenzeit ja sowieso überholt bzw. kontroproduktiv ist. Wenn noindex, dann mit dem Robots Meta Tag und nicht mit der robots.txt. » weiter lesen »
Bis vor zirka einem halben Jahr funktionierte die robots.txt noch so wie es sollte. Doch auf einmal wurden über die robots.txt gesperrte Seiten in den Google Index aufgenommen wurden. Zwar ohne Titel und ohne Beschreibung, aber immerhin da. “Das kann nicht gut sein”, dachte ich mir, als ich davon vor einiger Zeit ziemlich viele für meinen Shop entdeckte (zum Beispiel Session IDs) und begab mich auf einen etwas längeren Weg der Ursachen Forschung. Bis am Ende dabei herauskam: Die Sperrungen über die robots.txt waren schuld. » weiter lesen »
Auf beliebtestewebseite.de scheint ein Herr Müller sein Unwesen zu treiben und Urheberrechtsverletzungen ohne Ende zu begehen. Wenn ich es richtig interpretiere, dann hat auf dem genannten Service Herr Müller bis dato 1889 Webseiten empfohlen und es sieht auf den ersten Blicken ganz so aus, als würde er schlicht und ergreifend den Inhalt der entsprechenden „Über uns“ Seiten dieser Internetpräsenzen stehlen und bei beliebtestewebseite.de einstellen. Ein Contentdieb der ganz großen Sorte! » weiter lesen »
Hin und wieder mag es für Webmaster notwendig werden, mit dem Googlebot zu kommunizieren. So ist das z.B. auch bei meinem Shop der Fall, wo verhindert werden soll, dass dem Googlebot Session IDs ausgegeben werden, deren Indexierung zu Double Content und dadurch auch zu Ranking Verschlechterungen führt. Lange Zeit war es möglich, Google von der Indexierung einzelner Webseiten mittels der robots.txt fernzuhalten. Irgendwann in diesem Jahr hat sich aber Google entschlossen, den Inhalten der robots.txt nicht mehr ganz so viel Beachtung zu schenken und sobald ein interner oder externer Link vorhanden ist, den entsprechenden Inhalt der robots.txt zu ignorieren. » weiter lesen »
Der ein oder andere von Euch mag sich bei diesem Titel jetzt wohl denken, dass die „alte Crazy“ wohl einen an der Birne hat. Vor kurzem beschwert sie sich, dass Google Blog Artikel aus dem Index verliert und nun will sie absichtlich einzelne URLs aus dem Google Index verschwinden lassen. Wie passt das denn zusammen? Eigentlich gar nicht aber irgendwie auch wieder schon. Es gibt hin und wieder so Fälle, da wird es notwendig, einzelne URLs aus dem Google Index verschwinden zu lassen… » weiter lesen »