Beurteilung von Ergebnissen bei der Internetrecherche

Über das Blog zum Seminar “Philosophieren mit dem Internet? : Social Media im philosophischen Unterricht” an der TU Dresden, das von Mandy Schütze und Dona Schmidt angeboten wird, bin ich auf die folgende Prezi “Webrecherche und das Hinterfragen von Internetquellen” von Franziska Philipp aufmerksam geworden. Die Präsentation enthält zwar einige (Rechtschreib-Grammatik-)Fehler, aber ich dachte, dass sie dennoch auch für uns interessant sein kann, da man einerseits die Konzentration auf das Wichtigste sieht und andererseits einmal in nicht ganz so bibliothekarischen Wort lesen kann, wie man soetwas gestalten und beschreiben kann. Gefallen hat mir, mit welchen Argumenten an die Erweiterte Suche bei Google herangeführt wird.

“Redefining Research”: Eine Infografik zur heutigen Entwicklung und Nutzung von Wikipedia

“According to this infographic, you don’t matter. You are replaceable. You are overpriced. You are irrelevant in a world embracing Wikipedia. You are obsolete.” Matthew C. Winner

Nach 244 Jahren regelmäßigem Erscheinen der Encyclopedia Britannica in Printform wurde der Druck eines der bekanntesten Nachschlagewerke im März diesen Jahres eingestellt. Durch den Wettbewerbsdruck mit Wikipedia wird Encyclopedia Britannica künftig online zur Verfügung stehen.Wikipedia liefert auf 26 Millionen Seiten Inhalt und Informationen zu unterschiedlichen Themengebieten. Obwohl des Öfteren die Informationsqualität und die Glaubwürdigkeit der Quellen auf Wikipedia infrage gestellt wird, achten die Schreiberlinge bei Wikipedia auf Aktualität und Fehler. Studien haben gezeigt, dass Wikipedia inzwischen genauso fehlerfrei und präzise ist, wie die Encyclopedia Britannica. Die folgende Infografik zeigt, wie Wikipedia die Suche nach enzyklopädischem Wissen revolutioniert hat und zu einer vertrauenswürdigen Wissensquelle wurde. “The Busy Librarian“, aber auch Joyce Valenza setzten sich kritisch mit dieser Infografik auseinander, welche Behauptungen aufstellt, dass Schüler mehr Wikipedia als Bibliotheken nutzen. Die Infografik wirft in der Tat einige Fragen auf, welche sich u.a. auch auf das Nutzungsverhalten von öffentlichen Bibliotheken im Vergleich mit Wikipedia beziehen. Lassen sich eine Enzyklopädie wie Wikipedia mit öffentlichen Bibiotheken so einfach vergleichen und gegenüberstellen? Ich denke, es ist nicht jedes Detail an dieser Infografik zu hinterfragen, da durchaus einige Aussagen Tatsachen entsprechen.

Wikipedia
Via: Open-Site.org

Google vs. Bibliotheken: 1:0

Der Titel dieser Überschrift wurde auf einem von Studenten angebotenen Workshop auf dem Bibliothekssymposium BOBCATSSS im Jahre 2005 in Budapest verwendet und eignet sich ebenso für die in diesem Beitrag beschriebene Studie. Vor kurzem wurde auf der Webseite Alltagsforschung.de der Frage nachgegangen, ob Suchmaschinen wirklich schneller sind und ob sich die Recherche in einer Bibliothek überhaupt noch lohnt. Im folgenden Interviewauszug werden die Lesegewohnheiten des New Yorker Autors Malcolm Gladwell näher beschrieben, über die er auch in einem Interview Auskunft gab.

I try to get to Bobst Library, at New York University, about once a week, to make my way through my favorite academic journals. I don’t really have a set pattern: mostly I just browse through the databases, or root around in the footnotes of things that I’ve liked. In the evening, before going to sleep, I read books.”

Gladwell zählt zu der Minderheit von Menschen in seinem Lande, die das Internet kaum nutzen. Werden Menschen mit den Lese- und Mediengewohnheiten eines Malcom Gladwell bald vom Aussterben bedroht sein oder wird die Lesekultur (Papierbücher und Papierzeitschriften) durch eine kleine Minderheit erhalten bleiben? Manchen Menschen ist der Gang in die Bibliothek und die Recherche vor Ort zu aufwändig. Es soll durchaus Studenten geben, die sich damit prahlen möglichst wenig in ihrer Studienzeit in der Bibliothek gewesen zu sein bzw. alles von zuhause online zu erledigen und die Bibliothek kaum als notwendig für das Fortkommen im Studium zu erachten. Die Frage ist doch, sind Suchmaschinen wie Google schneller, was die Recherche betrifft oder finden Suchende in der Bibliothek schneller ihre gewünschten Informationen? Eine an der Universität Michigan durchgeführte und am 15. November 2010 veröffentlichte Studie unter der Leitung der Professorin Yan Chen mit dem Titel “A Day without a Search Engine: An Experimental Study of Online and Offline Search” wollte es genauer herausfinden. Sie teilte 244 Studenten in zwei Gruppen. Eine Gruppe durfte nur Suchmaschinen im Internet verwenden und die andere nur die Bibliothek. Jede Gruppe hatte die Aufgabe bestimmte Informationen zu finden z.B. Antworten auf Fragen oder weitere Recherchequellen. Am Ende gewann “Google”. Dank Google fanden die Testpersonen die für das Experiment gesuchten Informationen in 99,7 % der Fälle. Bei der “Bibliotheksgruppe” lag die Quote bei 90 %. Hinzu kommt die Zeitersparnis: Eine durchschnittliche Internetrecherche in diesem Experiment dauerte 7 Minuten, wohingegen diese in der Bibliothek 22 Minuten dauerte. Der Google-Chefökonom Hal Varian kommentierte diese Ergebnisse folgendermaßen:

” […] It took them 7 minutes to answer the questions on Google and 22 minutes to answer them in the library. Think about all the time saved! Thirty years ago, getting answers was really expensive, so we asked very few questions. Now getting answers is cheap, so we ask billions of questions a day, like “what is Jennifer Aniston having for breakfast?” We would have never asked that 30 years ago.”

Prof. Yan Chen ist der festen Überzeugung, dass das Internet auch mehr Spaß mache:

“Wer online recherchieren durfte, fand die Aufgabe spannender, die Informationen interessanter und den Suchprozess weniger ermüdend.”

Dennoch lohnt es sich die Studie genauer durchzulesen und sich dem Schwierigkeitsgrad der Recherchefragen zu widmen. Waren die Rechercheaufgaben vielleicht doch besser für die Recherche in Suchmaschinen geeignet? Lag es an der mangelnden Informations- und Recherchekompetenz der Studenten, die im Offline-Bereich mehr Schwierigkeiten haben als im Online-Bereich? War die Studie von Anfang so konzipert, dass der Sponsor und Dienstleister der “University of Michigan” (Google) am Ende öffentlichkeitswirksam als die bessere Alternative dargestellt wird? Würde Google alleine ausreichen, wenn es sich um eine konkrete Seminarbeit oder Bachelorarbeit handelt? Meines Erachtens kommt es doch auf das an, wonach eigentlich gesucht wird. Diese absoluten Antworten, ob die Nutzung einer Suchmaschine besser ist, weil sie schneller die Ergebnisse liefere, müssen aber nicht grundsätzlich immer besser sein. Diese Art von Studien bringen der Firma Google eine gute Publicity, aber wer entwickelt denn Studien, die Bibliotheken eine bessere Publicity einbringen könnten?

Was Google über uns weiß …

Dass Google die Suche personalisiert ist nichts Neues. Doch was weiß Google eigentlich wirklich über uns? Schauen wir uns mal einige Angebote von Google an und betrachten mal dabei das Verhalten eine aktiven Google-Nutzers wie Hänschen Dummy.

Hänschen sitzt in Berlin und sucht nach Tipp und Tricks der Websiteprogrammierung natürlich mit der normalen Suche von Google. Die Suchmaschine erfährt folgende Informationen (die Angaben der Aufzählungen sind größtenteils aus den unten angegebenen Quellen übernommen worden):

  • Länder Code
  • die Suchanfrage
  • Nutzung alternativer Suchvorschläge
  • IP Adresse
  • Sprache
  • Anzahl der Ergebnisse
  • Safe search an/aus
  • Klicks auf die Links der Suchanfrage
  • Nutzung Werbelinks

Um bequem weitere Dienste von Google nutzen zu können, hat sich Hänschen ein Konto bei Google angelegt. Fleißig protokolliert der Gigant mit:

  • das Registrierungsdatum
  • seinen Benutzernamen
  • sein Passwort
  • eine alternative E-Mail-Adresse
  • sein Land
  • Anzahl der Logins
  • welche der Google Dienste er nutzt.

Hänschen will um eine Suche zu starten nicht immer erst Google aufrufen. Als Website-Anbieter ist er auch neugierig, welchen Pagerank die Websites haben, die er besucht, weil sie ähnliche Inhalte wie er anbieten. Deshalb hat er die Google Toolbar installiert und erlaubt, dass Google den Pagerank anzeigt. Diese Bequemlichkeit bezahlt er damit, dass Google neben den Informationen, die aus der Suche gewonnen werden nachvollziehen kann:

  • welche Webseiten er besucht (ALLE – unabhängig davon, ob Hänschen von Google kommt oder nicht)
  • auf welche 404-Seiten Hänschen gestoßen ist und welche der alternativen Suchangebote er angenommen hat (Klickbestätigung)
  • die Nutzung der Synchronisationsfunktion mit dem Googleaccount
  • welche Lesezeichen Hänschen abgespeichert hat
  • und ob er mehrere Rechner nutzt

Selbst wenn Hänschen deshalb auf die Toolbar verzichtet, gewinnt Google über den Browserverlauf folgende Daten:

  • Webseite von der Google Suche
  • Datum
  • Zeit
  • Suchergebnis
  • welche Werbung geklickt worden ist

Hänschen hat festgestellt, dass er aktuelle Informationen und Trends nicht unbedingt in deutscher Srache findet. Da er aber nicht sehr sicher ist beim Übersetzen, nutzt er Googles Sprachtools, um englische, französische und holländische Texte zu übersetzen. Google erfährt so:

  • alle übersetzten Texte
  • und den Sprachradius genutzter Texte

Nach getaner Arbeit stellt Hänschen seinen PC nicht aus, sondern vernügt sich erstmal bei Youtube. Der Dienst ist kostenlos, aber Hänschen verrät dabei:

  • E-Mail Adresse
  • Passwort
  • Benutzername
  • Land
  • alle hochgeladenen Videos
  • alle Kommentare
  • gemeldete Videos
  • Gruppen
  • Favoriten
  • Kontakte
  • angesehene Videos
  • Datentransfer
  • Klickverhalten

Bequem über das Google-Konto angemeldet verschickt Hänschen per GMail (Google-Mail) E-Mails an seine Freunde und liest noch rasch einen erhaltenen Newsletter. Die Entscheidung für Google Mail hat ihm Google mit dem riesigen Speicherplatz einfach gemacht. Dafür erhält Google

  • alle E-Mails
  • Kontoaktivitäten
  • Speicherplatzverbrauch
  • Anzahl der Logins
  • Links, die angeklickt wurden
  • Kontaktlisten
  • Spamtrends
  • Datenverkehr
  • Datengröße
  • Kontaktdaten

Hänschen ist außerdem ein aktiver Blogger. Er schreibt mindestens einmal die Woche einen Blogbeitrag zu Themen, die ihn bewegen und kommentiert munter in den Blogs seiner Bloggerfreunde. Dazu nutzt er dankbar die Plattform Blogger und verrät Google weitere Informationen:

  • Benutzerfoto
  • Geburtstag
  • Land
  • Datentransfer
  • Datengröße
  • Klicks
  • Posts
  • Kontakte

Für seine Arbeit nutzt er seinen Rechner Zuhause, auf Arbeit, einen Laptop eines Freundes und Bibliotheksrechner. Um einen zentralen Ort für seine Dokumente zu haben, nutzt er Google Docs, zumal er hier auch mit anderen kooperativ an den Dokumenten arbeiten kann. Google erhält dadurch:

  • E-Mail Adresse
  • Anzahl der Logins
  • Anzahl der Aktionen
  • Datengröße
  • Klicks
  • den/die gesamte(n) Text/Daten/Präsentation
  • alle Bilder
  • alle Änderungen
  • Informationen zu den Kooperationspartnern

Da Hänschen zudem viel unterwegs ist, informiert er sich im Vorfeld bei Google Maps über Routen von seiner Heimatstadt zu seinen Zielorten. Dafür nutzt er auch den Service auch mit seinem Handy. Es ist nur eine Frage der Zeit, bis Google hier personalisierte Dienste anbietet und so auch ein Bewegungsprofil von Hänschen erstellen kann.

Google weiß noch viel mehr über Hänschen Dummy. Datenwachschutz|Blog von Carsten Hoppe zeigt immer wieder, was mit den Informationen passiert, die wir wie Hänschen freiwillig weitergeben.

Gratis ist gut. Gratis ist klasse. Gerne nutzen wir Gratis-Angebote und fragen nicht, warum jemand etwas umsonst anbietet. – – – Umsonst? Nein, umsonst bietet niemand etwas an. Google erhält Daten, viele persönliche Daten über uns.

Daten sind das Zahlungsmittel im heutigen Informationszeitalter. Der Suchmaschinengigant Google versteht dieses Geschäft wie kein anderer Konzern und pflegt sein Image als welt- und menschenverbundenes Unternehmen, das sich für die Gesellschaft engagiert, indem es Programme und Services kostenlos zur Verfügung stellt. Völlig kostenlos sind die Programme freilich nicht, denn der Nutzer bezahlt mit seinem persönlichen Daten- und Webnutzungsprofil.

Aber auch wenn man sehr bewußt mit seinen Daten umgeht, Angebote hinterfragt, sie kritisch nutzt und auch Nutzungsalternativen sucht –

Selbst wenn man dezidiert Googles Datenradar entkommen will, fällt das dem Normalnutzer nicht leicht. So ist das Unternehmen mit Analytics mittlerweile auf vielen Webseiten präsent und leistet dort Nutzer-Analysedienste für den Webseitenbetreiber, ohne dass der Besucher dies im Normalfall mitbekommt.

Hänschen nutzt diesen Service in seinem Webangebot und zieht somit auch andere weiter in die Arme der Datenkrake Google.

Viele der Informationen sind für das gute Angebot von Google notwendig und für die Verbesserung der Dienste auch nützlich.

Das muss teilweise natürlich auch sein, weil sonst einige Dienste ja nicht funktionieren können. Wer aber sehr viele Dienste nutzt, der kann einsortiert und kategorisiert werden. Google kann und wird in Zukunft diese Daten auch nutzen.

Als Folgen heute zu sehen sind die Verwendung der Daten für die lokalisierte und personalisierte Werbung, mit der Google viel Geld verdient, denn die Personalisierung erhöht die Relevanz der Werbung für entsprechende Zielperson. Die Personalisierung ermöglicht es Google im Gegenzug bei Nutzung des Google-Accounts auch eine Anzeige besserer und relevanterer Suchergebnisse durch Profilbildung.

Hoppe kommt zum Fazit:

Die Frage wird hier sein ob ein User das überhaupt will, das er in eine Schublade gesteckt wird ??? Es hat mit Sicherheit viele Vorteile da Suchergebnisse besser angepasst/personalisiert werden.

Die Entscheidung kann jemand wie Hänschen nur treffen, wenn er auf die Gefahren hingewiesen wird und sich kritisch damit auseinandersetzt. Aber selbst wenn er die Gefahren kennt, kann er ihnen nur aus dem Weg gehen, wenn er Alternativen und ihre Vorteile gegenüber Google entdeckt. Er benötigt hier Informationskompetenz.

Man kann auf Googles Motto “Don’t be evil’ vertrauen oder sich bewußt machen, dass die Möglichkeiten dieser Informationsmassen auch die nettesten Firmen korrumpieren können.

Quellen:
Was Google alles über Sie weiss im Tagesanzeiger.ch Digital
Hoppe, Carsten: Welche Daten sammelt Google, ein interessanter Überblick im Datenwachschutz|Blog

Googles Studie mit der Eye Tracking-Methode

Wie sind die Sehgewohnheiten auf Websites? Wo schaut man zuerst hin und wovon wird man abgelenkt? Kurz gesagt: Wie kriegt man die gewünschte Information am besten an Frau oder Mann? Und verändern Sucherfahrungen die Art und Weise, wie man schaut?

Untersucht wurde das Suchverhalten von Probanden bei der Verwendung von Googles neuen Suchinteface “Universal Search”:engl: .

We (Google, Anmerkung d. V.) ran a series of eye-tracking studies where we compared how users scan the search results pages with and without thumbnail images.

In der Studie wurde mit Hilfe der Eye-Tracking-Methode das Suchverhalten untersucht. Es wurden mit Hilfe der Blickachsenmessung sogenannte heatmaps erstellt. Anhand der Heatmaps lässt sich die Verteilung der Aufmerksamkeit bezüglich des Klickverhaltens bzw. der Klickstärke an bestimmten Stellen der Trefferseite farblich genau darstellen.

Our studies showed that the thumbnails did not strongly affect the order of scanning the results and seemed to make it easier for the participants to find the result they wanted.

Nicht neu ist die Feststellung, dass Suchende ihre Suchergebnisse zu einem bestimmten Suchbegriff in weniger als einer Sekunde visuell abscannt. Innerhalb dieser kurzen Zeit trifft er unterbewusst Entscheiidungen über die Relevanz des Ergebnisses. Ziel von Google ist es, mit Hilfe dieser Methode diese kurze Zeitspanne der Entscheidung besser zu verstehen, d.h. die genauer zu analysieren und auszuwerten. Die so gewonnenen Rückschlüsse sollen helfen, das Ranking der Suchmaschinen zu verbessern und auch das Interface für die Google-Trefferlisten zu optimieren.

Das folgende Video zeigt den Blickweg eines Suchenden.

Je länger der Nutzer auf eine bestimmte Stelle schaut, umso größer wird der rote Punk. Sehr schön ist dabei zu sehen, dass der Nutzer erst auf das erste Ergebnis reagiert. Dabei wird nicht die Überschrift oder die Beschreibung als erstes betrachtet, sondern die Ziel URL der Webseite (grün). Danach wandert formlich das Auge zu den aufgelisteten Sitelinks und später zum zweiten und dritten Ergebnis. Ohne die zweite und dritte Position genauer zu betrachten, wird scheinbar der Nutzer von den unteren vier Bildern abgelenkt (nicht direkt) und fixiert eher bestimmte Schlagwörter im Titel.

Qellen:
Aula, Anne u. Rodden, Kerry: Eye-tracking studies: more than meets the eye:engl: im Official Google Blog
Neumann, Paul: Neue Google Eye Tracking Studie via blogtopf.de
Neumann, Paul: Google Suchverhalten – Eye-Tracking via blogtopf.de


[Korrektur zur Verbesserung des Datenschutzes. Umstellung Youtube-Video auf “privacy-enhanced mode”: 03.06.2018]

1 2