Datenanalyse: Wie Algorithmen funktionieren

Immer öfter haben Algorithmen Einfluss auf unser Leben. Sie berechnen alles Mögliche aus Daten – vom Wetter über das beste Kochrezept bis zu unserer Kreditwürdigkeit. Ihre Ergebnisse können also weitreichende Konsequenzen für den Einzelnen haben.

Autor: Roland Schenke. Mehr Wissen gibt’s unter: http://www.br.de/faszination-wissen

Wenn Google ein Mensch wäre – Teil 5

CAST
Google – Brian Husky
Curious Man – Colton Dunn
Little Boy – Ryan Fee
Hypochondriac – Damian Washington
Dumb Girl – Michele Love Santoro
Pathetic Man – Will Hines
Reasonable Woman – Lilan Bowden
Denier – D’Arcy Carden
Manchild – Jon Gabrus
Comedian – Matt McManus
Nerdy Guy – Nathan Barnatt
MebMD – Roger Anthony

CREW
Director – Matt Enlow
Producer – Michele Love Santoro
Writers – Sam Reich and the CH Staff
Cinematography – Jay Carey and James Milner
Editor – Ryan Anthony Martin
President of Original Content – Sam Reich
Vice President of Production / Executive Producer – Spencer Griffin
Director of Production – Sam Sparks
Director of Post Production – Michael Schaubach
Production Manager – Sam Kirkpatrick
Art Director – Abby Sanford
Costume Designer – Patrick Glendening
Hair and Makeup – Lauren Wilde
Production Coordinator – Shane Crown
Script Supervisor – Donald Tursman
1st Assistant Director – Asia Lemasters
2nd Assistant Director – Heath Lacy
1st Assistant Camera – Kelly Reed
2nd Assistant Camera / DIT – Kyle Loughrin
Gaffer – Dominic D’Astice
Key Grip – Eddy Scully
Swing Grip – Braden Barton
Set Dresser – Ian Lapadus
Art Assistant – Michael Yunez
Hair and Makeup Assistant – Chia Chia Feng
Production Sound – Anthony Kozlowski
Sound Utility – Michael Alaynik
Graphics – Michael Cisneros
Post Production Supervisor – Evan Watkins
Post Production Manager – Stephanie Zorn
Head Assistant Editor – Phil Fox
Production Legal – Karen Segall
Production Accountant – Shay Parsons
Assistant Production Accountant – Chetera Bell
Assistant Production Accountant – Giles Moffett
Production Assistant – Nicolas Morelli
Production Assistant – Peter Wilkerson

Ein Lied über Information Retrieval: „We started our engines“

Der Song entstand im Rahmen einer Videoprojekt-Hausaufgabe für die Übung zu Information Retrieval (Studiengang Informationswissenschaft & Sprachtechnologie, 1. Semester, WS 2011/12). Beteiligt daran waren Dominik Bauer, Yusuf Cezayirli & Moritz Röttges. Das Lied handelt vom Überfluss an Fachbegriffen und Fremdwörtern, die alle irgendwie damit zu tun haben, an Informationen zu kommen, einem dieses sowieso schon nicht ganz einfache Vorhaben aber enorm erschweren können. 🙂

 

BibApp – die Navigation durch die Bibliothek

Die folgende BibApp ist Ergebnis einer Seminararbeit im Kurs „Usability Engineering“ im Wintersemester 2011/12 an der Universität Konstanz. Die Entwickler hierzu sind Sebastian Beisch, Steffen Maurer und Oke Tennie. Die Musik in den folgenden Videos stammt von Sean Dorff.

Weiterlesen

Eine Infografik zur Geschichte der Informationsorganisation

A History of Information Organization | Mindjet

A History of Information Organization | Mindjet

Quellen: Mindjet und Wiredacademic

[Update: Umgezogene Grafik ergänzt, 15.07.2013, Dörte]

Warum Google sterben muss?

Gründe dafür sucht John C. Dvorak im PC Magazine:engl: .

Once you learn how Google handles SEO, you see that getting the right results takes a miracle.

SEO steht für Suchmaschinenoptimierung. Ein Mythos, der sich dahinter versteckt, ist, dass man damit ein besseres Google-Ranking erhält, als man es verdient. Aber tatsächlich denken diejenigen, die SEO einsetzen eher, dass Googleergebnisse sind schlecht und sie müssen ihre Seiten mit SEO verbessern, um die Ergebnisse zu erhalten, die sie verdienen.

From a user’s perspective, once you learn how Google does what it does, it’s a miracle that you ever get the right results. And from my experience, the right results in many circumstances are nearly impossible to obtain—and may never be obtainable in the future.

Dvorak macht folgende Probleme mit Google fest:

  • Unfähigkeit, die Homepage zu identifizieren : Man sollte davon ausgehen, dass wenn man nach Art Jenkins sucht und dieser eine Homepage jenkinsart.com besitzt, sollte seine Homepage ganz weit vorne gelistet werden. Pustekuchen!
  • Zu viel Kommerz, nicht genug Information : Ein weit verbreiteter Irrtum gerade bei Google ist wohl, dass Menschen nur ins Internet gehen, um Geld auszugeben und zu shoppen. Wer nach Informationen über ein aktuelles Produkt, z.B. über ein Handy, sucht, findet lange Zeit erstmal nur Seiten, die ihm das Produkt verkaufen wollen. Objektiv ist da wohl sehr deutlich was anderes.
    Ziel der Suche sollte es doch eigentlich sein, die beste Seite als erstes anzuzeigen, ohne dass es darum geht, viel Geld für die Suchmaschinenoptimierung auszugeben.
  • Geparkte Seiten : Man muss schon von Betrug sprechen, was da die Suchmaschinen mit einem machen. Da werden nicht mehr benötigte Domains ins Domain Parking geschoben und dort mit vielen schönen und relevanten Stichworten gespickt, mit SEO auf Hochglanz in Suchmaschinenaugen getrimmt und schon sind sie ganz weit vorne bei Google gelistet. Wie also soll das PageRanking von Google mit diesen „Fake-Seiten“ umgehen?
  • Unwiederholbare Suchergebnisse : Wie kommt es, dass man eine Recherche von letzter Woche zwar wiederholen, aber niemals die gleichen Sucherergebnisse erhält? Das ist ja schon von einem Tag auf den anderen oft so. Können sich Dinge so rasch drastisch ändern? Ganz schwierig ist, wenn man einem Kollgen bittet, die gleiche Suche zeitgleich mit nachzuvollziehen. Sie haben gute Chancen die Wette zu gewinnen, dass Sie nicht die gleichen Ergebnisse erhalten. Womit begründet Google das?

Welche Lösungen bieten sich an?

The solution to this entire mess, which is slowly worsening, is to „wikify“ search results somehow without overdoing it. Yahoo! had a good idea when its search engine was actually a directory with segments „owned“ by communities of experts. These people could isolate the best of breed, something Google has never managed to do.

Google hat sich an dieser Stelle immer auf mathematische Verfahren verlassen, die nie die Qualität von Yahoo! erreicht haben. Noch immer kann das menschliche Gehirn mit der Fähigkeit, Dinge kognitiv zu verknüpfen, nicht ersetzt werden. SEO-Experten durchschauen die Ranking-Algorithmen von Google und nutzen sie eben für ihre Vorteile.

Eine weitere Lösung ist das Flagging. Dahinter versteckt sich ein einfaches System. Das was die Maschine nicht kann, soll die Masse machen. Die Suchenden sollen die Suchergebnisse mit verschiedenen Attributen verknüpfen, beispielsweise könnten so durch Nutzer besonders gute Links gekennzeichnet werden, aber auch solche, die z.B. geparkte Domains sind. Risikoreich ist diese Variante schon, denn schon viele Bewertungskriterien von jedermann sind geknackt und in Google-Spam-Möglichkeiten umgewandelt worden.

Stephen Abram geht bei seinem Blogbeitrag Why Google Must Die:engl: noch weiter mit seinen Fragen und stellt dabei auch Verhalten der Bibliotheken in Frage. Zu viele Bibliothekare sagen, dass ihre OPACs, Metasuchen und Website-Suchmaschinen „just like Google“ arbeiten sollten. Wenn es das ist, dann könnten wir auch einfach aufgeben, die weiße Flagge schwenken und gleich zu Google gehe. Er gibt da einige Punkte zu bedenken:

  1. Should I start manipulating the search results of library users based on the needs of advertisers who pay for position?
  2. Should I track your users‘ searches and offer different search results or ads based on their private searches?
  3. Should I open library OPACs and searches to ’search engine optimization‘ (SEO) techniques that allow special interest groups, commercial interests, politicians (as we’ve certainly seen with the geotagged searches in the US election this year), racist organizations (as in the classsic MLK example), or whatever to change results?
  4. Should I geotag all searches, using Google Maps, coming from colleges, universities or high schools because I can ultimately charge more for clicks coming from younger searchers? Should I build services like Google Scholar to attract young ad viewers and train or accredit librarians and educators in the use of same?
  5. Should I allow the algoritim to override the end-user’s Boolean search if it meets an advertiser’s goal?
  6. „Evil,“ says Google CEO Eric Schmidt, „is what Sergey says is evil.“ (Wired). Is that who you want making your personal and institutional values decisions?

Abram ist auch erstaunt darüber, dass Bibliothekare sich nicht klarmachen, dass Google Milliarden Dollar damit verdient, in dem es die Kunden zum Einkaufen animiert, sprich es bezahlte Suchergebnisse verkauft. Google will Geld verdienen und verkauft sich dafür. Bibliotheken sollten auch im Bereich der Online-Angebote Google nicht verteufeln, aber sie sollten auch hier ein Ort bleiben, wo der Nutzer kein Geld bezahlen muss und sich nicht zum Geldausgeben verführt sieht.

Ziel sollte es also nicht sein, Google zu kopieren, weil dann kann man auch gleich zu Google gehen. Ziel muss es sein, eine Suche zu entwickeln, die die Bedürfnisse des Suchenden besser erfüllt als es Google tut. Fragen müssen sein: Kann die Suche so einfach zu bedienen sein wie Google und sollte sie es auch sein? Ich erlebe diese Frage immer wieder auch bei mir auf Arbeit. Da bietet der OPAC zwar den Google-Schlitz für die Suche an, dennoch schulen wir die Nutzung der erweiterten und komplizierteren Suche. Die Studenten sollen die Vorteile der erweiterten Suchmöglichkeiten kennenlernen.

Google zu verteufeln bringt nichts. Ziel muss es sein, Google als ein Suchinstrument von vielesn in eine strukturierte Recherche zu integrieren. Dafür müssen die Studenten aber die Algorithmen hinter Google und anderen Suchmaschinen verstehen. Oft fehlt eine gute Unterscheidung zwischen den einzelnen Suchinstrumenten, ihren Vor- und Nachteilen.

Google muss nicht sterben. Es hat mit all seinen Mankos eine berechtigte Position zwischen all den anderen Möglichkeiten (OPAC, Datenbank, Katalog, etc.). Bibliotheken haben sich das Vermitteln von Informationskompetenz auf die neuen Fahnen geschrieben. Das bedeutet aber auch, dass sie selbst mit kritischen, aber auch offenem Blick die Suchschwächen und -stärken der einzelnen Recherchmöglichkeiten beurteilen können müssen.

And they (the librarians, A.d.V.) should find their voice to talk to their host institutions and communities about their role.

Quellen:
Abram, Stephen: Why Google Must Die:engl: via Stephen’s Lighthouse
Dvorak, John C.: Why Google Must Die:engl: via PC Magazine