Schutzlos der Willkür eines Giganten ausgeliefert

Unter den seit 2004 durch Google digitalsierten Büchern befinden sich auch deutsche Bücher, die noch immer urheberrechtlich geschützt sind. Damit sind viele Betroffene nicht uneingeschränkt einverstanden. Zwar hat sich Google mit amerikanischen Autoren und Verlegerverbänden Herbst 2008 in einem noch durch Gerichte abschließend zu bestätigen Vergleich geeinigt, aber deutsche Urheber und Verlage sind damit nicht eiinverstanden, da hier ungefragt amerikanisches Recht auf deutsche Urheberwerke übertragen wird.

Die Verwertungsgesellschaft VG Wort möchte für die Rechteinhaber auch jene Rechte kollektiv wahrnehmen, die nach dem Google Settlement den Urhebern zustehen. Dies geht aber nur mit einer Ergänzung der Wahrnehmungsverträge. Die Zeit drängt allerdings. Bis zum 05. Mai 2009 müssen die Vergütungsansprüche für jedes in den USA durch Google digitalisierte Buch geltend gemacht werden. Google bietet eine Entschädigung in Höhe von 60 US-Dollar für jedes gescannte Buch an und eine pauschalisierte Verteilung von 63 Prozent der Werbeeinnahmen an.

Das zweite Ziel der VG Wort ist die Entfernung von vergriffenen und lieferbaren Büchern aus dem Digitalisierungsprogramm. Urheberrechtlich geschützte Werke sollen, sofern es noch berechtigte Rechtsansprüche gibt, nicht durch Google genutzt werden dürfen. Was verspricht man sich dadurch? Die VG Wort und die Rechteinhaber gehen davon aus, dass den Urhebern Schäden dadurch entsteht, dass Google die Bücher digital zugänglich macht. Man erwartet wohl, dass mögliche Verluste höher sind, als die Einmalzahlung und die anteilig ausgezahlte Gewinnbeteiligung von Google. Wie dem auch sein wird, wird die Zeit zeigen.

Ob es wirklich so günstig ist, ganz aus dem Vergleich mit Google auszuscheiden, ist fraglich, denn Google Books hat sicherlich auch eine Art Werbeeffekt für die dort verzeichneten Bücher. Die Frage ist also, ob es nicht sinnvoll sein kann, das Buch trotz Lieferbarkeit bei Google Books zu belassen.

Einen weiteren entscheidenden Punkt dieser Aktion von VG Wort offenbart sich im dritten Ziel der Verwertungsgesellschaft. Man will auf Dauer das Recht eingeräumt bekommen,die digitale Nutzung vergriffener Werke zu lizenzieren. Hier würde dann nur noch einen Ansprechpartner geben. Doch dies ist nur möglich, wenn sich die Rechteinhaber damit einverstanden erklären. Und man überlässt bei lieferbaren Werken natürlich auch Autoren und Verlagen die Möglichkeit, direkt mit Google Nutzungsverträge abzuschließen.

Autoren können auch darüber entscheiden, ob sie ganz aus dem Vergleich aussteigen oder eigene Einwände geltend machen wollen. Die Einwände müssten ebenfalls bis fünften Mai genannt und nicht im Rahmen der VG Wort vertreten werden. Eine individuelle Durchsetzung in den USA gilt als sehr schwierig, so dass die VG Wort davon eher abrät.

Die Situation des deutschen Urheberrechts sieht VG Wort durch all die Möglichkeiten des Internet gefährdet. Eine effektive Verfolgung von Urheberrechtverletzungen ist bis jetzt nicht möglich.

Die Welt hat nun auch einen sachlichen Artikel zum Problem des Google Settlement gebracht. Zwar wirken die Fakten verkürzt und unvollständig, doch verzichtet man auf jegliche Polemik und Verknüpfung falscher Tatsachen, wie es in letzter Zeit bei einigen Zeitschriften der Fall war.

Quelle
Google digitalisiert auch deutsche Autoren via Welt online

Erster-Aprilente: Google wird zum Buchhändler

Bis jetzt ist es noch niemandem aufgefallen, aber der Beitrag Google als Buchhändler stimmt nicht so ganz. Google zeigt derzeit – so weit mir bekannt ist – keine Ambitionen als Zwischenhändler im Buchhandel aufzutreten.

Natürlich wird Google hier nicht das Print-Buch vertreiben, sondern einzelne benötigte Kapitel oder das gesamte wissenschaftliche Buch als E-Book. Verlage können sich bereits jetzt dafür anmelden.

Verlinkt wird hier nur auf das Partnerschaftsprogramm von Google, bei dem sich Verlage und Buchhändler anmelden können, um entsprechend gefundene Google-Scan-Bücher direkt an den Suchenden zu verkaufen. Dieses Programm gehört mit zum Werbeangebot, von dem letztendes die Autoren der Bücher profitieren können.

Ich wünsche allen noch einen schönen 1. April

Google als Buchhändler

Die Buchsuche, die ein gutes Instrument für die bibliothekarische Auskunftsarbeit ist und die vor allem schwer zugängliche, verwaiste Werke und gemeinfreie Bücher (vor 1923) enthält, integriert umstrittener Weise auch Bücher, die derzeit nicht mehr gedruckt werden aber auch aktuelle Bücher.

Die Einigung mit den Verlegern durch das “Google Settlement” ist noch nicht gerichtlich bestätigt, aber schon denkt Google weiter. Die Buchsuche und Volltextanzeige sollen als Premiumaccount in Bibliotheken zugänglich gemacht werden. Hier befürchten Bibliotheken zurecht, dass Google sein Monopol nutzen wird und die diktierten Bedingungen unerfüllbar sein werden.

Um hier billigere Angebote an Bibliotheken machen zu können, will Google demnächst nicht nur Hinweise geben, wo ein Leser das bei Google Books gefundene Buch entleihen oder kaufen kann, nein Google will zunehmend auch als Vertriebsplattform für die Verlage in Erscheinung ertreten. Natürlich wird Google hier nicht das Print-Buch vertreiben, sondern einzelne benötigte Kapitel oder das gesamte wissenschaftliche Buch als E-Book. Verlage können sich bereits jetzt dafür anmelden.

In dieser Form wird aus Google nicht nur ein Verlag sondern auch ein Buchhändler. Über die genauen Konditionen für die Verlage und Preise ist noch nichts nach Außen gedrungen.

[Update]

Aprilscherz

Das Dilemma des Autor-Google-Verhältnisses

Die FAZ schießt gegen Google. Malerisch beschreibt man das Aufbegehren gegen Google als “Rückzugsgefecht versprengter Truppen gegen eine Übermacht”. Es fehlt bei der Einleitung nur das Wort “Größenwahn” in Bezug auf Googles Politik des Auslotens normativer Grenzen, wenn es darum geht, das Weltwissen verfügbar zu machen.

Dabei geht es nicht nur ums große Geld, sondern auch selten mit ganz legalen Mitteln zu – wie bei großen Eroberungszügen nicht anders zu erwarten.

Alles begann damit, dass Google sich vor erst fünf Jahren an das Riesenprojekt wagte, die Bestände amerikanischer Bibliotheken zu scannen. Neben Public-Domain-Werken, nicht mehr lieferbaren Büchern sind dort aber auch noch urheberrechtlich geschützte und lieferbare Bücher zu finden. Einen Großteil der Masse der Google-Scans betreffen die Books-out-of-Print. Europäische Bibliothekspartner lassen nur gemeinfreie Bücher digitalisieren.

Das dreijährige Mammutverfahren kostete 45 Mio Dollar und häufte eine Million Akten- und Gutachtenseiten an. Oktober letzten Jahres dann wurde der Vergleich “Google Book Settlement” eingereicht und wird seit dem auch durch eine große Anzeigenkampagne und im Internet in 36 Sprachen bekannt gemacht. Damit sollen die Autoren über die Modalitäten des Settlements aufgeklärt werden.

Der Ton wurde leider nicht sachlicher, nachdem der erste Frust niedergeschrieben war. Sicherlich muss man bemängeln, dass die Übersetzung wohl mit Hilfe von Googles hauseigener Übersetzungsmaschine durchgeführt worden war und keine deutschen Urheberrechtler herangezogen worden.

So wird schon auf der ersten Seite aus einem „Verleger“ ein „Herausgeber“ und aus einem „Autor“ ein „Unterklasse-Autor“.

Damit wird dieser Vertrag rechtlich praktisch unlesbar.

Ein zweites Leider mag vielleicht auch gelten. Um herauszufinden, ob die eigenen Werke digitalisiert wurden, hat auch Schwierigkeiten. Metadatenquelle war der Worldcat, der mit 270 Millionen Büchern aus allen Ländern doch recht unübersichtlich ist.

Der FAZ-Autor macht sich auch hier unreflektiert zum Sprachrohr eines (zumindest vom Sprachstil so wirkenden) aufgebrachten Christian Sprang,seines Zeichens Justitiar des Börsenvereins des Deutschen Buchhandels.

Hinzu kommt: Wer das Settlement-Formular ausfülle, gebe schon wieder jede Menge Metadaten von sich preis.

Die Opt-out-Klausel, die es Autoren und Verlagen ermöglicht, Google mitzuteilen, dass sie aus dem Vergleich aussteigen wollen. Dies ist für den Riesen nicht verpflichtend, dass er die Bücher tatsächlich aus dem Netz nehmen muss. Erst mit einer Privatklage in den Vereinigten Staaten kann der Autor/Verlag nachweisen, dass Google amerikanisches Copyright gebrochen hat. Kleine Verlagee und einzelne Autoren können sich dies finanziell nicht leisten. Bis zum Ende der „notification period“ am 5. Mai 2009 müssen sich Autoren bzw. Verlage gemeldet haben.

Die Frage, die sich stellt, ist natürlich, welche Vorteile Autoren davon hätten, dass sie sich dieser größeren Sichtbarkeit entziehen. Muss man auf seinem Recht bestehen, nur um Recht zu behalten? Fast trotzig wirkt hier die Reaktion des deutschen Jusitziars. Welche Nachteile befürchtet man, dass man allen Autoren und Verlagen pauschal dazu rät, Google zu verlassen? Wo gibt es offizielle, sachliche Entscheidungshilfen, die ein Pro & Contra einer solchen Entscheidung klar darstellen oder abwägen?

Am 11. Juni wird das Gerichtin New York dem Vergleich mit hoher Wahrscheinlichkeit zustimmen, da sich hier in den Augen der Richter die Prozessparteien selbständig geeinigt haben.

Sollte trotz von mehreren Seiten angekündigter Einsprüche der Vergleich am 11. Juni bestätigt werden, wird der Tag als Wende in die Geschichte des Urheberrechts eingehen.

Formal gilt dieser Vergeleich nur in den USA, dennoch befürchtet der Börsenverein, dass jetzt das Urheberrecht leichter umgehbar wird. Der Autor sieht dadurch die bisherige Rechtsstaatlichkeit für Verleger und Autoren bedroht.

Google erhält durch diesen Vergleich eine andere Rolle. Die Regelungen des Settlement mit der Authors Guild sehen eine Garantiesumme von 60 Dollar pro unauthorisiert digitalisierten Buch vor. Diese Autoren können mit entscheiden, ob und in welchem Umfang Google das Werk im Zusammenhang mit Werbung nutzen darf. An die Autoren wird außerdem pauschalisiert dreiundsechzig Prozent der Werbeeinnahmen Googles ausgeschüttet.

So wird Google zum Händler und nach 2011 zum Verleger. Denn das gar nicht unrealistische Kalkül der Firma sieht vor, dass höchstens einer von zehn Copyright-Inhabern seine Ansprüche geltend machen wird. Damit fallen die Rechte im Lauf der nächsten Jahre an Google.

Mir ist Unklar, in welcher Form Google hier zum Verleger wird. Wikipedia definiert Verleger:

Früher bezeichnete man mit Verleger den Auftraggeber im Verlagssystem. Heute bezeichnet der Begriff einen Unternehmer, der einen Verlag für Bücher, Noten, Zeitschriften oder Zeitungen betreibt oder leitet. Die Branchenbezeichnung leitet sich von Vorlage ab. Der Verleger geht mit Druck- und Werbungskosten in Vorlage.

In diesem Fall wird Google nicht erst 2011 zum verleger, sondern ist es bereits seit der Verlag Scans erster Bücher der Public Domain angeboten hat.

Die Regelung des Vergleichs sichert Google, dass sollten alle sieben Millionen Rechteinhaber die 60 Dollar pro Buch verlangen, maximal 420 Millionen zahlen muss. Auch diese Rechnung kann ich nicht ganz nachvollziehen. Es sind etwa 7 Millionen Bücher, die digitalisiert worden, aber etwa 500.000 fallen davon unter die Public Domain. Die muss man wohl abziehen. Google scheint nicht mit einer großen Anzahl von Anträgen zu rechnen, denn man stellt 45 Millionen Dollar, d.h. knapp 11 % der Summe für die Auszahlung bereit.

Schon jetzt darf, die Zustimmung des Gerichts voraussetzend, Google alle Bücher einscannen, die bis zum 5. Januar 2009 erschienen sind. „Das ist das eigentlich Teuflische an diesem Plan“, erklärt Sprang.

Kolidieren hier die Wünsche des größten Menschheitsprojekts mit den Vorstellungen des geistigen Eigentums? Sehr schön, jetzt kommen wir zu den tapferen Männlein, die sich gegen die Übermacht stämmen. Auf dieses Bild habe ich direkt seit Beginn des Feuilletons gewartet.

Der Börsenverein hat sich mit der Verwertungsgesellschaft Wort und mit dem Schriftstellerverband verbündet, die sich normalerweise um das Eintreiben von Kopier- und anderen Vervielfältigungserlösen für Autoren kümmert. Die VG Wort soll nun ihren Wahrnehmungsvertrag gegenüber 380.000 Vertragsnehmern um die elektronischen Rechte erweitern. Per Rechtsgutachten ist diese Vorgehensweise abgesichert, es wäre ein Pfund, mit dem sich wenigstens ein wenig wuchern ließe.

Und jetzt passiert was, wo ich stutzte. Bis eben war Google der Buh-Mann und auf einmal träumen nicht alle Autoren davon, Google zu enteignen? Das ist eine sehr unerwartete Wendung am Ende des Beitrages.

Sicherlich muss man Googles Tätigkeiten besser kanalisieren und den Kopf gottergeben in den Sand zu stecken oder einfach das, was Google macht, unreflektiert zu verteufeln.

So gelähmt wirkt die Branche angesichts der Chuzpe, dass viele klagen, der Kampf sei schon verloren – bevor sie ihn aufgenommen haben. Mit den Urheberrechten gäbe man, so der Schriftsteller Thomas Hettche, auf, wofür man Jahrhunderte gekämpft habe.

Etwas ungläubig las ich dann, dass der Digitalisierungskritikier und Schriftsteller Thomas Hettche sich mit einer für seine Arbeit doch so wichtigen Vereinbarung, die seit Monaten durch die Presse geistert, noch nicht auseinander gesetzt hat. Damit reiht er sich wohl in die Mehrheit der Autoren ein.

Das zeigt einmal mehr das man “dagegen” ist, ohne das Problem oder die Möglichkeiten zu beleuchten. Autoren, die sich nämlich auch mit den Chancen auseinander setzen, erkennen, dass sie als passive Nutzer nämlich sogar selbst von Google Books profitieren. Das zeigt aber auch das Dilemma in denen Autoren stecken. Einerseits haben sie nicht wirklich Einfluss auf Google, andererseits gewinnen Sie auch durch die bessere Sichtbarkeit ihrer Bücher. Ich persönlich habe schon mehrfach Fachbücher erworben, die ich in der Bibliothek nicht schnell beschaffen konnte und deren Relevanz ich über Google evaluieren konnte. Also, das ist dann wohl Google Books als die perfekte Werbeplattform.

Glücklich ist die Lösung für beide Seiten nicht, da man mit mehr Einigungsbereitschaft von beiden Seiten im vorfeld eine einvernehmlichere Lösung hätte erzielen können.

Unter den Büchern, die Google digitalisieren will, befinden sich nach Angaben es Börsenvereins allein 50.000 deutschsprachige Titel von Random House Deutschland, dem größten deutschen Publikumsverlag. Random House Vorstandsvorsitzender Joerg Pfuhl ist nicht ganz so ablehnend:

„Grundsätzlich ist der Google-Vergleich eine gute Sache. Er könnte Basis für neue Geschäftsideen sein. Und immerhin hat Google die Urheberrechte nun anerkannt.“ Aber auch er räumt ein, Google habe „viel Misstrauen gesät. Die Vorgehensweise ist bekannt: Fakten schaffen, um dann unter Druck Lösungen zu erzwingen.“

Google muss zeigen, dass es auf der finanziellen Seite wenigstens ein verlässlicher Partner ist und das Vertrauen rechtfertigt, dass Autoren in das Unternehmen einbringen.

Eine letzte Schwarzmalerei kann sich der Autor am Ende des Beitrages nicht verkneifen. Er sieht ein Grundsatzproblem, dass dieser Prozess akut werden lässt.

Werden künftig Werke der Wissenschaft, der Literatur geschrieben, wenn sie sogleich Gemeingut im Internet sind? Was, wenn die neuen Geschäftsmodelle es Urhebern nicht mehr ermöglichen, von dieser Arbeit zu leben: Verschwinden dann ganze Berufszweige und machen den Selbstausstellern Platz?

Da will ich mal ein paar genauso grundsätzliche Gegenfragen stellen. Schaffen wir den Zugang zu Wissen für eine Elite, wenn der Zugang zu Informationen immer kostenpflichtig ist? Geht nicht zu viel Wissen verloren, weil es nicht zur rechten Zeit auffindbar ist? Ist der Schaden für die Allgemeinheit nicht höher, wenn wegen fehlendem Wissenszugang die Forschung erlahmt oder es zu Doppel- und Dreifachentwicklungen kommt (mal abgesehen, dass wir damit zur Zeit sowieso schon zu kämpfen haben)?
Natürlich muss man Google im Auge behalten und verhindern, dass aus Google ein neues Elsevir wird. Google darf kein Monopolist bleiben. Und man mag meinen, die Industrie und damit auch die Content-Industrie, wüßte, dass Konkurrenz das Geschäft belebt Ich weiß, das ist ein abgedroschener Allgemeinplatz, doch die Bestrebungen mit Libreka wirken einfach nur ungeschickt. Da klingt es richtiggehend getroffen, was der Autor zum Schluss schreibt:

Früher hätte man nach der Politik gerufen und ihr erklärt, dass Wissen systemwichtig sei. Doch die Politik scheint sich für all das nicht zu interessieren.

Quelle:
Hintermeier, Hannes: Das Teuflische an diesem Plan via FAZ.Net

Der idealistische Bibliothekar des Internets

Für einen Mann allein wohl eine unmöglich zu bewältigende Aufgabe, aber Brewester Brewster Kahle lässt sich davon nicht abschrecken. Mit großem Enthusiasmus geht er dran, eine Alexandrinische Bibliothek 2.0 zu bauen. Man könnte ihn schmunzelnd als Scherzkeks abtun, aber dazu ist er sich seiner Sache zu sicher. Er schafft es Menschen und Technologien so zusammenzubringen, dass auch die schwierigsten Aufgaben gelöst werden. Er ist ein Visionär, der auf die Probleme aus einem anderen Blickwinkel als andere schaut und sich zutraut, Probleme zu lösen, bei denen andere denken, die wären unmöglich zu schaffen.

Millionär Kahle gibt sein Geld nicht für Klamotten aus, sondern hinter dem einfach gekleideten Mann versteckt sich ein geübter Technologe und ein sehr erfolgreicher Unternehmer. Er hat Firmen wie AOL und Amazon gegründet und sehr erfolgreich verkauft. Jetzt Zur Zeit setzt er seine Energie dafür ein, ein gemeinnütziges digitales Archiv mit freien Inhalten aufzubauen, seien es Bücher, Filme, konzerte usw. – ganz ähnlich der legendären Bibliothek von Alexandria. Dies bringt ihn in Konflikt mit dem Giganten Google, der ein ähnliches, aber doch eher kommerziell ausgelegtes Ziel verfolgt.

Kahle graduierte 1982 am Massachusetts Institute of Technology (MIT). Dort studierte er mit dem artificial-intelligence guru Marvin Minsky. Er trat einer Gruppe von MIT Alumni bei, welche die Firma Thinking Machines gründete, die Parallele Supercomputer herstellten. Dort arbeitete er mit Größen wie Richard Feynman (Nobelpreis-Gewinner), Dr. Minsky and Daniel Hillis zusammen.

1989 gründete er seine eigene Firma WAIS Inc und baute dort auf die Suchtechnologie auf, die bei Thinking Machines entwickelt worden war. Zu seinen Kunden zählte das Wall Street Journal, welche die erste News-Site aus Subskriptionsbasis war oder die Zeitschriftenfirma CMP, die ein Pionier der Online-Werbung war. Da Kahle die Bedeutung von Bezahlsystem, Online-Privacy und Nutzer-Ratings begriffen hatte, lag er fast ein ganzes Jahrzehnt vor seinen Mitbewerbern. 1955 wurde seine Firma für wohl 15 Millionen Dollar von AOL erworben.

1996 liefen schon fast ein Dutzend Patente auf den Namen Kahle. In dem Jahr wendete er sich seinem nächsten Projekt zu, dem gemeinnützigen Internet Archive. Außerdem gründete er zusammen mit einem ehemaligen Kollegen eine neue Firma namens Alexa. Diese Firma verfolgt und analysiert die Wege, denen Menschen folgen, wenn sie sich im Web bewegen, um ihnen behilflich sein zu können, ähnliche Informationen zu finden. Alexa wurde 1999 von Amazon für geschätzte 250 Millionen Dollar erworben. Kahle arbeitete dort noch bis 2002, bevor er sich ganz dem Internet Archive widmete.

Der bekannteste Teil des Archivs ist die Wayback Machine. Auf diesem “Online-Dachboden digitaler Erinnerungen” werden Kopien von Internetseiten aufgehoben, so dass man schauen kann, wie eine Website vor einigen Jahren ausgesehen hat. Man könnte auch sagen, das Archive ist das Museum des Internets. Das Internet heute ist für viele das erste Medium der Wahl für kulturelle Erzeugnisse und die Wayback Machine ermöglicht einen Zugang dazu zu unterschiedlichen Zeitpunkten. Und es gibt an der Stelle mehr als nur wissenschaftliches Interesse, was mehr als 500 Zugriffe pro Sekunde bestätigen.

Zusätzlich zum Archiv von Webseiten gibt es eine Audiobibliothek mit mehr als 300.000 MP3-Dateien, ein Filmarchiv mit mehr als 150.000 Filmen und Videos und ein Livemusikarchiv mit Aufnahmen von mehr als 60.000 Konzerten. All diese Sammlungen sind kostenlos zugänglich.

Das ist ein guter Schritt in Richtung Ziel von Herrn Kahle, der die weltgrößte digitale Bibliothek aufbauen möchte. Dazu hat er auch welltweit 135 Bibliotheken für die openlibrary.org gewonnen. Ziel dieses Projektes ist es, einen Katalog zu jedem jemals erschienenen Buch zu schaffen und da, wo es möglich ist, zum Volltext zu verlinken. Um das zu erreichen, digitalisiert das Internet Archive in Zusammenharbeit für seine Bibliothekspartner täglich mehr als 1000 Bücher. Dafür zahlen die Bibliothek über 30 Dollar. Die digitalisierten Kopien dürfen dabei von beiden Parteien genutzt.

Über 200 Menschen arbeiten für das Internet Archive, welches ein jährliches Budget von 10 – 14 Millionen Dollar benötigt. Anfangs hat Herr Kahle dieses Geld gespendet, doch inzwischen kommen mehr und mehr Spenden von Stiftungen und Bibliotheken, die dafür bezahlen, dass ihre Bücher digitalisiert werden.

It also runs a variety of one-off projects, such as a collaboration with America’s space agency, NASA, to make available photos and films relating to the history of the space programme, and a “print on demand” system to turn digital files into physical books in minutes.

Herr Kahle wirkt mit seinem Stil unbekümmert und lässig, aber der 48-jährige steht mit beiden Beinen fest auf dem Boden und weiß sich auch gegen starke Gegner zu wehren.

“Come back when you have a warrant,” reads the floor mat underneath his office recliner. It was a gift from the Electronic Frontier Foundation (an activist group on whose board Mr Kahle sits) after Mr Kahle refused to hand over information about one of the Internet Archive’s users to the Federal Bureau of Investigation in 2007.

Dieser Aktivist für Online Privacy ist auch ein überzeugter Befürworter der Offenheit. Er bestand auf einer extra für das Internet Archive entwickelten Open-Source-Suchmaschine (Scribe). Auch die “PetaBox”, die eine Million Gigabyte Daten speichern kann, ist auf Open-Source-Basis entwickelt worden.

“Everything Brewster does is open. He personifies openness,” says John Seely Brown, who sits on Amazon’s board of directors and was previously the chief scientist at Xerox, and the director of its Palo Alto Research Centre. Being open “is the right way to have a thriving industry,” says Mr Kahle. “I have been much more successful when letting people know what I want to do. I get much more help that way.”

Dieser große Enthusiasmus Kahles für eine solche Offenheit enhält implizit auch eine Kritik an dem viel größeren Buchdigitalisierungsprojekt von Google. Auch die Googlegründer haben ein ähnliches Ziel wie Herr Kahle, auch sie wollen das Wissen der Welt organisieren und es allen zugänglich und nutzbar zu machen. Da das meiste Wissen immer noch in Büchern enthalten ist, scannt man sie.
Während für das Internet Archive den Focus auf gemeinfreie Werke legt, um sie im Volltext zugänglich zu machen, so scannt Google mehr als 7 Millionen neuere Werke, von denen die meisten noch urheberrechtlich geschützt sind. Diese werden in kleinen Auszügen zugänglich gemacht.

Auch wenn Google bisher behauptete, man würde nicht das ganze Werk zugänglich machen und damit weder eine Copyrightverletzung begehen noch die Erlaubnis der Verlegerbenötigen, zwangen die Verleger den Suchmaschinengiganten zu einer Vereinbarung Oktober 2008. Eine endgültige gerichtliche Entscheidung wird Juni dieses Jahres erwartet.

Under the terms of the settlement, Google will put copyrighted works online only with the permission of publishers, who can also decide whether to make a preview available or not. Google will also be allowed to sell access to entire books online, sharing the proceeds with publishers. It has, in other words, struck a deal that will allow it to go on scanning books and make money providing access to them online.

Die Herangehensweise von Herrn Kahle, die Anzahl der verfügbaren Bücher zu erweitern, ist anders. Wenig erfoglreich verklagte er die die amerikanische Regierung (Kahle vs. Gonzales), übermäßig restriktive Copyyrightregelungen rückgängig zu machen. Eine Verkürzung des Schutzzeitraumes hätte die Zahl der gemeinfreien Werke dramatisch gesteigert und die Zahl der digitalisierbaren und damit frei zugänglichen Online-Werke erheblich erhöht. Davon hätte jeder profitiert.

Googles rechtliche Einigung hat eine Kontroverse verursacht. Die Einigung bedeutet, dass Google jetzt die einzige große Firma ist, die eine bedeutende digitale Sammlung copyrightgeschützter Bücher ist. Einige Bibliothekare befürchten, dass dies der Internetfirma riesige Macht gibt. Nicht umsonst heißt es “Wissen ist Macht” und nicht umsonst wird viel Geld für Informationen bezahlt.

“This is a more powerful monopoly than we’ve ever seen for access to 20th-century material,” says Ms Moore of the University of Toronto. “We do not have a good track record in negotiating good prices with monopolies.” Similar concerns led Harvard University to reduce its participation in Google’s project.

Die Meinung ist nicht eindeutig. Andere Bibliothekare begrüßen das Google Settlement als einen guten Kompromiss, aber nichts ist perfekt und betrifft nicht die Kritikpunkte, die Herr Kahle und andere Internetanbieter am Copyright-Gesetz äußerten. Herr Kahle möchte alles frei haben. Darin wird er auch von Bibliothekaren unterstützt, aber Bibliotheken müssen große Abstriche machen bei dem was sie sammeln und archivieren und dem, was sie zugänglich machen können.

Obwohl beide Projekte sehr verschiedene Ansätze wählen – eines einen idealistischen, das andere einen pragmatischen – kann es sein, dass sich beide eigentlich gut ergänzen. Bibliotheken können mit beiden Projekten zusammen arbeiten. Und falls die Dinge bei Google schief laufen, können Bibliotheken immer noch woanders hingehen. Wenn die Preise bei Google zu hoch werden, können und werden sich andere Mitspieler finden, die die Werke erneut scannen. Es gibt noch genug Originalquellen. Auch den Nutzern ist es freigetellt, ihren Service zu wählen, um Zugang zu erhalten, wie das bei den gemeinfreien Büchern nachvollziehbar ist.

It may be that a lack of library funds, rather than Google, poses the biggest short-term threat to Mr Kahle’s dream. Google covers the cost of scanning libraries’ books. But to get into Mr Kahle’s archive, libraries must either do their own scanning or pay the archive to do it. And, like everyone else, libraries are feeling the financial squeeze at the moment.

Herr Kahle ist sehr vorausschauend. Universeller Online-Zugang zu allem Wissen ist ein Ziel, dass wohl während unser Lebensdauer nicht erreicht wird, aber wenn man ein solches weitentferntes Ziel wählt, kann man viele Leute darauf einschwören. Kahle will kein Imperium aufbauen, seine Idee ist es, die Zukunft zu schaffen.

Quelle:
The internet’s librarian :engl: in The Economist, 05.03.2009

Aufmerksam geworden über:
Robes, Jochen: The internet’s librarian :engl: bei Weiterbildungsblog

Errata als Kommentar 2

Google Konkurrenz zu Microsoft?

Zwei Giganten kämpfen um den Markt im Internet. Wo treffen Google und Microsoft aufeinander?

Betriebssysteme

Handy-Betriebssystem (Netbook-Betriebssystem)
Googles Android Basis ist ein Vorstoß in den Markt von Microsoft. Der bedeutendste Vorteil von Android ist, dass es schlank ist und ressourcensparend arbeitet. Als Netbook-Betriebssystem wird es noch dieses Jahr erwartet und könnte sich als Alternative zu Windows etablieren (Effektivität vorausgesetzt).
Microsofts Reaktion auf Android ist die Ankündigung einer neuen, völlig überarbeiteten Version von Windows Mobile 6.5. Ein weiterer Anbieter im Handy-Betriebssystembereich ist Apple, das man nicht unterschätzen sollte.

Office Anwendungen

Marktbestimmend ist hier Microsoft. Die Nutzer setzen außerdem noch stark auf lokale Office-Pakete und sind Online-Office-Anwendungen gegenüber noch sehr skeptisch. Mit den Erfahrungen dürfte Microsoft auch bei neuen Online-Versionen die Nase vorn haben. Google muss da gegen einen (vielleicht über)mächtigen Gegner antreten.

Browser

Sehr greifbar ist das Konkurrenzgehabe im Browsergeschäft, wo Google weder mit dem Marktführer Microsoft (ca. 65% Marktanteil) noch mit dessen größten Herausforderer Mozilla(ca. 30% Marktanteil) mithalten kann. Google Chrome kann gerade 1% für sich verzeichnen.
Der Browser hat einen schlechten Ruf, woran wohl die Datenkrake Google selbst Schuld ist, in dem sie mit dem Browser Daten sammelt – ein erhebliches Image-Problem. Dahinter verschwindet das schlanke Design des Browsers und seine extreme Schnelligkeit. Das ist ein großer Vorteil bei mobilen Geräten.

Das Blog Blue Summit News kommt zum Fazit:

Die beiden [Microsoft und Google, Anm. d. Verf.] schenken sich nichts, was im Endeffekt nur sinnvoll für den User sein kann, der von dem Kampf der Mitbewerber profitieren kann. Oder ist das letztendlich doch eine persönliche Sache, in der Sergey und Larry Microsoft zeigen wollen, dass es auch ohne sie geht und man mit der Suche doch Geld verdienen kann? Sogar soviel, dass man als Nebenprodukt ein eigenes Betriebssystem entwickeln kann, um mehr Reichweite für das eigentliche Kerngeschäft, der Suche, zu erlangen?

Man erkennt, dass die Konkurrenz der beiden Giganten in Zukunft noch größer werden wird. Sie treffen jetzt nicht mehr nur im hart umkämpften Suchmaschinenmarkt aufeinander.

Quelle:
Google vs. Microsoft via Blue Summit News

Was Google über uns weiß …

Dass Google die Suche personalisiert ist nichts Neues. Doch was weiß Google eigentlich wirklich über uns? Schauen wir uns mal einige Angebote von Google an und betrachten mal dabei das Verhalten eine aktiven Google-Nutzers wie Hänschen Dummy.

Hänschen sitzt in Berlin und sucht nach Tipp und Tricks der Websiteprogrammierung natürlich mit der normalen Suche von Google. Die Suchmaschine erfährt folgende Informationen (die Angaben der Aufzählungen sind größtenteils aus den unten angegebenen Quellen übernommen worden):

  • Länder Code
  • die Suchanfrage
  • Nutzung alternativer Suchvorschläge
  • IP Adresse
  • Sprache
  • Anzahl der Ergebnisse
  • Safe search an/aus
  • Klicks auf die Links der Suchanfrage
  • Nutzung Werbelinks

Um bequem weitere Dienste von Google nutzen zu können, hat sich Hänschen ein Konto bei Google angelegt. Fleißig protokolliert der Gigant mit:

  • das Registrierungsdatum
  • seinen Benutzernamen
  • sein Passwort
  • eine alternative E-Mail-Adresse
  • sein Land
  • Anzahl der Logins
  • welche der Google Dienste er nutzt.

Hänschen will um eine Suche zu starten nicht immer erst Google aufrufen. Als Website-Anbieter ist er auch neugierig, welchen Pagerank die Websites haben, die er besucht, weil sie ähnliche Inhalte wie er anbieten. Deshalb hat er die Google Toolbar installiert und erlaubt, dass Google den Pagerank anzeigt. Diese Bequemlichkeit bezahlt er damit, dass Google neben den Informationen, die aus der Suche gewonnen werden nachvollziehen kann:

  • welche Webseiten er besucht (ALLE – unabhängig davon, ob Hänschen von Google kommt oder nicht)
  • auf welche 404-Seiten Hänschen gestoßen ist und welche der alternativen Suchangebote er angenommen hat (Klickbestätigung)
  • die Nutzung der Synchronisationsfunktion mit dem Googleaccount
  • welche Lesezeichen Hänschen abgespeichert hat
  • und ob er mehrere Rechner nutzt

Selbst wenn Hänschen deshalb auf die Toolbar verzichtet, gewinnt Google über den Browserverlauf folgende Daten:

  • Webseite von der Google Suche
  • Datum
  • Zeit
  • Suchergebnis
  • welche Werbung geklickt worden ist

Hänschen hat festgestellt, dass er aktuelle Informationen und Trends nicht unbedingt in deutscher Srache findet. Da er aber nicht sehr sicher ist beim Übersetzen, nutzt er Googles Sprachtools, um englische, französische und holländische Texte zu übersetzen. Google erfährt so:

  • alle übersetzten Texte
  • und den Sprachradius genutzter Texte

Nach getaner Arbeit stellt Hänschen seinen PC nicht aus, sondern vernügt sich erstmal bei Youtube. Der Dienst ist kostenlos, aber Hänschen verrät dabei:

  • E-Mail Adresse
  • Passwort
  • Benutzername
  • Land
  • alle hochgeladenen Videos
  • alle Kommentare
  • gemeldete Videos
  • Gruppen
  • Favoriten
  • Kontakte
  • angesehene Videos
  • Datentransfer
  • Klickverhalten

Bequem über das Google-Konto angemeldet verschickt Hänschen per GMail (Google-Mail) E-Mails an seine Freunde und liest noch rasch einen erhaltenen Newsletter. Die Entscheidung für Google Mail hat ihm Google mit dem riesigen Speicherplatz einfach gemacht. Dafür erhält Google

  • alle E-Mails
  • Kontoaktivitäten
  • Speicherplatzverbrauch
  • Anzahl der Logins
  • Links, die angeklickt wurden
  • Kontaktlisten
  • Spamtrends
  • Datenverkehr
  • Datengröße
  • Kontaktdaten

Hänschen ist außerdem ein aktiver Blogger. Er schreibt mindestens einmal die Woche einen Blogbeitrag zu Themen, die ihn bewegen und kommentiert munter in den Blogs seiner Bloggerfreunde. Dazu nutzt er dankbar die Plattform Blogger und verrät Google weitere Informationen:

  • Benutzerfoto
  • Geburtstag
  • Land
  • Datentransfer
  • Datengröße
  • Klicks
  • Posts
  • Kontakte

Für seine Arbeit nutzt er seinen Rechner Zuhause, auf Arbeit, einen Laptop eines Freundes und Bibliotheksrechner. Um einen zentralen Ort für seine Dokumente zu haben, nutzt er Google Docs, zumal er hier auch mit anderen kooperativ an den Dokumenten arbeiten kann. Google erhält dadurch:

  • E-Mail Adresse
  • Anzahl der Logins
  • Anzahl der Aktionen
  • Datengröße
  • Klicks
  • den/die gesamte(n) Text/Daten/Präsentation
  • alle Bilder
  • alle Änderungen
  • Informationen zu den Kooperationspartnern

Da Hänschen zudem viel unterwegs ist, informiert er sich im Vorfeld bei Google Maps über Routen von seiner Heimatstadt zu seinen Zielorten. Dafür nutzt er auch den Service auch mit seinem Handy. Es ist nur eine Frage der Zeit, bis Google hier personalisierte Dienste anbietet und so auch ein Bewegungsprofil von Hänschen erstellen kann.

Google weiß noch viel mehr über Hänschen Dummy. Datenwachschutz|Blog von Carsten Hoppe zeigt immer wieder, was mit den Informationen passiert, die wir wie Hänschen freiwillig weitergeben.

Gratis ist gut. Gratis ist klasse. Gerne nutzen wir Gratis-Angebote und fragen nicht, warum jemand etwas umsonst anbietet. – – – Umsonst? Nein, umsonst bietet niemand etwas an. Google erhält Daten, viele persönliche Daten über uns.

Daten sind das Zahlungsmittel im heutigen Informationszeitalter. Der Suchmaschinengigant Google versteht dieses Geschäft wie kein anderer Konzern und pflegt sein Image als welt- und menschenverbundenes Unternehmen, das sich für die Gesellschaft engagiert, indem es Programme und Services kostenlos zur Verfügung stellt. Völlig kostenlos sind die Programme freilich nicht, denn der Nutzer bezahlt mit seinem persönlichen Daten- und Webnutzungsprofil.

Aber auch wenn man sehr bewußt mit seinen Daten umgeht, Angebote hinterfragt, sie kritisch nutzt und auch Nutzungsalternativen sucht –

Selbst wenn man dezidiert Googles Datenradar entkommen will, fällt das dem Normalnutzer nicht leicht. So ist das Unternehmen mit Analytics mittlerweile auf vielen Webseiten präsent und leistet dort Nutzer-Analysedienste für den Webseitenbetreiber, ohne dass der Besucher dies im Normalfall mitbekommt.

Hänschen nutzt diesen Service in seinem Webangebot und zieht somit auch andere weiter in die Arme der Datenkrake Google.

Viele der Informationen sind für das gute Angebot von Google notwendig und für die Verbesserung der Dienste auch nützlich.

Das muss teilweise natürlich auch sein, weil sonst einige Dienste ja nicht funktionieren können. Wer aber sehr viele Dienste nutzt, der kann einsortiert und kategorisiert werden. Google kann und wird in Zukunft diese Daten auch nutzen.

Als Folgen heute zu sehen sind die Verwendung der Daten für die lokalisierte und personalisierte Werbung, mit der Google viel Geld verdient, denn die Personalisierung erhöht die Relevanz der Werbung für entsprechende Zielperson. Die Personalisierung ermöglicht es Google im Gegenzug bei Nutzung des Google-Accounts auch eine Anzeige besserer und relevanterer Suchergebnisse durch Profilbildung.

Hoppe kommt zum Fazit:

Die Frage wird hier sein ob ein User das überhaupt will, das er in eine Schublade gesteckt wird ??? Es hat mit Sicherheit viele Vorteile da Suchergebnisse besser angepasst/personalisiert werden.

Die Entscheidung kann jemand wie Hänschen nur treffen, wenn er auf die Gefahren hingewiesen wird und sich kritisch damit auseinandersetzt. Aber selbst wenn er die Gefahren kennt, kann er ihnen nur aus dem Weg gehen, wenn er Alternativen und ihre Vorteile gegenüber Google entdeckt. Er benötigt hier Informationskompetenz.

Man kann auf Googles Motto “Don’t be evil’ vertrauen oder sich bewußt machen, dass die Möglichkeiten dieser Informationsmassen auch die nettesten Firmen korrumpieren können.

Quellen:
Was Google alles über Sie weiss im Tagesanzeiger.ch Digital
Hoppe, Carsten: Welche Daten sammelt Google, ein interessanter Überblick im Datenwachschutz|Blog

Canonical – Kooperation von Google, Yahoo und Microsoft

Die Suchmaschinen wie Google, Yahoo und Microsoft haben mit gleichen oder sehr ähnlichen Inhalten unter mehreren URLS zu tun und müssen dann im Rahmen ihres Rankings entscheiden, welche der URLs die wichtigere ist, wenn nicht der gleiche oder sehr ähnliche Inhalt mehrfach im Index erschlossen werden soll.

Die drei Anbietergiganten von Suchmaschinen wollen einen neuen Linkparameter einführen, damit die Nutzer ihnen helfen können, welche der URLs die originärste/maßgeblichste Quelle ist.

Im Head-Bereich der Seite wird die maßgebliche URL für den Inhalt festgelegt: < link rel="canonical" href="http://diepresse.com/home/techscience/internet/452272/index.do" >

So wird der gleiche Inhalt für die Suchmaschine eindeutig einer URL zugeordnet, selbst wenn weitere Parameter mit der URL übergeben werden, wie dies häufig bei Blogs geschieht. Die Archiv-URL unterscheidet sich vom einfachen Artikel-Permanentlink.
http://diepresse.com/home/techscience/internet/452272/index.do?_vl_backlink=/home/techscience/internet/index.do Damit ist es den Websitebetreibern möglich, den Suchmaschinen zu signalisieren, unter welcher URL die entsprechenden Inhalte im Index geführt werden sollen.

Duplikate sind von diesem Canonical-Parameter nicht erfasst. Sie müssen weiterhin mit einer permanenten Umleitung (301) umgebogen werden. Bei Subdomains reicht der Canonical-Link aus, um von den Suchmaschinen beachtet zu werden.

Diese Linkangabe hilft, den Inhalt eines Blogs unter einer eindeutigen URL anzubieten und erleichtert so sicherlich ein gutes Ranking und verringert so sicherlich auch dublette Trefferanzeigen.

Quellen:
Google, Yahoo und Microsoft wollen “sauberes” Internet bei DiePresse.com
Mit Canonical gegen “duplicate content” via golem.de

Googles Studie mit der Eye Tracking-Methode

Wie sind die Sehgewohnheiten auf Websites? Wo schaut man zuerst hin und wovon wird man abgelenkt? Kurz gesagt: Wie kriegt man die gewünschte Information am besten an Frau oder Mann? Und verändern Sucherfahrungen die Art und Weise, wie man schaut?

Untersucht wurde das Suchverhalten von Probanden bei der Verwendung von Googles neuen Suchinteface “Universal Search”:engl: .

We (Google, Anmerkung d. V.) ran a series of eye-tracking studies where we compared how users scan the search results pages with and without thumbnail images.

In der Studie wurde mit Hilfe der Eye-Tracking-Methode das Suchverhalten untersucht. Es wurden mit Hilfe der Blickachsenmessung sogenannte heatmaps erstellt. Anhand der Heatmaps lässt sich die Verteilung der Aufmerksamkeit bezüglich des Klickverhaltens bzw. der Klickstärke an bestimmten Stellen der Trefferseite farblich genau darstellen.

Our studies showed that the thumbnails did not strongly affect the order of scanning the results and seemed to make it easier for the participants to find the result they wanted.

Nicht neu ist die Feststellung, dass Suchende ihre Suchergebnisse zu einem bestimmten Suchbegriff in weniger als einer Sekunde visuell abscannt. Innerhalb dieser kurzen Zeit trifft er unterbewusst Entscheiidungen über die Relevanz des Ergebnisses. Ziel von Google ist es, mit Hilfe dieser Methode diese kurze Zeitspanne der Entscheidung besser zu verstehen, d.h. die genauer zu analysieren und auszuwerten. Die so gewonnenen Rückschlüsse sollen helfen, das Ranking der Suchmaschinen zu verbessern und auch das Interface für die Google-Trefferlisten zu optimieren.

Das folgende Video zeigt den Blickweg eines Suchenden.

Je länger der Nutzer auf eine bestimmte Stelle schaut, umso größer wird der rote Punk. Sehr schön ist dabei zu sehen, dass der Nutzer erst auf das erste Ergebnis reagiert. Dabei wird nicht die Überschrift oder die Beschreibung als erstes betrachtet, sondern die Ziel URL der Webseite (grün). Danach wandert formlich das Auge zu den aufgelisteten Sitelinks und später zum zweiten und dritten Ergebnis. Ohne die zweite und dritte Position genauer zu betrachten, wird scheinbar der Nutzer von den unteren vier Bildern abgelenkt (nicht direkt) und fixiert eher bestimmte Schlagwörter im Titel.

Qellen:
Aula, Anne u. Rodden, Kerry: Eye-tracking studies: more than meets the eye:engl: im Official Google Blog
Neumann, Paul: Neue Google Eye Tracking Studie via blogtopf.de
Neumann, Paul: Google Suchverhalten – Eye-Tracking via blogtopf.de


[Korrektur zur Verbesserung des Datenschutzes. Umstellung Youtube-Video auf “privacy-enhanced mode”: 03.06.2018]

FAZ, Google, VG Wort und irgendwo auch Bibliotheken

Wieviel Selbstbetrug ist dabei, wenn man dem “liebenswerten” Riesen Google traut? Bunt und lässig wirkt die schnelle Suchmaschine und ihr Motto “Don’t be evil” ist geradezu sympatisch. Das Versprechen, nicht mehr in Büchern blättern zu müssen, ist eine Verheißung, die Google mit “Google Books” glaubhaft werde lässt.

Aus ehemaligen Gegnern dieses Projektes, den Autoren und Verlegerverbänden, wurden in den letzten drei Monaten nach der bahnbrechenden Einigung am 28. Oktober 2008:engl: „Branchenpartner“. Damit ist man bei der Sache also schon beim “Wir” angekommen.

Eng wollen die Suchmaschinisten mit ihnen zusammenarbeiten, „um noch mehr Bücher dieser Welt online verfügbar zu machen“. Das utopisch Vermessene steckt in der Wendung „dieser Welt“, welche Google erneut zu erobern ausgezogen ist – und wie wohl niemand zuvor in der Geschichte über alle Kulturen, Sprachen und Religionen hinweg tatsächlich in den Griff zu bekommen scheint.
Anzeige

Anders ist da der Auftritt deutscher Streiter wie der VG Wort, die nun gegen das Projekt Google Books vorgehen möchten, für das Google in den USA “trotz bisheriger Rechtsunsicherheit schon sieben Millionen Bücher digitalisiert” hat.

Weiterlesen

1 3 4 5 6 7 8