Der idealistische Bibliothekar des Internets

Für einen Mann allein wohl eine unmöglich zu bewältigende Aufgabe, aber Brewester Brewster Kahle lässt sich davon nicht abschrecken. Mit großem Enthusiasmus geht er dran, eine Alexandrinische Bibliothek 2.0 zu bauen. Man könnte ihn schmunzelnd als Scherzkeks abtun, aber dazu ist er sich seiner Sache zu sicher. Er schafft es Menschen und Technologien so zusammenzubringen, dass auch die schwierigsten Aufgaben gelöst werden. Er ist ein Visionär, der auf die Probleme aus einem anderen Blickwinkel als andere schaut und sich zutraut, Probleme zu lösen, bei denen andere denken, die wären unmöglich zu schaffen.

Millionär Kahle gibt sein Geld nicht für Klamotten aus, sondern hinter dem einfach gekleideten Mann versteckt sich ein geübter Technologe und ein sehr erfolgreicher Unternehmer. Er hat Firmen wie AOL und Amazon gegründet und sehr erfolgreich verkauft. Jetzt Zur Zeit setzt er seine Energie dafür ein, ein gemeinnütziges digitales Archiv mit freien Inhalten aufzubauen, seien es Bücher, Filme, konzerte usw. – ganz ähnlich der legendären Bibliothek von Alexandria. Dies bringt ihn in Konflikt mit dem Giganten Google, der ein ähnliches, aber doch eher kommerziell ausgelegtes Ziel verfolgt.

Kahle graduierte 1982 am Massachusetts Institute of Technology (MIT). Dort studierte er mit dem artificial-intelligence guru Marvin Minsky. Er trat einer Gruppe von MIT Alumni bei, welche die Firma Thinking Machines gründete, die Parallele Supercomputer herstellten. Dort arbeitete er mit Größen wie Richard Feynman (Nobelpreis-Gewinner), Dr. Minsky and Daniel Hillis zusammen.

1989 gründete er seine eigene Firma WAIS Inc und baute dort auf die Suchtechnologie auf, die bei Thinking Machines entwickelt worden war. Zu seinen Kunden zählte das Wall Street Journal, welche die erste News-Site aus Subskriptionsbasis war oder die Zeitschriftenfirma CMP, die ein Pionier der Online-Werbung war. Da Kahle die Bedeutung von Bezahlsystem, Online-Privacy und Nutzer-Ratings begriffen hatte, lag er fast ein ganzes Jahrzehnt vor seinen Mitbewerbern. 1955 wurde seine Firma für wohl 15 Millionen Dollar von AOL erworben.

1996 liefen schon fast ein Dutzend Patente auf den Namen Kahle. In dem Jahr wendete er sich seinem nächsten Projekt zu, dem gemeinnützigen Internet Archive. Außerdem gründete er zusammen mit einem ehemaligen Kollegen eine neue Firma namens Alexa. Diese Firma verfolgt und analysiert die Wege, denen Menschen folgen, wenn sie sich im Web bewegen, um ihnen behilflich sein zu können, ähnliche Informationen zu finden. Alexa wurde 1999 von Amazon für geschätzte 250 Millionen Dollar erworben. Kahle arbeitete dort noch bis 2002, bevor er sich ganz dem Internet Archive widmete.

Der bekannteste Teil des Archivs ist die Wayback Machine. Auf diesem “Online-Dachboden digitaler Erinnerungen” werden Kopien von Internetseiten aufgehoben, so dass man schauen kann, wie eine Website vor einigen Jahren ausgesehen hat. Man könnte auch sagen, das Archive ist das Museum des Internets. Das Internet heute ist für viele das erste Medium der Wahl für kulturelle Erzeugnisse und die Wayback Machine ermöglicht einen Zugang dazu zu unterschiedlichen Zeitpunkten. Und es gibt an der Stelle mehr als nur wissenschaftliches Interesse, was mehr als 500 Zugriffe pro Sekunde bestätigen.

Zusätzlich zum Archiv von Webseiten gibt es eine Audiobibliothek mit mehr als 300.000 MP3-Dateien, ein Filmarchiv mit mehr als 150.000 Filmen und Videos und ein Livemusikarchiv mit Aufnahmen von mehr als 60.000 Konzerten. All diese Sammlungen sind kostenlos zugänglich.

Das ist ein guter Schritt in Richtung Ziel von Herrn Kahle, der die weltgrößte digitale Bibliothek aufbauen möchte. Dazu hat er auch welltweit 135 Bibliotheken für die openlibrary.org gewonnen. Ziel dieses Projektes ist es, einen Katalog zu jedem jemals erschienenen Buch zu schaffen und da, wo es möglich ist, zum Volltext zu verlinken. Um das zu erreichen, digitalisiert das Internet Archive in Zusammenharbeit für seine Bibliothekspartner täglich mehr als 1000 Bücher. Dafür zahlen die Bibliothek über 30 Dollar. Die digitalisierten Kopien dürfen dabei von beiden Parteien genutzt.

Über 200 Menschen arbeiten für das Internet Archive, welches ein jährliches Budget von 10 – 14 Millionen Dollar benötigt. Anfangs hat Herr Kahle dieses Geld gespendet, doch inzwischen kommen mehr und mehr Spenden von Stiftungen und Bibliotheken, die dafür bezahlen, dass ihre Bücher digitalisiert werden.

It also runs a variety of one-off projects, such as a collaboration with America’s space agency, NASA, to make available photos and films relating to the history of the space programme, and a “print on demand” system to turn digital files into physical books in minutes.

Herr Kahle wirkt mit seinem Stil unbekümmert und lässig, aber der 48-jährige steht mit beiden Beinen fest auf dem Boden und weiß sich auch gegen starke Gegner zu wehren.

“Come back when you have a warrant,” reads the floor mat underneath his office recliner. It was a gift from the Electronic Frontier Foundation (an activist group on whose board Mr Kahle sits) after Mr Kahle refused to hand over information about one of the Internet Archive’s users to the Federal Bureau of Investigation in 2007.

Dieser Aktivist für Online Privacy ist auch ein überzeugter Befürworter der Offenheit. Er bestand auf einer extra für das Internet Archive entwickelten Open-Source-Suchmaschine (Scribe). Auch die “PetaBox”, die eine Million Gigabyte Daten speichern kann, ist auf Open-Source-Basis entwickelt worden.

“Everything Brewster does is open. He personifies openness,” says John Seely Brown, who sits on Amazon’s board of directors and was previously the chief scientist at Xerox, and the director of its Palo Alto Research Centre. Being open “is the right way to have a thriving industry,” says Mr Kahle. “I have been much more successful when letting people know what I want to do. I get much more help that way.”

Dieser große Enthusiasmus Kahles für eine solche Offenheit enhält implizit auch eine Kritik an dem viel größeren Buchdigitalisierungsprojekt von Google. Auch die Googlegründer haben ein ähnliches Ziel wie Herr Kahle, auch sie wollen das Wissen der Welt organisieren und es allen zugänglich und nutzbar zu machen. Da das meiste Wissen immer noch in Büchern enthalten ist, scannt man sie.
Während für das Internet Archive den Focus auf gemeinfreie Werke legt, um sie im Volltext zugänglich zu machen, so scannt Google mehr als 7 Millionen neuere Werke, von denen die meisten noch urheberrechtlich geschützt sind. Diese werden in kleinen Auszügen zugänglich gemacht.

Auch wenn Google bisher behauptete, man würde nicht das ganze Werk zugänglich machen und damit weder eine Copyrightverletzung begehen noch die Erlaubnis der Verlegerbenötigen, zwangen die Verleger den Suchmaschinengiganten zu einer Vereinbarung Oktober 2008. Eine endgültige gerichtliche Entscheidung wird Juni dieses Jahres erwartet.

Under the terms of the settlement, Google will put copyrighted works online only with the permission of publishers, who can also decide whether to make a preview available or not. Google will also be allowed to sell access to entire books online, sharing the proceeds with publishers. It has, in other words, struck a deal that will allow it to go on scanning books and make money providing access to them online.

Die Herangehensweise von Herrn Kahle, die Anzahl der verfügbaren Bücher zu erweitern, ist anders. Wenig erfoglreich verklagte er die die amerikanische Regierung (Kahle vs. Gonzales), übermäßig restriktive Copyyrightregelungen rückgängig zu machen. Eine Verkürzung des Schutzzeitraumes hätte die Zahl der gemeinfreien Werke dramatisch gesteigert und die Zahl der digitalisierbaren und damit frei zugänglichen Online-Werke erheblich erhöht. Davon hätte jeder profitiert.

Googles rechtliche Einigung hat eine Kontroverse verursacht. Die Einigung bedeutet, dass Google jetzt die einzige große Firma ist, die eine bedeutende digitale Sammlung copyrightgeschützter Bücher ist. Einige Bibliothekare befürchten, dass dies der Internetfirma riesige Macht gibt. Nicht umsonst heißt es “Wissen ist Macht” und nicht umsonst wird viel Geld für Informationen bezahlt.

“This is a more powerful monopoly than we’ve ever seen for access to 20th-century material,” says Ms Moore of the University of Toronto. “We do not have a good track record in negotiating good prices with monopolies.” Similar concerns led Harvard University to reduce its participation in Google’s project.

Die Meinung ist nicht eindeutig. Andere Bibliothekare begrüßen das Google Settlement als einen guten Kompromiss, aber nichts ist perfekt und betrifft nicht die Kritikpunkte, die Herr Kahle und andere Internetanbieter am Copyright-Gesetz äußerten. Herr Kahle möchte alles frei haben. Darin wird er auch von Bibliothekaren unterstützt, aber Bibliotheken müssen große Abstriche machen bei dem was sie sammeln und archivieren und dem, was sie zugänglich machen können.

Obwohl beide Projekte sehr verschiedene Ansätze wählen – eines einen idealistischen, das andere einen pragmatischen – kann es sein, dass sich beide eigentlich gut ergänzen. Bibliotheken können mit beiden Projekten zusammen arbeiten. Und falls die Dinge bei Google schief laufen, können Bibliotheken immer noch woanders hingehen. Wenn die Preise bei Google zu hoch werden, können und werden sich andere Mitspieler finden, die die Werke erneut scannen. Es gibt noch genug Originalquellen. Auch den Nutzern ist es freigetellt, ihren Service zu wählen, um Zugang zu erhalten, wie das bei den gemeinfreien Büchern nachvollziehbar ist.

It may be that a lack of library funds, rather than Google, poses the biggest short-term threat to Mr Kahle’s dream. Google covers the cost of scanning libraries’ books. But to get into Mr Kahle’s archive, libraries must either do their own scanning or pay the archive to do it. And, like everyone else, libraries are feeling the financial squeeze at the moment.

Herr Kahle ist sehr vorausschauend. Universeller Online-Zugang zu allem Wissen ist ein Ziel, dass wohl während unser Lebensdauer nicht erreicht wird, aber wenn man ein solches weitentferntes Ziel wählt, kann man viele Leute darauf einschwören. Kahle will kein Imperium aufbauen, seine Idee ist es, die Zukunft zu schaffen.

Quelle:
The internet’s librarian :engl: in The Economist, 05.03.2009

Aufmerksam geworden über:
Robes, Jochen: The internet’s librarian :engl: bei Weiterbildungsblog

Errata als Kommentar 2

[Kurz] VG Wort zum Google-Vergleich

Matthias Spielkamp weist in seinem Blog auf den Newsletter der VG Wort hin.

In ihrem aktuellen Newsletter (PDF, 532 kb) analysiert die Verwertungsgesellschaft Wort (VG Wort) die Einigung, die Google mit US-Verbänden der Verleger und Autoren getroffen hat. Das ist gut, denn auch wenn die VG Wort natürlich ein Interessenverband ist, gibt es bisher kaum Einschätzungen in deutscher Sprache und aus deutscher Perspektive.

Die VG Wort schreibt:

Zum besseren Verständnis werden die Eckpunkte des Vergleichs hier nochmals zusammengefasst; die Erläuterungen orientieren sich dabei an der – teilweise schwer verständlichen – Terminologie der Gerichtsinformation.

Mehr dazu:
Spielkamp, Matthias: VG Wort anlaysiert Google-Einigung via immateriblog.de
Google-Vergleich: Arbeitsgruppe prüft Änderung des Wahrnehmungsvertrags in VG Wort aktuell, Februar 2009, S. 1-3

Google Books ist auf der Suche

Die us-amerikanische Anwaltskanzelei Boni & Zack LLC:engl: ruft Rechteinhaber weltweit auf, ihre Ansprüche gegenber Google anzumelden.

Die Aufforderung beruht auf dem Google-Abkommen1 vom Okober mit den Verlagen. Die us-amerikanischen Rechteinhaber und Google einigten sich darüber, dass die ersteren für die Nutzung der Bücher durch Google finanziell beteiligt werden. Google hingegen darf die Bücher einscannen, in den USA online auch mit Werbeeinblendungen verfügbarmachen und gegen Geld zugänglich machen oder Abonnements mit akademischen und öffentlichen Institutionen abschließen.

“The settlement is a tremendous win for authors,” says Michael J. Boni.
[…]
“This historic agreement will breathe new commercial life into out-of-print books and provide other significant benefits to authors,” says Joanne Zack.

Boni & Zack, die maßgeblich am Zustandekommen dieser Einigung beteiligt waren schreiben dazu auf ihrer Website:engl: :

Holders worldwide of U.S. copyrights can register their works with the Book Rights Registry and receive compensation from institutional subscriptions, book sales, ad revenues and other possible revenue models, as well as a cash payment if their works have already been digitized.

Diese Möglichkeit sollten die Autoren wahrnehmen, deren urheberrechtlich geschützte Werken vor dem 06.01.2009 veröffentlicht wurden. Auch die Verleger von Büchern und Zeitschriften können ihre Rechte geltend machen.

Die Rechtsansprüche müssen bis zum 5. Januar 2010 gemeldet werden, entweder per Brief oder über die dafür eingerichtete Website Googlesettlement.com2. Wichtig zu beachten ist die Widerspruchsfrist. Bis zum 05.05.09 muss der Widerspruch gegen die Onlinenutzung ihrer Werke eingereicht werden.

Auf die in diesem Register verzeichneten Autoren und Verleger werden 63 Prozent der von Google aus der Onlinenutzung ihrer Werke erzielten Einnahmen pauschal verteilt. Google nutzt dies auch als Werbung für Google Books. Nach Meinung des Unternehmens werden vor allem Autoren von vergriffenen Büchern durch das Onlineprogramm profitieren. Google Books biete ihnen die Möglichkeit, mit ihren Inhalten noch einmal Geld zu verdienen.

Diese Vereinbarung gilt so nur in den USA und wird erst am 11. Juni 2009 rechtskräftig. In Deutschland gibt es heftige Kritik an diesem Abkommen.

Quelle:
US-Kanzlei sucht nach Rechteinhabern für Google Books via golem.de

  1. Kurzfassung des Abkommens auf Deutsch []
  2. Die Seite wird in Deutscher Übersetzung angeboten. []

FAZ, Google, VG Wort und irgendwo auch Bibliotheken

Wieviel Selbstbetrug ist dabei, wenn man dem “liebenswerten” Riesen Google traut? Bunt und lässig wirkt die schnelle Suchmaschine und ihr Motto “Don’t be evil” ist geradezu sympatisch. Das Versprechen, nicht mehr in Büchern blättern zu müssen, ist eine Verheißung, die Google mit “Google Books” glaubhaft werde lässt.

Aus ehemaligen Gegnern dieses Projektes, den Autoren und Verlegerverbänden, wurden in den letzten drei Monaten nach der bahnbrechenden Einigung am 28. Oktober 2008:engl: „Branchenpartner“. Damit ist man bei der Sache also schon beim “Wir” angekommen.

Eng wollen die Suchmaschinisten mit ihnen zusammenarbeiten, „um noch mehr Bücher dieser Welt online verfügbar zu machen“. Das utopisch Vermessene steckt in der Wendung „dieser Welt“, welche Google erneut zu erobern ausgezogen ist – und wie wohl niemand zuvor in der Geschichte über alle Kulturen, Sprachen und Religionen hinweg tatsächlich in den Griff zu bekommen scheint.
Anzeige

Anders ist da der Auftritt deutscher Streiter wie der VG Wort, die nun gegen das Projekt Google Books vorgehen möchten, für das Google in den USA “trotz bisheriger Rechtsunsicherheit schon sieben Millionen Bücher digitalisiert” hat.

Weiterlesen

Mobil gemacht gegen Google Books!

Der Börsenverein, der Verband deutscher Schriftsteller (VS) und die VG WORT gehen gegen den us-amerikanischen Dienst Google Books vor. Sie wolllen damit eine ihrer Meinung nach ungenehmigte Digitalisierung ihrer Bücher durch Google in den USA beenden.

Ende November 2008 einigte sich Google nach einer Zahlung von 125 Millionen US-Dollar mit den Verbänden Authors Guild und der Association of American Publishers (AAP) und beendete somit einen mehrjährigen Streit zwischen dem Suchmaschinenbetreiber und den US-Rechteinhabern. Danach darf Google die kompletten Buchbestände der größten US-amerikanischen Bibliotheken, die der Internetkonzern gescannt hatte, auf seiner Plattform “Google Books” zugänglich machen.

Für deutsche Bücher ist diese Einigung nicht gültig. Deutsche Verlage und Autoren richten sich dagegen, denn sie sehen nicht ein, warum dieses Abkommen auch für ausländische und somit deutsche Werke gelten soll.

Google habe sieben Millionen Bücher ohne Genehmigung der Rechteinhaber vervielfältigt, so Alexander Skipis, Hauptgeschäftsführer des Börsenvereins des Deutschen Buchhandels. [… ] Unter den circa 7 Millionen Büchern, die von dem Vergleich erfasst werden, sind auch zehntausende deutschsprachige Buchtitel, so der Börsenverein.

Besonders problematisch ist, dass der Onlinezugang zu geschützten Werken, die allerdings nicht mehr gedruckt werden, bei Google Books nur gegen Bezahlung möglich ist, wobei er in Bibliotheken kostenlos ist. Als ein weiteres Problem wird angesehen, dass Rechteinhaber ihre Werke nur schützen können, wenn sie diese in ein Buchrechte-Register eintragen (Opt-Out-Verfahren). Für weiterhin verlegte Titel ist die Aufnahme in Google Books nur mit der Zustimmung der Verleger und Autoren möglich.

“Ein effizienter Schutz der Interessen von Urhebern und Verlagen ist in dieser Situation am besten durch ein gemeinsames Vorgehen aller Beteiligten zu erreichen”, sagte VG-Wort-Geschäftsführer Robert Staats.

Bei ihrem Vorgehen stützt sich die VG WORT auf ein Rechtsgutachten, welches durch eine spezialisierte internationale Anwaltskanzlei erstellt wurde. Auf dieser Basis soll das weitere Vorgehen abgesprochen werden. Außerdem versucht VG WORT ihr Vorgehen mit anderen Verwertungsgesellschaften im deutschsprachigen Raum abzustimmen.

Quelle:
Deutsches Bündnis gegen Google-Dienst für gescannte Bücher via golem.de
Deutsche Autoren und Verlage wollen Verlust von Bücherrechten an Google verhindern via heise online

[Kurz] Google Books knackt die 7-Millionen-Marke

Das “Google Books Projekt” hat über 7 Millionen Bücher:engl: gescannt.

To put that into perspective, Bowker’s Book In Print:engl: , a commercial database of bibliographic data, has 7.5 million in-print and out-of-print entries. The Library of Congress:engl: has around 32 million books in its collection. In fact, if you were to look at the American Library Association’s list of America’s largest libraries:engl: , the Google collection would rank as the 19th largest library in the US.

Natürlich sind die meisten Bücher englischsprachig, aber erschlagend ist die Zahl doch. Und gleich noch ein paar Zahlen:

Quellen:
Google has 7 million books scanned:engl: bei BookFinder.com Journal
New chapter for Google Book Search:engl: via Official Google Blog am 28.10.2008

Wie zitierfähig ist Google Books?

Hm, die Frage dachte ich, stellt sich nicht. Allerdings tauchte sie bei Suchanfragen ans Blog immer wieder auf. Daher soll es hier eine Antwort geben.

Google Books hat zum jetzigen Zeitpunkt etwa sieben Millionen Bücher im Index, die per Volltextsuche durchforscht werden können. Volltextsuche heißt, dass alle Seiten als Volltext indiziert worden sind. Es heißt jedoch nicht, dass man alle Bücher auch im Volltext angezeigt bekommt.

Bibliothek (Google Library) Bibliothek (Google Library) Verlag (Google Print)
Urheberrechtsschutz abgelaufen urheberrechtlich geschützt urheberrechtlich geschützt
Anzeige im Volltext keine Anzeige/ Anzeige in Auszügen Anzeige in Auszügen

Google Books ist rein theoretisch schon daher keine Zitiergrundlage, da von vielen Büchern nur Auszüge vorliegen oder überhaupt keine Vorschau möglich ist. Sie erhalten allenfalls eine Bestätigung, dass sich das Zitat auf einer bestimmten Seite, in einer bestimmen Randnote befindet. Das Zitat selbst ist damit noch nicht überprüft!

Google Books bildet zwar die Orignale ab und man könnte dann daher davon ausgehen, dass der gefundene Ausschnitt in dem angegebenen Buch auch wirklich auf Seite xy steht. Das mag sein, aber zum wissenschaftlichen Arbeiten gehört auch, das Umfeld des Zitates zu evaluieren. Denn wenn der Autor dieses Zitates hier gerade etwas Gegenteiliges zu seiner eigentlichen Meinung darlegen wollte, zitiert man zwar vermutlich formal korrekt, inhaltlich jedoch verfälschend. Zitate dürfen in diesem Sinne nicht aus dem inhaltlichen Kontext herausgelöst werden.

Sollte das Buch im Volltext vorliegen – das tut es meist, wenn die Schutzfrist der Urheberrechte abgelaufen ist und das Werk gemeinfrei ist. Hier kann man das Buch in einer vollständigen, zitierfähigen Form einsehen. In diesem Fall zitieren Sie das Buch und können dann als nächstes optional angeben, dass Sie das Buch elektronisch bei Google Books eingesehen haben. Bedenken Sie jedoch, dass die Bücher meistens sehr alt sind und sich eher für eine historische Arbeit oder einen historischen Überblick eignen.

Die feinere Form ist es, sich das Buch, auf das man über Google Books aufmerksam geworden ist und bei dem man Dank der Ausschnitte und Angaben feststellen konnte, dass es für einen wichtig ist, über die Bibliothek zu besorgen, z.B. als Leihe vor Ort oder aus den Verbundbibliotheken, bzw. per Fernleihe.

Google Books ist wie eine Datenbank ein Nachweisinstrument, das auch z.T. die Volltexte in einer einheitlichen Umgebung zur Verfügung stellt. Sie würden an Stelle einer anderen Datenbank auch nicht diese Zitieren sondern die entsprechende Quelle.

Daher zitiert man nicht Google Books sondern die Originalquelle. Wenn Sie einen Link zu Google Books angeben, legen Sie offen, welche Version des Buches genau angeschaut wurde und Sie erleichtern damit anderen Nutzern den Zugang zum Buch.

Eine Zitierfähigkeit von Google Books ist zu verneinen. Auch einen Einstieg ins Thema erhält man mit einer Recherche in Google Books nur bedingt. In Google Books ist derzeit eher eine zusätzliche Recherchemöglichkeit zu sehen, die zu weiterer Literatur führt.

Google feierte vor wenigen Tagen eine Vergleich zwischen dem Unternehmen und den Verlagen. Stolz berichtet Google, dass sie nun zukünftig Volltexte von vergriffenen Büchern anbieten dürfen.

Im Rahmen dieser Vereinbarung können wir nun diese vergriffenen Bücher zur Vorschau, zum Lesen und zum Kauf in den USA zur Verfügung stellen. Die permanente Verfügbarkeit vergriffener Bücher sicherzustellen war einer der Hauptgründe, weshalb wir dieses Projekt ins Leben gerufen haben.1

Wichtiger Punkt des Vergleiches ist:

Der vorgeschlagene Vergleich autorisiert Google ebenfalls dazu, öffentlichen Bibliotheken sowie Bibliotheken in Einrichtungen für höhere Bildung einen kostenlosen Zugang zu der Bücherdatenbank zu gewähren.2

Das gilt allerdings nur für die USA. Eine Entscheidung für Deutschland / Europa muss noch abgewartet werden.

  1. Die Zukunft der Google Buchsuche []
  2. Was bietet der Vergleich an? []
1 2 3 4