Google lässt seine Bibliothek erforschen

Google hatte mit Google Books 2004 ein Projekt angestoßen, dass gar nicht durchdacht war. Ziel war es einfach, alles Wissen der Welt online sichtbar zu machen und dazu zählen auch Bücher. Doch was anfangen mit diesem Projekt? Wie dieses optimal gestalten und allen zugänglich machen? Urheberrechte? Anfangen und machen hieß erstmal. Das Google Books settlement diente dazu, unter anderem die Copyright-Fragen zu klären. Auch sonst verlässt man sich da bei Google in aller Ruhe auf Gerichtsentscheidungen. Doch wie kann man die Bücher den Nutzern besser zugänglich machen? Um den Nutzen seiner rasch wachsenden Online-Bibliothek besser erfassen zu können, gibt Google dieses und nächstes Jahr je eine halbe Million Dollar aus.

Finanziert werden damit zwölf Projekte unter verschiedenen Fragestellungen und außerdem weden Tausender der online zugänglichen Bücher geprüft.

Google is hoping the research will validate its long-held belief that making electronic copies of old books will bring greater enlightenment to the world.

Damit will man auch den Vorwurf entkräften, Google, welches das Copyright mit Füßen tritt, würde Bücher nur digitalisieren, um den eigenen Profit zu steigern.

Zu den Gewinnern von Googles „Digital Humanities Awards“ gehört auch ein Projekt der George Mason University, welches durch tiefere Analysen des Vokabulars zeitgenössischer Bücher ein genaueres Porträt des Viktorianischen Zeitalters zeichnen möchte. Das Projekt am Magdalen College Oxford erstellt einen Index übersetzter europäischer Literatur des Zeitraums von 1701-1917 (Bibliotheca Academica Traslationum), um die Änderungen der Übermittlung von Wissen innerhalb dieser Periode zu untersuchen. Andere Forscher der University of California, Los Angeles und der University of Washington erforschen Werkzeuge und Techniken zur automatisierten Bibliotheksanalyse. Für Google forschen derzeit 23 Gelehrte an 15 Universitäten.

Der Enthusiasmus von Google beim Buchscannen wurde inzwischen durch verschiedene änhängige Gerichtsverfahren bezüglich Urheberrechtsverletzungen etwas gestoppt. Dennoch sind derzeit über 12 Millionen Bücher eingescannt, wobei nicht alle online gestellt wurden. Betroffen sind vor allem copyrightgeschützte Bücher out of Print. Hier wartet Google auf eine Entscheidung bezüglich des Google Settlement, um so die Rechte für den digitalen Vertrieb von Büchern Out of Print zu erhalten. Viele lehnen dies ab, z.B. das U.S. Department of Justice, Verbraucherschützer und Google-Konkurrenten, die befürchten, dass dem Giganten so zu viel Macht auf dem digitalen Buchmarkt eingeräumt wird.

Quellen:

Orwant, Jon: Our commitment to the digital humanities, Official Google Research Blog
Google puts $1m into academic research projects for digitised books, Guardian.co.uk PDA digitalcontentblog
Liedtke, Michael: Google finances projects to test digital library, Associated Press
Google prüft Online-Bibliothek, nachrichten.at

Google Editions coming soon

Das iPad hat eingeschlagen wie eine Bombe und Apple-Jünger gieren nach Inhalten. Der Kindle ist eine weitere Erfolgsgeschichte. Apple, Amazon, aber wo ist der Internetgigant Google? Verschläft er hier einen Markt? – Nein, ist wohl die richtige Antwort, aber unklar ist, wie Google seine Konkurrenten bei ihrer Markteroberung stören möchte. So will Google mit seinem „Cloud Bookstore“ – besser bekannt als Google Editions irgendwann in diesem Sommer über vier Millionen Bücher verfügbar machen. Was jedoch ist über Google Editions bekannt. Das ist nicht viel.

Google Editions sollte Ende Juni bis Juli starten, wie das Wallstreet Journal berichtet. Bisher hat man von Editions noch nicht viel gehört.

Vermutlich wird Google Editions erstmal mit den Büchern starten, die freiwillig von den Verlegern bereitgestellt wurden. Das betrifft eine Größenordnung zwischen 400.000 und 600.000 Bücher für den Start. Das ist mehr als Apple derzeit in seinem gesamten iBookstore hat. Es könnten mehr sein, doch das Googlebooks-Settlement (GBS) ist bis jetzt nicht zustande gekommen. Daher können die durch Google eingescannten Bücher (Google Books), die noch immer durch das Urhberrecht geschützt sind, nicht mit angeboten werden. Google hat zudem nicht geplant, die gemeinfreien Bücher zu verkaufen, aber selbst wenn das Unternehmen dieses noch nicht angekündigt hat, so darf erwartet werden, dass diese dennoch für Leser über Editions bezogen werden können.

Google unterstützt eher das Lesen der Bücher im Browser als mit einem bestimmten Programm oder Lesegerät. Eventuell werden Programme erstellt, die das Lesen auf bestimmten Geräten, z.B. dem iPad, verbessern, aber spezifische Pläne wurden bisher dazu nicht veröffentlicht. Notwendig wird vor allem ein Internetzugang sein (always on). Unklar ist, welche Voraussetzungen die Browerser mitbringen müssen und ob auch gerätespezifische Broswer, z. B. die des Kindles Editions unterstützt werden.

Bei Google Editions werden fast alle U.S.-Verleger (über 20.000) zu finden sein nach Angaben von Google, denn bisher hat kein Verlag seine Teilnahme bestätigt. Da jedoch alle Verlage versuchen, möglichst eine weite Verbreitung ihrer Vertriebskanäle zu haben, werden auch die meisten großen Verlage sehr schnell bei Google Editions zu finden sein, wenn die Zeit reif ist. Aber gerade kleine unabhängige Verlage setzen auf Editions.

Editions is planned in such a way that book retailers, including independent booksellers, can use Editions to sell books from their own websites and keep most of the revenue.

Entscheidend für die Verleger wird wohl auch die Formatfrage sein. Vermutlich wird kein Verlag seine urheberrechtlich geschützten Bücher ohne DRM-Schutz verkaufen. Bisher gab es keine Ankündigung, dass Editions den EPUB-Standard unterstützen wird. In einem Interview im Maiy bestätigte ein Google-Manager, dass die herunterladbaren Bücher mit Adobe ACS4 DRM arbeiten werden, welches PDF und EPUB unterstützt. Auf eine EPUB-Unterstützung kann man daher nur spekulieren. Google selbst empfiehlt aus Usability-Gründen einen Verzicht auf DRM. Den Verlagen steht es frei festzulegen, wieviel Text ein Nutzer kopieren, einfügen oder drucken darf. Als Standard empfiehlt Editions bis zu 20 Prozent des Inhaltes verteilt über einen Zeitraum von 60 Tagen freizugeben. Zwar soll auch das gesamte Buch ausgedruckt werden können, jedoch macht man es den Nutzer nicht zu einfach. Mit jedem Druckauftrag lassen sich maximal 20 Seiten ausdrucken.

Die Kosten für Editions sollen über Werbung finanziert werden. Bis jetzt ist auch wenig zu den Preisen durchgedrungen (Geheimhaltung). Verschiedene Quellen berichteten, dass die Verleger eigene Preise bestimmen dürfen. Andere Quellen berichten, dass Google Verlegern ihnen 63% beim Direktverkauf an den Kunden auszahlt und 45 Prozent an jene, die über Wiederverkäufer vertrieben werden. Nur ein kleiner Prozentsatz geht dabei an Google. Denkbar wären aber auch Standardpreise für alle Bücher eines Verlages.

Multimedia-E-Books werden durch Google Editions derzeit nicht unterstützt werden und außerdem ist unklar, ob Links direkt angeklickt und weitergeleitet werden. Die Möglichkeit eines Book-on-Demand-Services durch Google kann im Rahmen der Editions nicht ausgeschlossen werden. Die wird jedoch vom Verlag und vom jeweiligen Buch abhängen. Es gibt auch Gerüchte über einen Google-eigenen Tablet PC, das gPad. Sie sind in verschiedenen Artikeln geschürt werden. Dabei ist unbekannt, ob Google dort auf das neue Chrome OS oder auf Android setzt.

Quellen:
Freese, Eric: Google Editions: What We Know (and Don’t Know), Digital Book World
Weitere Details zu „Google Editions“, Börsenblatt.net, 21.12.2009

[Kurz] Es werden nicht nur Bibliotheken geschlossen

„Dannenwalde bald mit Bibliothek“ heißt es in der Märkischen Allgemeinen. Die Bücherstube wird ehrenamtlich durch Gabriele Eggert geführt und gehört dem Dannenwalder Heimat- und Kulturverein. Die Bibliothek wird im ehemaligen, jüngst renovierten Arztzimmer des Gemeindehauses eingerichtet und vermutlich zum Ende des Monats eröffnet. In den zehn Regalen werden dann rund 1000 Bücher aus Spenden zu finden sein. Noch ist man dabei alles zu sortieren. Der Dannenwalder Heimatverein wird die Öffnungszeiten demnächst bekannt geben.

Eine Lösung für das Müllproblem unserer Informationsgesellschaft?

Nicht alles, was man ins Netz hochlädt, soll auf Dauer dort stehen bleiben. Der Sicherheitsexperte Bruce Schneier warnte auf der RSA-Konferenz 2008 in London bereits deutlich davor, dass es viele private Informationen gibt, die digital vorliegen und eine Nachvollziehbarkeit unseres Lebens ermöglichen. Anbieter wie Facebook und andere sozialen Netzwerke zeigen, dass persönliche Daten miniaturisiert werden und besser miteinander verknüpft werden können. Besonders problematisch ist, dass die heute noch wahrnehmbare Überwachung somit mehr und mehr in den Hintergrund verschwindet und auch Bilder lassen sich auch immer besser zuordnen. Die zunehmend besseren Speicherkapazitäten und bessere Rechenleistungen ermöglichen es, immer mehr Daten zu erfassen und zu bearbeiten. Dadurch entstehen ungeheure Mengen verknüpfbarer Daten.

Informatiker der Universität des Saarlandes haben eine mögliche Lösung entwickelt, bei der Daten und Bilder (Inhalte) bereits beim Hochladen mit einem Verfallsdatum bedacht werden können. Dazu müssen die Inhalte vorher verschlüsselt werden und die Schlüssel dann auf mehreren Servern abgelegt werden. Zum Lesen der Daten benötigt man diesen Schlüssel, welcher ganz automatisch vom Rechner vom Server angefordert wird. Die Ver- und Entschlüsselung läuft dabei im Hintergrund und wird von einem Browser-Add-on übernommen. Wie es funktioniert, zeigt auch ein downloadbares Video :video: (*.wmv) der Wissenschaftler.

Für den Nutzer, der nicht möchte, dass seine Partyfotos auch noch Jahre später auf Facebook sichtbar sind, kann beim Einstellen der Fotos bei Facebook auch gleich ein Verfallsdatum eintragen. Die Schlüssel, die dann zum Ansehen der Bilder notwendig sind, werden von den Servern automatisch nach Ablauf des Datums gelöscht und es werden keine neue mehr ausgestellt. Die Bilder (Daten) können danach nicht mehr aufgerufen werden. Einen zusätzlichen Schutz bietet ein Captchas-System.

Auf diese Art und Weise soll der Einzelne Kontrolle übe seine Daten erhalten. So können Suchmaschinen nicht automatisch Zugriff auf alle Daten erhalten. Außerdem könne man so einmal veröffentlichte Bilder auch wieder komplett löschen. Dieses Verschlüsselungssystem soll auch eine wirksame Hürde für die Cache-Funktion der Suchmaschinen sein, die Daten auch dann noch zur Verfügung stellen, wenn die ursprüngliche Quelle bereits längst gelöscht sind. Diese vollautomatische Speicherung sorgt mit dafür, dass das Internet ein Elefantengedächtnis hat und das Verfahren könnte vielleicht das wahre Müllproblem unserer Informationsgesellschaft lösen, nur kaum eine Verschlüsselung ist ungeknackt geblieben und die ursprünglichen Originaldaten bleiben trotz verfallenem Schlüssel erhalten, auch wenn sie ohne Schlüssel nicht sichtbar gemacht werden können.

Quelle:
Klingler, Anita: Saarbrücker Forscher erfinden Ablaufdatum für Netzinhalte, ZDNet.de