Historiker müssen doch jubeln. Dank Suchgigant und Google-Books lassen sich bisher verborgene Trends in Geschichte, Kultur und Sprache online entdecken. Forscher der amerikanischen Havard University wollen in diesen Daten das “Erbgut” der Kultur entdeckt haben.
Man müsste alle Bücher, die jemals geschrieben worden sind, lesen können, um die Fragen beantworten zu können. Wie hat sich das Bild von der Welt verändert? Wie würde es es sich mit der Zeit wandeln. Wie hat sich die Sprache, die Ernährung und das, was wir Kultur nennen verändert? Vier Jahre haben Forscher der Havard-University versucht zusammen mit Google Books diese Frage zu beantworten.
Da niemand mehr alle je geschriebenen Bücher lesen kann, nichtmal alle Bücher die innerhalb eines Jahres erscheinen, hat man mit der Digitalisierung eine gute Lösung gefunden. Dazu werden die Informationen in den Büchern in eine computerverständliche Sprache übersetzt. Nun findet man ca. 15 Millionen digitalisierte Bücher aus Universitätsbibliotheken aus aller Welt bei Google Books, ein Bruchteil von den geschätzt 129 Millionen jemals geschriebenen Büchern.
Daraus hat der Wissenschaftler Erez Lieberman Aiden und sein Team fast 5,2 Millionen Bücher ausgewählt, deren Text in einer guten Qualtität und mit Metadaten verfügbar waren. Wichtige Metadaten waren der Ort und der Zeitpunkt der Publikation. Der Zeitraum geht zurück bis ins 16. Jahrhundert und die Danmenge betrug 500 Milliarden Wörter, 361 Milliarden davon in Englisch und 37 Milliarden in Deutsch.
Weiterlesen