Volltextrecherche im Internet Archive mit Open Library

Open Library ist “ein Projekt zur kollaborativen Erstellung einer auf einer bibliographischen Datenbank basierenden Online-Bibliothek. Selbsterklärtes Ziel der Open Library ist es, eine eigene Webseite für jedes bislang veröffentlichte Buch zu schaffen. In vielen Fällen wird dabei über den bibliographischen Nachweis hinaus auch der Zugang zum Digitalisat des jeweiligen Buchtitels mit hinterlegtem Volltext ermöglicht.” (Wikipedia: Open Library)

Als Teilprojekt des Internet Archive eignet sich Open Library dabei auch für die Suche in den dort enthaltenen Beständen. Unter der Rubrik “Digitale Medien” kann nun auch über den Karlsruher Virtuellen Katalog (KVK) im Internet Archive gesucht werden (Klaus Graf in Archivalia).

In einem früheren Beitrag habe ich bereits vorgestellt, wie mit dem Site:-Operator per Google-Suche auf die Volltexte im Internet Archive zugegriffen werden kann. Wikisource liefert hier eine gut durchdachte Variante:

site:archive.org/stream/ filetype:txt *
(Das Sternchen * im Eingabefeld muss dann nur 
durch den gewünschten Suchbegriff ersetzt 
und die Suche gestartet werden.)

Klaus Graf macht in Archivalia auf die Volltextsuche der Open Library aufmerksam. Diese möchte ich anhand des Suchbegriffs “Allmende” vorstellen und lasse nach diesem suchen. Es erscheint eine Trefferliste mit der Kurzfassung der bibliographischen Angaben jedes gefundenen Werkes:

AllmendeA

 

 

 

 

 

 

 

 

 

Im folgenden verwende ich “Beiträge zur kenntnis der allmendverfassung” von “Ahron Eliasberg” als Beispiel. Mit einem Mausklick auf den Namen des Werkes oder Autors gelangt man zu den jeweiligen Datensätzen der Open Library. Unter den bibliographischen Angaben der Suchtreffer werden ausgewählte Fundstellen mit dem hervorgehobenen Suchbegriff angezeigt. Zwar erscheint über der Liste die Anzahl aller ermittelten Treffer, aber leider keine Anzahl der Treffer innerhalb eines bestimmten Werkes. Die hier angezeigten Fundstellen sind nicht vollständig, erst die Funktion “snippets in situ” zeigt die einzelnen Treffer im Originalkontext:

AllmendeB

 

 

 

 

 

 

 

 

“beitrgezurkennt00eliagoog” ist der Identifier des Items im Internet Archive, mit dem die Links zu den Metadaten und in diesem Fall zum Volltext gebildet werden:

https://archive.org/details/beitrgezurkennt00eliagoog

Der “Read”-Button mit dem Buchsymbol führt direkt zum Online-Reader des Internet Archive. Auf der Leiste zum Blättern erscheinen nun Lesezeichen für die Fundstellen im geöffneten Volltext:

AllmendeC

 

 

 

 

 

 

 

 

 

 

Mit den Lesezeichen lassen sich nicht nur die einzelnen Seiten mit den Fundstellen gezielt aufrufen, sondern sie ermöglichen eine Vorschau auf die jeweilige Seite, die aber nicht vollständig ist.

Blättert man durch die Seiten im Volltext, werden die gefundenen Wörter farbig unterlegt angezeigt. Durch die hier vorgestellten Funktionen ist diese Suche zur Orientierung überaus praktisch, doch nach wie vor gilt Klaus Grafs Kommentar:

Jedes beim Internet Archive hochgeladene Buch erhält eine OCR, die bei Frakturschriften nach wie vor unbrauchbar ist und bei Antiquaschriften in der Regel auch nicht besonders gut. Dieser E-Text wird häufig von der Google-Websuche erfasst.

Für dieses Problem gibt es in Wikisource ein paar Suchtipps. Nach einigen Probeläufen halte ich die Suche mit dem Site:-Operator von Google nach wie vor für ergiebiger.

Die St. Paul Public Library: “Mehr als nur Bücher”

Bibliotheken verfügen über eine lange Geschichte darüber, wie sie ihren Nutzer und Nutzerinnen einen Zugang zu Quellen und Informationen gewährleisten. Als die St. Paul Public Libraryein wachsendes Bedürfnis für Computer- und Berufsrecherchekompetenzen erkannte, schuf sie eine neuen Weg, um den (potentiellen) Bibliotheksbesucher_innen das Handwerkszeug und Zugang, den sie wünschten.

Beurteilung von Ergebnissen bei der Internetrecherche

Über das Blog zum Seminar “Philosophieren mit dem Internet? : Social Media im philosophischen Unterricht” an der TU Dresden, das von Mandy Schütze und Dona Schmidt angeboten wird, bin ich auf die folgende Prezi “Webrecherche und das Hinterfragen von Internetquellen” von Franziska Philipp aufmerksam geworden. Die Präsentation enthält zwar einige (Rechtschreib-Grammatik-)Fehler, aber ich dachte, dass sie dennoch auch für uns interessant sein kann, da man einerseits die Konzentration auf das Wichtigste sieht und andererseits einmal in nicht ganz so bibliothekarischen Wort lesen kann, wie man soetwas gestalten und beschreiben kann. Gefallen hat mir, mit welchen Argumenten an die Erweiterte Suche bei Google herangeführt wird.

Wie man richtig googlet!

Wie googelt man richtig? Marcus Lindemann ist Onlinerecherche-Trainer und erklärt auf der 13. Jahrestagung von netzwerk recherche, wie Journalisten mit Hilfe von Google einfacher an Informationen gelangen können.

Übersicht der besten Operatoren bei Google: Schreibweise, Verwendung und Anwendungsbeispiele

Mehr dazu:

 

Recherche im Internet Archive

Das Internet Archive orientiert sich an der Vision, die Gesamtheit des menschlichen Wissens allen verfügbar zu machen. Schon jetzt hat diese Vision zu bemerkenswerten Resultaten geführt. Losgelöst von der kreativen Energie, zu der diese Vision beflügelt, bleibt besonders zu klären, welcher Wissensbegriff diesem utopischen Entwurf unterliegt.

Persönlich bin ich ein großer Fan dieses Projektes und stöbere gerne ausgiebig in den digitalen Beständen. Besonders gefällt mir dabei, dass neben der Erstellung und Pflege digitaler Bestände mit der Eröffnung der physischen Sektion ebenfalls Sorge für die Erhaltung des gedruckten Buches als Kulturgut getragen wird.

Nun möchte ich kurz skizzieren, wie ich Google für die Recherche in den Beständen des Internet Archive nutze. Damit meine ich besonders die Volltext-Recherche. Google erlaubt es, die Suche auf einzelne Internetseiten zu begrenzen. Suchen möchte ich nach dem Zitat von Walter Benjamin über die Kartothek eines Wissenschaftlers, gebe also bei Google ein:

kartothek site:archive.org

“Kartothek” ist hier mein Stichwort, “site:archive.org” begrenzt die Suche auf die entsprechende Internetseite. Nun erscheint eine Trefferliste, bei der die gelisteten Fundstellen mit “Full text of” beginnen. Dies sind natürlich die Fundstellen in den Volltexten. Ich klicke mit der Maus auf “Full text of “Einbahnstraße” – Internet Archive”, weil ich weiß, dass “Einbahnstraße” ein berühmtes Werk von Benjamin ist.

Mit dem Link gelange ich zum Volltext des Textes und kann mit meinem Browser innerhalb des Textes nach dem Stichwort “Kartothek” suchen: Vier Treffer werden angezeigt, und die Suchfunktion meines Browsers bringt mich zum gesuchten Zitat und seinem Kontext, durch die Zeichenerkennung etwas entstellt:

(Und beute scbon ist das Buch, wie die aktuelle wissen-
scbaftlicbe Produktionsweise lehrt, eine veraltete Vermitt-
lung zwischen zwei verscbiedenen Kartothekssystemen.
Denn alles Wesentlicbe findet sich im Zettelkasten des
Forscbers, der’s verfaBte, und der Gelebrte, der darin
studiert, assimiliert es seiner eigenen Kartothek.)

Die Überschrift des Textes heißt hier: “YEREIDIQTEH BUCHERREVISOR”. Etwas weiter oben im Volltext findet sich die Seitenangabe: 26. Ganz oben über dem Volltext findet sich die Überschrift “Full text of “Einbahnstraße”” mit dem Link zum Archiveintrag. Nun kann man auf der linken Seite “Read Online” wählen und im Reader zur Seite 26 Blättern. Die Seitenzahl bringt mich in die Nähe des Textes, wenige Seiten später treffe ich – durch die Überschrift – auf die gesuchte Stelle. Nun habe ich die bibliographischen Angaben zum gesuchten Zitat sowie einen direkten Link für Belege in digitalen Publikationen:

http://archive.org/stream/Einbahnstrae/BenjaminEinbahnstrae#page/n25/mode/2up

Hier ist die doppelseitige Ansicht ausgewählt.

Mit Hilfe von Google lassen sich so viele Treffer ermitteln, besonders was die Suche nach unselbständigen Publikationen oder besonderen Stichworten (Ortsnamen, veraltete Ausdrücke) betrifft. Aber aufgrund der Qualität der Scans und der Volltexte sollten die Suchabfragen stark variiert werden.

Die Möglichkeit direkter Links zu digitalisierten Quellen stellt einen bisher kaum gehobenen Schatz dar. Klaus Graf nutzt diese Möglichkeit direkter Online-Belege – hier ein Beispiel – in dem von ihm administrierten Gemeinschafts-Blog Archivalia.

Die Zukunft der Bibliothek der Harvard Universität

1 2 3 4 5